KR102637821B1 - Method and apparatus for recommending contents based on artificial intelligence - Google Patents

Method and apparatus for recommending contents based on artificial intelligence Download PDF

Info

Publication number
KR102637821B1
KR102637821B1 KR1020210102357A KR20210102357A KR102637821B1 KR 102637821 B1 KR102637821 B1 KR 102637821B1 KR 1020210102357 A KR1020210102357 A KR 1020210102357A KR 20210102357 A KR20210102357 A KR 20210102357A KR 102637821 B1 KR102637821 B1 KR 102637821B1
Authority
KR
South Korea
Prior art keywords
content
data
artificial intelligence
intelligence model
user
Prior art date
Application number
KR1020210102357A
Other languages
Korean (ko)
Other versions
KR20230020680A (en
Inventor
이종원
조우승
김태현
양명석
최광남
Original Assignee
한국과학기술정보연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국과학기술정보연구원 filed Critical 한국과학기술정보연구원
Priority to KR1020210102357A priority Critical patent/KR102637821B1/en
Publication of KR20230020680A publication Critical patent/KR20230020680A/en
Application granted granted Critical
Publication of KR102637821B1 publication Critical patent/KR102637821B1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Primary Health Care (AREA)
  • Biophysics (AREA)
  • Strategic Management (AREA)
  • Marketing (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • General Business, Economics & Management (AREA)
  • Computational Linguistics (AREA)
  • Evolutionary Computation (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

인공지능 기반의 콘텐츠 추천을 위한 방법 및 장치가 제공된다. 본 발명의 일 실시예에 따른 인공지능 모델 구축 방법은, 콘텐츠를 학습에 필요한 하나 이상의 데이터를 포함하는 제1 데이터셋으로 가공 처리하는 단계와, 상기 콘텐츠와 연관관계에 있는 타 콘텐츠의 제2 데이터셋을 확장 데이터로서 획득하는 단계와, 콘텐츠 열람 이력을 포함하는 사용자 데이터를 획득하는 단계와, 상기 제1 데이터셋, 상기 제2 데이터셋 및 상기 사용자 데이터를 콘텐츠 추천을 위한 인공지능 모델에 적용하여, 상기 인공지능 모델을 학습시키는 단계를 포함한다.A method and device for artificial intelligence-based content recommendation are provided. An artificial intelligence model building method according to an embodiment of the present invention includes processing content into a first dataset containing one or more data necessary for learning, and second data of other content that is related to the content. Obtaining the set as extended data, acquiring user data including content viewing history, and applying the first data set, the second data set, and the user data to an artificial intelligence model for content recommendation. , including the step of learning the artificial intelligence model.

Description

인공지능 기반의 콘텐츠 추천을 위한 방법 및 장치{METHOD AND APPARATUS FOR RECOMMENDING CONTENTS BASED ON ARTIFICIAL INTELLIGENCE}Method and device for recommending content based on artificial intelligence {METHOD AND APPARATUS FOR RECOMMENDING CONTENTS BASED ON ARTIFICIAL INTELLIGENCE}

본 발명은 인공지능 기반의 콘텐츠 추천 방법에 관한 것이다. 보다 자세하게는, 인공지능 기반의 하이브리드 학습 모델을 이용하여 사용자가 선호할 것으로 예상되는 콘텐츠를 선별하여 추천하는 방법 및 장치에 관한 것이다. The present invention relates to an artificial intelligence-based content recommendation method. More specifically, it relates to a method and device for selecting and recommending content expected to be preferred by users using an artificial intelligence-based hybrid learning model.

사용자에게 콘텐츠를 추천하는 기술이 이용되고 있다. 콘텐츠 추천 기술은, 주로 사용자가 관심이 있는 콘텐츠를 알고리즘을 통해서 선별하여, 선별된 콘텐츠를 웹 페이지를 통해서 사용자에게 제공한다. 예컨대, 콘텐츠 추천 기술로는 사용자가 자주 이용하는 콘텐츠의 유형을 분석하고, 해당 콘텐츠 유형에 해당하는 콘텐츠를 선별하거나 사용자의 연령과 성별과 기초로 사용자에게 콘텐츠를 추천하기 등의 다양한 알고리즘이 개발되었다. 이러한 콘텐츠 추천 기술은, 광고, 동영상 등에서 널리 활용되고 있다.Technology is being used to recommend content to users. Content recommendation technology mainly selects content of interest to users through an algorithm and provides the selected content to users through web pages. For example, various algorithms have been developed as content recommendation technologies, such as analyzing the type of content frequently used by users, selecting content corresponding to the content type, or recommending content to the user based on the user's age and gender. This content recommendation technology is widely used in advertisements, videos, etc.

근래에는, 인공지능을 이용하여 콘텐츠 추천하는 방법이 연구도 진행되고 있다. 그런데 인공지능을 이용한 콘텐츠 추천 기술은 학습 데이터 규모가 작을 경우, 정확한 정보를 출력하지 못하는 콜드 스타트(cold start) 문제가 발생할 수 있다.Recently, research is being conducted on ways to recommend content using artificial intelligence. However, content recommendation technology using artificial intelligence may have a cold start problem in which it cannot output accurate information if the size of the learning data is small.

인공지능을 이용한 콘텐츠 추천 기술에서 정확한 콘텐츠를 추천하기 위해서, 콘텐츠의 특성에 적합한 가공 데이터가 마련되어야 하고, 그 가공 데이터를 이용하여 학습을 진행하여야 한다. 그런데 광고, 동영상의 멀티미디어 콘텐츠를 대상으로 하는 인공지능 모델에 대해서 많은 연구가 진행되고 있으나, 논문, 연구 과제 등을 포함하는 학술 관련 콘텐츠를 대상으로 하는 인공지능 모델에 대한 연구가 미미한 실정이다.In order to recommend accurate content in content recommendation technology using artificial intelligence, processed data suitable for the characteristics of the content must be prepared, and learning must be performed using the processed data. However, although much research is being conducted on artificial intelligence models targeting multimedia content such as advertisements and videos, research on artificial intelligence models targeting academic content including papers and research projects is minimal.

한국공개특허 제10-2009-0015240호 (2009.02.12 공개)Korean Patent Publication No. 10-2009-0015240 (published on February 12, 2009)

본 발명이 해결하고자 하는 기술적 과제는, 사용자가 활용할 수 있는 콘텐츠를 정확하게 선별하여 추천하는 콘텐츠 추천 방법 및 장치를 제공하는데 있다.The technical problem to be solved by the present invention is to provide a content recommendation method and device that accurately selects and recommends content that can be utilized by a user.

본 발명이 해결하고자 하는 다른 기술적 과제는, 콘텐츠를 정확하게 추천할 수 있도록 하이브리드 형태의 인공지능 모델을 구축하는 방법을 제공하는데 있다.Another technical problem that the present invention aims to solve is to provide a method of building a hybrid artificial intelligence model to accurately recommend content.

본 발명이 해결하고자 하는 또 다른 기술적 과제는, 인공지능 학습에 필요한 가공 데이터를 전처리할 수 있는 방법을 제공하는데 있다. Another technical problem that the present invention aims to solve is to provide a method for preprocessing the processed data required for artificial intelligence learning.

본 발명의 기술적 과제들은 이상에서 언급한 기술적 과제들로 제한되지 않으며, 언급되지 않은 또 다른 기술적 과제들은 아래의 기재로부터 본 발명의 기술분야에서의 통상의 기술자에게 명확하게 이해될 수 있을 것이다.The technical problems of the present invention are not limited to the technical problems mentioned above, and other technical problems not mentioned will be clearly understood by those skilled in the art from the description below.

상기 기술적 과제를 해결하기 위한, 본 발명의 일 실시예에 따른 인공지능 모델 구축 방법은, 콘텐츠를 학습에 필요한 하나 이상의 데이터를 포함하는 제1 데이터셋으로 가공 처리하는 단계와, 상기 콘텐츠와 연관관계에 있는 타 콘텐츠의 제2 데이터셋을 확장 데이터로서 획득하는 단계와, 콘텐츠 열람 이력을 포함하는 사용자 데이터를 획득하는 단계와, 상기 제1 데이터셋, 상기 제2 데이터셋 및 상기 사용자 데이터를 콘텐츠 추천을 위한 인공지능 모델에 적용하여, 상기 인공지능 모델을 학습시키는 단계를 포함할 수 있다.In order to solve the above technical problem, an artificial intelligence model building method according to an embodiment of the present invention includes processing content into a first dataset containing one or more data necessary for learning, and establishing a correlation relationship with the content. obtaining a second data set of other content as extended data, obtaining user data including content viewing history, and recommending content using the first data set, the second data set, and the user data. It may include the step of learning the artificial intelligence model by applying it to an artificial intelligence model for.

상기 기술적 과제를 해결하기 위한, 본 발명의 다른 실시예에 따른 콘텐츠 추천 방법은, 사용자의 접속을 감지하는 단계와, 상기 사용자의 콘텐츠 열람 이력과 상기 사용자가 참여인력으로 기록된 하나 이상의 콘텐츠의 데이터를 획득하는 단계와, 상기 획득한 콘텐츠 열람 이력과 상기 하나 이상의 콘텐츠의 데이터를 기 구축된 인공지능 모델에 입력하여, 상기 사용자가 선호하는 하나 이상의 콘텐츠를 선별하는 단계와, 상기 선별한 복수의 콘텐츠를 사용자에게 추천하는 단계를 포함할 수 있다.In order to solve the above technical problem, a content recommendation method according to another embodiment of the present invention includes the steps of detecting a user's connection, the user's content viewing history, and data of one or more contents in which the user is recorded as a participant. A step of acquiring, inputting the obtained content viewing history and data of the one or more contents into a pre-built artificial intelligence model to select one or more contents preferred by the user, and the selected plurality of contents It may include a step of recommending to the user.

상기 기술적 과제를 해결하기 위한, 본 발명의 또 다른 실시예에 따른 컴퓨팅 장치는, 하나 이상의 프로세서와, 상기 프로세서에 의하여 수행되는 프로그램을 로드(load)하는 메모리와, 상기 프로그램이 저장된 스토리지를 포함하되, 상기 프로그램은 콘텐츠를 학습에 필요한 하나 이상의 데이터를 포함하는 제1 데이터셋으로 가공 처리하는 동작과, 상기 콘텐츠와 연관관계에 있는 타 콘텐츠의 제2 데이터셋을 확장 데이터로서 획득하는 동작과, 콘텐츠 열람 이력을 포함하는 사용자 데이터를 획득하는 동작과, 상기 제1 데이터셋, 상기 제2 데이터셋 및 상기 사용자 데이터를 콘텐츠 추천을 위한 인공지능 모델에 적용하여, 상기 인공지능 모델을 학습시키는 동작을 수행하기 위한 인스트럭션들(instructions)을 포함할 수 있다. In order to solve the above technical problem, a computing device according to another embodiment of the present invention includes one or more processors, a memory for loading a program performed by the processor, and storage in which the program is stored. , the program includes an operation of processing the content into a first dataset including one or more data necessary for learning, an operation of acquiring a second dataset of other content that is related to the content as extension data, and the content Obtaining user data including browsing history, applying the first dataset, the second dataset, and the user data to an artificial intelligence model for content recommendation, and performing an operation to train the artificial intelligence model. It may include instructions for doing this.

상기 기술적 과제를 해결하기 위한, 본 발명의 또 다른 실시예에 따른 컴퓨팅 장치는, 하나 이상의 프로세서와, 상기 프로세서에 의하여 수행되는 프로그램을 로드(load)하는 메모리와, 상기 프로그램이 저장된 스토리지를 포함하되, 상기 프로그램은 사용자의 접속을 감지하는 동작과, 상기 사용자의 콘텐츠 열람 이력과 상기 사용자가 참여인력으로 기록된 하나 이상의 콘텐츠의 데이터를 획득하는 동작과, 상기 획득한 콘텐츠 열람 이력과 상기 하나 이상의 콘텐츠의 데이터를 기 구축된 인공지능 모델에 입력하여, 상기 사용자가 선호하는 하나 이상의 콘텐츠를 선별하는 동작과, 상기 선별한 복수의 콘텐츠를 사용자에게 추천하는 동작을 수행하기 위한 인스트럭션들을 포함할 수 있다. In order to solve the above technical problem, a computing device according to another embodiment of the present invention includes one or more processors, a memory for loading a program performed by the processor, and storage in which the program is stored. , the program includes an operation of detecting the user's connection, an operation of acquiring the user's content viewing history and data of one or more contents in which the user is recorded as a participant, the obtained content viewing history and the one or more contents It may include instructions for inputting data into a pre-built artificial intelligence model to select one or more contents preferred by the user and recommending the selected plurality of contents to the user.

도 1은 본 발명의 일 실시예에 따른, 인공지능 기반의 콘텐츠 추천 시스템의 구성을 나타내는 도면이다.
도 2는 본 발명의 다른 실시예에 따른, 인공지능 모델이 구축되는 방법의 순서도이다.
도 3은 도 2의 단계 S200을 상세하게 설명하기 위한 도면이다.
도 4는 가중치 조절을 위한 실험을 예시하는 도면이다.
도 5는 데이터셋을 예시하는 도면이다.
도 6는 참여인력에 따른 콘텐츠들의 연결 관계를 예시하는 도면이다.
도 7은 성과 관계에 따른 콘텐츠들의 연결 관계를 예시하는 도면이다.
도 8은 도 2의 단계 S300을 상세하게 설명하기 위한 도면이다.
도 9은 콘텐츠 추천을 위한 인공지능 모델의 기능을 예시하는 도면이다.
도 10은 본 발명의 또 다른 실시예에 따른, 콘텐츠 추천 방법의 순서도이다.
도 11은 도 10의 단계 S600을 상세하게 설명하기 위한 도면이다.
도 12는 추천 콘텐츠들과 협업 파트너를 디스플레이하는 웹 페이지를 예시하는 도면이다.
도 13은 몇몇 실시예들에 따른 예시적인 컴퓨팅 장치의 하드웨어 구성을 나타내는 도면이다.
1 is a diagram showing the configuration of an artificial intelligence-based content recommendation system according to an embodiment of the present invention.
Figure 2 is a flowchart of a method for building an artificial intelligence model according to another embodiment of the present invention.
FIG. 3 is a diagram for explaining step S200 of FIG. 2 in detail.
Figure 4 is a diagram illustrating an experiment for weight adjustment.
Figure 5 is a diagram illustrating a dataset.
Figure 6 is a diagram illustrating the connection relationship between contents according to participating personnel.
Figure 7 is a diagram illustrating the connection relationship between contents according to performance relationship.
FIG. 8 is a diagram for explaining step S300 of FIG. 2 in detail.
Figure 9 is a diagram illustrating the function of an artificial intelligence model for content recommendation.
Figure 10 is a flowchart of a content recommendation method according to another embodiment of the present invention.
FIG. 11 is a diagram for explaining step S600 of FIG. 10 in detail.
12 is a diagram illustrating a web page displaying recommended content and collaboration partners.
13 is a diagram illustrating a hardware configuration of an example computing device according to some embodiments.

이하, 첨부된 도면을 참조하여 본 발명의 바람직한 실시예들을 상세히 설명한다. 본 발명의 이점 및 특징, 그리고 그것들을 달성하는 방법은 첨부되는 도면과 함께 상세하게 후술되어 있는 실시예들을 참조하면 명확해질 것이다. 그러나 본 발명의 기술적 사상은 이하의 실시예들에 한정되는 것이 아니라 서로 다른 다양한 형태로 구현될 수 있으며, 단지 이하의 실시예들은 본 발명의 기술적 사상을 완전하도록 하고, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 본 발명의 범주를 완전하게 알려주기 위해 제공되는 것이며, 본 발명의 기술적 사상은 청구항의 범주에 의해 정의될 뿐이다.Hereinafter, preferred embodiments of the present invention will be described in detail with reference to the attached drawings. The advantages and features of the present invention and methods for achieving them will become clear by referring to the embodiments described in detail below along with the accompanying drawings. However, the technical idea of the present invention is not limited to the following embodiments and may be implemented in various different forms. The following examples are merely intended to complete the technical idea of the present invention and to be used in the technical field to which the present invention pertains. It is provided to fully inform those skilled in the art of the scope of the present invention, and the technical idea of the present invention is only defined by the scope of the claims.

각 도면의 구성요소들에 참조부호를 부가함에 있어서, 동일한 구성요소들에 대해서는 비록 다른 도면상에 표시되더라도 가능한 한 동일한 부호를 가지도록 하고 있음에 유의해야 한다. 또한, 본 발명을 설명함에 있어, 관련된 공지 구성 또는 기능에 대한 구체적인 설명이 본 발명의 요지를 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명은 생략한다.When adding reference numerals to components in each drawing, it should be noted that identical components are given the same reference numerals as much as possible even if they are shown in different drawings. Additionally, in describing the present invention, if it is determined that a detailed description of a related known configuration or function may obscure the gist of the present invention, the detailed description will be omitted.

다른 정의가 없다면, 본 명세서에서 사용되는 모든 용어(기술 및 과학적 용어를 포함)는 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 공통적으로 이해될 수 있는 의미로 사용될 수 있다. 또 일반적으로 사용되는 사전에 정의되어 있는 용어들은 명백하게 특별히 정의되어 있지 않는 한 이상적으로 또는 과도하게 해석되지 않는다. 본 명세서에서 사용된 용어는 실시예들을 설명하기 위한 것이며 본 발명을 제한하고자 하는 것은 아니다. 본 명세서에서, 단수형은 문구에서 특별히 언급하지 않는 한 복수형도 포함한다.Unless otherwise defined, all terms (including technical and scientific terms) used in this specification may be used with meanings that can be commonly understood by those skilled in the art to which the present invention pertains. Additionally, terms defined in commonly used dictionaries are not interpreted ideally or excessively unless clearly specifically defined. The terminology used herein is for describing embodiments and is not intended to limit the invention. As used herein, singular forms also include plural forms, unless specifically stated otherwise in the context.

또한, 본 발명의 구성 요소를 설명하는 데 있어서, 제1, 제2, A, B, (a), (b) 등의 용어를 사용할 수 있다. 이러한 용어는 그 구성 요소를 다른 구성 요소와 구별하기 위한 것일 뿐, 그 용어에 의해 해당 구성 요소의 본질이나 차례 또는 순서 등이 한정되지 않는다. 어떤 구성 요소가 다른 구성요소에 "연결", "결합" 또는 "접속"된다고 기재된 경우, 그 구성 요소는 그 다른 구성요소에 직접적으로 연결되거나 또는 접속될 수 있지만, 각 구성 요소 사이에 또 다른 구성 요소가 "연결", "결합" 또는 "접속"될 수도 있다고 이해되어야 할 것이다.Additionally, when describing the components of the present invention, terms such as first, second, A, B, (a), and (b) may be used. These terms are only used to distinguish the component from other components, and the nature, sequence, or order of the component is not limited by the term. When a component is described as being “connected,” “coupled,” or “connected” to another component, that component may be directly connected or connected to that other component, but there is another component between each component. It will be understood that elements may be “connected,” “combined,” or “connected.”

명세서에서 사용되는 "포함한다 (comprises)" 및/또는 "포함하는 (comprising)"은 언급된 구성 요소, 단계, 동작 및/또는 소자는 하나 이상의 다른 구성 요소, 단계, 동작 및/또는 소자의 존재 또는 추가를 배제하지 않는다.As used in the specification, “comprises” and/or “comprising” refers to the presence of one or more other components, steps, operations and/or elements. or does not rule out addition.

이하, 도면들을 참조하여 본 발명의 몇몇 실시예들을 설명한다.Hereinafter, several embodiments of the present invention will be described with reference to the drawings.

도 1은 본 발명의 일 실시예에 따른, 인공지능 기반의 콘텐츠 추천 시스템의 구성을 나타내는 도면이다. 1 is a diagram showing the configuration of an artificial intelligence-based content recommendation system according to an embodiment of the present invention.

도 1에 도시된 바와 같이, 본 발명의 일 실시예에 따른 콘텐츠 추천 시스템은 사용자 단말(10), 콘텐츠 추천 장치(20) 및 데이터베이스(30)를 포함할 수 있다. 상기 콘텐츠 추천 장치(20)와 사용자 단말(10)은 네트워크(40)를 통해서 서로 통신할 수 있다. 여기서, 네트워크(40)는 유선 통신망, 이동통신망 등을 포함하는 것으로서, 본 발명의 주지의 관용 기술에 해당하므로 자세한 설명은 생략한다.As shown in FIG. 1, a content recommendation system according to an embodiment of the present invention may include a user terminal 10, a content recommendation device 20, and a database 30. The content recommendation device 20 and the user terminal 10 may communicate with each other through the network 40. Here, the network 40 includes a wired communication network, a mobile communication network, etc., and since it corresponds to the well-known common technology of the present invention, detailed description is omitted.

사용자 단말(10)은 로그인에 성공한 후, 사용자가 활용할 만한 하나 이상의 콘텐츠를 콘텐츠 추천 장치(20)로부터 제공받을 수 있다. 일 실시예에서, 콘텐츠는 과제, 논문, 특허 등과 같은 학술과 관련된 콘텐츠일 수 있다. 일 실시예에서, 사용자 단말(10)이 디스플레이하는 웹 페이지에는 콘텐츠 추천 영역이 형성되어 있으며, 사용자 단말(10)은 추천된 하나 이상의 콘텐츠에 대한 정보를 수신하여 상기 콘텐츠 추천 영역에 디스플레이할 수 있다. 이러한 사용자 단말(10)은 이동통신 단말, 태블릿 컴퓨터, 개인용 컴퓨터 등을 포함할 수 있다. After successfully logging in, the user terminal 10 may receive one or more content that the user may utilize from the content recommendation device 20 . In one embodiment, the content may be content related to academics, such as assignments, papers, patents, etc. In one embodiment, a content recommendation area is formed on the web page displayed by the user terminal 10, and the user terminal 10 may receive information about one or more recommended contents and display the content in the content recommendation area. . This user terminal 10 may include a mobile communication terminal, tablet computer, personal computer, etc.

데이터베이스(30)는 스토리지와 같은 저장수단으로서, 다수의 콘텐츠 및 다수의 사용자 데이터를 포함할 수 있다. 상기 콘텐츠는, 과제, 논문, 특허, 연구보고서 등과 같은 학술 관련 콘텐츠를 포함할 수 있다. 상기 콘텐츠는 복수의 속성을 가질 수 있다. 상기 속성은 콘텐츠를 카테고리로 구분할 수 있는 기준점이 될 수 있다. 상기 콘텐츠는 유형 속성, 연구책임자 속성, 참여연구원 속성, 년도 속성, 수행기관 속성, 부처명 속성, 기술분류 속성, 실용화 속성, 지역 속성 등 중에서 하나 이상을 포함할 수 있다. 여기서, 유형 속성은, 해당 콘텐츠의 유형을 나타낼 수 있다. 예컨대, 유형 속성은, 과제, 논문, 특허, 연구시설 장비, 연구보고서, 기술요약 정보, 소프트웨어, 생물자원, 화합물, 생명정보, 신품종 등과 같은 사전에 정의된 콘텐츠의 유형을 가리킬 수 있다. The database 30 is a storage means, such as storage, and may include multiple contents and multiple user data. The content may include academic-related content such as assignments, papers, patents, research reports, etc. The content may have multiple properties. The above attribute can be a reference point for dividing content into categories. The content may include one or more of type attributes, researcher attributes, participating researchers attributes, year attributes, executing agency attributes, ministry name attributes, technology classification attributes, commercialization attributes, regional attributes, etc. Here, the type attribute may indicate the type of the corresponding content. For example, type attributes may refer to types of content defined in advance, such as assignments, papers, patents, research facility equipment, research reports, technical summary information, software, biological resources, compounds, life information, new varieties, etc.

연구책임자 속성은, 콘텐츠의 연구를 진행한 연구책임자 식별정보를 포함할 수 있다. 참여 연구자 속성은, 콘텐츠의 연구에 참여한 한 명 이상의 연구자의 식별정보를 포함할 수 있다. 또한, 년도 속성은 해당 콘텐츠의 연구가 시행된 년도, 또는 해당 콘텐츠의 연구가 완료된 년도 또는 해당 콘텐츠의 성과 년도를 포함할 수 있다. 수행기관 속성은 해당 콘텐츠에 대한 연구를 수행한 기관명을 포함할 수 있다. 또한, 부처명 속성은 해당 콘텐츠에 대한 연구를 의뢰한 부처명을 포함할 수 있다. 기술분류 속성은 해당 콘텐츠의 분류되는 기술분야를 포함할 수 있다. 예컨대, 인공지능, 소프트웨어 솔루션, 인터넷 솔루션, SoC, 임베디드 소프트웨어, 로봇 제어 기술, 영상 의학, 차량 지능화 기술, 생물정보학, 데이터베이스, 보안기술 등 중에서 어느 하나로 콘텐츠의 기술분류 속성이 결정될 수 있다. 또한, 실용화 속성은 콘텐츠의 성과물이 실제로 상용화가 되었는지 여부에 대한 정보를 포함할 수 있다. 지역 속성은 콘텐츠가 연구된 지역 정보를 포함할 수 있다. The researcher attributes may include identification information of the researcher who conducted the research on the content. Participating researcher attributes may include identification information of one or more researchers who participated in the study of the content. Additionally, the year attribute may include the year in which research on the content was conducted, the year in which the research on the content was completed, or the year in which the content was completed. The performing organization attribute may include the name of the organization that conducted research on the content. Additionally, the ministry name attribute may include the name of the ministry that requested research on the content. The technical classification attribute may include the technical field in which the content is classified. For example, the technical classification attribute of the content can be determined as one of artificial intelligence, software solutions, internet solutions, SoC, embedded software, robot control technology, radiology, vehicle intelligence technology, bioinformatics, database, and security technology. Additionally, the commercialization attribute may include information about whether the outcome of the content has actually been commercialized. Regional attributes may include information about the region where the content was studied.

또한, 콘텐츠는 부가 정보를 포함할 수 있다. 상기 부가 정보는 메타 데이터와 같은 역할을 수행할 수 있다. 상기 부가 정보는, 콘텐츠의 조회수, 게시 날짜(또는 발표 날짜), 타 콘텐츠와의 관계 정보 등을 포함할 수 있다. 여기서, 타 콘텐츠와의 관계 정보는, 콘텐츠와 성과 관계에 있거나 콘텐츠로부터 파생된 타 콘텐츠의 식별정보를 포함할 수 있다. 예컨대, 제1 콘텐츠에 대한 성과 관계 콘텐츠로서 제2 콘텐츠가 설정될 수 있으며, 이 경우 제1 콘텐츠에 포함된 관계 정보에는 제2 콘텐츠의 식별정보가 포함될 수 있다. 상기 성과 관계는 연구를 수행한 콘텐츠와 그 콘텐츠의 연구 결과로서 나타난 타 콘텐츠와의 관계일 수 있다. 예컨대, 제1 콘텐츠(예컨대, 과제)의 연구 결과로서 제2 콘텐츠(예컨대, 특허)가 발표(또는 출원)된 경우, 제1 콘텐츠와 제2 콘텐츠는 성과 관계가 형성될 수 있다.Additionally, content may include additional information. The additional information may perform the same role as metadata. The additional information may include the number of views of the content, posting date (or announcement date), relationship information with other content, etc. Here, the relationship information with other content may include identification information of other content that has a sexual relationship with the content or is derived from the content. For example, the second content may be set as sexual relationship content with respect to the first content, and in this case, the relationship information included in the first content may include identification information of the second content. The performance relationship may be a relationship between the content on which research was conducted and other content that emerged as a result of research on that content. For example, when second content (eg, patent) is published (or applied for) as a result of research on first content (eg, project), a performance relationship may be formed between the first content and the second content.

상기 사용자 데이터는, 사용자의 식별정보(예컨대, 로그인 아이디), 사용자의 콘텐츠 검색 이력, 사용자의 참여인력으로 기록된 콘텐츠 목록, 사용자가 스크랩한 콘텐츠 목록 등을 포함할 수 있다. The user data may include the user's identification information (eg, login ID), the user's content search history, a content list recorded with the user's participation, a list of content scraped by the user, etc.

콘텐츠 추천 장치(20)는 사용자가 활용할 수 있거나 사용자가 선호할 것으로 예상되는 하나 이상의 콘텐츠를 선별하고, 선별된 하나 이상의 콘텐츠를 추천 콘텐츠로서 사용자 단말(10)로 전송할 수 있다. 콘텐츠 추천 장치(20)는 하이브리드 인공지능 모델을 이용하여 하나 이상의 콘텐츠를 선별할 수 있다. 여기서, 하이브리드 인공지능 모델은, 딥 러닝 신경망과 콘텐츠 추천 알고리즘과 필터링 알고리즘이 통합된 인공지능 모델일 수 있다. 콘텐츠 추천 장치(20)는 데이터를 수집하고 수집한 데이터를 학습에 적합한 형태로 가공 처리한 후에, 가공 처리된 데이터를 하이브리드 인공지능 모델에 적용하여 하이브리드 인공지능 모델을 학습할 수 있다. The content recommendation device 20 may select one or more contents that the user can use or that the user is expected to prefer, and transmit the one or more selected contents to the user terminal 10 as recommended content. The content recommendation device 20 can select one or more content using a hybrid artificial intelligence model. Here, the hybrid artificial intelligence model may be an artificial intelligence model that integrates a deep learning neural network, a content recommendation algorithm, and a filtering algorithm. The content recommendation device 20 can collect data, process the collected data into a form suitable for learning, and then apply the processed data to the hybrid artificial intelligence model to learn the hybrid artificial intelligence model.

이하, 도 2 내지 도 9를 참조하여, 인공지능 모델이 구축되는 방법에 대해서 설명한다. Hereinafter, with reference to FIGS. 2 to 9, a method for constructing an artificial intelligence model will be described.

도 2는 본 발명의 다른 실시예에 따른, 인공지능 모델이 구축되는 방법의 순서도이다.Figure 2 is a flowchart of a method for building an artificial intelligence model according to another embodiment of the present invention.

도 2에 도시된 방법의 각 단계는 컴퓨팅 장치에 의해 수행될 수 있다. 다시 말하면, 본 방법의 각 단계는 컴퓨팅 장치의 프로세서에 의해 실행되는 하나 이상의 인스트럭션들로 구현될 수 있다. 본 방법에 포함되는 제1 단계들은 제1 컴퓨팅 장치에 의하여 수행되고, 본 방법의 제2 단계들은 제2 컴퓨팅 장치에 의하여 수행될 수 있다. 이하에서는, 본 방법의 각 단계가 도 1을 참조하여 설명한 콘텐츠 추천 장치(20)에 의해 수행되는 것을 가정하여 설명을 이어가도록 하되, 각 단계의 수행 주체는 단지 예시일 뿐, 본 발명이 이하의 설명에 의해 한정되는 아니며, 설명의 편의를 위해 상기 방법에 포함되는 일부 단계의 동작 주체는 그 기재가 생략될 수도 있다.Each step of the method shown in FIG. 2 may be performed by a computing device. In other words, each step of the method may be implemented as one or more instructions executed by a processor of a computing device. The first steps included in the method may be performed by a first computing device, and the second steps included in the method may be performed by a second computing device. Hereinafter, the description will be continued assuming that each step of the method is performed by the content recommendation device 20 described with reference to FIG. 1. However, the performer of each step is only an example, and the present invention is described below. The description is not limited, and for convenience of description, the description of some steps included in the method may be omitted.

도 2를 참조하면, 콘텐츠 추천 장치(20)는 데이터베이스(30)에 다수의 데이터를 수집할 수 있다(S100). 일 실시예에서, 상기 다수의 데이터에는, 다수의 콘텐츠 및 다수의 사용자 데이터가 포함될 수 있다. Referring to FIG. 2, the content recommendation device 20 may collect a plurality of data in the database 30 (S100). In one embodiment, the plurality of data may include multiple contents and multiple user data.

이어서, 콘텐츠 추천 장치(20)는 데이터베이스(30)에 포함된, 상기 다수의 데이터를 학습에 적합된 형태로 전처리하여 가공할 수 있다(S200). 일 실시예에서, 콘텐츠 추천 장치(20)는 콘텐츠를 학습에 필요한 하나 이상의 데이터를 포함하는 데이터셋으로 가공 처리하고, 상기 콘텐츠와 연관관계에 있는 타 콘텐츠의 데이터를 확장 데이터로서 획득하고, 콘텐츠 열람 이력을 포함하는 사용자 데이터를 획득할 수 있다. 콘텐츠 추천 장치(20)는 타 콘텐츠의 데이터를 가공 처리할 수 있고, 또한, 사용자 데이터도 가공 처리할 수 있다. 여기서, 데이터를 벡터로 변환함으로써, 데이터의 가공처리가 진행될 수 있다. 단계 S200에 대해서는 도 3 내지 도 7을 참조한 설명을 통해서 자세하게 후술하기로 한다.Next, the content recommendation device 20 may preprocess and process the plurality of data included in the database 30 into a form suitable for learning (S200). In one embodiment, the content recommendation device 20 processes the content into a dataset containing one or more data necessary for learning, obtains data of other content that is related to the content as expansion data, and views the content. User data including history can be obtained. The content recommendation device 20 can process data of other content and can also process user data. Here, by converting the data into vectors, the data can be processed. Step S200 will be described in detail later through explanation with reference to FIGS. 3 to 7.

다음으로, 콘텐츠 추천 장치(20)는 가공 처리된 데이터, 즉 데이터셋, 확장 데이터 및 사용자 데이터를 인공지능 모델에 적용하여, 상기 인공지능 모델을 학습시킴으로써, 콘텐츠를 추천하기 위한 인공지능 모델을 구축할 수 있다(S300). 상기 인공지능 모델은 딥러닝 신경망과 콘텐츠를 추천하기 위한 알고리즘이 혼합된 하이브리드형의 인공지능 모델일 수 있다. 인공지능 모델이 구축되는 단계 S300에 대해서는 도 8 및 도 9를 참조하여 더욱 자세하게 설명한다.Next, the content recommendation device 20 constructs an artificial intelligence model for recommending content by applying the processed data, i.e., dataset, extended data, and user data, to an artificial intelligence model and learning the artificial intelligence model. You can do it (S300). The artificial intelligence model may be a hybrid artificial intelligence model that combines a deep learning neural network and an algorithm for recommending content. Step S300 in which the artificial intelligence model is built will be described in more detail with reference to FIGS. 8 and 9.

이하, 도 3 내지 도 7을 참조하여, 도 2의 단계 S200에 대해서 더욱 구체적으로 설명한다.Hereinafter, with reference to FIGS. 3 to 7, step S200 of FIG. 2 will be described in more detail.

도 3을 참조하면, 콘텐츠 추천 장치(20)는 수집한 콘텐츠로부터 텍스트를 추출하고, 그 텍스트를 제1 데이터로서 가공 처리할 수 있다(S201). 콘텐츠에 기재된 전체 텍스트 중에서 사전에 설정된 구역에 위치하는 텍스트가 추출될 수 있다. 예를 들어, 콘텐츠의 요약 또는 서지 사항에서 기재된 텍스트가 추출되어, 제1 데이터로서 가공 처리될 수 있다. 텍스트 분석을 위해서, 공지된 starspace 라이브러리가 사용될 수 있다. 일 실시예서, 콘텐츠 추천 장치(20)는 상기 추출한 텍스트를 밀집 벡터(dense vector)로 가공 처리하여 임베딩할 수 있다. 즉, 제1 데이터는 밀집 벡터 형태로 임베딩될 수 있다. Referring to FIG. 3, the content recommendation device 20 can extract text from the collected content and process the text as first data (S201). Text located in a preset area may be extracted from the entire text written in the content. For example, text described in a summary of content or bibliography may be extracted and processed as first data. For text analysis, the known starspace library can be used. In one embodiment, the content recommendation device 20 may process the extracted text into a dense vector and embed it. That is, the first data may be embedded in the form of a dense vector.

이어서, 콘텐츠 추천 장치(20)는 콘텐츠에 포함된 하나 이상의 속성을 추출하고, 추출된 하나 이상의 속성을 제2 데이터로 가공 처리할 수 있다(S203). 여기서, 콘텐츠는 유형 속성, 연구책임자 속성, 참여연구원 속성, 년도 속성, 수행기관 속성, 부처명 속성, 기술분류 속성, 실용화 속성, 지역 속성 등 중에서 하나 이상이 속성을 포함하고, 콘텐츠 추천 장치(20)는 이러한 하나 이상의 속성을 제2 데이터로 가공 처리할 수 있다. 콘텐츠에 임계개수 이상의 속성이 포함되어 있는 경우, 콘텐츠 추천 장치(20)는 사전에 설정된 속성 목록에 기록된 속성들만을 콘텐츠에서 추출하여 제2 데이터로 가공 처리할 수 있다. 일 실시예서, 콘텐츠 추천 장치(20)는 상기 추출한 하나 이상의 속성을 희소 벡터(sparse vector)로 가공 처리하여 임베딩할 수 있다. 즉, 제2 데이터는 희소 벡터 형태로 임베딩될 수 있다. Next, the content recommendation device 20 may extract one or more attributes included in the content and process the one or more extracted attributes into second data (S203). Here, the content includes one or more attributes among type attributes, researcher attributes, participating researcher attributes, year attributes, executing agency attributes, ministry name attributes, technology classification attributes, practicalization attributes, regional attributes, etc., and the content recommendation device 20 Can process one or more of these properties into second data. If the content contains more than a critical number of attributes, the content recommendation device 20 may extract only the attributes recorded in a preset attribute list from the content and process them into second data. In one embodiment, the content recommendation device 20 may process the extracted one or more attributes into a sparse vector and embed the extracted properties. That is, the second data may be embedded in the form of a sparse vector.

다음으로, 콘텐츠 추천 장치(20)는 콘텐츠에서 부가 정보를 추출하여, 부가 정보를 제3 데이터로 가공할 수 있다(S205). 일 실시예서, 콘텐츠 추천 장치(20)는 상기 부가 정보를 밀집 벡터 또는 희소 벡터로 가공 처리하여 임베딩할 수 있다. 즉, 제3 데이터도 벡터 형태로 표현될 수 있다. Next, the content recommendation device 20 may extract additional information from the content and process the additional information into third data (S205). In one embodiment, the content recommendation device 20 may process the additional information into dense vectors or sparse vectors and embed them. That is, third data can also be expressed in vector form.

상기 부가 정보는 콘텐츠의 조회수, 게시 날짜 또는 발표 날짜, 타 콘텐츠와의 관계 정보를 포함할 수 있는데, 콘텐츠 추천 장치(20)는 상기 게시 날짜 또는 발표 날짜를 기초로 콘텐츠의 최신성을 나타내는 제1 수치를 결정하고, 상기 조회수를 기초로 콘텐츠의 인기도를 나타내는 제2 수치를 결정하여, 상기 제3 데이터에 포함시킬 수 있다. 상기 제1 수치와 제2 수치는 소정의 범위에 해당하는 실수로서, 숫자가 클수록 인기도가 높거나 최근의 콘텐츠인 것을 의미할 수 있다. 몇몇 실시예에서, 제1 수치와 제2 수치는 로그자(Logarithmic Scale)를 이용하여 계산할 수 있다.The additional information may include the number of views of the content, the posting date or announcement date, and relationship information with other content, and the content recommendation device 20 may provide a first information indicating the latestness of the content based on the posting date or announcement date. A numerical value may be determined, and a second numerical value indicating the popularity of the content may be determined based on the number of views and included in the third data. The first and second numbers are real numbers that fall within a predetermined range, and a larger number may indicate more popular or more recent content. In some embodiments, the first numerical value and the second numerical value may be calculated using a logarithmic scale.

몇몇 실시예에서, 제1 수치에 제1 가중치를 적용하고, 제2 수치에 제2 가중치를 적용한 후, 각각에 가중치가 적용된 제1 수치와 제2 수치를 합산할 수도 있다. 또한, 제1 가중치와 제2 가중치는 콘텐츠 유형에 따라 동적으로 변경될 수 있다. 예컨대, 제1 유형의 콘텐츠에 제1 가중치가 'a'로 적용되고 제2 가중치가 'b'로 적용되고, 제2 유형의 콘텐츠에 제1 가중치가 'c'로 적용되고 제2 가중치가 'd'로 적용될 수 있다. 이러한 제1 가중치와 제2 가중치는 실험을 통해서 획득될 수도 있다.In some embodiments, a first weight may be applied to the first value, a second weight may be applied to the second value, and then the first and second weighted values may be added together. Additionally, the first weight and the second weight may be dynamically changed depending on the content type. For example, the first weight is applied as 'a' and the second weight is applied as 'b' to the first type of content, and the first weight is applied as 'c' and the second weight is applied to the second type of content as 'c'. It can be applied as d'. These first and second weights may be obtained through experiment.

도 4는 가중치 조절을 위한 실험을 예시하는 도면이다. 도 4의 위쪽의 그래프는 시간에 따른 최신성을 나타내는 값들 중에서 최신의 시간값, 중간의 시간값, 오래된 시간값 각각의 중요 정도를 조절하기 위해서 제1 가중치가 상이하게 적용되는 것을 예시하고 있다. 또한, 도 4의 아래쪽의 그래프는, 제1 수치와 제2 수치가 결합된 값을 예시하고 있다. Figure 4 is a diagram illustrating an experiment for weight adjustment. The upper graph of FIG. 4 illustrates that the first weight is applied differently to adjust the importance of the latest time value, the middle time value, and the old time value among the values representing recency over time. Additionally, the graph at the bottom of FIG. 4 illustrates a value in which the first and second numerical values are combined.

다시 도 3을 참조하면, 콘텐츠 추천 장치(20)는 제1 데이터, 제2 데이터 및 제3 데이터를 결합함으로써, 콘텐츠를 데이터셋으로 가공 처리할 수 있다(S207). Referring again to FIG. 3, the content recommendation device 20 can process the content into a dataset by combining the first data, second data, and third data (S207).

도 5는 데이터셋을 예시하는 도면으로서, 제2 데이터, 제1 데이터 및 제3 데이터가 결합되어 데이터셋을 구성하고 있다.Figure 5 is a diagram illustrating a dataset, in which second data, first data, and third data are combined to form a dataset.

이어서, 콘텐츠 추천 장치(20)는 상기 콘텐츠와 연관 관계에 있는 타 콘텐츠를 식별하고, 상기 식별된 타 콘텐츠를 확장 데이터로서 획득하고, 그 획득된 타 콘텐츠의 데이터를 가공 처리할 수 있다(S209). 일 실시예에서, 콘텐츠 추천 장치(20)는 상기 콘텐츠의 참여인력으로 기재된 사용자를 식별하고, 상기 식별된 사용자가 타 콘텐츠의 참여인력으로 등재되어 있는지 여부를 판정하고, 판정 결과 타 콘텐츠의 참여인력으로 등재되어 있으면 상기 타 콘텐츠를 데이터베이스(30)에서 획득할 수 있다. 즉, 콘텐츠 추천 장치(20)는 각각의 콘텐츠에 기재된 참여인력 정보를 이용하여, 사용자가 상기 콘텐츠 이외에 타 콘텐츠에도 참여인력으로 기록되어 있는지 여부를 판정하여 타 콘텐츠에 기록되어 있으면, 상기 타 콘텐츠를 데이터베이스(30)에서 획득할 수 있다. 이어서, 콘텐츠 추천 장치(20)는 상기 타 콘텐츠의 데이터를 가공 처리할 수 있다. 이때, 타 콘텐츠를 상술한 제1 데이터, 제2 데이터 및 제3 데이터를 포함하는 데이터셋으로 가공 처리할 수 있다.Subsequently, the content recommendation device 20 may identify other content that is related to the content, obtain the identified other content as extended data, and process the acquired data of the other content (S209). . In one embodiment, the content recommendation device 20 identifies a user listed as a participant in the content, determines whether the identified user is registered as a participant in other content, and determines whether the user is a participant in other content as a result of the determination. If registered, the other content can be obtained from the database 30. That is, the content recommendation device 20 uses the participant information recorded in each content to determine whether the user is recorded as a participant in other content in addition to the content, and if the user is recorded as a participant in other content, the content recommendation device 20 selects the other content. It can be obtained from the database 30. Subsequently, the content recommendation device 20 may process data of the other content. At this time, other content can be processed into a dataset including the above-described first data, second data, and third data.

도 6는 참여인력에 따른 콘텐츠들의 연결 관계를 예시하는 도면이다. Figure 6 is a diagram illustrating the connection relationship between contents according to participating personnel.

도 6에 예시된 바와 같아. 제1 콘텐츠의 참여인력은 제1 사용자(user1)와 제2 사용자(user2)이고, 이에 따라, 제1 콘텐츠는 제2 사용자가 참여한 제2 콘텐츠와 연결 관계가 형성되고, 제1 사용자가 참여한 제3 콘텐츠와 제4 콘텐츠와도 연결 관계가 형성될 수 있다. 이에 따라, 제1 콘텐츠의 데이터셋 이외에, 제2 콘텐츠의 데이터셋, 제3 콘텐츠의 데이터셋 및 제4 콘텐츠의 데이터셋이 함께 가공 처리되어, 학습되는 콘텐츠의 범위가 확장될 수 있다. As illustrated in Figure 6. The participants of the first content are the first user (user1) and the second user (user2). Accordingly, the first content is connected to the second content in which the second user participated, and the first content in which the first user participated is formed. A connection can also be formed between 3 content and 4th content. Accordingly, in addition to the data set of the first content, the data set of the second content, the data set of the third content, and the data set of the fourth content may be processed together, thereby expanding the range of content to be learned.

다른 실시예에서, 콘텐츠 추천 장치(20)는 상기 콘텐츠의 대한 성과를 나타내는 타 콘텐츠를 더 획득하고, 그 타 콘텐츠를 가공 처리한 데이터셋을 확장 데이터로서 획득할 수 있다. 구체적으로, 콘텐츠 추천 장치(20)는 상기 콘텐츠와 성과로서 관련되는 또 다른 콘텐츠가 존재하는지 여부를 판정할 수 있다. 이때, 콘텐츠 추천 장치(20)는 상기 콘텐츠의 부가정보를 이용하여, 콘텐츠와 성과로서 관련되는 또 다른 콘텐츠가 존재하는지 여부를 판정할 수 있다. 판정 결과 성과로서 관련된 또 다른 콘텐츠가 존재하면, 콘텐츠 추천 장치(20)는 상기 또 다른 콘텐츠를 데이터베이스(30)에서 획득하고, 상기 획득된 또 다른 콘텐츠를 상술한 제1 데이터, 제2 데이터 및 제3 데이터를 포함하는 데이터셋으로 가공 처리하고, 가공 처리된 또 다른 콘텐츠의 데이터셋을 확장 데이터로서 획득할 수 있다. In another embodiment, the content recommendation device 20 may further acquire other content indicating the performance of the content, and obtain a dataset obtained by processing the other content as extended data. Specifically, the content recommendation device 20 may determine whether there is another content related to the content and performance. At this time, the content recommendation device 20 may use the additional information of the content to determine whether there is another content related to the content and performance. If there is another related content as a result of the determination, the content recommendation device 20 obtains the other content from the database 30, and uses the obtained another content to include the first data, second data and second data described above. You can process a dataset containing 3 data, and obtain a dataset of another processed content as extended data.

도 7은 성과 관계에 따른 콘텐츠들의 연결 관계를 예시하는 도면이다. Figure 7 is a diagram illustrating the connection relationship between contents according to performance relationship.

도 7에 예시된 바와 같아. 제1 콘텐츠는 성과 관련 콘텐츠로서 제5 콘텐츠의 식별정보(#5)와 제6 콘텐츠의 식별정보(#6)가 기록되고, 이에 따라 제1 콘텐츠는 제5 콘텐츠와 제6 콘텐츠 각각과 연결 관계가 형성된다. 이러한 연결 관계에 따라, 제1 콘텐츠의 데이터셋 이외에, 제5 콘텐츠의 데이터셋 및 제5 콘텐츠의 데이터셋이 함께 가공 처리되어, 학습되는 콘텐츠의 범위가 확장될 수 있다. As illustrated in Figure 7. The first content is performance-related content, and the identification information (#5) of the fifth content and the identification information (#6) of the sixth content are recorded, and accordingly, the first content has a connection relationship with each of the fifth content and the sixth content. is formed. According to this connection relationship, in addition to the dataset of the first content, the dataset of the fifth content and the dataset of the fifth content may be processed together, thereby expanding the range of content to be learned.

다시 도 3을 참조하면, 콘텐츠 추천 장치(20)는 수집된 다수의 데이터로부터 다수의 사용자 데이터를 획득하고 그 획득된 사용자 데이터를 가공 처리할 수 있다(S211). 상기 사용자 데이터도 벡터로 임베딩될 수 있다. 이때, 벡터는 밀집 벡터 또는 희소 벡터일 수 있다. 일 실시예에서, 콘텐츠 추천 장치(20)는 사용자가 열람한 콘텐츠 목록, 사용자의 검색 이력, 사용자가 스크랩한 콘텐츠 목록, 사용자가 참여인력으로 등재된 콘텐츠 목록, 사용자와 협업한 타 사용자 목록 중에서 하나 이상을 상기 사용자 데이터로서 획득할 수 있다. 여기서, 협업한 타 사용자는, 상기 사용자가 동일한 콘텐츠에 참여인력으로 등재된 타 사용자일 수 있으며, 콘텐츠 추천 장치(20)는 상기 사용자가 참여인력으로 등재된 콘텐츠 목록에서 콘텐츠를 식별하고, 그 식별한 콘텐츠에서 참여인력으로 등재된 하나 이상의 타 사용자의 식별정보를 취합하여 상기 타 사용자 목록을 생성할 수 있다. 예컨대, 제1 사용자가 참여한 콘텐츠 목록에 제1 콘텐츠의 식별정보, 제3 콘텐츠의 식별정보 및 제4 콘텐츠의 식별정보가 기록되고, 제1 콘텐츠의 참여인력에 제1 사용자와 제2 사용자가 등재되고, 제3 콘텐츠의 참여인력에 제1 사용자와 제3 사용자가 등재되고, 제4 콘텐츠의 참여인력에 제1 사용자와 제4 사용자 등재된 경우를 가정하자. 이 경우, 콘텐츠 추천 장치(20)는 제2 사용자, 제3 사용자 및 제4 사용자를 제1 사용자와 협업한 타 사용자 목록에 기록할 수 있다. Referring again to FIG. 3, the content recommendation device 20 may obtain a plurality of user data from a plurality of collected data and process the obtained user data (S211). The user data may also be embedded as a vector. At this time, the vector may be a dense vector or a sparse vector. In one embodiment, the content recommendation device 20 selects one of a list of content viewed by the user, a search history of the user, a list of content scraped by the user, a list of content in which the user is registered as a participant, and a list of other users who have collaborated with the user. The above can be obtained as the user data. Here, the other user who collaborated may be another user registered as a participant in the same content as the user, and the content recommendation device 20 identifies the content in the content list in which the user is registered as a participant, and identifies the content. The list of other users can be created by collecting the identification information of one or more other users registered as participants in one content. For example, the identification information of the first content, the identification information of the third content, and the identification information of the fourth content are recorded in the list of contents in which the first user participated, and the first user and the second user are registered in the participation personnel of the first content. Assume that the first user and the third user are registered in the participation force of the third content, and the first user and the fourth user are registered in the participation force of the fourth content. In this case, the content recommendation device 20 may record the second user, third user, and fourth user in the list of other users who collaborated with the first user.

본 실시예에 따르면, 콘텐츠의 연결 관계에 따라 학습 대상이 되는 콘텐츠의 범위 확장되어, 초기 학습 데이터의 부족을 발생하는 콜드 스타트(cold start) 문제가 예방될 수 있다. 또한, 사용자와 협업한 타 사용자 목록이 가공 처리되어, 인공지능 모델에서 학습되면, 더욱 정확한 콘텐츠를 추천할 수 있고, 더불어 사용자가 선호하는 것으로 예상하는 협업 파트너를 추천할 수 있다. According to this embodiment, the range of content to be learned is expanded according to the connection relationship between the contents, and the cold start problem that causes a lack of initial learning data can be prevented. In addition, when the list of other users who have collaborated with the user is processed and learned by an artificial intelligence model, more accurate content can be recommended, and collaboration partners expected to be preferred by the user can be recommended.

이하, 도 2의 단계 S300에 대해서 도 8 및 도 9를 참조하면 자세히 설명한다.Hereinafter, step S300 of FIG. 2 will be described in detail with reference to FIGS. 8 and 9.

도 8을 참조하면, 콘텐츠 추천 장치(20)는 추천 알고리즘과 딥러닝 신경망이 융합되어 있는 하이브리드 형태의 인공지능 모델을 준비할 수 있다(S301). 상기 준비된 인공지능 모델은 가공 데이터를 입력 데이터로서 입력 받을 수 있으며, 더불어 출력 데이터로서 사용자가 선호할 수 있는 다수의 콘텐츠와 협업 파트너가 출력하도록 내부가 설계될 수 있다.Referring to FIG. 8, the content recommendation device 20 can prepare a hybrid artificial intelligence model in which a recommendation algorithm and a deep learning neural network are fused (S301). The prepared artificial intelligence model can receive processed data as input data, and can be internally designed to output a number of contents that the user may prefer and collaboration partners to output as output data.

이어서, 콘텐츠 추천 장치(20)는 가공된 데이터, 콘텐츠의 데이터셋, 상기 확장 데이터(예컨대, 타 학술 데이터의 데이터셋) 및 상기 사용자 데이터를 상기 인공지능 모델의 학습을 진행할 수 있다(S303). 일 실시예에서, 콘텐츠 추천 장치(20)는 콘텐츠의 유형을 식별하고, 상기 식별된 유형에 상응하는 가중치를 상기 데이터셋에 적용할 수 있다. 예컨대, 콘텐츠의 유형이 과제인 경우, 제3 가중치를 상기 데이터셋에 적용하고, 콘텐츠의 유형이 논문인 경우 제4 가중치를 상기 데이터셋에 적용하며, 콘텐츠의 유형이 특허인 경우 제5 가중치를 상기 데이터셋에 적용할 수 있다. 다수의 가공 데이터가 상기 인공지능 모델에 적용되어 학습이 진행되면, 은닉층에 있는 복수의 가중치가 최적의 값으로 수렴하게 된다.Subsequently, the content recommendation device 20 may train the artificial intelligence model using the processed data, the content dataset, the extended data (eg, a dataset of other academic data), and the user data (S303). In one embodiment, the content recommendation device 20 may identify a type of content and apply a weight corresponding to the identified type to the dataset. For example, if the type of content is a task, the third weight is applied to the dataset, if the type of content is a paper, the fourth weight is applied to the dataset, and if the type of content is a patent, the fifth weight is applied to the dataset. It can be applied to the above dataset. When a large number of processed data are applied to the artificial intelligence model and learning progresses, the plurality of weights in the hidden layer converge to the optimal value.

도 9은 콘텐츠 추천을 위한 인공지능 모델의 기능을 예시하는 도면이다. Figure 9 is a diagram illustrating the function of an artificial intelligence model for content recommendation.

도 9에 따르면, 상기 인공지능 모델은 사용자 선호하는 콘텐츠를 딥 러닝을 통해서 필터링할 수 있고, 또한 사용자가 선호하는 파트너를 딥 러닝을 통해서 필터링할 수 있다. 또한, 인공지능 모델에는 정보의 최신성에 나타내는 제1 수치에 제1 가중치가 적용되고, 콘텐츠의 인기도를 나타내는 제2 수치에 제2 가중치가 적용되어, 사용자가 활용할 수 있는 가치 있는 콘텐츠가 선별될 수 있다.According to Figure 9, the artificial intelligence model can filter the user's preferred content through deep learning, and can also filter the user's preferred partner through deep learning. In addition, in the artificial intelligence model, a first weight is applied to the first number indicating the recency of the information, and a second weight is applied to the second number indicating the popularity of the content, so that valuable content that users can utilize can be selected. there is.

도 10은 본 발명의 또 다른 실시예에 따른, 콘텐츠 추천 방법의 순서도이다.Figure 10 is a flowchart of a content recommendation method according to another embodiment of the present invention.

도 10에 도시된 방법의 각 단계는 컴퓨팅 장치에 의해 수행될 수 있다. 다시 말하면, 본 방법의 각 단계는 컴퓨팅 장치의 프로세서에 의해 실행되는 하나 이상의 인스트럭션들로 구현될 수 있다. 본 방법에 포함되는 제1 단계들은 제1 컴퓨팅 장치에 의하여 수행되고, 본 방법의 제2 단계들은 제2 컴퓨팅 장치에 의하여 수행될 수 있다. 이하에서는, 본 방법의 각 단계가 도 1을 참조하여 설명한 콘텐츠 추천 장치(20)에 의해 수행되는 것을 가정하여 설명을 이어가도록 하되, 각 단계의 수행 주체는 단지 예시일 뿐, 본 발명이 이하의 설명에 의해 한정되는 아니며, 설명의 편의를 위해 상기 방법에 포함되는 일부 단계의 동작 주체는 그 기재가 생략될 수도 있다.Each step of the method shown in FIG. 10 may be performed by a computing device. In other words, each step of the method may be implemented as one or more instructions executed by a processor of a computing device. The first steps included in the method may be performed by a first computing device, and the second steps included in the method may be performed by a second computing device. Hereinafter, the description will be continued assuming that each step of the method is performed by the content recommendation device 20 described with reference to FIG. 1. However, the performer of each step is only an example, and the present invention is described below. The description is not limited, and for convenience of description, the description of some steps included in the method may be omitted.

도 10을 참조하면, 콘텐츠 추천 장치(20)는 사용자 단말(10)의 접속을 감지할 수 있다(S500). 몇몇 실시예에서, 콘텐츠 추천 장치(20)는 사용자 단말(10)이 로그인에 성공한 경우에, 상기 사용자 단말(10)의 접속을 감지할 수 있다.Referring to FIG. 10, the content recommendation device 20 can detect the connection of the user terminal 10 (S500). In some embodiments, the content recommendation device 20 may detect the connection of the user terminal 10 when the user terminal 10 successfully logs in.

이어서, 콘텐츠 추천 장치(20)는 상기 사용자와 관련된 데이터를 획득하고, 상기 획득한 사용자 데이터를 구축된 인공지능 모델에 입력하여, 상기 사용자가 선호하는 것으로 예상하는 하나 이상의 콘텐츠를 선별한 후, 선별된 복수의 콘텐츠를 추천 콘텐츠로서 사용자 단말(10)에게 전송할 수 있다(S600).Subsequently, the content recommendation device 20 acquires data related to the user, inputs the obtained user data into the constructed artificial intelligence model, and selects one or more contents expected to be preferred by the user. A plurality of contents can be transmitted to the user terminal 10 as recommended content (S600).

이하, 도 11 및 도 12를 참조하여, 도 10의 단계 S600에 대해서 자세하게 설명한다.Hereinafter, with reference to FIGS. 11 and 12, step S600 of FIG. 10 will be described in detail.

도 11을 참조하면, 콘텐츠 추천 장치(20)는 사용자를 식별할 수 있다(S601). 일 실시예에서, 콘텐츠 추천 장치(20)는 로그인 아이디를 이용하여 사용자를 식별할 수 있다.Referring to FIG. 11, the content recommendation device 20 can identify the user (S601). In one embodiment, the content recommendation device 20 may identify the user using a login ID.

이어서, 콘텐츠 추천 장치(20)는 상기 사용자의 콘텐츠 열람 이력을 데이터베이스(30)에서 획득할 수 있다(S603). 다음으로, 콘텐츠 추천 장치(20)는 식별한 사용자가 참여인력으로 등록된 콘텐츠 목록을 데이터베이스(30)에서 획득하고, 더불어 사용자의 콘텐츠 검색 이력을 데이터베이스(30)에서 획득할 수 있다(S605). 이어서, 콘텐츠 추천 장치(20)는 사용자가 스크랩한 콘텐츠 목록을 데이터베이스(30)에서 획득하고(S609), 사용자와 협업한 타 사용자 목록을 데이터베이스(30)에서 획득할 수 있다(S611). Subsequently, the content recommendation device 20 may obtain the user's content viewing history from the database 30 (S603). Next, the content recommendation device 20 may obtain a list of content in which the identified user is registered as a participant from the database 30, and may also obtain the user's content search history from the database 30 (S605). Subsequently, the content recommendation device 20 may obtain a list of content scraped by the user from the database 30 (S609) and obtain a list of other users who collaborated with the user from the database 30 (S611).

다음으로, 콘텐츠 추천 장치(20)는 획득한 데이터, 즉, 콘텐츠 열람 이력, 사용자가 참여한 콘텐츠 목록, 검색 이력, 스크랩된 콘텐츠 목록 중에서 하나 이상을 벡터(예컨대, 밀집 벡터 또는 희소 벡터)로 표현하여, 획득한 데이터를 가공 처리할 수 있다. 이어서, 콘텐츠 추천 장치(20)는 획득하여 가공 처리한 데이터를 구축된 인공지능 모델에 입력하여, 그 인공지능 모델에서 출력되는 다수의 콘텐츠와 다수의 협업 파트너(즉, 타 사용자의 식별정보)를 획득할 수 있다(S613). 상기 다수의 콘텐츠는 각 유형에 따라 구분되어 출력될 수 있다. 예컨대, 다수의 과제, 다수의 논문 및 다수의 특허가 상기 인공지능 모델을 통해서 출력될 수 있다. 부연하면, 학습된 인공지능 모델에 의해서, 사용자가 선호할 것으로 예상되는 상기 다수의 콘텐츠는 각 유형에 따라 구분되어 출력될 수 있으며, 더불어 사용자가 선호할 것으로 예상된 다수의 협업 파트너가 출력될 수 있다.Next, the content recommendation device 20 expresses one or more of the acquired data, that is, the content viewing history, the content list in which the user participated, the search history, and the scraped content list, as a vector (e.g., a dense vector or a sparse vector). , the acquired data can be processed. Subsequently, the content recommendation device 20 inputs the acquired and processed data into the constructed artificial intelligence model, and selects a plurality of contents and a plurality of collaboration partners (i.e., identification information of other users) output from the artificial intelligence model. Can be obtained (S613). The plurality of contents may be output separately according to each type. For example, multiple assignments, multiple papers, and multiple patents can be output through the artificial intelligence model. In other words, by the learned artificial intelligence model, the plurality of contents expected to be preferred by the user can be output separately according to each type, and in addition, a plurality of collaboration partners expected to be preferred by the user can be output. there is.

이어서, 콘텐츠 추천 장치(20)는 인공지능 모델을 통해서 획득된 각각의 콘텐츠에 대한 선호도 점수를 계산하고, 선호도 점수를 기준으로 각각의 콘텐츠를 내림차순으로 정렬할 수 있다(S615). 일 실시예에서, 콘텐츠 추천 장치(20)는 콘텐츠의 유형에 따라, 콘텐츠를 내림차순으로 정렬할 수 있다. Subsequently, the content recommendation device 20 may calculate a preference score for each content obtained through an artificial intelligence model and sort each content in descending order based on the preference score (S615). In one embodiment, the content recommendation device 20 may sort content in descending order according to the type of content.

일 실시예에서, 콘텐츠 추천 장치(20)는 콘텐츠의 최신성 정도를 제1 수치 및 콘텐츠의 인기도를 나타내는 제2 수치를 합산하여, 각 콘텐츠의 선호도 점수를 계산할 수 있다. 콘텐츠 추천 장치(20)는 콘텐츠의 게시일 또는 발표일을 데이터베이스(30)에서 식별하고, 게시일 또는 발표일에 기초하여 콘텐츠의 제1 수치를 결정할 수 있다. 게시일 또는 발표일이 최근일수록 제1 수치는 높아질 수 있다. 콘텐츠 추천 장치(20)는 콘텐츠의 조회수를 데이터베이스(30)에서 식별하고, 그 조회수에 기초하여 콘텐츠의 제2 수치를 결정할 수 있다. 제2 수치는 조회수에 비례할 수 있다. 몇몇 실시예에서, 상기 제1 수치에 제1 가중치가 적용되고, 상기 제2 수치에 제2 가중치가 적용되어, 제1 수치와 제2 수치가 합산되어 콘텐츠의 선호도 점수가 결정될 수 있다. In one embodiment, the content recommendation device 20 may calculate a preference score for each content by adding a first number indicating the degree of recency of the content and a second number indicating the popularity of the content. The content recommendation device 20 may identify the posting date or announcement date of the content in the database 30 and determine the first numerical value of the content based on the posting date or announcement date. The more recent the publication or announcement date, the higher the first figure may be. The content recommendation device 20 may identify the number of views of the content in the database 30 and determine a second value of the content based on the number of views. The second number may be proportional to the number of views. In some embodiments, a first weight may be applied to the first value, a second weight may be applied to the second value, and the first and second values may be added to determine the preference score of the content.

또한, 콘텐츠 추천 장치(20)는 인공지능 모델을 통해서 획득된 다수의 협업 파트너에 대한 선호도 점수를 계산할 수 있다. 일 실시예에서, 콘텐츠 추천 장치(20)는 협업 파트너가 참여인력으로 등재된 콘텐츠(이하, '협업 파트너 콘텐츠'라고 지칭함)의 최신성을 나타내는 제3 수치와 협업 파트너 콘텐츠의 인기도를 나타내는 제4 수치를 가중 합산하여, 각 협업 파트너의 선호도를 점수를 산출할 수 있다. 이어서, 콘텐츠 추천 장치(20)는 선호도 점수를 기준으로 협업 파트너들을 내림차순으로 정렬할 수 있다.Additionally, the content recommendation device 20 can calculate preference scores for multiple collaboration partners obtained through an artificial intelligence model. In one embodiment, the content recommendation device 20 provides a third number indicating the recency of the content in which the collaboration partner is registered as a participant (hereinafter referred to as 'collaboration partner content') and a fourth value indicating the popularity of the collaboration partner content. By weighting and summing the numbers, a score can be calculated for the preference of each collaboration partner. Subsequently, the content recommendation device 20 may sort collaboration partners in descending order based on preference scores.

다음으로, 콘텐츠 추천 장치(20)는 일정 순위 안에 드는 유형별 콘텐츠를 선별하고, 그 선별된 복수의 콘텐츠를 사용자 단말(10)로 추천할 수 있다(S617). 또한, 콘텐츠 추천 장치(20)는 일정 순위 안에 드는 협업 파트너를 선별하고, 그 선별된 복수의 협업 파트너를 사용자 단말(10)로 추천할 수 있다. 이때, 콘텐츠 추천 장치(20)는 콘텐츠 유형별로 추천된 콘텐츠를 열람할 수 있으며, 더불어 협업 파트너를 열람할 수 있는 웹 페이지를 사용자 단말(10)로 전송할 수 있다.Next, the content recommendation device 20 may select content by type that falls within a certain ranking and recommend the selected plurality of content to the user terminal 10 (S617). Additionally, the content recommendation device 20 may select collaboration partners within a certain ranking and recommend the selected plurality of collaboration partners to the user terminal 10 . At this time, the content recommendation device 20 can view recommended content by content type, and can also transmit a web page through which collaboration partners can be viewed to the user terminal 10.

도 12는 추천 콘텐츠들과 협업 파트너를 디스플레이하는 웹 페이지를 예시하는 도면이다. 12 is a diagram illustrating a web page displaying recommended content and collaboration partners.

도 12에 예시된 바와 같이, 사용자 단말(10)은 콘텐츠의 유형, 예컨대, 과제, 논문, 특허별 추천 목록을 수신할 수 있으며, 또한 추천되는 협업 파트너 목록을 수신할 수 있다. 사용자는 웹 페이지에서 과제, 논문, 특허, 협업 파트너 중 어느 하나를 선택함으로써, 추천 정보를 확인할 수 있다.As illustrated in FIG. 12 , the user terminal 10 may receive a list of recommendations by type of content, such as assignments, papers, and patents, and may also receive a list of recommended collaboration partners. Users can check recommended information by selecting one of assignments, papers, patents, and collaboration partners on the web page.

본 실시예에 따르면, 인공지능 모델을 이용하여 학술 관련 콘텐츠와 협업 파트너를 사용자에게 추천하여, 콘텐츠 활용을 극대화하고, 파트너 선정 과정에서의 편의성을 향상시킬 수 있다.According to this embodiment, academic-related content and collaboration partners can be recommended to users using an artificial intelligence model, thereby maximizing content utilization and improving convenience in the partner selection process.

이하, 몇몇 실시예들에 따른 예시적인 컴퓨팅 장치의 하드웨어 구성을 도 13을 참조하여 설명하기로 한다.Hereinafter, the hardware configuration of an example computing device according to some embodiments will be described with reference to FIG. 13.

도 13은 다양한 실시예에서 컴퓨팅 장치를 구현할 수 있는 예시적인 하드웨어 구성도이다. 본 실시예에 따른 컴퓨팅 장치(1000)는 하나 이상의 프로세서(1100), 시스템 버스(1600), 네트워크 인터페이스(1200), 프로세서(1100)에 의하여 수행되는 컴퓨터 프로그램(1500)을 로드(load)하는 메모리(1400)와, 컴퓨터 프로그램(1500)을 저장하는 스토리지(1300)를 포함할 수 있다. 도 13에는 실시예와 관련 있는 구성요소들 만이 도시되어 있다. 따라서, 본 명세서의 실시예들이 속한 기술분야의 통상의 기술자라면 도 13에 도시된 구성요소들 외에 다른 범용적인 구성 요소들이 더 포함될 수 있음을 알 수 있다.Figure 13 is an example hardware configuration diagram that can implement a computing device in various embodiments. The computing device 1000 according to this embodiment includes one or more processors 1100, a system bus 1600, a network interface 1200, and a memory that loads a computer program 1500 executed by the processor 1100. It may include (1400) and a storage (1300) for storing a computer program (1500). In Figure 13, only components related to the embodiment are shown. Accordingly, a person skilled in the art to which the embodiments of the present specification pertain can recognize that other general-purpose components other than those shown in FIG. 13 may be further included.

프로세서(1100)는 컴퓨팅 장치(1000)의 각 구성의 전반적인 동작을 제어할 수 있다. 프로세서(1100)는 CPU(Central Processing Unit), MPU(Micro Processor Unit), MCU(Micro Controller Unit), GPU(Graphic Processing Unit) 또는 본 명세서의 기술 분야에 잘 알려진 임의의 형태의 프로세서 중 적어도 하나를 포함하여 구성될 수 있다. 또한, 프로세서(1100)는 다양한 실시예들에 따른 방법/동작을 실행하기 위한 적어도 하나의 애플리케이션 또는 프로그램에 대한 연산을 수행할 수 있다. 컴퓨팅 장치(1000)는 둘 이상의 프로세서를 구비할 수 있다.The processor 1100 may control the overall operation of each component of the computing device 1000. The processor 1100 includes at least one of a Central Processing Unit (CPU), Micro Processor Unit (MPU), Micro Controller Unit (MCU), Graphic Processing Unit (GPU), or any type of processor well known in the art of the present specification. It can be configured to include. Additionally, the processor 1100 may perform operations on at least one application or program to execute methods/operations according to various embodiments. Computing device 1000 may include two or more processors.

메모리(1400)는 각종 데이터, 명령 및/또는 정보를 저장한다. 메모리(1400)는 본 명세서의 다양한 실시예들에 따른 방법/동작들을 실행하기 위하여 스토리지(1300)로부터 하나 이상의 컴퓨터 프로그램(1500)을 로드(load) 할 수 있다. 메모리(1400)의 예시는 RAM이 될 수 있으나, 이에 한정되는 것은 아니다. The memory 1400 stores various data, commands and/or information. The memory 1400 may load one or more computer programs 1500 from the storage 1300 to execute methods/operations according to various embodiments of the present specification. An example of the memory 1400 may be RAM, but is not limited thereto.

시스템 버스(1600)는 컴퓨팅 장치(1000)의 구성 요소 간 통신 기능을 제공한다. 상기 버스는 주소 버스(Address Bus), 데이터 버스(Data Bus) 및 제어 버스(Control Bus) 등 다양한 형태의 버스로 구현될 수 있다. 네트워크 인터페이스(1200)는 네트워크(40)와 연결할 수 있다. 스토리지(1300)는 하나 이상의 컴퓨터 프로그램(1500)을 비임시적으로 저장할 수 있다. 스토리지(1300)는 플래시 메모리 등과 같은 비휘발성 메모리, 하드 디스크, 착탈형 디스크, 또는 본 명세서의 실시예들이 속하는 기술 분야에서 잘 알려진 임의의 형태의 컴퓨터로 읽을 수 있는 기록 매체를 포함하여 구성될 수 있다. The system bus 1600 provides communication functions between components of the computing device 1000. The bus may be implemented as various types of buses, such as an address bus, data bus, and control bus. The network interface 1200 can be connected to the network 40. Storage 1300 may non-temporarily store one or more computer programs 1500. The storage 1300 may be configured to include non-volatile memory such as flash memory, a hard disk, a removable disk, or any type of computer-readable recording medium well known in the technical field to which the embodiments of the present specification pertain. .

컴퓨터 프로그램(1500)은 본 명세서의 다양한 실시예들에 따른 방법/동작들이 구현된 하나 이상의 인스트럭션들(instructions)을 포함할 수 있다. 컴퓨터 프로그램(1500)이 메모리(1400)에 로드 되면, 프로세서(1100)는 상기 하나 이상의 인스트럭션들을 실행시킴으로써 본 명세서의 다양한 실시예들에 따른 방법/동작들을 수행할 수 있다. 컴퓨터 프로그램(1500)은, 도 2 내지 도 참조하여 설명한 방법을 위한 인스트럭션들을 포함할 수 있다. The computer program 1500 may include one or more instructions implementing methods/operations according to various embodiments of the present specification. When the computer program 1500 is loaded into the memory 1400, the processor 1100 can perform methods/operations according to various embodiments of the present specification by executing the one or more instructions. The computer program 1500 may include instructions for the method described with reference to FIGS. 2 to 2 .

일 실시예에서, 상기 컴퓨터 프로그램(1500)은 콘텐츠를 학습에 필요한 하나 이상의 데이터를 포함하는 제1 데이터셋으로 가공 처리하는 동작과, 상기 콘텐츠와 연관관계에 있는 타 콘텐츠의 제2 데이터셋을 확장 데이터로서 획득하는 동작과, 콘텐츠 열람 이력을 포함하는 사용자 데이터를 획득하는 동작과,상기 제1 데이터셋, 상기 제2 데이터셋 및 상기 사용자 데이터를 콘텐츠 추천을 위한 인공지능 모델에 적용하여, 상기 인공지능 모델을 학습시키는 동작을 수행하기 위한 인스트럭션들을 포함할 수 있다.In one embodiment, the computer program 1500 processes content into a first dataset containing one or more data necessary for learning, and expands a second dataset of other content that is related to the content. An operation of acquiring data as data, an operation of acquiring user data including content viewing history, and applying the first dataset, the second dataset, and the user data to an artificial intelligence model for content recommendation, and applying the artificial intelligence model for content recommendation. It may include instructions for performing an operation to train an intelligent model.

다른 실시예에서, 상기 컴퓨터 프로그램(1500)은 사용자의 접속을 감지하는 동작과, 상기 사용자의 콘텐츠 열람 이력과 상기 사용자가 참여인력으로 기록된 하나 이상의 콘텐츠의 데이터를 획득하는 동작과, 상기 획득한 콘텐츠 열람 이력과 상기 하나 이상의 콘텐츠의 데이터를 기 구축된 인공지능 모델에 입력하여, 상기 사용자가 선호하는 하나 이상의 콘텐츠를 선별하는 동작과, 상기 선별한 복수의 콘텐츠를 사용자에게 추천하는 동작을 수행하기 위한 인스트럭션들을 포함할 수 있다. In another embodiment, the computer program 1500 includes an operation of detecting a user's connection, an operation of obtaining the user's content viewing history and data of one or more contents in which the user is recorded as a participant, and the obtained data. Inputting content viewing history and data of the one or more contents into a pre-built artificial intelligence model to select one or more contents preferred by the user and recommending the selected plurality of contents to the user It can include instructions for

지금까지 도 1 내지 도 13을 참조하여 본 발명의 다양한 실시예들 및 그 실시예들에 따른 효과들을 언급하였다. 본 발명의 기술적 사상에 따른 효과들은 이상에서 언급한 효과들로 제한되지 않으며, 언급되지 않은 또 다른 효과들은 아래의 기재로부터 통상의 기술자에게 명확하게 이해될 수 있을 것이다.So far, various embodiments of the present invention and effects according to the embodiments have been mentioned with reference to FIGS. 1 to 13. The effects according to the technical idea of the present invention are not limited to the effects mentioned above, and other effects not mentioned can be clearly understood by those skilled in the art from the description below.

지금까지 도 1 내지 도 13을 참조하여 설명된 본 발명의 기술적 사상은 컴퓨터가 읽을 수 있는 매체 상에 컴퓨터가 읽을 수 있는 코드로 구현될 수 있다. 상기 컴퓨터로 읽을 수 있는 기록 매체는, 예를 들어 이동형 기록 매체(CD, DVD, 블루레이 디스크, USB 저장 장치, 이동식 하드 디스크)이거나, 고정식 기록 매체(ROM, RAM, 컴퓨터 구비 형 하드 디스크)일 수 있다. 상기 컴퓨터로 읽을 수 있는 기록 매체에 기록된 상기 컴퓨터 프로그램은 인터넷 등의 네트워크를 통하여 다른 컴퓨팅 장치에 전송되어 상기 다른 컴퓨팅 장치에 설치될 수 있고, 이로써 상기 다른 컴퓨팅 장치에서 사용될 수 있다.The technical idea of the present invention described so far with reference to FIGS. 1 to 13 can be implemented as computer-readable code on a computer-readable medium. The computer-readable recording medium may be, for example, a removable recording medium (CD, DVD, Blu-ray disk, USB storage device, removable hard disk) or a fixed recording medium (ROM, RAM, computer-equipped hard disk). You can. The computer program recorded on the computer-readable recording medium can be transmitted to another computing device through a network such as the Internet, installed on the other computing device, and thus used on the other computing device.

이상에서, 본 발명의 실시예를 구성하는 모든 구성 요소들이 하나로 결합되거나 결합되어 동작하는 것으로 설명되었다고 해서, 본 발명의 기술적 사상이 반드시 이러한 실시예에 한정되는 것은 아니다. 즉, 본 발명의 목적 범위 안에서라면, 그 모든 구성요소들이 하나 이상으로 선택적으로 결합하여 동작할 수도 있다.In the above, even though all the components constituting the embodiments of the present invention have been described as being combined or operated in combination, the technical idea of the present invention is not necessarily limited to these embodiments. That is, as long as it is within the scope of the purpose of the present invention, all of the components may be operated by selectively combining one or more of them.

도면에서 동작들이 특정한 순서로 도시되어 있지만, 반드시 동작들이 도시된 특정한 순서로 또는 순차적 순서로 실행되어야만 하거나 또는 모든 도시 된 동작들이 실행되어야만 원하는 결과를 얻을 수 있는 것으로 이해되어서는 안 된다. 특정 상황에서는, 멀티태스킹 및 병렬 처리가 유리할 수도 있다. 더욱이, 위에 설명한 실시예들에서 다양한 구성들의 분리는 그러한 분리가 반드시 필요한 것으로 이해되어서는 안 되고, 설명된 프로그램 컴포넌트들 및 시스템들은 일반적으로 단일 소프트웨어 제품으로 함께 통합되거나 다수의 소프트웨어 제품으로 패키지 될 수 있음을 이해하여야 한다.Although operations are shown in the drawings in a specific order, it should not be understood that the operations must be performed in the specific order shown or sequential order or that all illustrated operations must be performed to obtain the desired results. In certain situations, multitasking and parallel processing may be advantageous. Moreover, the separation of the various components in the embodiments described above should not be construed as necessarily requiring such separation, and the program components and systems described may generally be integrated together into a single software product or packaged into multiple software products. You must understand that it exists.

이상 첨부된 도면을 참조하여 본 발명의 실시예들을 설명하였지만, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자는 그 기술적 사상이나 필수적인 특징을 변경하지 않고서 본 발명이 다른 구체적인 형태로도 실시될 수 있다는 것을 이해할 수 있다. 그러므로 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적인 것이 아닌 것으로 이해해야만 한다. 본 발명의 보호 범위는 아래의 청구범위에 의하여 해석되어야 하며, 그와 동등한 범위 내에 있는 모든 기술 사상은 본 발명에 의해 정의되는 기술적 사상의 권리범위에 포함되는 것으로 해석되어야 할 것이다.Although embodiments of the present invention have been described above with reference to the attached drawings, those skilled in the art will understand that the present invention can be implemented in other specific forms without changing the technical idea or essential features. I can understand that there is. Therefore, the embodiments described above should be understood in all respects as illustrative and not restrictive. The scope of protection of the present invention shall be interpreted in accordance with the claims below, and all technical ideas within the equivalent scope shall be construed as being included in the scope of rights of the technical ideas defined by the present invention.

Claims (18)

컴퓨팅 장치에 의해서 수행되는 방법에 있어서,
콘텐츠를 학습에 필요한 하나 이상의 데이터를 포함하는 제1 데이터셋으로 가공 처리하는 단계;
상기 콘텐츠와 연관관계에 있는 타 콘텐츠의 제2 데이터셋을 확장 데이터로서 획득하는 단계; 및
상기 제1 데이터셋 및 상기 제2 데이터셋을 콘텐츠 추천을 위한 인공지능 모델에 적용하여, 상기 인공지능 모델을 학습시키는 단계를 포함하되,
상기 가공 처리하는 단계는,
상기 콘텐츠의 텍스트를 나타내는 제1 데이터, 상기 콘텐츠의 속성을 나타내는 제2 데이터 및 상기 콘텐츠의 상기 콘텐츠의 최신성 정도를 나타내는 제1 수치 및 인기도를 나타내는 제2 수치를 포함하는 부가 정보를 나타내는 제3 데이터를 포함하는 상기 제1 데이터셋으로 콘텐츠를 가공 처리하는 단계;
상기 콘텐츠의 유형을 식별하는 단계; 및
상기 식별된 유형에 상응하는 가중치를 상기 제1 데이터셋에 적용하는 단계를 더 포함하고,
상기 제2 데이터셋을 확장 데이터로서 획득하는 단계는,
상기 콘텐츠에 대한 성과를 나타내는 또 다른 콘텐츠를 획득하고, 상기 또 다른 콘텐츠를 가공처리한 제3 데이터셋을 확장 데이터로서 더 획득하는 단계를 포함하고,
상기 인공지능 모델을 학습시키는 단계는,
상기 제3 데이터셋을 상기 인공지능 모델에 더 적용하여, 상기 인공지능 모델을 학습시키는 단계를 포함하고,
상기 식별된 유형에 상응하는 가중치는 상기 제1 수치에 제1 가중치로 적용되고, 상기 제2 수치에 제2 가중치로 적용되는 것인,
인공지능 모델 구축 방법.
In a method performed by a computing device,
Processing content into a first dataset including one or more data required for learning;
Obtaining a second data set of other content that is related to the content as extended data; and
Applying the first data set and the second data set to an artificial intelligence model for content recommendation, comprising training the artificial intelligence model,
The processing step is,
Third data representing additional information including first data representing the text of the content, second data representing the attributes of the content, and a first numerical value representing the degree of recency of the content and a second numerical value representing the popularity of the content. Processing content with the first dataset containing data;
identifying the type of content; and
Further comprising applying a weight corresponding to the identified type to the first dataset,
The step of acquiring the second data set as extended data,
Obtaining another content indicating the performance of the content, and further obtaining a third dataset obtained by processing the other content as extended data,
The step of learning the artificial intelligence model is,
Further applying the third data set to the artificial intelligence model to train the artificial intelligence model,
The weight corresponding to the identified type is applied as a first weight to the first value and as a second weight to the second value,
How to build an artificial intelligence model.
삭제delete 제1항에 있어서,
상기 제1 데이터, 상기 제2 데이터, 상기 제3 데이터 각각은, 밀집 벡터 또는 희소 벡터인 것인,
인공지능 모델 구축 방법.
According to paragraph 1,
Each of the first data, the second data, and the third data is a dense vector or a sparse vector,
How to build an artificial intelligence model.
삭제delete 제1항에 있어서,
상기 제1 수치는 상기 콘텐츠의 날짜에 기초하여 결정되고,
상기 제2 수치는, 상기 콘텐츠의 조회수에 기초하여 결정되는 것인,
인공지능 모델 구축 방법.
According to paragraph 1,
the first value is determined based on the date of the content,
The second number is determined based on the number of views of the content,
How to build an artificial intelligence model.
삭제delete 제1항에 있어서,
상기 제2 데이터셋을 확장 데이터로서 획득하는 단계는,
상기 콘텐츠의 참여인력으로 기재된 사용자를 식별하는 단계; 및
상기 식별된 사용자가 참여한 상기 타 콘텐츠를 획득하고, 상기 타 콘텐츠를 가공처리한 상기 제2 데이터셋을 상기 확장 데이터로서 획득하는 단계를 포함하는,
인공지능 모델 구축 방법.
According to paragraph 1,
The step of acquiring the second data set as extended data,
Identifying a user listed as a participant in the content; and
Comprising the steps of acquiring the other content in which the identified user participated, and obtaining the second dataset obtained by processing the other content as the extended data,
How to build an artificial intelligence model.
삭제delete 삭제delete 삭제delete 삭제delete 삭제delete 삭제delete 삭제delete 삭제delete 삭제delete 하나 이상의 프로세서;
상기 프로세서에 의하여 수행되는 프로그램을 로드(load)하는 메모리; 및
상기 프로그램이 저장된 스토리지를 포함하되,
상기 프로그램은,
콘텐츠를 학습에 필요한 하나 이상의 데이터를 포함하는 제1 데이터셋으로 가공 처리하는 동작;
상기 콘텐츠와 연관관계에 있는 타 콘텐츠의 제2 데이터셋을 확장 데이터로서 획득하는 동작; 및
상기 제1 데이터셋 및 상기 제2 데이터셋을 콘텐츠 추천을 위한 인공지능 모델에 적용하여, 상기 인공지능 모델을 학습시키는 동작을 수행하기 위한 인스트럭션들(instructions)을 포함하되,
상기 가공 처리하는 동작은,
상기 콘텐츠의 텍스트를 나타내는 제1 데이터, 상기 콘텐츠의 속성을 나타내는 제2 데이터 및 상기 콘텐츠의 상기 콘텐츠의 최신성 정도를 나타내는 제1 수치 및 인기도를 나타내는 제2 수치를 포함하는 부가 정보를 나타내는 제3 데이터를 포함하는 상기 제1 데이터셋으로 콘텐츠를 가공 처리하는 동작;
상기 콘텐츠의 유형을 식별하는 동작; 및
상기 식별된 유형에 상응하는 가중치를 상기 제1 데이터셋에 적용하는 동작을 더 포함하고,
상기 제2 데이터셋을 확장 데이터로서 획득하는 동작은,
상기 콘텐츠에 대한 성과를 나타내는 또 다른 콘텐츠를 획득하고, 상기 또 다른 콘텐츠를 가공처리한 제3 데이터셋을 확장 데이터로서 더 획득하는 동작을 포함하고,
상기 인공지능 모델을 학습시키는 동작은,
상기 제3 데이터셋을 상기 인공지능 모델에 더 적용하여, 상기 인공지능 모델을 학습시키는 동작을 포함하고,
상기 식별된 유형에 상응하는 가중치는 상기 제1 수치에 제1 가중치로 적용되고, 상기 제2 수치에 제2 가중치로 적용되는 것인,
컴퓨팅 장치.
One or more processors;
a memory that loads a program executed by the processor; and
Including storage where the above program is stored,
The above program is,
An operation of processing content into a first dataset including one or more data required for learning;
Obtaining a second data set of other content that is related to the content as extended data; and
Includes instructions for performing an operation of applying the first data set and the second data set to an artificial intelligence model for content recommendation and training the artificial intelligence model,
The processing operation is,
Third data representing additional information including first data representing the text of the content, second data representing the attributes of the content, and a first numerical value representing the degree of recency of the content and a second numerical value representing the popularity of the content. Processing content using the first dataset containing data;
identifying the type of content; and
Further comprising applying a weight corresponding to the identified type to the first dataset,
The operation of acquiring the second data set as extended data is,
Obtaining another content indicating the performance of the content, and further obtaining a third dataset obtained by processing the other content as extended data,
The operation of learning the artificial intelligence model is,
An operation of further applying the third data set to the artificial intelligence model to train the artificial intelligence model,
The weight corresponding to the identified type is applied as a first weight to the first value and as a second weight to the second value,
Computing device.
삭제delete
KR1020210102357A 2021-08-04 2021-08-04 Method and apparatus for recommending contents based on artificial intelligence KR102637821B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020210102357A KR102637821B1 (en) 2021-08-04 2021-08-04 Method and apparatus for recommending contents based on artificial intelligence

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020210102357A KR102637821B1 (en) 2021-08-04 2021-08-04 Method and apparatus for recommending contents based on artificial intelligence

Publications (2)

Publication Number Publication Date
KR20230020680A KR20230020680A (en) 2023-02-13
KR102637821B1 true KR102637821B1 (en) 2024-02-19

Family

ID=85202633

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020210102357A KR102637821B1 (en) 2021-08-04 2021-08-04 Method and apparatus for recommending contents based on artificial intelligence

Country Status (1)

Country Link
KR (1) KR102637821B1 (en)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102004145B1 (en) * 2018-11-29 2019-07-29 한국과학기술정보연구원 Method for recommending content and apparatus thereof
KR102059309B1 (en) 2019-11-04 2020-02-11 윤선희 Method and server for adaptive paper search using machine learning
KR102249466B1 (en) * 2020-12-14 2021-05-11 주식회사 데이터스트림즈 Data catalog providing method and system for providing recommendation information using artificial intelligence recommendation model

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20090015240A (en) 2007-08-08 2009-02-12 에스케이 텔레콤주식회사 Recommendation service system reflecting consumer preferences
KR101426765B1 (en) * 2012-11-27 2014-08-06 한국과학기술정보연구원 System and method for supplying collaboration partner search service
KR102365967B1 (en) * 2017-09-22 2022-02-23 라인 가부시키가이샤 Recommendation method and system using content containing location data

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102004145B1 (en) * 2018-11-29 2019-07-29 한국과학기술정보연구원 Method for recommending content and apparatus thereof
KR102059309B1 (en) 2019-11-04 2020-02-11 윤선희 Method and server for adaptive paper search using machine learning
KR102249466B1 (en) * 2020-12-14 2021-05-11 주식회사 데이터스트림즈 Data catalog providing method and system for providing recommendation information using artificial intelligence recommendation model

Also Published As

Publication number Publication date
KR20230020680A (en) 2023-02-13

Similar Documents

Publication Publication Date Title
US11574116B2 (en) Apparatus and method for providing summarized information using an artificial intelligence model
CN109117731B (en) Classroom teaching cognitive load measurement system
Charte et al. Addressing imbalance in multilabel classification: Measures and random resampling algorithms
RU2678716C1 (en) Use of autoencoders for learning text classifiers in natural language
CN110334759B (en) Comment-driven depth sequence recommendation method
CN111242310B (en) Feature validity evaluation method and device, electronic equipment and storage medium
CN105074694B (en) The system and method for natural language processing
CN108132961B (en) Reference recommendation method based on citation prediction
EP3968337A1 (en) Target object attribute prediction method based on machine learning and related device
Vesely et al. Permutation-based true discovery guarantee by sum tests
US20200175052A1 (en) Classification of electronic documents
JPWO2019106965A1 (en) Information processing equipment, information processing methods, and programs
CN113299346A (en) Classification model training and classifying method and device, computer equipment and storage medium
CN114330499A (en) Method, device, equipment, storage medium and program product for training classification model
Ikawati et al. Student behavior analysis to predict learning styles based felder silverman model using ensemble tree method
CN115114445A (en) Cell knowledge graph construction method and device, computing equipment and storage medium
CN117763126A (en) Knowledge retrieval method, device, storage medium and apparatus
KR102637821B1 (en) Method and apparatus for recommending contents based on artificial intelligence
CN117371511A (en) Training method, device, equipment and storage medium for image classification model
Mah et al. An accessible, interactive GenePattern Notebook for analysis and exploration of single-cell transcriptomic data
JP5700007B2 (en) Information processing apparatus, method, and program
KR102183412B1 (en) Method and artificial intelligence system of servicing affiliate marketing using personal data that is based on the results of fortune-telling information contents
Hsu et al. Using deep learning to identify translational research in genomic medicine beyond bench to bedside
CN114049023A (en) High-level talent subject evaluation method based on big data analysis
CN113569018A (en) Question and answer pair mining method and device

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
AMND Amendment
E601 Decision to refuse application
X091 Application refused [patent]
AMND Amendment
X701 Decision to grant (after re-examination)
GRNT Written decision to grant