KR20160043601A - Device and method for recommendationing digital content - Google Patents
Device and method for recommendationing digital content Download PDFInfo
- Publication number
- KR20160043601A KR20160043601A KR1020140137765A KR20140137765A KR20160043601A KR 20160043601 A KR20160043601 A KR 20160043601A KR 1020140137765 A KR1020140137765 A KR 1020140137765A KR 20140137765 A KR20140137765 A KR 20140137765A KR 20160043601 A KR20160043601 A KR 20160043601A
- Authority
- KR
- South Korea
- Prior art keywords
- digital content
- category
- digital
- information
- word
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/16—Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Mathematical Physics (AREA)
- Pure & Applied Mathematics (AREA)
- Computational Mathematics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- General Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Computing Systems (AREA)
- Algebra (AREA)
- Software Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
본 발명은 디지털 컨텐츠 추천 단말 및 방법에 관한 것이다.The present invention relates to a digital content recommendation terminal and method.
추천 서비스(recommendation service)는 과다하게 제공되는 정보로부터 사용자의 선호(interest)에 맞는 정보를 제공하는 서비스이다. 이 서비스는 사용자의 이력(history) 내의 컨텐츠에 대한 선호 점수(rating)이나 선호 여부(preference) 등을 분석하여 사용자 프로파일(profile)을 생성하고 이를 기반으로 컨텐츠의 추천을 수행한다.A recommendation service is a service that provides information corresponding to a user's interest from information provided in an excessive amount. This service analyzes the rating or preference of the content in the history of the user to generate a user profile and performs recommendation of the content based on the profile.
특히, 최근에는 기존의 컴퓨터, 스마트 폰 및 태블릿 PC 등의 다양한 단말에 대한 사용자가 급증함에 따라 다양한 단말을 위한 사용자 맞춤형 디지털 컨텐츠 기반 추천 기술이 개발되고 있다. 다양한 단말을 위한 맞춤형 디지털 컨텐츠 기반 추천 기술은 단말에서 자동으로 사용자 선호를 추론(inference)하고, 추론된 사용자의 관심에 기반하여 사용자에게 디지털 컨텐츠를 추천한다. In particular, recently, as users have been rapidly increasing in various terminals such as computers, smart phones and tablet PCs, a user-customized digital content-based recommendation technology has been developed for various terminals. A customized digital content based recommendation technology for various terminals automatically infer user preferences from the terminals and recommend digital contents to the users based on the interest of the inferred users.
그러나 서버(server)나 PC 등의 일반적인 컴퓨팅 시스템과 달리 스마트 폰 등의 스마트 단말은 저사양의 컴퓨팅 환경을 지원하며, 네트워크 통신을 수행할 때, 비용이 많이 든다는 단점이 있다. 그러므로 다양한 단말을 위한 디지털 컨텐츠의 추천 서비스는 최소한의 하드웨어 자원(resource) 및 최소한의 네트워크 통신에 기반하여 사용자의 선호 정보를 분류하고 추천할 수 있어야 한다.However, unlike a general computing system such as a server or a PC, a smart terminal such as a smart phone supports a low-end computing environment and has a drawback in that it is costly to perform network communication. Therefore, digital contents recommendation service for various terminals should be able to classify and recommend user 's preference information based on minimum hardware resource and minimum network communication.
스마트 단말에서 사용자에게 맞춤형 디지털 컨텐츠를 추천하기 위한 종래의 기술로는 스마트 단말에서 자동으로 사용자의 관심 사항을 추론하는 기술 및 추론된 사용자의 관심사항을 기반으로 사용자에게 디지털 컨텐츠를 추천하는 기술이 있다. 이러한 종래의 기술은 사용자의 관심 사항을 추출하고 추천할 디지털 컨텐츠를 선택함에 있어서, 공개된 디렉터리 데이터를 가공하여 생성된 주제 분류 트리 내의 카테고리를 이용하고 있다. Conventional technologies for recommending customized digital contents to a user in a smart terminal include a technology for automatically inferring a user's interest in a smart terminal and a technique for recommending digital contents to a user based on the interests of the inferred user . In this conventional technology, in extracting a user's interest and selecting digital contents to be recommended, a category in a subject classification tree generated by processing public directory data is used.
예를 들어, 사용자의 스마트 기기 내부에 있는 디지털 컨텐츠를 분석하여 사용자의 관심 사항으로 "축구"가 추출된 경우, 같은 카테고리로 추론된 디지털 컨텐츠가 사용자에게 추천된다. 하지만, 추천된 디지털 컨텐츠가 정확하기 분류되지 않았을 경우, 실제로 "축구"와 관련이 없는 디지털 컨텐츠가 추천되며, 이에 따라 사용자 관심 사항에 부합하는 디지털 컨텐츠를 추천할 수 없다. For example, if "soccer" is extracted as a user's interest by analyzing the digital content inside the user's smart device, the digital content deduced in the same category is recommended to the user. However, if the recommended digital content is not correctly classified, then digital content that is not actually associated with "soccer" is recommended, thereby not recommending digital content that meets user interests.
디지털 컨텐츠를 추천하는 기술에 대한 종래 발명은 다음과 같다. The conventional invention for recommending digital contents is as follows.
한국 등록특허공보 제2013-0049253호(발명의 명칭: "컨텐츠 추천 서비스 방법")는 스마트 단말을 사용하는 사용자의 컨텐츠 사용 시 상황 정보에 기반한 내역 정보를 수집하여 사용자 맞춤 추천 컨텐츠를 제공하는 방법을 개시하고 있다. 이 발명은 구체적으로 사용자의 컨텐츠 사용 시점의 시간, 날씨, 계절 및 기념일 등의 상황 정보에 기반하여 사용자의 선호 정보를 분석하고 컨텐츠를 서비스한다. Korean Patent Registration No. 2013-0049253 (entitled "Content Recommendation Service Method") discloses a method of collecting history information based on context information when a user using a smart terminal is used and providing customized recommendation contents Lt; / RTI > Specifically, the present invention analyzes user's preference information based on context information such as the time, weather, season, and anniversary of the user when the content is used and services the content.
이와 더불어, Springer에서 발표한 국외 논문(논문명: "Efficient Recommendation for Smart TV Contents")은 스마트 TV 환경에서 사용자의 선호 정보를 분석하고 선호 정보를 이용하여 사용자에게 스마트 TV에게 디지털 컨텐츠를 제공하는 방법을 개시하고 있다. 이 방법은 구체적으로 사용자가 과거에 구매한 디지털 컨텐츠의 카테고리 정보를 이용하여 사용자 프로파일을 생성하고, 협력적 여과(collaborative filtering) 방법에 기반하여 사용자의 프로파일과 유사한 다른 사용자의 정보를 추출하여 디지털 컨텐츠를 추천한다. In addition, Springer's foreign paper ("Efficient Recommendation for Smart TV Contents") analyzes users' preference information in smart TV environment and provides digital TV contents to smart TV users by using preference information Lt; / RTI > Specifically, the method includes generating a user profile using category information of digital content purchased by a user in the past, extracting information of another user similar to the profile of the user based on a collaborative filtering method, Is recommended.
본 발명은 전술한 종래 기술의 문제점을 해결하기 위한 것으로서, 본 실시예는 디지털 컨텐츠의 카테고리를 분류하고, 분류된 카테고리에 기반하여 디지털 컨텐츠를 추천하는 스마트 단말 및 방법을 제공하는데 그 목적이 있다. It is an object of the present invention to provide a smart terminal and method for classifying categories of digital contents and recommending digital contents based on the classified categories.
다만, 본 실시예가 이루고자 하는 기술적 과제는 상기된 바와 같은 기술적 과제로 한정되지 않으며, 또 다른 기술적 과제들이 존재할 수 있다.It should be understood, however, that the technical scope of the present invention is not limited to the above-described technical problems, and other technical problems may exist.
상술한 기술적 과제를 달성하기 위한 기술적 수단으로서, 본 발명의 일 실시예에 따른 디지털 컨텐츠를 추천을 위한 스마트 단말은 디지털 컨텐츠를 추천하는 프로그램이 저장된 메모리, 미리 분류된 하나 이상의 카테고리를 포함하는 주제 분류 트리를 저장하는 데이터베이스 및 프로그램을 실행하는 프로세서를 포함한다. 이때, 프로세서는 프로그램의 실행에 따라, 스마트 단말에 저장된 디지털 컨텐츠를 수집하고, 데이터베이스에 저장된 주제 분류 트리에서 수집된 디지털 컨텐츠에 대응하는 카테고리를 추출하고, 추출된 카테고리에 기초하여 수집된 디지털 컨텐츠를 분류하며, 분류된 디지털 컨텐츠의 인덱스를 생성하고, 생성된 인덱스에 기초하여 상기 디지털 컨텐츠를 추천한다. According to an aspect of the present invention, there is provided a smart terminal for recommending digital contents, comprising: a memory for storing a program for recommending digital contents; A database for storing the tree, and a processor for executing the program. At this time, the processor collects the digital contents stored in the smart terminal, extracts the category corresponding to the digital contents collected in the subject classification tree stored in the database, and stores the collected digital contents based on the extracted category Generates an index of the classified digital contents, and recommends the digital contents based on the generated index.
또한, 본 발명의 일 실시예에 따른 스마트 단말에서의 디지털 컨텐츠 추천 방법은 스마트 단말에 저장된 디지털 컨텐츠를 수집하는 단계; 데이터베이스에 저장된 주제 분류 트리에서 수집된 디지털 컨텐츠에 대응하는 카테고리를 추출하는 단계; 추출된 카테고리에 기초하여 수집된 디지털 컨텐츠를 분류하는 단계; 분류된 디지털 컨텐츠의 인덱스를 생성하는 단계; 및 생성된 인덱스에 기초하여 디지털 컨텐츠를 추천하는 단계를 포함한다. 이때, 주제 분류 트리는 미리 분류된 하나 이상의 카테고리를 포함한다.According to another aspect of the present invention, there is provided a digital content recommendation method for a smart terminal, comprising: collecting digital content stored in a smart terminal; Extracting a category corresponding to digital contents collected in a subject classification tree stored in a database; Classifying the collected digital content based on the extracted category; Generating an index of the classified digital contents; And recommending digital content based on the generated index. At this time, the subject classification tree includes one or more categories classified in advance.
전술한 과제 해결 수단 중 어느 하나에 의하면, 사용자가 사용하는 디지털 컨텐츠에 기반하여 카테고리를 추출하고, 추출된 카테고리에 기반하여 추천을 수행하므로 더욱 사용자의 요구에 정확한 디지털 컨텐츠를 제공할 수 있다. According to any one of the above-mentioned means for solving the problems, the category is extracted based on the digital content used by the user, and the recommendation is performed based on the extracted category, so that the digital content can be more accurately provided to the user's request.
또한, 디지털 컨텐츠 추천을 위한 스마트 단말에 저장된 카테고리별로 분류된 주제 분류 트리 및 디지털 컨텐츠의 단어 빈도 기반으로 추천을 수행하므로 적은 컴퓨팅 자원 및 네트워크 전송량으로 정확하고 빠르게 추천을 수행할 수 있다. In addition, since the recommendation is performed based on the topic classification tree classified by the category stored in the smart terminal for digital contents recommendation and the word frequency of the digital contents, recommendation can be performed accurately and quickly with less computing resources and network traffic.
도 1은 본 발명의 일 실시예에 따른 스마트 단말의 구성도이다.
도 2는 본 발명의 일 실시예에 따른 주제 분류 트리의 예시도이다.
도 3은 본 발명의 일 실시예에 따른 디지털 컨텐츠를 추천하는 프로그램의 구성도이다.
도 4는 본 발명의 일 실시예에 따른 스마트 단말에서의 디지털 컨텐츠를 추천하는 방법을 설명하기 위한 순서도이다.
도 5는 본 발명의 일 실시예에 따른 스마트 단말에서의 디지털 컨텐츠의 카테고리를 추출하는 방법을 설명하기 위한 순서도이다.
도 6은 본 발명의 일 실시예에 따른 스마트 단말에서의 디지털 컨텐츠의 인덱스를 생성하는 방법을 설명하기 위한 순서도이다.
도 7은 본 발명의 일 실시예에 따른 스마트 단말에서의 디지털 컨텐츠의 추천을 수행하는 방법을 설명하기 위한 순서도이다. 1 is a configuration diagram of a smart terminal according to an embodiment of the present invention.
2 is an exemplary diagram of a subject classification tree according to an embodiment of the present invention.
3 is a block diagram of a program for recommending digital contents according to an embodiment of the present invention.
4 is a flowchart illustrating a method of recommending digital contents in a smart terminal according to an exemplary embodiment of the present invention.
5 is a flowchart illustrating a method of extracting categories of digital contents in a smart terminal according to an embodiment of the present invention.
6 is a flowchart illustrating a method of generating indexes of digital contents in a smart terminal according to an exemplary embodiment of the present invention.
7 is a flowchart illustrating a method of recommending digital content in a smart terminal according to an embodiment of the present invention.
아래에서는 첨부한 도면을 참조하여 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 본 발명의 실시예를 상세히 설명한다. 그러나 본 발명은 여러 가지 상이한 형태로 구현될 수 있으며 여기에서 설명하는 실시예에 한정되지 않는다. 그리고 도면에서 본 발명을 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략하였다.Hereinafter, embodiments of the present invention will be described in detail with reference to the accompanying drawings, which will be readily apparent to those skilled in the art. The present invention may, however, be embodied in many different forms and should not be construed as limited to the embodiments set forth herein. In order to clearly explain the present invention in the drawings, parts not related to the description are omitted.
명세서 전체에서, 어떤 부분이 다른 부분과 "연결"되어 있다고 할 때, 이는 "직접적으로 연결"되어 있는 경우뿐 아니라, 그 중간에 다른 소자를 사이에 두고 "전기적으로 연결"되어 있는 경우도 포함한다. 또한, 어떤 부분이 어떤 구성요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있는 것을 의미한다.Throughout the specification, when a part is referred to as being "connected" to another part, it includes not only "directly connected" but also "electrically connected" with another part in between . Also, when a part is referred to as "including " an element, it does not exclude other elements unless specifically stated otherwise.
이하에서는 도 1 내지 도 3을 참조하여 본 발명의 일 실시예에 따른 디지털 컨텐츠(digital contents; 140)를 추천을 위한 스마트 단말(100)을 설명하도록 한다. Hereinafter, a
도 1은 본 발명의 일 실시예에 따른 스마트 단말(100)의 구성도이다. 1 is a configuration diagram of a
도 1을 참조하면, 스마트 단말(100)은 스마트 단말(100)에 저장된 디지털 컨텐츠(140)에 기반하여 디지털 컨텐츠(140)를 추천한다. 이때, 스마트 단말(100)은 메모리(110), 데이터베이스(120) 및 프로세서(130)를 포함한다. Referring to FIG. 1, a
스마트 단말(100)은 컴퓨터나 휴대용 단말기로 구현될 수 있다. 이때, 컴퓨터는 예를 들어, 웹 브라우저(WEB Browser)가 탑재된 노트북, 데스크톱(desktop), 랩톱(laptop), 태블릿 PC, 슬레이트 PC 등을 포함하고, 휴대용 단말기는 예를 들어, 휴대성과 이동성이 보장되는 무선 통신 장치로서, PCS(Personal Communication System), GSM(Global System for Mobile communications), PDC(Personal Digital Cellular), PHS(Personal Handyphone System), PDA(Personal Digital Assistant), IMT(International Mobile Telecommunication)-2000, CDMA(Code Division Multiple Access)-2000, W-CDMA(W-Code Division Multiple Access), WiBro(Wireless Broadband Internet) 단말, 스마트 폰(Smart Phone) 등과 같은 모든 종류의 핸드헬드(Handheld) 기반의 무선 통신 장치를 포함할 수 있다.The
또한, 디지털 컨텐츠(140)는 동영상, 사진, 이미지, 음악, 소셜 네트워크 서비스(social network service; SNS), 북마크(bookmark), 애플리케이션(application), 단문 메시지 서비스(short message service; SMS) 등을 포함할 수 있다. The
메모리(110)는 디지털 컨텐츠(140)를 추천하는 프로그램(150)이 저장된다. 여기에서 메모리(110)는 전원이 공급되지 않아도 저장된 정보를 계속 유지하는 비휘발성 저장 장치를 통칭하는 것이다. 예를 들어, 메모리(110)는 콤팩트 플래시(compact flash; CF) 카드, SD(secure digital) 카드, 메모리 스틱(memory stick), 솔리드 스테이트 드라이브(solid-state drive; SSD) 및 마이크로(micro) SD 카드 등과 같은 낸드 플래시 메모리(NAND flash memory), 하드 디스크 드라이브(hard disk drive; HDD) 등과 같은 마그네틱 컴퓨터 기억 장치 및 CD-ROM, DVD-ROM 등과 같은 광학 디스크 드라이브(optical disc drive) 등을 포함할 수 있다.The
또한, 메모리(110)에 저장된 디지털 컨텐츠(140)를 추천하는 프로그램(150)은 소프트웨어 또는 FPGA(Field Programmable Gate Array) 또는 ASIC(Application Specific Integrated Circuit)와 같은 하드웨어 형태로 구현될 수 있으며, 소정의 역할들을 수행할 수 있다. The
한편, 데이터베이스(120)는 미리 분류된 하나 이상의 카테고리를 포함하는 주제 분류 트리를 저장한다. 이때, 데이터베이스(120)는 스마트 단말(100)에 설치된 애플리케이션(application) 형태로 실행되거나, 스마트 단말(100)에 설치된 서버 프로그램(server program)일 수 있다. 또한, 스마트 단말(100)과 네트워크로 연결된 독립적인 데이터베이스 서버(database server)일 수 있다. On the other hand, the
그리고 데이터베이스(120)는 캐쉬, ROM(Read Only Memory), PROM(Programmable ROM), EPROM(Erasable Programmable ROM), EEPROM(Electrically Erasable Programmable ROM) 및 플래쉬 메모리(Flash memory)와 같은 비휘발성 메모리 소자 또는 RAM(Random Access Memory)과 같은 휘발성 메모리 소자 또는 하드디스크 드라이브, CD-ROM과 같은 저장 매체 중 적어도 하나로 구현될 수 있으나 이에 한정되지는 않는다.The
데이터베이스(120)에 저장되는 주제 분류 트리는 디지털 컨텐츠(140)의 추천을 위하여 도 2와 같이 디지털 컨텐츠(140)의 주제를 트리 형태로 분류한 것이다. The subject classification tree stored in the
도 2는 본 발명의 일 실시예에 따른 주제 분류 트리의 예시도이다. 2 is an exemplary diagram of a subject classification tree according to an embodiment of the present invention.
도 2를 참조하면, 주제 분류 트리는 디지털 컨텐츠(140)의 텍스트 정보에서 주제(topic)를 추출하기 위하여 다양한 주제를 포함하는 카테고리(category)의 계층구조(hierarchy)를 트리 형태의 자료구조(data structure)로 표현(representation)한 것이다. Referring to FIG. 2, a subject classification tree includes a hierarchy of categories including various topics in order to extract a topic from text information of the
예를 들어, 주제 분류 트리는 오픈 디렉터리 프로젝트(open directory project)에 기반하여 생성될 수 있다. 오픈 디렉터리 프로젝트는 일종의 웹상의 텍스트 데이터베이스이다. 오픈 디렉터리 프로젝트는 월드 와이드 웹(world wide web) 상의 웹 문서 등의 텍스트를 계층적 온톨로지(hierarchical ontology)를 이용하여 카테고리로 세분화하고, 트리 자료 구조를 이용하여 분류한 것이다.For example, a subject classification tree can be created based on an open directory project. The Open Directory project is a kind of text database on the web. The Open Directory project classifies texts, such as web documents on the world wide web, into categories using hierarchical ontology and classifies them using a tree data structure.
본 발명의 일 실시예는 오픈 디렉터리 프로젝트의 계층구조에 포함된 웹사이트의 정보를 분류기(classify)의 학습 데이터(train data)로 활용하고 스마트 단말(100)의 특성에 따라 주제 분류 트리를 생성할 수 있다. 예를 들어, 스마트 단말(100)이 스마트 폰인 경우에는 스마트 폰에서 주로 사용할 수 있는 소셜 네트워크 서비스, 단문 메시지 서비스, 동영상 및 음악파일에 적합한 주제 분류 트리를 생성할 수 있다. 또한, 스마트 단말이 개인용 PC인 경우에는 개인의 PC 사용 패턴에 맞는 주제 분류 트리를 생성하여 사용할 수 있다. One embodiment of the present invention utilizes information of a website included in a hierarchical structure of an open directory project as train data of a classifier and generates a subject classification tree according to the characteristics of the
프로세서(130)는 메모리(110)에 저장된 디지털 컨텐츠(140)를 추천하는 프로그램(150)을 실행한다. 즉, 프로세서(130)는 디지털 컨텐츠(140)를 추천하는 프로그램(150)의 실행에 따라, 스마트 단말(100)에 저장된 디지털 컨텐츠(140)를 수집한다. The
프로세서(130)는 스마트 단말(100)에 저장된 디지털 컨텐츠(140)를 수집하기 위하여 미리 정해진 이벤트(event)에 대한 백 그라운드 서비스(back ground service)를 이용할 수 있다. 예를 들어, 미리 정해진 이벤트는 매일, 매시간 등 백 그라운드 서비스를 시작할 시간을 미리 설정하거나, 새로운 디지털 컨텐츠(140)가 추가되었을 경우 등과 같이 백 그라운드 서비스를 시작할 행동을 미리 정하는 것을 의미할 수 있다.The
미리 정해진 이벤트에 따라 프로세서(130)는 디지털 컨텐츠(140)의 종류에 따라 스마트 단말(100)의 메모리(110)에 저장된 파일을 탐색하고, 디지털 컨텐츠(140) 및 디지털 컨텐츠(140)의 정보를 수집할 수 있다. 수집되는 디지털 컨텐츠(140)의 정보는 디지털 컨텐츠(140)의 종류(type)에 따라 달라질 수 있다. 기본적으로 디지털 컨텐츠(140)의 정보는 디지털 컨텐츠(140)의 식별자(identifier), 제목(title) 및 텍스트 정보를 포함할 수 있다. 이때, 텍스트 정보는 디지털 컨텐츠(140)의 설명(description) 정보 및 디지털 컨텐츠(140)의 메타 데이터(meta-data)에 포함된 디지털 컨텐츠(140)의 생성 일자, 디지털 컨텐츠(140) 파일의 사이즈 및 디지털 컨텐츠(140)가 생성된 위치 정보 등이 될 수 있다. The
그리고 프로세서(130)는 데이터베이스(120)에 저장된 주제 분류 트리에서 수집된 디지털 컨텐츠(140)에 대응하는 카테고리를 추출한다. 예를 들어, 수집된 디지털 컨텐츠(140)에 대응하는 카테고리를 추출하기 위하여 디지털 컨텐츠(140)의 텍스트 정보 및 주제 분류 트리에 포함된 각각의 카테고리에 대한 텍스트 정보에 대한 벡터 스페이스 모델(vector space mode) 및 유사도(similarity)에 기초하여 카테고리를 추출할 수 있다. Then, the
또한, 프로세서(130)는 추출된 카테고리에 기초하여 수집된 디지털 컨텐츠(140)를 분류하며, 분류된 디지털 컨텐츠(140)의 인덱스(index)를 생성하고, 생성된 인덱스에 기초하여 디지털 컨텐츠(140)를 추천한다. 이때, 추천의 대상이 되는 디지털 컨텐츠(140)는 스마트 단말(100) 내에 포함된 디지털 컨텐츠(140)일 수 있으며, 네트워크를 통하여 스마트 단말(100)에 추가된 디지털 컨텐츠 제공자(digital contents provider)의 디지털 컨텐츠(140)의 정보일 수 있으나, 이에 한정된 것은 아니다. The
이렇게 추천된 디지털 컨텐츠(160)는 추천된 디지털 컨텐츠(160)의 종류에 따라 스마트 단말(100)에 추천된 디지털 컨텐츠(160)의 리스트 형태로 제공되거나 스마트 단말(100)에 포함된 애플리케이션을 통하여 서비스될 수 있다.The recommended
한편, 프로세서(130)는 디지털 컨텐츠(140)의 제목 및 텍스트 정보에 포함된 각 단어를 추출할 수 있다. 예를 들어, 디지털 컨텐츠(140)의 제목 및 텍스트 정보에 포함된 각 단어를 추출하기 위하여 형태소 분석기(morphological analysis)를 이용할 수 있다. 또한, 프로세서(130)는 주제 분류 트리에 포함된 단어 집합 및 미리 정해진 단어 집합 등을 이용하여, 디지털 컨텐츠(140)의 제목 및 텍스트 정보와 매칭된 단어를 추출할 수 있으나 이에 한정된 것은 아니다. Meanwhile, the
그리고 프로세서(130)는 벡터 스페이스 모델에 기반하여 디지털 컨텐츠(140)에서 추출된 단어에 가중치(weight)를 적용하여 단어 벡터(term vector)를 생성할 수 있다. 이때, 가중치는 가중치를 구하고자 하는 텍스트에 포함된 단어의 빈도(term frequency), 분류기를 통과한 전체 학습 문서의 수 및 각 단어가 포함된 학습 문서의 빈도(document frequency)에 기초하여 설정될 수 있다. The
예를 들어, 가중치는 단어 빈도 - 역문서 빈도(term frequency - inverse document frequency; TF-IDF) 방법에 기초하여 계산될 수 있다. 단어 빈도 - 역문서 빈도 가중치는 정보 검색(information retrieval) 분야에서 주로 활용되는 벡터 스페이스 모델의 대표적인 단어 가중치 측정 방법이다. 예를 들어, 수학식 1과 같이 계산될 수 있다. For example, the weights can be calculated based on the term frequency-inverse document frequency (TF-IDF) method. Word frequency - Inverse document frequency weighting is a representative word weighting method of the vector space model that is mainly used in the field of information retrieval. For example, it can be calculated as shown in Equation (1).
이때, 수학식 1에서 t는 가중치를 구하는 단어, 는 t의 가중치이며, 는 가중치를 구하고자 하는 텍스트에 포함된 t의 빈도, N은 전체 학습 문서의 개수, 는 전체 학습 문서 중 t를 포함하는 문서의 빈도이다. At this time, in Equation (1), t is a word for obtaining a weight, Is the weight of t , Is the frequency of t included in the text to be weighted, N is the number of all learning documents, Is the frequency of the document containing t among all learning documents.
또한, 프로세서(130)는 생성된 단어 벡터의 카테고리를 분류하기 위한 분류기에 통과시켜 유사도를 산출하고, 데이터베이스(120)에 저장된 주제 분류 트리에서 산출된 유사도에 따라 기 설정된 개수에 해당하는 하나 이상의 카테고리를 추출할 수 있다. The
예를 들어, 유사도 측정 척도는 수학식 2와 같은 코사인 유사도(cosine similarity)일 수 있다. For example, the similarity measure may be a cosine similarity as in Equation (2).
수학식 2에서 는 유사도를 구하고자 하는 단어 벡터, 는 카테고리 의 데이터베이스(120)에 저장된 주제 분류 트리에 포함된 학습 데이터로부터 학습 된 중심 벡터를 의미하며, V는 전체 주제 분류 트리에 포함된 학습 데이터에 사용된 전체 단어의 집합을 의미한다. 또한, 수학식 2에서 는 의 단어 t의 가중치, 는 의 단어 t의 가중치를 의미할 수 있다. In Equation 2, Is a word vector for which the degree of similarity is sought, Categories Means a central vector learned from learning data contained in a subject classification tree stored in the
유사도 측정 척도에 기반하여 유사도를 계산한 다음, 프로세서(130)는 기 설정된 개수에 따라 유사도가 높은 k개의 카테고리를 선택할 수 있다. 이렇게 선택된 k개의 카테고리는 단어 벡터와 연관성이 높은 상위 k개(top-k) 카테고리일 수 있다. After calculating the similarity based on the similarity measurement scale, the
그리고 프로세서(130)는 선택된 하나 이상의 카테고리 각각을 단어 단위로 분할하고, 분할된 단어 중 빈도가 가장 높은 단어가 포함된 카테고리를 선택할 수 있다. The
예를 들어, 프로세서(130)는 기 설정된 k가 3일 경우에 상위 3개의 카테고리를 선택하고, 선택된 상위 3개의 카테고리 각각을 단어 단위로 분할할 수 있다. 만약 선택된 상위 3개의 카테고리가 각각 "쇼핑 → 스포츠", "스포츠 → 축구" 및 "스포츠 → 축구 → UEFA → 잉글랜드"이라면, 각각의 카테고리를 단어 단위로 분할하면 "쇼핑 → 스포츠"는 "쇼핑, 스포츠", "스포츠 → 축구"는 "스포츠, 축구", "스포츠 → 축구 → UEFA → 잉글랜드"는 "스포츠, 축구, UEFA, 잉글랜드"가 될 수 있다. 이렇게 분할된 단어에 기반하여 프로세서(130)는 빈도를 계산하고 가장 빈도가 높은 단어를 포함하는 카테고리를 선택할 수 있다. 위 예시에서는 최빈값으로 "스포츠"가 선택되며 이에 따라 프로세서(130)는 디지털 컨텐츠(140)에 대응하는 카테고리로 "스포츠"가 포함된 "쇼핑 → 스포츠" 카테고리를 선택할 수 있다. For example, the
이때, 프로세서(130)가 카테고리의 이름을 단어 단위로 분할하면, 4개의 디지털 컨텐츠(140)의 정보는 각각 (448744, "쇼핑, 스포츠", 1, 0.1), (448744, "쇼핑, 스포츠", 2, 0.2), (492228, "스포츠, 축구", 3, 0.3) 및 (493203, "스포츠, 축구, UEFA, 잉글랜드", 4, 0.5)로 분할될 수 있다. At this time, if the
단어 단위로 분할된 카테고리의 이름에서 추출된 단어의 빈도를 계산하면, "스포츠"이 4개, "쇼핑"이 2개, "축구"가 2개, "UEFA"가 1개 및 "잉글랜드"가 1개가 된다. 여기에서 최빈값을 가지는 단어는 "스포츠"가 되므로 카테고리의 이름에 "스포츠"가 포함된 4개의 디지털 컨텐츠(140)의 정보가 선택될 수 있다. When the frequency of words extracted from the names of the categories divided by words is calculated, there are four "sports", two "shopping", two "football", one "UEFA" and one "England" One. Here, since the word having the mode is "sports ", information of the four
프로세서(130)는 이렇게 선택된 4개의 디지털 컨텐츠(140)를 다시 유사도에 기반하여 (493203, "스포츠, 축구, UEFA, 잉글랜드", 4, 0.5), (492228, "스포츠, 축구", 3, 0.3), (448744, "쇼핑, 스포츠", 2, 0.2) 및 (448744, "쇼핑, 스포츠", 1, 0.1) 순으로 내림차순 정렬할 수 있다. 만약, 추천하는 디지털 컨텐츠(160)의 개수인 이 1개라면 가장 유사도가 높은 (493203, "스포츠, 축구, UEFA, 잉글랜드", 4, 0.5)이 선택되고, 디지털 컨텐츠의 식별자가 4인 디지털 컨텐츠가 추천될 수 있다. The
다음은 도 3을 참조하여 본 발명의 일 실시예에 따른 디지털 컨텐츠(140)를 추천하는 프로그램(150)을 설명한다. Next, referring to FIG. 3, a
도 3은 본 발명의 일 실시예에 따른 디지털 컨텐츠(140)를 추천하는 프로그램(150)의 구성도이다. 3 is a configuration diagram of a
디지털 컨텐츠(140)를 추천하는 프로그램(150)은 디지털 컨텐츠 수집 모듈(151), 디지털 컨텐츠 분류 모듈(152), 디지털 컨텐츠 인덱스 모듈(153) 및 디지털 컨텐츠 추천 모듈(154)을 포함할 수 있다. The
디지털 컨텐츠 수집 모듈(151)은 스마트 단말(100)에 포함된 사진, 음악, 인터넷 방문 기록, 북마크 앱 등의 디지털 컨텐츠(140)를 자동으로 수집할 수 있다. 예를 들어, 디지털 컨텐츠 수집 모듈(151)은 백 그라운드 서비스를 통해 미리 정해진 이벤트에 따라 실행될 수 있다. 미리 정해진 이벤트가 실행되면 디지털 컨텐츠(140)의 파일 종류에 따라 스마트 단말(100)의 메모리(110)에 저장된 파일을 탐색하고, 디지털 컨텐츠(140) 및 디지털 컨텐츠(140)의 정보를 수집할 수 있다. 이때, 수집되는 디지털 컨텐츠(140)의 정보는 디지털 컨텐츠(140)의 종류에 따라 달라진다. 기본적으로 디지털 컨텐츠(140)의 정보는 디지털 컨텐츠(140)의 식별자, 제목 및 텍스트 정보를 포함할 수 있다. The digital
디지털 컨텐츠 분류 모듈(152)은 주제 분류 트리에 기초하여 디지털 컨텐츠 수집 모듈(151)에 의해 수집된 디지털 컨텐츠(140)의 주제를 추출할 수 있다. 이때, 디지털 컨텐츠 분류 모듈(152)은 디지털 컨텐츠(140)의 주제를 추출하기 위하여 디지털 컨텐츠(140)의 제목 및 텍스트 정보에서 단어를 추출하고 추출된 단어에 가중치를 적용하여 단어 벡터를 생성할 수 있다. 예를 들어, 가중치는 단어 빈도 - 역문서 빈도 방법을 사용할 수 있다. The digital
그리고 디지털 컨텐츠 분류 모듈(152)은 단어 벡터의 카테고리를 분류하기 위하여 분류기를 통과시켜 데이터베이스(120)에 저장된 주제 분류 트리의 각 카테고리에 대한 유사도를 산출하고, 산출된 유사도에 따라 기 설정된 개수에 해당하는 하나 이상의 카테고리를 추출할 수 있다. 예를 들어, 유사도는 코사인 유사도를 사용할 수 있다. The digital
그리고 디지털 컨텐츠(140)의 카테고리를 추출한 다음 디지털 컨텐츠 인덱스 모듈(153)에 기반하여 디지털 컨텐츠(140)의 인덱싱(indexing)을 수행할 수 있다. 디지털 컨텐츠 인덱스 모듈(153)은 디지털 컨텐츠 정보 테이블 및 카테고리 역 인덱스 테이블을 포함하는 디지털 컨텐츠(140)의 인덱스를 생성할 수 있다. 이때, 디지털 컨텐츠(140)의 인덱스는 디지털 컨텐츠(140)의 추천 수행 시 디지털 컨텐츠(140)의 정보나 카테고리 정보를 활용하여 원하는 디지털 컨텐츠(140)에 빠르게 접근하기 위하여 활용될 수 있다.Then, the
한편, 디지털 컨텐츠 추천 모듈(154)은 디지털 컨텐츠(140)의 카테고리 및 디지털 컨텐츠 인덱스에 기반하여 스마트 단말(100) 내의 디지털 컨텐츠(140)에 대하여 추천을 수행할 수 있다. 디지털 컨텐츠 추천 모듈(154)은 인덱싱된 디지털 컨텐츠(140)의 정보를 분석하고, 이에 기반하여 디지털 컨텐츠(140)에 대한 순위 정보를 구축하고, 순위 정보에 따라 추천된 디지털 콘텐츠(160)가 포함된 추천 결과를 생성할 수 있다. The digital
이렇게 추천된 디지털 컨텐츠(160)는 추천된 디지털 컨텐츠(160)의 종류에 따라 스마트 단말(100)에 추천된 디지털 컨텐츠(160)의 리스트 형태로 제공되거나 스마트 단말(100)에 포함된 애플리케이션을 통하여 서비스될 수 있다.The recommended
이하에서는 도 4 내지 도 7을 참조하여 본 발명의 일 실시예에 따른 스마트 단말(100)에서의 디지털 컨텐츠(140)의 추천 방법을 설명하도록 한다. Hereinafter, a method of recommending
도 4는 본 발명의 일 실시예에 따른 스마트 단말(100)에서의 디지털 컨텐츠(140)를 추천하는 방법을 설명하기 위한 순서도이다. 4 is a flowchart illustrating a method of recommending
본 발명이 일 실시예에 따른 스마트 단말(100)에서의 디지털 컨텐츠 추천 방법은 스마트 단말(100)에 저장된 디지털 컨텐츠(140)를 수집한다(S200). 이때, 디지털 컨텐츠 추천 방법은 스마트 단말(100)에 저장된 디지털 컨텐츠(140)를 수집하기 위하여 미리 정해진 이벤트에 대한 백 그라운드 서비스를 이용할 수 있다. 미리 정해진 이벤트는 매일, 매시간 등 백 그라운드 서비스를 시작할 시간을 미리 설정하거나, 새로운 디지털 컨텐츠(140)가 추가되었을 경우 등과 같이 백 그라운드 서비스를 시작할 행동을 미리 정하는 것을 의미한다. The digital content recommendation method in the
그리고 디지털 컨텐츠 추천 방법은 데이터베이스(120)에 저장된 주제 분류 트리에서 수집된 디지털 컨텐츠(140)에 대응하는 카테고리를 추출한다(S210). 이때, 주제 분류 트리는 디지털 컨텐츠(140)에 포함된 텍스트 정보에서 주제를 추출하기 위하여 다양한 주제를 포함하는 카테고리의 계층구조를 트리 형태의 자료구조로 표현한 것이다. 예를 들어, 주제 분류 트리는 오픈 디렉터리 프로젝트에 기반하여 오픈 디렉터리 프로젝트의 계층구조에 포함된 웹사이트의 정보를 분류기의 학습 데이터로 활용하여 생성할 수 있다. The digital content recommendation method extracts categories corresponding to the
또한, 디지털 컨텐츠 추천 방법은 추출된 카테고리에 기초하여 수집된 디지털 컨텐츠(140)를 분류하고(S220), 분류된 디지털 컨텐츠(140)의 인덱스를 생성한다(S230). 예를 들어, 디지털 컨텐츠 추천 방법은 디지털 컨텐츠(140)를 분류하기 위하여 수집된 디지털 컨텐츠(140)의 텍스트 정보 및 주제 분류 트리를 활용하고, 벡터 스페이스 모델 및 유사도에 기초하여 수집된 디지털 컨텐츠(140)에 대응하는 카테고리를 추출할 수 있다. In addition, the digital content recommendation method classifies the collected
그리고 분류된 디지털 컨텐츠(140)의 인덱스를 생성한 다음, 디지털 컨텐츠 추천 방법은 생성된 인덱스에 기초하여 디지털 컨텐츠(140)를 추천한다(S240). 이렇게 추천된 디지털 컨텐츠(160)는 추천된 디지털 컨텐츠(160)의 종류에 따라 스마트 단말(100)에 추천된 디지털 컨텐츠(160)의 리스트 형태로 제공되거나 스마트 단말(100)에 포함된 애플리케이션을 통하여 서비스될 수 있다.After generating the index of the classified
도 5는 본 발명의 일 실시예에 따른 스마트 단말(100)에서의 디지털 컨텐츠(140)의 카테고리를 추출하는 방법을 설명하기 위한 순서도이다. 5 is a flowchart illustrating a method of extracting categories of
디지털 컨텐츠(140)의 정보는 디지털 컨텐츠(140)의 식별자, 디지털 컨텐츠(140)의 제목 및 디지털 컨텐츠(140)의 텍스트 정보를 포함할 수 있다. 이때, 디지털 컨텐츠(140)의 텍스트 정보는 디지털 컨텐츠(140)의 설명 정보 혹은 디지털 컨텐츠(140)가 포함하는 메타데이터일 수 있다. The information of the
도 5를 참조하면, 디지털 컨텐츠 추천 방법은 카테고리를 추출하기 위하여(S220) 디지털 컨텐츠(140)의 제목 및 텍스트 정보에 포함된 각 단어를 추출하고(S211), 추출된 각 단어에 가중치를 적용하여 단어 벡터를 생성할 수 있다(S212). 이때, 가중치는 각 단어의 빈도, 분류기를 통과한 전체 학습 문서의 수 및 전체 학습 문서에 포함된 각 단어의 빈도에 기초하여 설정될 수 있다. 예를 들어 가중치는 단어 빈도 - 역문서 빈도 방법을 사용할 수 있다. Referring to FIG. 5, the digital content recommendation method extracts each word included in the title and text information of the digital content 140 (S211) to extract a category (S220), applies a weight to each extracted word A word vector can be generated (S212). At this time, the weight can be set based on the frequency of each word, the total number of learning documents passed through the classifier, and the frequency of each word included in the entire learning document. For example, weights can be word frequency - inverse document frequency method.
디지털 컨텐츠 추천 방법은 생성된 단어 벡터를 카테고리를 분류하기 위한 분류기에 통과시켜 유사도를 산출할 수 있다(S213). 예를 들어, 유사도는 코사인 유사도 일 수 있다. The digital content recommendation method can calculate the degree of similarity by passing the generated word vector through a classifier for classifying categories (S213). For example, the similarity may be a cosine similarity.
그리고 디지털 컨텐츠 추천 방법은 데이터베이스(120)에 저장된 주제 분류 트리에서 산출된 유사도에 따라 기 설정된 개수에 해당하는 하나 이상의 카테고리를 추출하고(S214), 추출된 하나 이상의 카테고리 각각을 단어 단위로 분할하고, 분할된 단어 중 빈도가 가장 높은 단어가 포함된 카테고리를 선택할 수 있다(S215).The digital content recommendation method extracts one or more categories corresponding to a preset number according to the similarity calculated in the subject classification tree stored in the database 120 (S214), divides each extracted one or more categories into words, The category including the word having the highest frequency among the divided words can be selected (S215).
도 6은 본 발명의 일 실시예에 따른 스마트 단말(100)에서의 디지털 컨텐츠(140)의 인덱스를 생성하는 방법을 설명하기 위한 순서도이다. 6 is a flowchart illustrating a method of generating an index of the
도 6을 참조하면, 디지털 컨텐츠 추천 방법은 디지털 컨텐츠(140)의 인덱스를 생성하기 위하여(S230) 수집된 디지털 컨텐츠(140)의 정보 및 디지털 컨텐츠(140)의 위치를 디지털 컨텐츠 정보 테이블에 저장하고(S231), 분류된 디지털 컨텐츠(140)의 정보를 카테고리 역 인덱스 테이블에 저장할 수 있다(S232). 이때, 카테고리 역 인덱스 테이블은 추출된 카테고리의 식별자, 추출된 카테고리의 이름, 디지털 컨텐츠(140)의 식별자 및 추출된 카테고리와 디지털 컨텐츠(140)의 유사도를 포함할 수 있다. Referring to FIG. 6, the digital content recommendation method stores information on the collected
이때, 디지털 컨텐츠(140)의 인덱스는 디지털 컨텐츠 테이블 및 카테고리 역 인덱스 테이블을 포함하므로 디지털 컨텐츠(140)의 추천 수행 시 디지털 컨텐츠(140)의 정보나 카테고리 정보를 활용하여 원하는 디지털 컨텐츠(140)에 빠르게 접근할 수 있다. Since the index of the
도 7은 본 발명의 일 실시예에 따른 스마트 단말(100)에서의 디지털 컨텐츠의 추천을 수행하는 방법을 설명하기 위한 순서도이다. 7 is a flowchart illustrating a method of performing recommendation of digital contents in the
도 7을 참조하면, 디지털 컨텐츠(140)를 추천하기 위하여 카테고리 역 인덱스 테이블에 저장된 카테고리의 이름을 각각 단어 단위로 분할하고(S241), 분류된 디지털 컨텐츠(140) 중 가장 빈도가 높은 분할된 단어가 포함된 하나 이상의 디지털 컨텐츠(140)를 선택할 수 있다(S242). 또한, 선택된 디지털 컨텐츠(140)를 유사도에 기초하여 추천할 수 있다(S243). Referring to FIG. 7, in order to recommend the
본 발명의 일 실시예에 따른 디지털 컨텐츠(140)를 추천하는 스마트 단말(100) 및 방법은 주제 분류 트리를 사용하며, 단어 벡터와 연관성이 높은 카테고리를 선택 한 다음 카테고리에 포함된 단어의 빈도를 계산하고 빈도가 높은 단어를 포함하는 카테고리를 선택하여 정확하게 카테고리 형태의 주제를 추출할 수 있으며, 이를 활용하여 사용자의 요구에 정확한 디지털 컨텐츠(140)를 제공할 수 있다. The
또한, 오픈 디렉터리 프로젝트의 카테고리별로 분류된 디지털 컨텐츠(140)의 단어 빈도 기반으로 추천을 수행하므로 스마트 단말과 같은 환경에서 적은 컴퓨팅 리소스 및 네트워크 전송량으로 빠르게 추천을 수행할 수 있다.In addition, since the recommendation is performed based on the word frequency of the
본 발명의 일 실시예는 컴퓨터에 의해 실행되는 프로그램 모듈과 같은 컴퓨터에 의해 실행가능한 명령어를 포함하는 기록 매체의 형태로도 구현될 수 있다. 컴퓨터 판독 가능 매체는 컴퓨터에 의해 액세스될 수 있는 임의의 가용 매체일 수 있고, 휘발성 및 비휘발성 매체, 분리형 및 비분리형 매체를 모두 포함한다. 또한, 컴퓨터 판독가능 매체는 컴퓨터 저장 매체 및 통신 매체를 모두 포함할 수 있다. 컴퓨터 저장 매체는 컴퓨터 판독가능 명령어, 데이터 구조, 프로그램 모듈 또는 기타 데이터와 같은 정보의 저장을 위한 임의의 방법 또는 기술로 구현된 휘발성 및 비휘발성, 분리형 및 비분리형 매체를 모두 포함한다. 통신 매체는 전형적으로 컴퓨터 판독가능 명령어, 데이터 구조, 프로그램 모듈, 또는 반송파와 같은 변조된 데이터 신호의 기타 데이터, 또는 기타 전송 메커니즘을 포함하며, 임의의 정보 전달 매체를 포함한다. One embodiment of the present invention may also be embodied in the form of a recording medium including instructions executable by a computer, such as program modules, being executed by a computer. Computer readable media can be any available media that can be accessed by a computer and includes both volatile and nonvolatile media, removable and non-removable media. In addition, the computer-readable medium can include both computer storage media and communication media. Computer storage media includes both volatile and nonvolatile, removable and non-removable media implemented in any method or technology for storage of information such as computer readable instructions, data structures, program modules or other data. Communication media typically includes any information delivery media, including computer readable instructions, data structures, program modules, or other data in a modulated data signal such as a carrier wave, or other transport mechanism.
본 발명의 방법 및 시스템은 특정 실시예와 관련하여 설명되었지만, 그것들의 구성 요소 또는 동작의 일부 또는 전부는 범용 하드웨어 아키텍쳐를 갖는 컴퓨터 시스템을 사용하여 구현될 수 있다.While the methods and systems of the present invention have been described in connection with specific embodiments, some or all of those elements or operations may be implemented using a computer system having a general purpose hardware architecture.
전술한 본 발명의 설명은 예시를 위한 것이며, 본 발명이 속하는 기술분야의 통상의 지식을 가진 자는 본 발명의 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 쉽게 변형이 가능하다는 것을 이해할 수 있을 것이다. 그러므로 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적이 아닌 것으로 이해해야만 한다. 예를 들어, 단일형으로 설명되어 있는 각 구성 요소는 분산되어 실시될 수도 있으며, 마찬가지로 분산된 것으로 설명되어 있는 구성 요소들도 결합된 형태로 실시될 수 있다.It will be understood by those skilled in the art that the foregoing description of the present invention is for illustrative purposes only and that those of ordinary skill in the art can readily understand that various changes and modifications may be made without departing from the spirit or essential characteristics of the present invention. will be. It is therefore to be understood that the above-described embodiments are illustrative in all aspects and not restrictive. For example, each component described as a single entity may be distributed and implemented, and components described as being distributed may also be implemented in a combined form.
본 발명의 범위는 상기 상세한 설명보다는 후술하는 특허청구범위에 의하여 나타내어지며, 특허청구범위의 의미 및 범위 그리고 그 균등 개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다.The scope of the present invention is defined by the appended claims rather than the detailed description and all changes or modifications derived from the meaning and scope of the claims and their equivalents are to be construed as being included within the scope of the present invention do.
100 스마트 단말
110: 메모리
120: 데이터베이스
130: 프로세서100 smart terminal 110: memory
120: Database 130: Processor
Claims (11)
디지털 컨텐츠를 추천하는 프로그램이 저장된 메모리,
미리 분류된 하나 이상의 카테고리를 포함하는 주제 분류 트리를 저장하는 데이터베이스 및
상기 프로그램을 실행하는 프로세서를 포함하고,
상기 프로세서는 상기 프로그램의 실행에 따라, 상기 스마트 단말에 저장된 디지털 컨텐츠를 수집하고, 상기 데이터베이스에 저장된 주제 분류 트리에서 상기 수집된 디지털 컨텐츠에 대응하는 카테고리를 추출하고, 상기 추출된 카테고리에 기초하여 상기 수집된 디지털 컨텐츠를 분류하며, 상기 분류된 디지털 컨텐츠의 인덱스를 생성하고, 상기 생성된 인덱스에 기초하여 상기 디지털 컨텐츠를 추천하는 스마트 단말.A smart terminal for recommending digital contents,
A memory in which a program for recommending digital contents is stored,
A database storing a subject classification tree including one or more categories classified in advance; and
And a processor for executing the program,
The processor collects digital contents stored in the smart terminal according to the execution of the program, extracts a category corresponding to the collected digital contents from a subject classification tree stored in the database, A smart terminal for classifying the collected digital contents, generating an index of the classified digital contents, and recommending the digital contents based on the generated index.
상기 디지털 컨텐츠의 정보는 상기 디지털 컨텐츠의 식별자, 상기 디지털 컨텐츠의 제목 및 상기 디지털 컨텐츠의 텍스트 정보를 포함하되,
상기 프로세서는 상기 디지털 컨텐츠의 제목 및 상기 디지털 컨텐츠의 텍스트 정보에 포함된 각 단어를 추출하고, 상기 추출된 단어에 가중치를 적용하여 단어 벡터를 생성하며, 상기 생성된 단어 벡터를 상기 카테고리를 분류하기 위한 분류기에 통과시켜 유사도를 산출하고, 상기 데이터베이스에 저장된 주제 분류 트리에서 상기 산출된 유사도에 따라 기 설정된 개수에 해당하는 하나 이상의 카테고리를 추출하며, 상기 하나 이상의 카테고리 각각을 단어 단위로 분할하고, 상기 분할된 단어 중 빈도가 가장 높은 단어가 포함된 카테고리를 선택하는 스마트 단말.The method according to claim 1,
Wherein the information of the digital content includes an identifier of the digital content, a title of the digital content, and text information of the digital content,
The processor extracts each word included in the title of the digital content and the text information of the digital content, applies a weight to the extracted word to generate a word vector, classifies the generated word vector into the category Extracting one or more categories corresponding to a predetermined number according to the calculated similarity in a subject classification tree stored in the database, dividing each of the one or more categories into words, A smart terminal that selects a category that contains the word with the highest frequency among the divided words.
상기 가중치는 상기 각 단어의 빈도, 상기 분류기를 통과한 전체 학습 문서의 수 및 상기 각 단어가 포함된 학습 문서의 빈도에 기초하여 설정되는 것인 스마트 단말.3. The method of claim 2,
Wherein the weight is set based on a frequency of each word, a total number of learning documents passed through the classifier, and a frequency of a learning document in which each word is included.
상기 디지털 컨텐츠의 인덱스는 상기 디지털 컨텐츠의 정보 및 디지털 컨텐츠의 정보를 포함하는 디지털 컨텐츠 정보 테이블 및
상기 추출된 카테고리의 식별자, 상기 카테고리의 이름, 상기 디지털 컨텐츠의 식별자 및 유사도를 포함하는 카테고리 역 인덱스 테이블을 포함하되,
상기 수집된 디지털 컨텐츠의 정보 및 상기 디지털 컨텐츠의 위치를 디지털 컨텐츠 정보 테이블에 저장하고, 상기 분류된 디지털 컨텐츠의 정보를 카테고리 역 인덱스 테이블에 저장하는 스마트 단말. The method according to claim 1,
The index of the digital content includes a digital content information table including information of the digital content and information of the digital content,
A category reverse index table including an identifier of the extracted category, a name of the category, an identifier of the digital content, and a similarity,
Storing the collected digital content information and the location of the digital content in a digital content information table, and storing information of the classified digital content in a category reverse index table.
상기 프로세서는 상기 카테고리 역 인덱스 테이블에 저장된 상기 카테고리의 이름을 각각 단어 단위로 분할하고, 상기 분류된 디지털 컨텐츠 중 가장 빈도가 많은 분할된 단어가 포함된 하나 이상의 디지털 컨텐츠를 선택하며, 상기 선택된 디지털 컨텐츠를 상기 유사도에 기초하여 추천하는 스마트 단말.5. The method of claim 4,
Wherein the processor divides the names of the categories stored in the category reverse index table into words and selects one or more digital contents including divided words having the highest frequency among the classified digital contents, Based on the degree of similarity.
상기 주제 분류 트리는 오픈 디렉토리 프로젝트에 기반하여 생성된 것인 스마트 단말. The method according to claim 1,
Wherein the subject classification tree is generated based on an open directory project.
상기 스마트 단말에 저장된 디지털 컨텐츠를 수집하는 단계;
데이터베이스에 저장된 주제 분류 트리에서 상기 수집된 디지털 컨텐츠에 대응하는 카테고리를 추출하는 단계;
상기 추출된 카테고리에 기초하여 상기 수집된 디지털 컨텐츠를 분류하는 단계;
상기 분류된 디지털 컨텐츠의 인덱스를 생성하는 단계; 및
상기 생성된 인덱스에 기초하여 상기 디지털 컨텐츠를 추천하는 단계를 포함하되,
상기 주제 분류 트리는 미리 분류된 하나 이상의 카테고리를 포함하는 것인 디지털 컨텐츠 추천 방법.A method for recommending digital content in a smart terminal,
Collecting digital contents stored in the smart terminal;
Extracting a category corresponding to the collected digital contents in a subject classification tree stored in a database;
Classifying the collected digital contents based on the extracted categories;
Generating an index of the classified digital contents; And
And recommending the digital content based on the generated index,
Wherein the subject classification tree comprises one or more categories pre-classified.
상기 디지털 컨텐츠의 정보는 상기 디지털 컨텐츠의 식별자, 제목 및 텍스트 정보를 포함하고,
상기 카테고리를 추출하는 단계는,
상기 디지털 컨텐츠의 제목 및 텍스트 정보에 포함된 각 단어를 추출하는 단계;
상기 추출된 각 단어에 가중치를 적용하여 단어 벡터를 생성하는 단계;
상기 생성된 단어 벡터를 상기 카테고리를 분류하기 위한 분류기에 통과시켜 유사도를 산출하는 단계;
상기 데이터베이스에 저장된 주제 분류 트리에서 상기 산출된 유사도에 따라 기 설정된 개수에 해당하는 하나 이상의 카테고리를 추출하는 단계; 및
상기 하나 이상의 카테고리 각각을 단어 단위로 분할하고, 상기 분할된 단어 중 빈도가 가장 높은 단어가 포함된 카테고리를 선택하는 단계를 포함하는 디지털 컨텐츠 추천 방법.8. The method of claim 7,
Wherein the information of the digital content includes an identifier, a title, and text information of the digital content,
The step of extracting the category includes:
Extracting each word included in the title and text information of the digital content;
Generating a word vector by applying a weight to each of the extracted words;
Calculating the similarity by passing the generated word vector through a classifier for classifying the category;
Extracting one or more categories corresponding to a predetermined number according to the calculated similarity in a subject classification tree stored in the database; And
Dividing each of the one or more categories into words, and selecting a category including a word having the highest frequency among the divided words.
상기 가중치는 상기 각 단어의 빈도, 상기 분류기를 통과한 전체 학습 문서의 수 및 상기 각 단어가 포함된 학습 문서의 빈도에 기초하여 설정되는 것인 디지털 컨텐츠 추천 방법.9. The method of claim 8,
Wherein the weight is set based on a frequency of each word, a total number of learning documents passed through the classifier, and a frequency of a learning document including the words.
상기 인덱스를 생성하는 단계는,
상기 수집된 디지털 컨텐츠의 정보 및 상기 디지털 컨텐츠의 위치를 디지털 컨텐츠 정보 테이블에 저장하는 단계; 및
상기 분류된 디지털 컨텐츠의 정보를 카테고리 역 인덱스 테이블에 저장하는 단계를 포함하되,
상기 카테고리 역 인덱스 테이블은 상기 추출된 카테고리의 식별자, 상기 카테고리의 이름, 상기 디지털 컨텐츠의 식별자 및 상기 유사도를 포함하는 것인 디지털 컨텐츠 추천 방법.8. The method of claim 7,
The generating of the index may comprise:
Storing the collected digital content information and the location of the digital content in a digital content information table; And
Storing information of the classified digital contents in a category reverse index table,
Wherein the category reverse index table includes an identifier of the extracted category, a name of the category, an identifier of the digital content, and the similarity.
상기 추천하는 단계는,
상기 카테고리 역 인덱스 테이블에 저장된 상기 카테고리의 이름을 각각 단어 단위로 분할하는 단계;
상기 분류된 디지털 컨텐츠 중 가장 빈도가 높은 상기 분할된 단어가 포함된 하나 이상의 디지털 컨텐츠를 선택하는 단계; 및
상기 선택된 디지털 컨텐츠를 상기 유사도에 기초하여 추천하는 단계를 포함하는 디지털 컨텐츠 추천 방법.11. The method of claim 10,
Wherein the recommending step comprises:
Dividing the names of the categories stored in the category reverse index table into words;
Selecting one or more digital contents including the divided word having the highest frequency among the classified digital contents; And
And recommending the selected digital content based on the similarity.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020140137765A KR20160043601A (en) | 2014-10-13 | 2014-10-13 | Device and method for recommendationing digital content |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020140137765A KR20160043601A (en) | 2014-10-13 | 2014-10-13 | Device and method for recommendationing digital content |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20160043601A true KR20160043601A (en) | 2016-04-22 |
Family
ID=55918168
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020140137765A KR20160043601A (en) | 2014-10-13 | 2014-10-13 | Device and method for recommendationing digital content |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR20160043601A (en) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20180058449A (en) * | 2016-11-24 | 2018-06-01 | 주식회사 솔트룩스 | System and method of semantic search using word vector |
WO2018174469A1 (en) * | 2017-03-23 | 2018-09-27 | (주)플랜아이 | Digital information providing system and method |
KR20200059430A (en) * | 2018-11-21 | 2020-05-29 | 주식회사 쓰리빌리언 | Systme and method for recommanding symptoms of diseases |
KR20200131736A (en) * | 2019-05-14 | 2020-11-24 | 고려대학교 산학협력단 | Method and server for text classification using multi-task learning |
KR20200144417A (en) * | 2019-06-18 | 2020-12-29 | 빅펄 주식회사 | Multimodal content analysis system and method |
KR102284393B1 (en) * | 2020-08-26 | 2021-08-04 | (주)인더스트리미디어 | Apparatus and method for recommending learning contents |
KR20210123598A (en) * | 2020-04-03 | 2021-10-14 | 주식회사 웹웨어 | Method and apparatus for processing personalized content based on device independent re-grab |
KR20220111602A (en) * | 2021-02-02 | 2022-08-09 | 주식회사 키리콘 | Method for recommending contents to user after classification and system for the same |
-
2014
- 2014-10-13 KR KR1020140137765A patent/KR20160043601A/en not_active Application Discontinuation
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20180058449A (en) * | 2016-11-24 | 2018-06-01 | 주식회사 솔트룩스 | System and method of semantic search using word vector |
WO2018174469A1 (en) * | 2017-03-23 | 2018-09-27 | (주)플랜아이 | Digital information providing system and method |
KR20200059430A (en) * | 2018-11-21 | 2020-05-29 | 주식회사 쓰리빌리언 | Systme and method for recommanding symptoms of diseases |
KR20200131736A (en) * | 2019-05-14 | 2020-11-24 | 고려대학교 산학협력단 | Method and server for text classification using multi-task learning |
KR20200144417A (en) * | 2019-06-18 | 2020-12-29 | 빅펄 주식회사 | Multimodal content analysis system and method |
KR20210123598A (en) * | 2020-04-03 | 2021-10-14 | 주식회사 웹웨어 | Method and apparatus for processing personalized content based on device independent re-grab |
KR102284393B1 (en) * | 2020-08-26 | 2021-08-04 | (주)인더스트리미디어 | Apparatus and method for recommending learning contents |
KR20220111602A (en) * | 2021-02-02 | 2022-08-09 | 주식회사 키리콘 | Method for recommending contents to user after classification and system for the same |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11914662B2 (en) | System, method, and computer program product for automated discovery, curation and editing of online local content | |
KR20160043601A (en) | Device and method for recommendationing digital content | |
Ren et al. | Context-aware probabilistic matrix factorization modeling for point-of-interest recommendation | |
Xiao et al. | Inferring social ties between users with human location history | |
TWI636416B (en) | Method and system for multi-phase ranking for content personalization | |
US10152479B1 (en) | Selecting representative media items based on match information | |
CN103955464B (en) | It is a kind of that the recommendation method perceived is merged based on situation | |
CN110059255B (en) | Browser navigation method, device and medium | |
KR101562279B1 (en) | Mobile device based on inference of user intent and content recommending method using the same | |
CN105488233A (en) | Reading information recommendation method and system | |
Nokhbeh Zaeem et al. | PrivacyCheck v2: A tool that recaps privacy policies for you | |
Shi et al. | Nontrivial landmark recommendation using geotagged photos | |
KR20120026682A (en) | Method and apparatus providing for internet service in mobile communication terminal | |
KR102319438B1 (en) | System for Providing Tourism information based on Bigdata and Driving method of the Same | |
Wang et al. | Relation embedding for personalised translation-based poi recommendation | |
KR101508583B1 (en) | Semantic searching system and method for smart device | |
Piccardi et al. | On the Value of Wikipedia as a Gateway to the Web | |
Hong et al. | GRSAT: a novel method on group recommendation by social affinity and trustworthiness | |
Aliannejadi et al. | User model enrichment for venue recommendation | |
CN103399855A (en) | Behavior intention determining method and device based on multiple data sources | |
Viana et al. | A hybrid approach for personalized news recommendation in a mobility scenario using long-short user interest | |
Yu et al. | Point-of-interest recommendation based on user contextual behavior semantics | |
Xu et al. | Learning to annotate via social interaction analytics | |
KR20130064447A (en) | Method and appratus for providing search results using similarity between inclinations of users and device | |
KR101252245B1 (en) | Module for topic classification and contextual advertisement system using the same |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
E601 | Decision to refuse application |