KR20150104882A - 개인별 연관 콘텐츠 네트워크 제공장치 및 그 방법 - Google Patents

개인별 연관 콘텐츠 네트워크 제공장치 및 그 방법 Download PDF

Info

Publication number
KR20150104882A
KR20150104882A KR1020140026793A KR20140026793A KR20150104882A KR 20150104882 A KR20150104882 A KR 20150104882A KR 1020140026793 A KR1020140026793 A KR 1020140026793A KR 20140026793 A KR20140026793 A KR 20140026793A KR 20150104882 A KR20150104882 A KR 20150104882A
Authority
KR
South Korea
Prior art keywords
similarity
content
user
information
degree
Prior art date
Application number
KR1020140026793A
Other languages
English (en)
Inventor
김형우
조준면
유정주
홍진우
Original Assignee
한국전자통신연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국전자통신연구원 filed Critical 한국전자통신연구원
Priority to KR1020140026793A priority Critical patent/KR20150104882A/ko
Publication of KR20150104882A publication Critical patent/KR20150104882A/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/40Searching chemical structures or physicochemical data
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computing Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

본 발명은 콘텐츠에 대하여 작성된 코멘트를 분석하여 콘텐츠의 요소들을 추출하고, 추출된 요소들을 비교하여 두 콘텐츠 간의 유사도를 계산하고, 계산된 유사도를 바탕으로 많은 수의 콘텐츠를 연결해 주는 멀티미디어 콘텐츠 연관 콘텐츠 네트워크를 생성장치 및 그 방법으로, 콘텐츠 연관 콘텐츠 네트워크는 콘텐츠 유사도 산출부, 사용자 유사도 산출부, 네트워크 생성부를 포함할 수 있으며, 이를 통해 서비스를 제공받는 사용자와 코멘트를 작성한 사용자 간의 유사도를 고려하여 실제 사용자가 선호하는 요소들을 영화의 특징으로 포함함으로써 콘텐츠들의 특징을 비교하여 콘텐츠 연관 콘텐츠 네트워크를 생성하여 개인 사용자에게 정확하고 만족스러운 결과를 제공하는 데에 그 목적이 있다.

Description

개인별 연관 콘텐츠 네트워크 제공장치 및 그 방법 {Individually associated contents network providing apparatus and method therefor}
본 발명은 개인별 연관 콘텐츠 네트워크 제공장치 및 그 방법에 관한 것으로, 보다 구체적으로는 많은 수의 연관되는 콘텐츠를 유사도에 따라 연결해 주는 콘텐츠 네트워크 생성장치 및 그 방법에 관한 것이다.
최근 스마트 기기들의 발전으로 많은 사용자들은 쉽게 멀티미디어 콘텐츠를 접하고 소비하고 있으며 이러한 멀티미디어 콘텐츠들을 소비하기 위하여 사용자들은 웹 포털 사이트, 영화 포털 사이트 등에 자신이 원하는 키워드를 입력하여 혹은 포털 사이트 자체에서 제공하여 주는 콘텐츠 리스트 등으로 제공받은 결과를 통하여 소비하는 패턴이 가장 일반적이다.
하지만, 현재 이러한 서비스들에서 제공하는 결과는 단순한 리스트 형태에 불과하며, 검색 혹은 추천 결과로 나온 콘텐츠들간의 점수(평점) 등의 1차원적인 정보를 바탕으로 정렬하여 주는 수준에 불과하다.
수 많은 콘텐츠들이 존재하는 현실에서 단순한 리스트 형태의 결과 제공은 사용자들에게 결과 정보를 요약적으로 한눈에 제공하지 못하며, 사용자들이 원하는 콘텐츠를 찾을 때까지 반복적으로 페이지 혹은 리스트를 넘기며 찾아야 하는 불편함이 존재한다.
본 발명은 콘텐츠에 관한 코멘트를 이용하여, 콘텐츠의 특징을 추출하고, 서비스를 제공받는 사용자와 코멘트를 작성한 사용자 간의 유사도를 고려하여 실제 사용자가 선호하는 요소들을 영화의 특징으로 포함함으로써 콘텐츠들의 특징을 비교하여 콘텐츠 연관 콘텐츠 네트워크를 생성하여 개인 사용자에게 정확하고 만족스러운 결과를 제공하는 데에 그 목적이 있다.
본 발명의 실시 예에 따르면 개인별 연관 콘텐츠 네트워크 제공장치는 콘텐츠에 관한 사용자의 코멘트 정보를 이용하여 각 콘텐츠들의 특성을 나타낼 수 있는 특징 벡터를 산출하고, 상기 특징 벡터를 이용해 각 콘텐츠들 간의 유사도를 계산하는 콘텐츠 유사도 산출부; 및 상기 계산된 유사도 정보를 수신하여 유사도가 클수록 상호 콘텐츠를 근접하게 위치시켜 연결함으로써 연관 콘텐츠 네트워크를 생성하는 네트워크 생성부를 포함할 수 있다.
본 발명의 일 실시 예에 따르면 상기 콘텐츠에 관한 사용자의 코멘트 정보를 이용하여 사용자들 간의 유사도를 계산하며, 상기 계산된 정보를 상기 콘텐츠 유사도 산출부 및 상기 네트워크 생성부에 전달하는 사용자 유사도 산출부를 더 포함할 수 있다.
본 발명의 일 실시 예에 따르면 상기 콘텐츠 유사도 산출부는 상기 사용자 유사도 산출부에서 생성된 사용자 간 유사도를 포함하는 정보를 수신하여 콘텐츠의 특징 벡터를 산출할 수 있다.
본 발명의 일 실시 예에 따르면 상기 콘텐츠 유사도 산출부는 상기 코멘트 정보 중에서 해당 콘텐츠에 작성된 코멘트에서 특정단어의 등장 횟수를 카운트하여 사용자가 미리 설정한 횟수 이상 등장하는 단어에 대하여 가중치를 주어 등장 횟수 및 가중치를 고려하여 점수를 측정한 후 일정 점수 이상의 단어를 특징 벡터로 선정함으로써 콘텐츠 유사도를 계산할 수 있는 정보를 생성하는 특징벡터 추출부; 및
상기 생성된 정보를 수신하여 각 콘텐츠 마다 선정된 특징벡터간의 유사도를 계산하는 콘텐츠 유사도 계산부를 더 포함할 수 있다.
본 발명의 일 실시 예에 따르면 콘텐츠에 관한 사용자의 코멘트 정보를 이용하여 사용자들 간의 유사도를 계산하며, 상기 계산된 정보를 상기 콘텐츠 유사도 산출부 및 상기 네트워크 생성부에 전달하는 사용자 유사도 산출부를 더 포함하며,
상기 특징벡터 추출부는 상기 콘텐츠에 관한 사용자의 코멘트 정보 및 상기 사용자 유사도 산출부로부터 사용자간 유사도에 대한 정보를 수신 받아 상기 수신한 정보에 포함된 미리 설정된 유사도보다 높은 수준의 유사도를 가진 콘텐츠를 제공받은 사용자 또는 콘텐츠 선호도에 있어 미리 설정된 유사도보다 높은 수준의 유사도를 가진 사용자와 같이 사용자 유사도가 높은 사용자가 언급한 단어 일수록 상대적으로 높은 가중치를 주어 등장 횟수 및 가중치를 고려하여 일정 점수 이상의 단어를 특징 벡터로 선정하여 각 콘텐츠의 특징 요소들을 추출함으로써 사용자 유사도를 계산할 수 있는 정보를 생성하고, 상기 생성된 정보를 상기 콘텐츠 유사도 계산부 및 상기 네트워크 생성부에 송신할 수 있다.
본 발명의 일 실시 예에 따르면 상기 특징벡터 추출부는 오피니언 마이닝을 실시한 결과 값을 포함하여 상기 결과 값에 따라 상기 코멘트에 포함된 특정단어에 추가적으로 가중치를 부여하고, 상기 가중치를 반영하여 특징벡터를 선정할 수 있다.
본 발명의 일 실시 예에 따르면 상기 사용자 유사도 산출부는, 복수의 콘텐츠에 대하여 평가한 정보를 이용하여 각 사용자간에 콘텐츠에 관한 선호도의 유사 정도인 사용자 유사도를 계산하는 사용자 유사도 계산부를 포함하며, 상기 계산된 사용자 유사도의 결과를 수신하여 저장하고, 상기 저장된 정보를 콘텐츠간의 특징 벡터를 생성하는데 사용할 수 있도록 상기 콘텐츠 유사도 산출부 및 상기 연관 콘텐츠 네트워크를 생성하는 데 사용할 수 있도록 네트워크 생성부에 송신하는 사용자 유사도 DB를 더 포함할 수 있다.
본 발명의 일 실시 예에 따르면 상기 사용자 유사도 DB를 더 포함하며 상기 생성된 사용자 유사도에 대한 정보는 상기 사용자 유사도 계산부에서 상기 네트워크 생성부 및 콘텐츠 유사도 산출부로 송신하고, 상기 사용자 유사도 산출부가 상기 사용자 유사도 DB를 포함하는 경우에는 상기 생성된 사용자 유사도에 대한 정보는 상기 사용자 유사도 DB에서 상기 네트워크 생성부 및 콘텐츠 유사도 산출부로 송신할 수 있다.
본 발명의 일 실시 예에 따르면 상기 네트워크 생성부는 상기 연관 콘텐츠 네트워크를 생성하기 위해 복수의 콘텐츠 중 가장 유사도가 높은 콘텐츠를 최소 비용을 가지는 경로 경유점으로 보아 다음 경로 경유점으로 선택하고, 상기 다음 경로 경유점으로의 경로를 최단 경로에 포함시킴으로써 상기 최단 경로를 선정하여 상기 최단 경로에 따라 콘텐츠 연관 콘텐츠 네트워크를 생성하는 것을 특징으로 할 수 있다.
본 발명의 일 실시 예에 따르면 상기 네트워크 생성부는, 상기 연관 콘텐츠 네트워크에 포함되는 각 콘텐츠 간의 유사도를 거리로 나타내는 것을 포함하고, 상기 연관 콘텐츠 네트워크에 포함되는 각 콘텐츠들을 연결하는 연결고리를 생성하여 상기 연결고리에 콘텐츠의 특징정보를 더 포함할 수 있다.
본 발명의 실시 예에 따르면 개인별 연관 콘텐츠 네트워크 제공방법은 콘텐츠에 관한 사용자의 콘텐츠 정보를 이용하여 각 콘텐츠들의 특성을 나타낼 수 있는 특징 벡터를 산출하고, 상기 특징 벡터를 이용해 각 콘텐츠들 간의 유사도를 계산하는 단계; 및 상기 계산된 유사도에 대한 정보를 수신하여 유사도가 클수록 상호 콘텐츠를 근접하게 위치시켜 연결함으로써 연관 콘텐츠 네트워크를 생성하는 단계를 포함할 수 있다.
본 발명의 일 실시 예에 따르면 상기 콘텐츠에 관한 사용자의 코멘트 정보를 이용하여 사용자들 간의 유사도를 계산하는 단계를 더 포함할 수 있다.
본 발명의 일 실시 예에 따르면 상기 계산된 사용자 간 유사도를 콘텐츠의 특징 벡터를 산출을 위하여 사용할 수 있다.
본 발명의 일 실시 예에 따르면 상기 콘텐츠간 유사도에 대한 정보를 생성하는 단계는 상기 코멘트 정보 중에서 해당 콘텐츠에 작성된 코멘트에서 특정단어의 등장 횟수를 카운트하여 사용자가 미리 설정한 횟수 이상 등장하는 단어에 대하여 가중치를 주어 등장 횟수 및 가중치를 고려하여 점수를 측정한 후 일정 점수 이상의 단어를 특징 벡터로 선정함으로써 콘텐츠 유사도를 계산할 수 있는 정보를 생성하는 단계; 및 상기 생성된 정보를 수신하여 각 콘텐츠 마다 선정된 특징벡터간의 유사도를 계산하는 단계를 더 포함할 수 있다.
본 발명의 일 실시 예에 따르면 상기 코멘트 정보를 이용하여 사용자들 간의 유사도를 계산하는 단계를 더 포함하며, 상기 콘텐츠 유사도를 계산할 수 있는 정보를 생성하는 단계는 콘텐츠에 대한 코멘트 정보 및 상기 사용자 유사도에 대한계산결과가 포함된 정보를 수신 받고, 상기 수신한 정보에 포함된 미리 설정된 유사도보다 높은 수준의 유사도의 콘텐츠를 제공받은 사용자 또는 콘텐츠 선호도에 있어 미리 설정된 유사도보다 높은 수준의 유사도를 가진 사용자와 같이 사용자 유사도가 높은 사용자가 언급한 단어 일수록 상대적으로 높은 가중치를 주어 미리 설정한 일정 점수 이상의 단어를 특징 벡터로 선정함으로써 각 콘텐츠 별로 특징 요소들을 추출하여 사용자 유사도를 계산할 수 있는 정보를 생성할 수 있다.
본 발명의 일 실시 예에 따르면 상기 콘텐츠 유사도를 계산할 수 있는 정보를 생성하는 단계는, 오피니언 마이닝을 실시한 결과 값을 포함하여 상기 결과 값에 따라 상기 코멘트에 포함된 특정단어에 추가적으로 가중치를 부여하고, 상기 가중치를 반영하여 특징벡터를 선정하는 것을 특징으로 할 수 있다.
본 발명의 일 실시 예에 따르면 상기 사용자들 간의 유사도를 계산하는 단계는, 복수의 콘텐츠에 대하여 평가한 정보를 이용하여 각 사용자간에 콘텐츠에 관한 선호도의 유사 정도인 사용자 유사도를 계산하는 단계를 포함하며, 상기 생성된 사용자간의 유사도에 대한 정보를 수신하여 저장하고, 상기 저장된 정보를 콘텐츠간의 특징 벡터를 생성하는데 사용할 수 있도록 송신하는 단계를 더 포함할 수 있다.
본 발명의 일 실시 예에 따르면 상기 연관 콘텐츠 네트워크를 생성하는 단계는, 상기 연관 콘텐츠 네트워크를 생성하기 위해 복수의 콘텐츠 중 가장 유사도가 높은 콘텐츠를 최소 비용을 가지는 경로 경유점으로 보아 다음 경로 경유점으로 선택하고, 상기 다음 경로 경유점으로의 경로를 최단 경로에 포함시킴으로써 상기 최단 경로를 선정하여 상기 최단 경로에 따라 콘텐츠 연관 콘텐츠 네트워크를 생성하는 것을 더 포함할 수 있다.
본 발명의 일 실시 예에 따르면 상기 연관 콘텐츠 네트워크를 생성하는 단계는, 상기 연관 콘텐츠 네트워크에 포함되는 각 콘텐츠 간의 유사도를 거리로 나타내는 것을 포함하고, 상기 연관 콘텐츠 네트워크에 포함되는 각 콘텐츠들을 연결하는 연결고리를 생성하여 상기 연결고리에 콘텐츠의 특징정보를 더 포함할 수 있다.
도 1은 본 발명의 실시 예에 따른 개인별 연관 콘텐츠 네트워크 제공장치의 구성도이다.
도 2는 도 1에 도시된 콘텐츠 유사도 산출부의 세부 구성도이다.
도 3은 도 1에 도시된 사용자 유사도 산출부의 세부 구성도이다.
도 4는 사용자 유사도 DB를 포함하는 실시 예에 따른 개인별 연관 콘텐츠 네트워크 제공장치와 사용자 코멘트 DB간 데이터 전달관계를 나타낸 도면이다.
도 5는 개인별 연관 콘텐츠 네트워크 제공장치가 콘텐츠들 간의 유사도 거리만을 표현한 네트워크를 제공하는 실시 예의 결과를 나타낸 도면이다.
도 6은 개인별 연관 콘텐츠 네트워크 제공장치가 콘텐츠들의 연결간의 특징정보를 표현하는 네트워크를 제공하는 실시 예의 결과를 나타낸 도면이다.
도 7은 본 발명의 실시 예에 따른 개인별 연관 콘텐츠 네트워크 제공방법을 나타낸 흐름도이다.
아래에서는 첨부한 도면을 참고로 하여 본 발명의 실시 예에 대하여 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 상세히 설명한다. 그러나 본 발명은 여러 가지 상이한 형태로 구현될 수 있으며 여기에서 설명하는 실시 예에 한정되지 않는다. 그리고 도면에서 본 발명을 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략하였으며, 명세서 전체를 통하여 유사한 부분에 대해서는 유사한 도면 부호를 붙였다.
명세서 전체에서, 어떤 부분이 어떤 구성요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성 요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있는 것을 의미한다.
이하, 도면을 참조하여 본 발명의 실시 예에 따른 개인별 연관 콘텐츠 네트워크 제공장치 및 그 방법에 대하여 설명한다.
도 1은 본 발명의 실시 예에 따른 개인별 연관 콘텐츠 네트워크 제공장치의 구성도이다.
도 1을 참조하면 본 발명의 실시 예에 따른 개인별 연관 콘텐츠 네트워크 제공장치(1000)는 콘텐츠 유사도 산출부(100), 네트워크 생성부(300)를 포함할 수 있으며 사용자 유사도 산출부(200)를 더 포함할 수도 있다.
콘텐츠 유사도 산출부(100)는 사용자 코멘트 DB(Data base)(2000)에 포함된 정보를 이용하여 각 콘텐츠들의 특성을 나타낼 수 있는 특징 벡터를 산출하고, 특징 벡터를 이용해 각 콘텐츠간의 유사도를 계산하여 콘텐츠간 유사도에 대한 정보를 생성할 수 있다.
여기서 사용자 코멘트 DB는 콘텐츠에 대한 코멘트(텍스트 정보로 이루어진) 및 콘텐츠에 대한 사용자의 평가 점수(numerical rating)와 자유롭게 서술한 비정형 텍스트, 비정형 텍스트를 대상으로 오피니언 마이닝(Opinion mining)을 실시한 정보 등을 포함할 수 있으며, 이러한 정보를 포함하여 콘텐츠의 특징에 대한 특징 벡터를 생성 할 수 있도록 정보를 제공하는 역할을 할 수 있다.
오피니언 마이닝은 어떤 사안이나 인물, 이슈, 이벤트에 대한 사람들의 의견이나 평가, 태도, 감정 등을 분석하는 것을 의미하며, 특정 주제에 대해 사람들의 주관적인 의견을 모아 문장을 분석할 수 있다.
문장 분석에서는 사실과 의견을 구분해 의견을 뽑아내어 긍정과 부정으로 나누고 그 강도를 측정할 수 있다.
특징 벡터를 생성하는 방법 및 콘텐츠 간의 유사도를 계산하는 방법은 도 2를 참조하여 더 자세히 설명하도록 한다.
일 실시 예에 따르면 사용자 유사도 산출부(200)는 개인별 연관 콘텐츠 네트워크 제공장치(1000)에 더 포함될 수 있으며 사용자 코멘트 DB(2000)의 콘텐츠에 관한 사용자의 코멘트 정보를 이용하여 사용자들 간의 유사도를 계산하며, 계산된 정보를 콘텐츠 유사도 산출부(100) 및 네트워크 생성부(300)에 전달할 수 있다.
사용자 코멘트 DB(2000)의 콘텐츠에 관한 사용자의 코멘트 정보를 이용하여 사용자들 간의 유사도를 계산하여 계산된 정보를 네트워크 생성부(300)에 전달할 수 있고 사용자 유사도 DB(220)를 포함하는 실시 예에 따르면 사용자 유사도 DB(220)에 저장할 수도 있다.
사용자들 간의 유사도를 계산하는 방법은 도 3를 참조하여 더 자세히 설명하도록 한다.
네트워크 생성부(300)는 사용자 유사도 산출부(200)를 포함하는 실시 예에 따르면 콘텐츠 유사도 산출부(100) 및 사용자 유사도 산출부(200)로부터 유사도에 대한 정보를 수신하여 유사도의 수준별로 콘텐츠를 분류, 연결하여 연관 콘텐츠 네트워크를 생성할 수 있다.
사용자 유사도 산출부(200)를 포함하지 않는 실시 예에 따르면 콘텐츠 유사도 산출부(100)로부터 유사도에 대한 정보를 수신하여 유사도의 수준별로 콘텐츠를 분류, 연결하여 연관 콘텐츠 네트워크를 생성할 수 있다.
여기서 연관 콘텐츠 네트워크는 각 콘텐츠들을 연결하는 연결고리로 콘텐츠의 특징정보를 포함할 수 있다.
콘텐츠 연관 콘텐츠 네트워크를 생성하기 위해 최단 거리 알고리즘을 사용할 수 있으나 이에 한정되지는 않고 콘텐츠 연관 콘텐츠 네트워크를 생성할 수 있는 방법이라면 제한 없이 사용될 수 있다.
여기서 최단 경로 알고리즘은 통신에서 네트워크의 성능을 평가할 때 최단 경로(shortest path) 또는 최소 비용(minimum cost)을 선정하여 평가하는 것을 의미한다.
비용이란 네트워크의 각 링크에 부여된 통신 비용을 의미하며, 경로 중에서 최소 비용 경로를 찾는 알고리즘이 여러 가지 개발되어 있는데 다이크스트라(Dijkstra) 알고리즘과 벨만-포드(Bellman-Ford) 알고리즘이 가장 많이 사용되고 있다.
여기서 다이크스트라 알고리즘은 가중치가 있는 그래프의 최단 경로를 구하는 알고리즘으로써 출발 경로 경유점에서 시작하여 현재의 경로 경유점까지의 값과 인접한 경로 경유점의 가중치 합이 가장 작은 경로 경유점을 최소 비용의 경로로 보아 다음 경로 경유점으로 선택하고 그 경로를 최단 경로에 포함시킨다. 이 과정을 모든 경로 경유점이 선택될 때까지 반복한다
다이크스트라 알고리즘을 사용하여 콘텐츠 연관 콘텐츠 네트워크를 생성하는 실시 예에 따르면 사용자로부터 입력 받은 키워드에 따라 탐색된 복수의 콘텐츠 세트(set)에 포함된 콘텐츠 중 가장 유사도가 높은 콘텐츠를 최소 비용을 가지는 경로 경유점으로 보아 다음 경로 경유점으로 선택하고 그 경로를 최단 경로에 포함시켜 최단 경로를 선정하여 최단 경로에 따라 콘텐츠 연관 콘텐츠 네트워크를 생성할 수 있다.
이러한 연관 콘텐츠 네트워크는 각 사용자들에게 자신의 선호에 적합한 콘텐츠들을 탐색하고 추천하기에 최적화된 환경을 제공할 수 있다.
도 2는 도 1에 도시된 콘텐츠 유사도 산출부(100)의 세부 구성도이다.
도 2를 참조하면 콘텐츠 유사도 산출부(100)는 특징벡터 추출부(110), 콘텐츠 유사도 계산부(120)를 포함할 수 있다.
특징벡터 추출부(110)는 사용자 코멘트 DB에 포함되어 있는 정보 중에서 해당 콘텐츠에 작성된 코멘트에서 특정단어의 등장 횟수를 카운트하여 사용자가 미리 설정한 횟수 이상 등장하는 단어에 대하여 가중치를 주어, 등장 횟수 및 가중치를 고려하여 점수를 측정한 후 일정 점수 이상의 단어를 특징 벡터로 선정하여 각 콘텐츠의 특징 요소들을 추출함으로써 콘텐츠 유사도를 계산할 수 있는 정보를 생성할 수 있다.
콘텐츠의 특징벡터의 추출을 위하여 사용자 유사도 추출부(200)를 포함하고 있는 실시 예에서는 사용자 코멘트 DB(2000)에 포함된 코멘트 정보 및 사용자 유사도 추출부(200)로부터 각 사용자간의 유사도 정보를 수신하고 이를 이용하여 콘텐츠의 특징벡터를 추출할 수 있다.
또한 사용자 유사도 추출부(200)에서 사용자 유사도 DB(220)를 포함하고 있는 실시 예에서는 사용자 코멘트 DB(2000)에 포함되어 있는 콘텐츠에 대한 텍스트 정보는 물론 사용자 유사도 DB(220)로부터 사용자 유사도 정보를 수신 받아 사용자 유사도 추출부(200)가 선정한 높은 유사도의 콘텐츠를 제공받은 또는 사용자와 비슷한 선호를 가진 사용자와 같이 사용자 유사도가 높은 사용자가 언급한 단어 일수록 그 높은 가중치를 주어, 등장 횟수 및 가중치를 고려하여 점수를 측정한 후 일정 점수 이상의 단어를 특징 벡터로 선정하여 각 콘텐츠의 특징 요소들을 추출함으로써 콘텐츠 유사도를 계산할 수 있는 정보를 생성할 수 있다.
상술한 것과 같은 방법으로 특징 벡터를 선정하는 방법을 사용할 수 있으나 이제 한정되지 아니하고 콘텐츠 또는 사용자에 대한 정보로 콘텐츠의 유사성을 판단할 수 있는 특징이 되는 특징벡터를 선정할 수 있는 방법이라면 제한 없이 사용될 수 있다.
또한 상술한 것과 같이 가중치를 주어 특징 벡터를 선정하는 방법을 사용하는 실시 예에 있어서 코멘트의 단어에 가중치를 줄 때 콘텐츠에 대한 정보에 포함된 코멘트의 텍스트에 대하여 오피니언 마이닝을 실시한 결과 값을 포함하여 특징벡터를 선정하는 방법을 사용할 수 있다.
여기서 오피니언 마이닝을 실시한 결과 값을 포함하여 특징벡터를 선정하는 방법은 문장 분석을 통해 사실과 의견을 구분해 의견을 뽑아내어 긍정과 부정으로 나누고 그 강도를 측정하여 높은 강도일수록 가중치를 주어 등장 횟수 및 가중치를 고려하여 점수를 측정한 후 일정 점수 이상의 단어를 특징 벡터로 선정하는 방법을 사용할 수 있다.
본 발명의 실시 예에 따르면 특징벡터는 점수가 높은 단어 및 그 가중치의 세트로 나타낼 수 있으나 이제 한정되지 아니하고 단어 또는 가중치만으로 나타낼 수 있다.
특징벡터 추출부(110)는 개인별 연관 콘텐츠 네트워크 제공장치(1000)에 사용자 유사도 산출부(200)가 포함된 실시 예에 따르면, 사용자 코멘트 DB(2000)에 포함되어 있는 콘텐츠에 대한 코멘트 정보 및 사용자 유사도 산출부(200)로부터 사용자간 유사도에 대한 정보를 수신 받을 수 있다
사용자 유사도 산출부(200)로부터 수신한 정보에 포함된 높은 유사도의 콘텐츠를 제공받은 사용자 또는 콘텐츠 선호도에 있어 높은 유사도를 가진 사용자와 같이 사용자 유사도가 높은 사용자가 언급한 단어 일수록 높은 가중치를 주어 등장 횟수 및 가중치를 고려하여 점수를 측정한 후 일정 점수 이상의 단어를 특징 벡터로 선정할 수 있다.
이렇게 선정된 특징 벡터를 이용하여 각 콘텐츠의 특징 요소들을 추출함으로써 사용자 유사도를 계산할 수 있는 정보를 생성하고, 생성된 정보를 콘텐츠 유사도 계산부(120) 및 상기 네트워크 생성부(300)에 송신할 수 있다.
콘텐츠 유사도 계산부(120)는 특징벡터 정보를 수신하여 각 콘텐츠 마다 선정된 특징 벡터간의 유사도를 계산하여 콘텐츠간 유사도에 대한 정보를 생성할 수 있다.
여기서 특징벡터간의 유사도를 계산하는 방법은 코사인 유사도(Cosine Similarity)방법을 사용하여 벡터 모델로 나타내고 이를 계산하여 콘텐츠 간 유사도를 0과 1사이의 값으로 나타내는 것을 사용할 수 있다.
여기서 코사인 유사도 방법은 내적 공간의 두 벡터간 각도의 코사인 값을 이용하여 측정된 벡터간의 유사한 정도를 구하는 방법을 의미한다.
그러나 특징벡터간의 유사도를 구하는 방법은 코사인 유사도 방법에 한정되지 아니하고 벡터를 사용하여 유사도를 구할 수 있는 방법이라면 제한 없이 사용될 수 있다.
도 3은 도 1에 도시된 사용자 유사도 산출부(200)의 세부 구성도이다.
도 3을 참조하면 사용자 유사도 산출부(200)는 사용자 유사도 계산부(210)를 포함할 수 있고 사용자 유사도 DB(220)를 더 포함할 수 있다.
사용자 유사도 계산부(210)는 과거에 사용자가 복수의 콘텐츠에 대하여 평가한 정보를 사용자 코멘트 DB(2000)로부터 수집하고, 이를 이용하여 각 사용자간에 특정 콘텐츠에 관하여 얼마나 유사한 선호도를 가지고 있는지를 계산하여 사용자 유사도에 대한 정보를 생성할 수 있다.
유사한 선호도의 계산은 과거에 사용자가 복수의 콘텐츠에 대하여 평가한 정보를 사용자 코멘트 DB(2000)로부터 수집하고, 이를 이용하여 상관 분석방법을 통해 계산하는 방법을 사용할 수 있으나 이에 한정되지 아니하고 코사인 유사도 방법 등 유사도를 산출 할 수 있는 방법이면 제한 없이 사용될 수 있다.
이렇게 계산된 사용자간의 유사도에 대한 정보는 특징벡터 추출부(110)로 송신하거나 사용자 유사도 산출부(200)가 사용자 유사도 DB(220)를 포함하는 실시 예의 경우에는 사용자 유사도 DB(220)로 송신하여 정보를 저장할 수 있다.
사용자 유사도 DB(220)는 사용자 유사도 계산부(201)에서 생성된 사용자간의 유사도에 대한 정보를 수신하여 저장하고, 저장된 정보를 콘텐츠간의 특징 벡터를 생성하는데 사용할 수 있도록 특징 벡터 추출부(110) 및 네트워크 생성부(300)에 송신할 수 있다.
사용자 유사도 DB(220)는 PC, 서버, 데이터 저장장치 등의 형태로 존재할 수 있으나 이에 한정되지 아니하고 데이터를 저장하고 송신할 수 있는 것이라면 제한 없이 사용될 수 있다.
본 발명의 실시 예에 있어서 사용자 유사도 산출부(200)는 개인별 연관 콘텐츠 네트워크 제공장치(1000)에 포함될 수도 있으며 포함되지 아니할 수도 있다.
사용자 유사도 산출부(200)가 사용자 유사도 DB(220)를 포함하지 않는 경우에는 생성된 사용자 유사도에 대한 정보는 사용자 유사도 계산부(210)에서 네트워크 생성부(300) 및 특징 벡터 추출부(110)로 송신되고, 사용자 유사도 산출부(200)가 사용자 유사도 DB(220)를 포함하는 경우에는 생성된 사용자 유사도에 대한 정보는 상기 사용자 유사도 DB(220)에서 상기 네트워크 생성부(300) 및 특징 벡터 추출부(110)로 송신할 수 있다.
사용자 유사도 산출부(200)가 포함되지 아니하는 실시 예에 따르면 사용자로부터 콘텐츠에 대한 키워드를 입력 받아 키워드 검색으로 복수의 콘텐츠 세트를 검색 결과로 제공 받을 수 있다.
그 후 사용자 코멘트 DB(2000)에서 복수의 콘텐츠로 이루어진 콘텐츠 세트의 콘텐츠에 대하여 작성되어 있는 코멘트 정보들을 수신할 수 있다.
수신한 코멘트 정보를 바탕으로 복수의 콘텐츠로 이루어진 콘텐츠 세트의 콘텐츠의 코멘트에서 등장한 단어들을 사용자들이 많이 언급할 수록, 단어가 언급된 코멘트의 점수가 높을 수록 높은 가중치를 주도록 설정할 수 있다.
이렇게 얻은 가중치와 등장 횟수를 곱하는 방법 등으로 점수를 산출하여 사용자가 설정한 점수 이상의 단어를 콘텐츠의 특징백터로 획득할 수 있다.
복수의 콘텐츠 세트에 포함된 각 콘텐츠의 특징백터들 통해 콘텐츠간의 유사도를 산출할 수 있다.
일 실시 예에 따르면 각 콘텐츠들 간의 유사도를 계산할 시에, 가장 영향을 많이 끼친 특징 요소들의 정보를 포함하게 할 수 있다.
연관 콘텐츠 네트워크에 포함되는 각 콘텐츠 간의 유사도를 거리로 나타내는 것을 포함하고, 상기 연관 콘텐츠 네트워크에 포함되는 각 콘텐츠들을 연결하는 연결고리를 생성하여 상기 연결고리에 콘텐츠가 연결되는데 가장 영향을 끼친 특징정보들의 정보를 포함할 수 있다.
사용자 유사도 산출부(200)가 포함되는 실시 예에 따르면 사용자로부터 콘텐츠에 대한 키워드를 입력 받아 키워드 검색으로 복수의 콘텐츠 세트를 검색 결과로 제공 받을 수 있다.
사용자 코멘트 DB(2000)에서 복수의 콘텐츠로 이루어진 콘텐츠 세트의 콘텐츠에 작성되어 있는 코멘트 정보들을 사용자 유사도 계산부(210)에서 수신할 수 있다.
수신한 정보를 통해 코멘트를 작성한 사용자들과 현재 사용자간의 사용자 유사도를 산출하여 정보를 생성하고 사용자 유사도에 대한 정보를 사용자 유사도 DB(220)에 송신하거나 특징벡터 추출부(110)로 송신할 수 있다.
특징벡터 추출부(110)는 사용자 유사도 계산부(210) 또는 사용자 유사도 DB(220)로부터 수신한 사용자 유사도 정보를 바탕으로 복수의 콘텐츠로 이루어진 콘텐츠 세트의 콘텐츠에 대한 코멘트에서 나타난 단어들을 사용자와 유사한 선호를 가진(유사도가 높은) 사용자가 많이 언급할 수록, 단어가 언급된 코멘트의 점수가 높을 수록 가중치를 주도록 설정할 수 있다.
이렇게 얻은 가중치와 등장 횟수를 곱하는 방법 등을 사용하여 점수를 산출하여 사용자가 설정한 점수 이상의 단어를 콘텐츠의 특징백터로 획득할 수 있다.
복수의 콘텐츠 세트에 포함된 각 콘텐츠의 특징백터들 통해 콘텐츠간의 유사도를 산출할 수 있다.
일 실시 예에 따르면 각 콘텐츠들 간의 유사도를 계산할 때, 가장 영향을 많이 준 특징 요소들의 정보를 포함하게 할 수 있다.
여기서 특징 요소들의 정보를 포함하는 것은 생성된 콘텐츠 별 유사도 정보를 이용하여 복수의 콘텐츠로 이루어진 콘텐츠 세트의 콘텐츠들을 연결하는 네트워크를 생성하며, 각 콘텐츠 간의 연결 고리 사이에 두 영화가 연결되는데 가장 영향을 끼친 요소들의 정보를 포함하는 방법을 사용할 수 있다.
도 4는 사용자 유사도 DB(220)를 포함하는 실시 예에 따른 개인별 연관 콘텐츠 네트워크 제공장치(1000)와 사용자 코멘트 DB(2000)간 데이터 전달관계를 나타낸 도면이다.
도 4를 참조하면 사용자 코멘트 DB(2000)는 특징 벡터 추출부(110)와 사용자 유사도 계산부(210)로 사용자 코멘트의 정보를 송신할 수 있다.
특징 벡터 추출부(110)는 콘텐츠 별 특징벡터를 추출하여 특징벡터에 대한 내용을 포함한 정보를 유사도 계산을 위해 콘텐츠 유사도 계산부(120)로 송신할 수 있으며 네트워크 생성부(300)에 송신할 수도 있다.
또한 사용자 코멘트 DB(2000)로부터 정보를 수신한 사용자 유사도 계산부(210)는 사용자간 유사도에 대한 정보를 생성하여 사용자 유사도 DB(200)에 송신할 수 있다.
사용자 유사도 DB(200)는 수신한 사용자간 유사도에 대한 정보를 저장하고 특징 벡터 추출부(110)에 송신할 수 있으며 네트워크 생성부(300)에 송신할 수도 있다.
도 5는 개인별 연관 콘텐츠 네트워크 제공장치(1000)가 콘텐츠들 간의 유사도 거리만을 표현한 네트워크를 제공하는 실시 예의 결과를 나타낸 도면이다.
도 5를 참조하면 사용자가 입력한 키워드로 검색하여 얻어진 콘텐츠 세트에 포함된 복수의 콘텐츠를 유사도 정보를 사용하여 각 콘텐츠 간의 유사도에 따른 거리만을 네트워크에 표현함으로써 콘텐츠 간의 유사성을 한눈에 표현할 수 있다.
도 6은 개인별 연관 콘텐츠 네트워크 제공장치(1000)가 콘텐츠들의 연결간의 특징정보를 표현하는 네트워크를 제공하는 실시 예의 결과를 나타낸 도면이다.
도 6을 참조하면 사용자가 입력한 키워드로 검색하여 얻어진 콘텐츠 세트에 포함된 복수의 콘텐츠를 유사도 정보를 사용하여 각 콘텐츠들 간의 유사도에 따른 거리와 콘텐츠들의 연결간의 특징정보를 네트워크에 표현함으로써 콘텐츠들 간의 유사성을 한눈에 표현할 뿐만 아니라 각 콘텐츠들 간의 유사도에 따른 거리와 해당 콘텐츠를 연결하는 특징 요소를 표현함으로써 각 콘텐츠들의 유사한 정도와 왜 연결되었는지에 대한 이유(특징)을 표현하여 콘텐츠 연관 콘텐츠 네트워크를 표현할 수 있다.
도 7은 본 발명의 실시 예에 개인별 연관 콘텐츠 네트워크 제공방법을 나타낸 흐름도이다.
개인별 연관 콘텐츠 네트워크 제공방법에 따른 사용자 유사도 산출단계가 포함되는지를 판단한다(710).
개인별 연관 콘텐츠 네트워크 제공방법에 사용자 유사도 산출단계가 포함되는 경우 사용자 코멘트 DB에 포함되어 있는 정보를 수신하고(720), 이를 이용하여 사용자 유사도를 계산한다(730).
반면 개인별 연관 콘텐츠 네트워크 제공방법에 사용자 유사도 산출단계가 포함되지 않는 경우에는 사용자 코멘트 DB(2000)에서 바로 코멘트 정보를 수신할 수 있다(765).
여기서 사용자 유사도를 계산하는 방법은 과거에 사용자가 복수의 콘텐츠에 대하여 평가한 정보를 사용자 코멘트 DB로부터 수집하고, 이를 이용하여 각 사용자간에 특정 콘텐츠에 관하여 얼마나 유사한 선호도를 가지고 있는지를 계산하여 사용자 유사도에 대한 정보를 생성할 수 있다.
유사한 선호도의 계산은 과거에 사용자가 복수의 콘텐츠에 대하여 평가한 정보를 사용자 코멘트 DB(2000)로부터 수집하고, 이를 이용하여 상관 분석방법을 통해 계산하는 방법을 사용할 수 있으나 이에 한정되지 아니하고 코사인 유사도 방법 등 유사도를 산출 할 수 있는 방법이면 제한 없이 사용될 수 있다.
사용자 유사도 DB에 포함되는지 여부를 판단하고(740), 만약에 포함되는 경우 생성된 사용자 유사도에 대한 정보를 사용자 유사도 DB에 저장하고 그 정보를 콘텐츠 유사도를 산출 및 연관 콘텐츠 네트워크를 생성하는데 반영하기 위해 송신한다(750).
만약 사용자 유사도 DB가 포함되지 않는 경우 생성된 사용자 유사도에 대한 정보를 저장 없이 바로 콘텐츠 유사도를 산출 및 연관 콘텐츠 네트워크를 생성하는데 하는데 반영하기 위해 송신한다(755).
사용자 코멘트 DB(2000)에서 콘텐츠에 대한 코멘트 정보 및 생성된 사용자 유사도 정보를 수신하고(760), 수신한 정보로부터 콘텐츠의 특징 벡터를 추출한다(770).
콘텐츠의 특징벡터를 추출하는 방법은 사용자 코멘트 DB(2000)에 포함되어 있는 콘텐츠에 대한 텍스트 정보 중에서 해당 콘텐츠에 작성된 코멘트의 단어의 등장 횟수를 카운트 하여 사용자가 미리 설정한 횟수 이상 등장하는 단어에 대하여 순위를 메겨 높은 순위부터 가중치를 주어 일정 점수 이상의 단어를 특징 벡터를 선정하는 방법을 사용할 수 있다.
또한 사용자 유사도 DB(220)를 포함하고 있는 실시 예에서는 사용자 코멘트 DB(2000)에 포함되어 있는 콘텐츠에 대한 텍스트 정보는 물론 사용자 유사도 DB(220)로부터 사용자 유사도 정보를 수신 받아 사용자 유사도 추출부(200)가 선정한 높은 유사도의 콘텐츠를 제공받은 또는 사용자와 비슷한 선호를 가진 사용자와 같은 사용자 유사도가 높은 사용자가 언급한 단어 일수록 그 높은 가중치를 주어 일정 점수 이상의 단어를 특징 벡터를 선정하는 방법을 사용할 수 있다.
상술한 것과 같은 방법으로 특징 벡터를 선정하는 방법을 사용할 수 있으나 이제 한정되지 아니하고 콘텐츠 또는 사용자에 대한 정보로 콘텐츠의 유사성을 판단할 수 있는 특징이 되는 특징벡터를 선정할 수 있는 방법이라면 제한 없이 사용될 수 있다.
또한 상술한 것과 같이 가중치를 주어 특징 벡터를 선정하는 방법을 사용하는 실시 예에 있어서 코멘트의 단어에 가중치를 줄 때 콘텐츠에 대한 정보에 포함된 코멘트의 텍스트에 대하여 오피니언 마이닝을 실시한 결과 값을 포함하여 특징벡터를 선정하는 방법을 사용할 수 있다.
여기서 오피니언 마이닝을 실시한 결과 값을 포함하여 특징벡터를 선정하는 방법은 문장 분석을 통해 사실과 의견을 구분해 의견을 뽑아내어 긍정과 부정으로 나누고 그 강도를 측정하여 높은 강도일수록 가중치를 주어 일정 점수 이상의 단어에 특징 벡터를 선정하는 방법을 사용할 수 있다.
본 발명의 실시 예에 따르면 특징벡터는 점수가 높은 단어 및 그 가중치의 세트로 나타낼 수 있으나 이제 한정되지 아니하고 단어 또는 가중치만으로 나타낼 수 있다.
만약 개인별 연관 콘텐츠 네트워크 제공방법에 사용자 유사도를 산출하는 단계가 포함되어 있다면, 사용자 코멘트 DB에 포함되어 있는 콘텐츠에 대한 코멘트 정보 및 사용자 유사도 산출부로부터 사용자간 유사도에 대한 정보를 수신 받고, 수신한 정보에 포함된 높은 유사도의 콘텐츠를 제공받은 사용자 또는 콘텐츠 선호도에 있어 높은 유사도를 가진 사용자와 같이 사용자 유사도가 높은 사용자가 언급한 단어 일수록 높은 가중치를 주어 등장 횟수 및 가중치를 고려하여 점수를 측정한 후 일정 점수 이상의 단어를 특징 벡터로 선정함으로써 사용자 유사도를 계산할 수 있는 정보를 생성하고, 생성된 정보를 콘텐츠 유사도 계산부 및 상기 네트워크 생성부에 송신할 수 있다.
또한 사용자 유사도 DB(220)를 포함하고 있는 실시 예에서는 사용자 코멘트 DB(2000)에 포함되어 있는 콘텐츠에 대한 텍스트 정보는 물론 사용자 유사도 DB(220)로부터 사용자 유사도 정보를 수신 받아 사용자 유사도 추출부(200)가 선정한 높은 유사도의 콘텐츠를 제공받은 또는 사용자와 비슷한 선호를 가진 사용자와 같은 사용자 유사도가 높은 사용자가 언급한 단어 일수록 그 높은 가중치를 주어 등장 횟수 및 가중치를 고려하여 점수를 측정한 후 일정 점수 이상의 단어를 특징 벡터로 선정하는 방법을 사용할 수 있다.
상술한 것과 같은 방법으로 특징 벡터를 선정하는 방법을 사용할 수 있으나 이제 한정되지 아니하고 콘텐츠 또는 사용자에 대한 정보로 콘텐츠의 유사성을 판단할 수 있는 특징이 되는 특징벡터를 선정할 수 있는 방법이라면 제한 없이 사용될 수 있다.
또한 상술한 것과 같이 가중치를 주어 특징 벡터를 선정하는 방법을 사용하는 실시 예에 있어서 코멘트의 단어에 가중치를 줄 때 콘텐츠에 대한 정보에 포함된 코멘트의 텍스트에 대하여 오피니언 마이닝을 실시한 결과 값을 포함하여 특징벡터를 선정하는 방법을 사용할 수 있다.
여기서 오피니언 마이닝을 실시한 결과 값을 포함하여 특징벡터를 선정하는 방법은 문장 분석을 통해 사실과 의견을 구분해 의견을 뽑아내어 긍정과 부정으로 나누고 그 강도를 측정하여 높은 강도일수록 가중치를 주어 등장 횟수 및 가중치를 고려하여 점수를 측정한 후 일정 점수 이상의 단어를 특징 벡터로 선정하는 방법을 사용할 수 있다.
본 발명의 실시 예에 따르면 특징벡터는 점수가 높은 단어 및 그 가중치의 세트로 나타낼 수 있으나 이제 한정되지 아니하고 단어 또는 가중치만으로 나타낼 수 있다.
추출된 특징 벡터 정보를 통하여 각 콘텐츠 별 유사도를 계산하고 콘텐츠 유사도 정보를 생성한다(780).
여기서 특징벡터간의 유사도를 계산하는 방법은 코사인 유사도(Cosine Similarity)방법을 사용하여 벡터 모델로 나타내고 이를 계산하여 콘텐츠 간 유사도를 0과 1사이의 값으로 나타내는 것을 사용할 수 있다.
여기서 코사인 유사도 방법은 내적 공간의 두 벡터간 각도의 코사인 값을 이용하여 측정된 벡터간의 유사한 정도를 구하는 방법을 의미한다.
그러나 특징벡터간의 유사도를 구하는 방법은 코사인 유사도 방법에 한정되지 아니하고 벡터를 사용하여 유사도를 구할 수 있는 방법이라면 제한 없이 사용될 수 있다.
그리고 생성된 콘텐츠 또는 사용자에 대한 유사도 정보를 수신하여 연관 콘텐츠 네트워크를 생성하여 사용자에게 제공할 수 있다(780).
여기서 연관 콘텐츠 네트워크는 각 콘텐츠들을 연결하는 연결고리로 콘텐츠의 특징정보를 포함할 수 있다.
콘텐츠 연관 콘텐츠 네트워크를 생성하기 위해 최단 경로 알고리즘을 사용할 수 있으나 이에 한정되지는 않고 콘텐츠 연관 콘텐츠 네트워크를 생성할 수 있는 방법이라면 제한 없이 사용될 수 있다.
여기서 최단 경로 알고리즘은 통신에서 네트워크의 성능을 평가할 때 최단 경로(shortest path) 또는 최소 비용(minimum cost)을 선정하여 평가하는 것을 의미한다.
비용이란 네트워크의 각 링크에 부여된 통신 비용을 의미하며, 경로 중에서 최소 비용 경로를 찾는 알고리즘이 여러 가지 개발되어 있는데 다이크스트라(Dijkstra) 알고리즘과 벨만-포드(Bellman-Ford) 알고리즘이 가장 많이 사용되고 있다.
여기서 다이크스트라 알고리즘은 가중치가 있는 그래프의 최단 경로를 구하는 알고리즘으로써 출발 경로 경유점에서 시작하여 현재의 경로 경유점까지의 값과 인접한 경로 경유점의 가중치 합이 가장 작은 경로 경유점을 최소 비용의 경로로 보아 다음 경로 경유점으로 선택하고 그 경로를 최단 경로에 포함시킨다. 이 과정을 모든 경로 경유점이 선택될 때까지 반복한다
다이크스트라 알고리즘을 사용하여 콘텐츠 연관 콘텐츠 네트워크를 생성하는 실시 예에 따르면 사용자로부터 입력 받은 키워드에 따라 탐색된 복수의 콘텐츠로 이루어진 콘텐츠 세트의 콘텐츠 중 가장 유사도가 높은 콘텐츠를 최소 비용을 가지는 경로 경유점으로 보아 다음 경로 경유점으로 선택하고 그 경로를 최단 경로에 포함시켜 최단 경로를 선정하여 최단 경로에 따라 콘텐츠 연관 콘텐츠 네트워크를 생성할 수 있다.
이러한 연관 콘텐츠 네트워크는 각 사용자들에게 자신의 선호에 적합한 콘텐츠들을 탐색하고 소비하기에 최적화된 환경을 제공할 수 있다.
본 발명의 실시 예는 이상에서 설명한 장치 및/또는 방법을 통해서만 구현이 되는 것은 아니며, 이상에서 본 발명의 실시 예에 대하여 상세하게 설명하였지만 본 발명의 권리범위는 이에 한정되는 것은 아니고 다음의 청구범위에서 정의하고 있는 본 발명의 기본 개념을 이용한 당업자의 여러 변형 및 개량 형태 또한 본 발명의 권리범위에 속하는 것이다.
100 : 콘텐츠 유사도 산출부 110 : 특징벡터 추출부
120 : 콘텐츠 유사도 계산부 200 : 사용자 유사도 산출부
210 : 사용자 유사도 계산부 220 : 사용자 유사도 DB
300 : 네트워크 생성부 2000 : 사용자 코멘트 DB

Claims (19)

  1. 콘텐츠에 관한 사용자의 코멘트 정보를 이용하여 각 콘텐츠들의 특성을 나타낼 수 있는 특징 벡터를 산출하고, 상기 특징 벡터를 이용해 각 콘텐츠들 간의 유사도를 계산하는 콘텐츠 유사도 산출부; 및
    상기 계산된 유사도 정보를 수신하여 유사도가 클수록 상호 콘텐츠를 근접하게 위치시켜 연결함으로써 연관 콘텐츠 네트워크를 생성하는 네트워크 생성부를 포함하는 것을 특징으로 하는 개인별 연관 콘텐츠 네트워크 제공장치.
  2. 제 1 항에 있어서,
    상기 콘텐츠에 관한 사용자의 코멘트 정보를 이용하여 사용자들 간의 유사도를 계산하며, 상기 계산된 정보를 상기 콘텐츠 유사도 산출부 및 상기 네트워크 생성부에 전달하는 사용자 유사도 산출부를 더 포함하는 것을 특징으로 하는 개인별 연관 콘텐츠 네트워크 제공장치.
  3. 제 2 항에 있어서 상기 콘텐츠 유사도 산출부는,
    상기 사용자 유사도 산출부에서 생성된 사용자 간 유사도를 포함하는 정보를 수신하여 콘텐츠의 특징 벡터를 산출하는 것을 특징으로 하는 개인별 연관 콘텐츠 네트워크 제공장치.
  4. 제 1 항에 있어서 상기 콘텐츠 유사도 산출부는,
    상기 코멘트 정보 중에서 해당 콘텐츠에 작성된 코멘트에서 특정단어의 등장 횟수를 카운트하여 사용자가 미리 설정한 횟수 이상 등장하는 단어에 대하여 가중치를 주어 등장 횟수 및 가중치를 고려하여 점수를 측정한 후 일정 점수 이상의 단어를 특징 벡터로 선정함으로써 콘텐츠 유사도를 계산할 수 있는 정보를 생성하는 특징벡터 추출부; 및
    상기 생성된 정보를 수신하여 각 콘텐츠 마다 선정된 특징벡터간의 유사도를 계산하는 콘텐츠 유사도 계산부를 더 포함하는 것을 특징으로 하는 개인별 연관 콘텐츠 네트워크 제공장치.
  5. 제 4 항에 있어서,
    콘텐츠에 관한 사용자의 코멘트 정보를 이용하여 사용자들 간의 유사도를 계산하며, 상기 계산된 정보를 상기 콘텐츠 유사도 산출부 및 상기 네트워크 생성부에 전달하는 사용자 유사도 산출부를 더 포함하며,
    상기 특징벡터 추출부는 상기 콘텐츠에 관한 사용자의 코멘트 정보 및 상기 사용자 유사도 산출부로부터 사용자간 유사도에 대한 정보를 수신 받아 상기 수신한 정보에 포함된 미리 설정된 유사도보다 높은 수준의 유사도를 가진 콘텐츠를 제공받은 사용자 또는 콘텐츠 선호도에 있어 미리 설정된 유사도보다 높은 수준의 유사도를 가진 사용자와 같이 사용자 유사도가 높은 사용자가 언급한 단어 일수록 상대적으로 높은 가중치를 주어 등장 횟수 및 가중치를 고려하여 일정 점수 이상의 단어를 특징 벡터로 선정하여 각 콘텐츠의 특징 요소들을 추출함으로써 사용자 유사도를 계산할 수 있는 정보를 생성하고, 상기 생성된 정보를 상기 콘텐츠 유사도 계산부 및 상기 네트워크 생성부에 송신하는 것을 특징으로 하는 개인별 연관 콘텐츠 네트워크 제공장치.
  6. 제 4 항에 있어서 상기 특징벡터 추출부는,
    오피니언 마이닝을 실시한 결과 값을 포함하여 상기 결과 값에 따라 상기 코멘트에 포함된 특정단어에 추가적으로 가중치를 부여하고, 상기 가중치를 반영하여 특징벡터를 선정하는 것을 특징으로 하는 개인별 연관 콘텐츠 네트워크 제공장치.
  7. 제 2 항에 있어서 상기 사용자 유사도 산출부는,
    복수의 콘텐츠에 대하여 평가한 정보를 이용하여 각 사용자간에 콘텐츠에 관한 선호도의 유사 정도인 사용자 유사도를 계산하는 사용자 유사도 계산부를 포함하며,
    상기 계산된 사용자 유사도의 결과를 수신하여 저장하고, 상기 저장된 정보를 콘텐츠간의 특징 벡터를 생성하는데 사용할 수 있도록 상기 콘텐츠 유사도 산출부 및 상기 연관 콘텐츠 네트워크를 생성하는 데 사용할 수 있도록 네트워크 생성부에 송신하는 사용자 유사도 DB를 더 포함하는 것을 특징으로 하는 개인별 연관 콘텐츠 네트워크 제공장치.
  8. 제 7 항에 있어서,
    상기 사용자 유사도 DB를 더 포함하며 상기 생성된 사용자 유사도에 대한 정보는 상기 사용자 유사도 계산부에서 상기 네트워크 생성부 및 콘텐츠 유사도 산출부로 송신하고, 상기 사용자 유사도 산출부가 상기 사용자 유사도 DB를 포함하는 경우에는 상기 생성된 사용자 유사도에 대한 정보는 상기 사용자 유사도 DB에서 상기 네트워크 생성부 및 콘텐츠 유사도 산출부로 송신하는 것을 특징으로 하는 개인별 연관 콘텐츠 네트워크 제공장치.
  9. 제 1 항에 있어서 상기 네트워크 생성부는,
    상기 연관 콘텐츠 네트워크를 생성하기 위해 복수의 콘텐츠 중 가장 유사도가 높은 콘텐츠를 최소 비용을 가지는 경로 경유점으로 보아 다음 경로 경유점으로 선택하고, 상기 다음 경로 경유점으로의 경로를 최단 경로에 포함시킴으로써 상기 최단 경로를 선정하여 상기 최단 경로에 따라 콘텐츠 연관 콘텐츠 네트워크를 생성하는 것을 특징으로 하는 개인별 연관 콘텐츠 네트워크 제공장치.
  10. 제 1 항에 있어서 상기 네트워크 생성부는,
    상기 연관 콘텐츠 네트워크에 포함되는 각 콘텐츠 간의 유사도를 거리로 나타내는 것을 포함하고, 상기 연관 콘텐츠 네트워크에 포함되는 각 콘텐츠들을 연결하는 연결고리를 생성하여 상기 연결고리에 콘텐츠의 특징정보를 더 포함하는 것을 특징으로 하는 개인별 연관 콘텐츠 네트워크 제공장치.
  11. 콘텐츠에 관한 사용자의 콘텐츠 정보를 이용하여 각 콘텐츠들의 특성을 나타낼 수 있는 특징 벡터를 산출하고, 상기 특징 벡터를 이용해 각 콘텐츠들 간의 유사도를 계산하는 단계; 및
    상기 계산된 유사도에 대한 정보를 수신하여 유사도가 클수록 상호 콘텐츠를 근접하게 위치시켜 연결함으로써 연관 콘텐츠 네트워크를 생성하는 단계를 포함하는 것을 특징으로 하는 개인별 연관 콘텐츠 네트워크 제공방법.
  12. 제 11 항에 있어서,
    상기 콘텐츠에 관한 사용자의 코멘트 정보를 이용하여 사용자들 간의 유사도를 계산하는 단계를 더 포함하는 것을 특징으로 하는 개인별 연관 콘텐츠 네트워크 제공방법.
  13. 제 12 항에 있어서,
    상기 계산된 사용자 간 유사도를 콘텐츠의 특징 벡터를 산출을 위하여 사용하는 것을 특징으로 하는 개인별 연관 콘텐츠 네트워크 제공방법.
  14. 제 1 항에 있어서 상기 콘텐츠간 유사도에 대한 정보를 생성하는 단계는,
    상기 코멘트 정보 중에서 해당 콘텐츠에 작성된 코멘트에서 특정단어의 등장 횟수를 카운트하여 사용자가 미리 설정한 횟수 이상 등장하는 단어에 대하여 가중치를 주어 등장 횟수 및 가중치를 고려하여 점수를 측정한 후 일정 점수 이상의 단어를 특징 벡터로 선정함으로써 콘텐츠 유사도를 계산할 수 있는 정보를 생성하는 단계; 및
    상기 생성된 정보를 수신하여 각 콘텐츠 마다 선정된 특징벡터간의 유사도를 계산하는 단계를 더 포함하는 것을 특징으로 하는 개인별 연관 콘텐츠 네트워크 제공방법.
  15. 제 14 항에 있어서,
    상기 코멘트 정보를 이용하여 사용자들 간의 유사도를 계산하는 단계를 더 포함하며,
    상기 콘텐츠 유사도를 계산할 수 있는 정보를 생성하는 단계는 콘텐츠에 대한 코멘트 정보 및 상기 사용자 유사도에 대한계산결과가 포함된 정보를 수신 받고, 상기 수신한 정보에 포함된 미리 설정된 유사도보다 높은 수준의 유사도의 콘텐츠를 제공받은 사용자 또는 콘텐츠 선호도에 있어 미리 설정된 유사도보다 높은 수준의 유사도를 가진 사용자와 같이 사용자 유사도가 높은 사용자가 언급한 단어 일수록 상대적으로 높은 가중치를 주어 미리 설정한 일정 점수 이상의 단어를 특징 벡터로 선정함으로써 각 콘텐츠 별로 특징 요소들을 추출하여 사용자 유사도를 계산할 수 있는 정보를 생성하는 것을 특징으로 하는 개인별 연관 콘텐츠 네트워크 제공방법.
  16. 제 14 항에 있어서 상기 콘텐츠 유사도를 계산할 수 있는 정보를 생성하는 단계는,
    오피니언 마이닝을 실시한 결과 값을 포함하여 상기 결과 값에 따라 상기 코멘트에 포함된 특정단어에 추가적으로 가중치를 부여하고, 상기 가중치를 반영하여 특징벡터를 선정하는 것을 특징으로 하는 개인별 연관 콘텐츠 네트워크 제공방법.
  17. 제 12 항에 있어서 상기 사용자들 간의 유사도를 계산하는 단계는,
    복수의 콘텐츠에 대하여 평가한 정보를 이용하여 각 사용자간에 콘텐츠에 관한 선호도의 유사 정도인 사용자 유사도를 계산하는 단계를 포함하며,
    상기 생성된 사용자간의 유사도에 대한 정보를 수신하여 저장하고, 상기 저장된 정보를 콘텐츠간의 특징 벡터를 생성하는데 사용할 수 있도록 송신하는 단계를 더 포함하는 것을 특징으로 하는 개인별 연관 콘텐츠 네트워크 제공방법.
  18. 제 11 항에 있어서 상기 연관 콘텐츠 네트워크를 생성하는 단계는,
    상기 연관 콘텐츠 네트워크를 생성하기 위해 복수의 콘텐츠 중 가장 유사도가 높은 콘텐츠를 최소 비용을 가지는 경로 경유점으로 보아 다음 경로 경유점으로 선택하고, 상기 다음 경로 경유점으로의 경로를 최단 경로에 포함시킴으로써 상기 최단 경로를 선정하여 상기 최단 경로에 따라 콘텐츠 연관 콘텐츠 네트워크를 생성하는 것을 더 포함하는 것을 특징으로 하는 개인별 연관 콘텐츠 네트워크 제공방법.
  19. 제 11 항에 있어서 상기 연관 콘텐츠 네트워크를 생성하는 단계는,
    상기 연관 콘텐츠 네트워크에 포함되는 각 콘텐츠 간의 유사도를 거리로 나타내는 것을 포함하고, 상기 연관 콘텐츠 네트워크에 포함되는 각 콘텐츠들을 연결하는 연결고리를 생성하여 상기 연결고리에 콘텐츠의 특징정보를 더 포함하는 것을 특징으로 하는 개인별 연관 콘텐츠 네트워크 제공장치.
KR1020140026793A 2014-03-06 2014-03-06 개인별 연관 콘텐츠 네트워크 제공장치 및 그 방법 KR20150104882A (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020140026793A KR20150104882A (ko) 2014-03-06 2014-03-06 개인별 연관 콘텐츠 네트워크 제공장치 및 그 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020140026793A KR20150104882A (ko) 2014-03-06 2014-03-06 개인별 연관 콘텐츠 네트워크 제공장치 및 그 방법

Publications (1)

Publication Number Publication Date
KR20150104882A true KR20150104882A (ko) 2015-09-16

Family

ID=54244425

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020140026793A KR20150104882A (ko) 2014-03-06 2014-03-06 개인별 연관 콘텐츠 네트워크 제공장치 및 그 방법

Country Status (1)

Country Link
KR (1) KR20150104882A (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101712291B1 (ko) 2015-12-14 2017-03-13 강원대학교산학협력단 오피니언 마이닝을 기반으로 한 사용자 맞춤형 명소 정보 추천 시스템 및 구동 방법

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101712291B1 (ko) 2015-12-14 2017-03-13 강원대학교산학협력단 오피니언 마이닝을 기반으로 한 사용자 맞춤형 명소 정보 추천 시스템 및 구동 방법

Similar Documents

Publication Publication Date Title
US10832008B2 (en) Computerized system and method for automatically transforming and providing domain specific chatbot responses
KR101678521B1 (ko) 도서 추천 서비스 제공 장치 및 방법
CN106709040B (zh) 一种应用搜索方法和服务器
US10120861B2 (en) Hybrid classifier for assigning natural language processing (NLP) inputs to domains in real-time
TWI636416B (zh) 內容個人化之多相排序方法和系統
US11216503B1 (en) Clustering search results
US8326861B1 (en) Personalized term importance evaluation in queries
US10685181B2 (en) Linguistic expression of preferences in social media for prediction and recommendation
Gomathi et al. Restaurant recommendation system for user preference and services based on rating and amenities
CN106484764A (zh) 基于人群画像技术的用户相似度计算方法
US20100185623A1 (en) Topical ranking in information retrieval
CN103761254A (zh) 多领域服务主题匹配推荐方法
KR20150086441A (ko) 콘텐츠 및 상관 거리에 기반하는 사람 연결
JP2009098964A (ja) ネットワークサービスシステム、サーバ、方法及びプログラム
US20140156673A1 (en) Measuring and altering topic influence on edited and unedited media
KR20190122334A (ko) 소셜 네트워크 시스템 기반의 질의 응답 서비스 제공을 위한 전문가 추천 방법 및 전문가 추천 시스템
CN110532469B (zh) 一种信息推荐方法、装置、设备及存储介质
KR101647087B1 (ko) 자연어 처리에 기반한 재화 제공 서버 및 방법
KR101712291B1 (ko) 오피니언 마이닝을 기반으로 한 사용자 맞춤형 명소 정보 추천 시스템 및 구동 방법
KR101074820B1 (ko) 인터넷을 활용한 추천 검색 시스템 및 그 방법
US20190347296A1 (en) Method of recommending at least one skin care product to a user
KR101652433B1 (ko) Sns 문서에서 추출된 토픽을 기반으로 파악된 감정에 따른 개인화 광고 제공 방법
US20150293988A1 (en) System and Method for Opinion Sharing and Recommending Social Connections
EP2613275B1 (en) Search device, search method, search program, and computer-readable memory medium for recording search program
KR20150104882A (ko) 개인별 연관 콘텐츠 네트워크 제공장치 및 그 방법

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E601 Decision to refuse application