KR20230112271A - 이종 산업 분야 간 콘텐츠 ip를 활용한 데이터 분석 방법 및 장치 - Google Patents

이종 산업 분야 간 콘텐츠 ip를 활용한 데이터 분석 방법 및 장치 Download PDF

Info

Publication number
KR20230112271A
KR20230112271A KR1020220008319A KR20220008319A KR20230112271A KR 20230112271 A KR20230112271 A KR 20230112271A KR 1020220008319 A KR1020220008319 A KR 1020220008319A KR 20220008319 A KR20220008319 A KR 20220008319A KR 20230112271 A KR20230112271 A KR 20230112271A
Authority
KR
South Korea
Prior art keywords
content
list
data
keywords
genres
Prior art date
Application number
KR1020220008319A
Other languages
English (en)
Inventor
장누리
김가윤
김요한
김종근
Original Assignee
유닉온 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 유닉온 주식회사 filed Critical 유닉온 주식회사
Priority to KR1020220008319A priority Critical patent/KR20230112271A/ko
Publication of KR20230112271A publication Critical patent/KR20230112271A/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/353Clustering; Classification into predefined classes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/3332Query translation
    • G06F16/3334Selection or weighting of terms from queries, including natural language queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/34Browsing; Visualisation therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

본 발명은 이종 산업 분야 간 콘텐츠 IP를 활용한 데이터 분석 방법 및 장치를 공개한다. 이 방법은 장치에 의해 수행되는 방법에 있어서, (a) 획득된 복수개의 콘텐츠 IP에 대한 리뷰와 게임에 대한 리뷰 각각에서 복수개의 키워드를 도출하는 단계; (b) 상기 도출된 복수개의 키워드를 기 설정된 복수 장르 및 상기 복수 장르에 속한 복수의 카테고리 별로 분류한 후에, 상기 복수 장르 각각의 복수 카테고리 중에서 서로 중복되는 키워드의 존재 여부에 따라, 중복되는 키워드의 리스트를 해당 장르의 군집화 데이터로 분류하거나, 다른 카테고리의 중복된 키워드의 리스트를 해당 카테고리의 군집화 데이터로 분류하는 단계; 및 (c) 상기 복수개의 콘텐츠 IP의 키워드 리스트와 복수 장르의 키워드 리스트 중에서 중복된 키워드의 존재 여부 및 단어 유사도에 따라, 추천 장르 리스트를 추출하고 세부 카테고리 추천 리스트를 작성하는 단계; 를 포함하는 것을 특징으로 한다.

Description

이종 산업 분야 간 콘텐츠 IP를 활용한 데이터 분석 방법 및 장치{A data analysis method using content IP between heterogeneous industries and a device thereof}
본 발명은 데이터 분석 방법 및 장치에 관한 것으로서, 특히 다양한 콘텐츠 IP와 게임 산업 분야 간 유의미한 키워드를 도출하고 이를 신속하고 정확하게 비교 및 분석하여, 콘텐츠 IP의 키워드와 일치율이 높은 게임의 세부 카테고리 순으로 데이터를 시각화하여 사용자에게 제공할 수 있는 이종 산업 분야 간 콘텐츠 IP를 활용한 데이터 분석 방법 및 장치에 관한 것이다.
최근에, 다양한 인터넷 서비스에 있어서 동영상, 음악, 웹 툰, 전자 서적 등 디지털 콘텐츠를 SNS 환경을 통하여 다른 사용자와 공유하거나 소개하는 기능이 제공되고 있다.
사용자는 전형적으로는 스마트폰 등으로 실행되는 브라우저 또는 애플리케이션을 이용하여 디지털 콘텐츠를 열람 또는 사용하는데, 이 디지털 콘텐츠에 관한 정보를 SNS의 블로그 기능 또는 메시지 송수신 기능 등을 이용해 다른 사용자와 공유할 수 있다.
예를 들면, 사용자는 공유하는 디지털 콘텐츠에 관련된 웹 페이지 등으로의 링크(URL 등)를 포함한 정보를 포털 사이트의 블로그나 휴대용 단말기의 메시지를 통해 다른 사용자에게 제공할 수 있다.
한편, 종래의 디지털 콘텐츠를 공유하는 기능에 있어서 블로그나 메시지 등을 통해 다른 사용자에게 제공되는 정보는 웹페이지 등으로의 링크 외에, 디지털 콘텐츠의 타이틀 및 자동으로 삽입되는 정형문 등에 의해 구성되는 것이 빈번하다.
그러나, 이렇게 구성되는 정보는 다양성이 부족함에 따라, 디지털 콘텐츠의 공유 촉진을 저해할 가능성이 있었다.
또한, 현재 서비스되고 있는 분석 기술들은 동종 산업 분야 내에서의 분석만을 지원하므로, 이를 통해 콘텐츠 IP과 게임 카테고리의 분석을 비교할 경우, 각각의 결과가 서로 유의미한 영향을 보이지 못하는 문제점이 있었다.
이는 콘텐츠 IP를 활용하여 게임을 제작하는 데 있어서, 이종 산업 분야에 대한 고려가 없이 각 분야의 단순 데이터 분석만으로는 실효성 있는 데이터를 얻을 수 없는 한계가 있음을 의미한다.
이러한 한계를 극복하기 위하여, 종래에는 각 분야의 분석가가 콘텐츠 산업을 직접 수동으로 조사하여 조사 결과를 서로 비교하는 방법을 활용해 왔다.
하지만, 이 방법은 고 비용과 장 시간을 필요로 하고, 분석가마다의 주관적인 견해가 개입됨으로 인해 일관적이지 않고 정확하지 않은 데이터가 도출될 수 있는 위험성이 항상 존재했다.
또한, 종래의 데이터 분석 서비스는 동종 품목에 대한 호불호를 수집하여 장르를 추천하거나, 선호도 퍼센트 또는 별점 점수와 같은 정량적인 비교 작업을 수행해 왔다.
하지만, 이 방법은 콘텐츠 IP와 게임이라는 이종 산업 분야를 융합해야 할 경우, 정확도가 현저하게 떨어지는 한계가 있었다.
이에 본 발명자들은 콘텐츠 IP - 게임 산업간 유의미한 키워드를 추출하여 군집화하고, 이를 상호 비교분석하여 이종 산업 분야 간에 콘텐츠 IP를 활용하여 게임을 제작하는 데 필요한 데이터의 정확도를 향상시킬 수 있는 이종 산업 분야 간 콘텐츠 IP를 활용한 데이터 분석 방법 및 장치를 발명하기에 이르렀다.
JP 2002-0123539 A2 (2002.4.26.)
본 발명이 해결하고자 하는 과제는 다양한 콘텐츠 IP와 게임 산업 분야 간 유의미한 키워드를 도출하고 이를 비교 및 분석함으로써, 콘텐츠 IP 활용 게임과 같은 융합 콘텐츠 산업에 적합한 데이터를 도출할 수 있는 이종 산업 분야 간 콘텐츠 IP를 활용한 데이터 분석 방법을 제공하는 데 있다.
또한, 분석된 콘텐츠 IP를 기준으로 군집화한 게임 세부 카테고리 DB를, 성별 데이터 가중치 알고리즘을 적용하여 비교하고, 콘텐츠 IP의 키워드와 일치율이 높은 게임의 세부 카테고리 순으로 데이터를 시각화하여 사용자에게 제공할 수 있는 이종 산업 분야 간 콘텐츠 IP를 활용한 데이터 분석 방법을 제공하는 데 있다.
본 발명이 해결하고자 하는 다른 과제는 상기 과제를 달성하기 위한 이종 산업 분야 간 콘텐츠 IP를 활용한 데이터 분석 장치를 제공하는데 있다.
본 발명이 해결하고자 하는 과제는 이상에서 언급된 과제로 제한되지 않으며, 언급되지 않은 또 다른 과제들은 아래의 기재로부터 통상의 기술자에게 명확하게 이해될 수 있을 것이다.
상술한 과제를 해결하기 위한 본 발명의 일 면에 따른 이종 산업 분야 간 콘텐츠 IP를 활용한 데이터 분석 방법은 장치에 의해 수행되는 방법에 있어서, (a) 획득된 복수개의 콘텐츠 IP에 대한 리뷰와 게임에 대한 리뷰 각각에서 복수개의 키워드를 도출하는 단계; (b) 상기 도출된 복수개의 키워드를 기 설정된 복수 장르 및 상기 복수 장르에 속한 복수의 카테고리 별로 분류한 후에, 상기 복수 장르 각각의 복수 카테고리 중에서 서로 중복되는 키워드의 존재 여부에 따라, 중복되는 키워드의 리스트를 해당 장르의 군집화 데이터로 분류하거나, 다른 카테고리의 중복된 키워드의 리스트를 해당 카테고리의 군집화 데이터로 분류하는 단계; 및 (c) 상기 복수개의 콘텐츠 IP의 키워드 리스트와 복수 장르의 키워드 리스트 중에서 중복된 키워드의 존재 여부 및 단어 유사도에 따라, 추천 장르 리스트를 추출하고 세부 카테고리 추천 리스트를 작성하는 단계; 를 포함하는 것을 특징으로 한다.
상술한 과제를 해결하기 위한 본 발명의 일 면에 따른 이종 산업 분야 간 콘텐츠 IP를 활용한 데이터 분석 방법의 상기 (a) 단계는 (a-1) 통신부가 상기 리뷰에 대한 데이터를 수신받는 단계; (a-2) 제어부가 상기 리뷰에 대한 데이터를 전달받아 견해 마이닝을 수행하여 상기 리뷰에 대한 데이터 내에 내포된 감성을 분석하는 단계; (a-3) 상기 제어부가 상기 리뷰에 대한 데이터가 긍정적 리뷰인지 여부를 판단하는 단계; (a-4) 상기 리뷰에 대한 데이터가 긍정적 리뷰인 것으로 판단된 경우, 상기 제어부가 텍스트 마이닝을 수행하여 용어 출현 빈도-용어 출현 문서 숫자의 역수를 체크하는 단계; 및 (a-5) 상기 체크된 리뷰에 대한 데이터 중에서 상기 제어부가 불용어를 제거하여 상기 복수개의 키워드만을 추출하는 단계; 를 포함하는 것을 특징으로 한다.
상술한 과제를 해결하기 위한 본 발명의 일 면에 따른 이종 산업 분야 간 콘텐츠 IP를 활용한 데이터 분석 방법의 상기 (b) 단계는 (b-1) 상기 제어부가 상기 도출된 복수개의 키워드를 상기 복수 장르 및 상기 복수의 카테고리 별로 분류하는 단계; (b-2) 상기 통신부가 상기 복수 장르의 키워드 리스트를 수신받는 단계; (b-3) 상기 제어부가 상기 복수 장르의 키워드 리스트를 검색하여, 중복된 키워드가 존재하는지 여부를 판단하는 단계; (b-4) 상기 복수 장르의 키워드 리스트 중에서 중복된 키워드가 존재하는 것으로 판단된 경우 상기 제어부가 키워드 리스트에서 해당 중복 키워드를 제거하는 단계; (b-5) 상기 중복된 키워드가 존재하지 않는 것으로 판단된 경우 상기 제어부가 상기 복수 장르 중 하나의 장르에서 다른 복수 카테고리의 키워드 리스트를 검색하는 단계; (b-6) 상기 하나의 장르의 다른 복수 카테고리 중에서 중복된 키워드가 존재하는지 여부를 판단하는 단계; (b-7) 상기 다른 복수 카테고리 중에서 중복된 키워드가 존재하는 것으로 판단된 경우 상기 제어부가 중복된 키워드의 리스트를 상기 해당 장르의 군집화 데이터로 분류하는 단계; 및 (b-8) 상기 다른 복수 카테고리 중에서 중복된 키워드가 존재하지 않는 것으로 판단된 경우 상기 제어부가 해당 장르에서 다른 카테고리의 중복된 키워드의 리스트를 상기 해당 카테고리의 군집화 데이터로 분류하는 단계; 를 포함하는 것을 특징으로 한다.
상술한 과제를 해결하기 위한 본 발명의 일 면에 따른 이종 산업 분야 간 콘텐츠 IP를 활용한 데이터 분석 방법의 상기 (c) 단계는 (c-1) 상기 통신부가 콘텐츠 IP 데이터 세트에서 콘텐츠 IP 키워드 리스트를 입력 데이터로 수신받는 단계; (c-2) 상기 통신부가 게임 데이터 세트에서 상기 복수 장르의 키워드 리스트를 비교 데이터로 수신받는 단계; (c-3) 상기 제어부가 상기 콘텐츠 IP 키워드 리스트와 상기 복수 장르의 키워드 리스트를 검색하여, 중복된 키워드가 존재하는지 여부를 판단하는 단계; (c-4) 상기 키워드 리스트들 중에서 중복되는 단어가 존재하지 않는 것으로 판단된 경우 상기 제어부가 세부 카테고리 비교용 콘텐츠 IP 데이터를 추출하는 단계; (c-5) 상기 중복된 키워드가 존재하는 것으로 판단된 경우 상기 제어부가 상위 장르 추천 알고리즘 동작을 종료하는 단계; (c-6) 상기 제어부가 상기 키워드 리스트들 중에서 단어 유사도가 기 설정된 제1 기준치 이상인지 여부를 판단하는 단계; (c-7) 단어 유사도가 상기 제1 기준치 이상인 것으로 판단된 경우 상기 제어부가 상기 추천 장르 리스트를 추출하는 단계; 및 (c-8) 단어 유사도가 상기 제1 기준치 미만인 것으로 판단된 경우 상기 제어부가 상기 상위 장르 추천 알고리즘 동작을 종료하는 단계; 를 포함하는 것을 특징으로 한다.
상술한 과제를 해결하기 위한 본 발명의 일 면에 따른 이종 산업 분야 간 콘텐츠 IP를 활용한 데이터 분석 방법은 상기 (c-8) 단계 이후에, 상기 제어부가 상기 추출된 세부 카테고리 비교용 콘텐츠 IP 데이터와, 상기 추출된 장르 리스트의 데이터베이스 각각에 저장되어 있는 상기 해당 카테고리의 군집화 데이터 중 단어 유사도를 판단하는 단계; 상기 해당 카테고리의 군집화 데이터 중 단어 유사도가 기 설정된 제2 기준치 이상인 것으로 판단된 경우 상기 제어부가 성별, 연령별 가중치를 계산하는 단계; 상기 제어부가 상기 계산된 가중치를 기초로 하여 세부 카테고리별 점수를 산출하는 단계; 상기 제어부가 상기 산출된 세부 카테고리별 점수를 기초로 하여 상기 세부 카테고리 추천 리스트를 작성하여 디스플레이부를 통해 시각화하는 단계; 및 상기 해당 카테고리의 군집화 데이터 중 단어 유사도가 상기 제2 기준치 미만인 것으로 판단된 경우 상기 제어부가 상기 상위 장르 추천 알고리즘 동작을 종료하는 단계; 를 더 포함하는 것을 특징으로 한다.
상술한 과제를 해결하기 위한 본 발명의 일 면에 따른 이종 산업 분야 간 콘텐츠 IP를 활용한 데이터 분석 방법의 상기 복수개의 콘텐츠 IP는 동영상, 음악, 웹 툰 및 전자 서적 중 어느 하나 이상을 포함하고, 상기 복수 장르는 시뮬레이션(simulation), 액션(action), 역할 수행 게임(Role Playing Game, RPG), 캐주얼(casual) 및 퍼즐(puzzle) 중 어느 하나 이상을 포함하며, 상기 복수 카테고리는 팜(farm), 3x3, 퀴즈, 카 레이싱, 해크 앤 슬래시(Hack n slash), 플랫포머(platformer), 로그라이크(Roguelike), 클릭커(clicker) 및 아이들(idle) 중 어느 하나 이상을 포함하는 것을 특징으로 한다.
상술한 과제를 해결하기 위한 본 발명의 일 면에 따른 이종 산업 분야 간 콘텐츠 IP를 활용한 데이터 분석 방법의 상기 시각화되는 데이터는 콘텐츠 IP 키워드 리스트와 게임 장르의 키워드 리스트에서 키워드의 일치율, 상기 복수 장르의 순위 리스트, 상기 복수 카테고리의 순위 리스트, 유사 게임 리스트, 키워드 모음 중 어느 하나 이상을 포함하는 것을 특징으로 한다.
상술한 과제를 해결하기 위한 본 발명의 일 면에 따른 이종 산업 분야 간 콘텐츠 IP를 활용한 데이터 분석 방법은 이종 산업 분야 간 복수개의 콘텐츠 IP를 활용하여 게임을 제작하는 콘텐츠 IP 활용 게임에 적용될 수 있는 것을 특징으로 한다.
상술한 과제를 해결하기 위한 본 발명의 일 면에 따른 이종 산업 분야 간 콘텐츠 IP를 활용한 데이터 분석 방법은 하드웨어인 컴퓨터와 결합되어 수행하기 위해, 컴퓨터 판독 가능한 기록매체에 컴퓨터 프로그램으로 저장되는 것을 특징으로 한다.
상술한 과제를 해결하기 위한 본 발명의 다른 면에 따른 이종 산업 분야 간 콘텐츠 IP를 활용한 데이터 분석 장치는 획득된 복수개의 콘텐츠 IP에 대한 리뷰와 게임에 대한 리뷰에 대한 데이터, 기 설정된 복수 장르의 키워드 리스트 및 콘텐츠 IP 키워드 리스트를 수신받는 통신부; 상기 리뷰 각각에서 복수개의 키워드를 도출하고, 상기 복수개의 콘텐츠 IP의 키워드 리스트와 상기 복수 장르의 키워드 리스트 중에서 중복된 키워드의 존재 여부 및 단어 유사도에 따라, 추천 장르 리스트를 추출하고 세부 카테고리 추천 리스트를 작성하는 제어부; 및 상기 작성된 세부 카테고리 추천 리스트를 화면에 시각화하는 디스플레이부; 를 포함하고, 상기 제어부는, 상기 도출된 복수개의 키워드를 상기 복수 장르 및 상기 복수 장르에 속한 복수의 카테고리 별로 분류한 후에, 상기 복수 장르 각각의 복수의 카테고리 중에서 서로 중복되는 키워드의 리스트를 해당 장르의 군집화 데이터로 분류하거나, 다른 카테고리의 중복된 키워드의 리스트를 해당 카테고리의 군집화 데이터로 분류하는 것을 특징으로 한다.
본 발명의 기타 구체적인 사항들은 상세한 설명 및 도면들에 포함되어 있다.
본 발명에 의할 경우, 보다 빠르고 정확도 높은 콘텐츠 IP와 게임산업 분석이 가능하게 되어, 데이터 분석에 소요되는 비용 및 인력이 절감됨으로써, 중소 규모의 다양한 콘텐츠 IP 개발업체나 게임 개발업체의 원활한 IP 활용 융합 콘텐츠 시장 진출을 지원할 수 있게 된다.
본 발명의 효과들은 이상에서 언급된 효과로 제한되지 않으며, 언급되지 않은 또 다른 효과들은 아래의 기재로부터 통상의 기술자에게 명확하게 이해될 수 있을 것이다.
도 1은 본 발명의 일 실시예에 따른 이종 산업 분야 간 콘텐츠 IP를 활용한 데이터 분석 방법을 설명하기 위한 시스템의 블록도이다.
도 2는 본 발명의 일 실시예에 따른 이종 산업 분야 간 콘텐츠 IP를 활용한 데이터 분석 방법의 전반적인 동작을 설명하기 위한 순서도이다.
도 3은 도 2에 도시된 데이터 분석 방법 중 단계(S100)의 세부적인 동작을 설명하기 위한 순서도이다.
도 4는 도 2에 도시된 데이터 분석 방법 중 단계(S200 ~ S300)의 세부적인 동작을 설명하기 위한 순서도이다.
도 5는 도 2에 도시된 데이터 분석 방법 중 단계(S400)의 세부적인 동작을 설명하기 위한 순서도이다.
도 6은 도 2에 도시된 데이터 분석 방법 중 단계(S400)에서 단계(S470) 이후 단계(S400')의 세부적인 동작을 설명하기 위한 순서도이다.
도 7은 도 6에 도시된 데이터 분석 방법 중 단계(S486)에서 디스플레이부(130)에 시각화되는 화면이다.
본 발명의 이점 및 특징, 그리고 그것들을 달성하는 방법은 첨부되는 도면과 함께 상세하게 후술되어 있는 실시예들을 참조하면 명확해질 것이다.
그러나, 본 발명은 이하에서 개시되는 실시예들에 제한되는 것이 아니라 서로 다른 다양한 형태로 구현될 수 있으며, 단지 본 실시예들은 본 발명의 개시가 완전하도록 하고, 본 발명이 속하는 기술 분야의 통상의 기술자에게 본 발명의 범주를 완전하게 알려주기 위해 제공되는 것이며, 본 발명은 청구항의 범주에 의해 정의될 뿐이다.
본 명세서에서 사용된 용어는 실시예들을 설명하기 위한 것이며 본 발명을 제한하고자 하는 것은 아니다. 본 명세서에서, 단수형은 문구에서 특별히 언급하지 않는 한 복수형도 포함한다. 명세서에서 사용되는 "포함한다(comprises)" 및/또는 "포함하는(comprising)"은 언급된 구성요소 외에 하나 이상의 다른 구성요소의 존재 또는 추가를 배제하지 않는다. 명세서 전체에 걸쳐 동일한 도면 부호는 동일한 구성 요소를 지칭하며, "및/또는"은 언급된 구성요소들의 각각 및 하나 이상의 모든 조합을 포함한다. 비록 "제1", "제2" 등이 다양한 구성요소들을 서술하기 위해서 사용되나, 이들 구성요소들은 이들 용어에 의해 제한되지 않음은 물론이다. 이들 용어들은 단지 하나의 구성요소를 다른 구성요소와 구별하기 위하여 사용하는 것이다. 따라서, 이하에서 언급되는 제1 구성요소는 본 발명의 기술적 사상 내에서 제2 구성요소일 수도 있음은 물론이다.
다른 정의가 없다면, 본 명세서에서 사용되는 모든 용어(기술 및 과학적 용어를 포함)는 본 발명이 속하는 기술분야의 통상의 기술자에게 공통적으로 이해될 수 있는 의미로 사용될 수 있을 것이다. 또한, 일반적으로 사용되는 사전에 정의되어 있는 용어들은 명백하게 특별히 정의되어 있지 않는 한 이상적으로 또는 과도하게 해석되지 않는다.
공간적으로 상대적인 용어인 "아래(below)", "아래(beneath)", "하부(lower)", "위(above)", "상부(upper)" 등은 도면에 도시되어 있는 바와 같이 하나의 구성요소와 다른 구성요소들과의 상관관계를 용이하게 기술하기 위해 사용될 수 있다. 공간적으로 상대적인 용어는 도면에 도시되어 있는 방향에 더하여 사용시 또는 동작시 구성요소들의 서로 다른 방향을 포함하는 용어로 이해되어야 한다. 예를 들어, 도면에 도시되어 있는 구성요소를 뒤집을 경우, 다른 구성요소의 "아래(below)"또는 "아래(beneath)"로 기술된 구성요소는 다른 구성요소의 "위(above)"에 놓여질 수 있다. 따라서, 예시적인 용어인 "아래"는 아래와 위의 방향을 모두 포함할 수 있다. 구성요소는 다른 방향으로도 배향될 수 있으며, 이에 따라 공간적으로 상대적인 용어들은 배향에 따라 해석될 수 있다.
본 발명의 명세서 전체에 걸쳐 동일 참조 부호는 동일 구성요소를 지칭한다. 본 명세서가 실시예들의 모든 요소들을 설명하는 것은 아니며, 본 발명이 속하는 기술분야에서 일반적인 내용 또는 실시예들 간에 중복되는 내용은 생략한다. 명세서에서 사용되는 '부, 모듈, 부재, 블록'이라는 용어는 소프트웨어 또는 하드웨어로 구현될 수 있으며, 실시예들에 따라 복수의 '부, 모듈, 부재, 블록'이 하나의 구성요소로 구현되거나, 하나의 '부, 모듈, 부재, 블록'이 복수의 구성요소들을 포함하는 것도 가능하다.
또한, 어떤 부분이 어떤 구성요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라, 다른 구성요소를 더 포함할 수 있는 것을 의미한다.
각 단계들에 있어 식별부호는 설명의 편의를 위하여 사용되는 것으로 식별부호는 각 단계들의 순서를 설명하는 것이 아니며, 각 단계들은 문맥상 명백하게 특정 순서를 기재하지 않는 이상 명기된 순서와 다르게 실시될 수 있다.
본 발명에서 통신부(110)는 외부 장치와 통신을 가능하게 하는 하나 이상의 구성 요소를 포함할 수 있으며, 예를 들어, 유선통신 모듈, 무선통신 모듈, 근거리 통신 모듈 중 적어도 하나를 포함할 수 있다.
본 발명에서 디스플레이부(130)는 본 발명의 데이터 분석 방법에서 처리되는 정보를 통신부(110)를 통해 전달받아 화면 상에 디스플레이하는 구성 요소로서, 사용자 단말기에서 구동되는 응용 프로그램(일 예로, 애플리케이션)의 실행 화면 정보, 또는 이러한 실행 화면 정보에 따른 UI(User Interface), GUI(Graphic User Interface) 정보를 표시할 수 있다.
본 발명에서 제어부(120)는 프로세서(Processor), 컨트롤러(controller), 마이크로 컨트롤러(microcontroller), 마이크로 프로세서(microprocessor), 마이크로 컴퓨터(microcomputer) 등으로서, 통신부(110) 및 디스플레이부(130)의 유기적인 동작을 전반적으로 제어하고, 각종 판단 및 연산을 수행하는 구성요소를 의미하고, 하드웨어(hardware) 또는 펌웨어(firmware), 소프트웨어 또는 이들의 결합에 의해 구현될 수 있다.
본 발명에서, 콘텐츠 IP는 동영상, 음악, 웹 툰, 전자 서적 등 디지털 콘텐츠 관련 IP 를 포함할 수 있다.
이하, 첨부된 도면을 참조하여 본 발명의 실시예를 상세하게 설명한다.
도 1은 본 발명의 일 실시예에 따른 이종 산업 분야 간 콘텐츠 IP를 활용한 데이터 분석 방법을 설명하기 위한 시스템의 블록도로서, 복수개의 포털 사이트(10), 복수개의 SNS 앱(20) 및 데이터 분석 장치(100)를 포함한다.
데이터 분석 장치(100)는 통신부(110), 제어부(120) 및 디스플레이부(130)를 포함한다.
도 2는 본 발명의 일 실시예에 따른 이종 산업 분야 간 콘텐츠 IP를 활용한 데이터 분석 방법의 전반적인 동작을 설명하기 위한 순서도이다.
도 3은 도 2에 도시된 데이터 분석 방법 중 단계(S100)의 세부적인 동작을 설명하기 위한 순서도이다.
도 4는 도 2에 도시된 데이터 분석 방법 중 단계(S200 ~ S300)의 세부적인 동작을 설명하기 위한 순서도이다.
도 5는 도 2에 도시된 데이터 분석 방법 중 단계(S400)의 세부적인 동작을 설명하기 위한 순서도이다.
도 6은 도 2에 도시된 데이터 분석 방법 중 단계(S400)에서 단계(S470) 이후 단계(S400')의 세부적인 동작을 설명하기 위한 순서도이다.
도 7은 도 6에 도시된 데이터 분석 방법 중 단계(S486)에서 디스플레이부(130)에 시각화되는 화면이다.
도 1 내지 도 7을 참조하여 본 발명의 일 실시예에 따른 이종 산업 분야 간 콘텐츠 IP를 활용한 데이터 분석 방법의 유기적인 동작을 상세하게 설명하면 다음과 같다.
먼저, 도 1 내지 도 3을 참조하여 본 발명의 데이터 분석 방법 중 키워드 추출 알고리즘(S100)의 세부적인 동작을 설명한다.
제어부(120)는 통신부(110)를 통해 획득된 복수개의 콘텐츠 IP에 대한 리뷰와 게임에 대한 리뷰 각각에서 복수개의 키워드를 도출한다(S100).
즉, 통신부(110)가 복수개의 포털 사이트(10) 및 복수개의 SNS 앱(20)으로부터 리뷰에 대한 데이터를 수신받으면(S110), 제어부(120)가 통신부(110)로부터 리뷰에 대한 데이터를 전달받아 견해 마이닝(Opinion Mining)을 수행하여 리뷰에 대한 데이터 내에 내포된 감성을 분석한다(S120).
여기에서, 견해 마이닝이란 다양한 상업적 웹 사이트 또는 블로그 상에 개인이 올리는 리뷰와 같은 피드백 데이터에서 자동 또는 반자동으로 추출하여 효과적 정보를 전달하는 것을 의미한다.
제어부(120)는 통신부(110)로부터 전달받은 리뷰에 대한 데이터가 긍정적 리뷰인지 여부를 판단한다(S130).
만일 리뷰에 대한 데이터가 긍정적 리뷰인 것으로 판단된 경우, 제어부(120)는 텍스트 마이닝(text Mining)을 수행하여 용어 출현 빈도(term frquency, TF)- 용어 출현 문서 숫자의 역수(inverse document frequency, IDF)를 체크하고(S140), 긍정적 리뷰가 아닌 것으로 판단된 경우 키워드 추출 알고리즘 동작을 종료한다.
여기에서, 텍스트 마이닝이란 비정형 또는 반정형 데이터에서 자연 언어 처리 기술로 유용한 정보를 추출하여 가공하는 것을 의미한다.
즉, 텍스트에서 의미있는 정보를 추출하고, 다른 정보와의 연관성을 파악하여 텍스트가 가진 카테고리를 찾아낸다.
여기에서, 카테고리는 예시적으로 팜(farm), 3x3, 퀴즈, 카 레이싱, 해크 앤 슬래시(Hack n slash), 플랫포머(platformer), 로그라이크(Roguelike), 클릭커(clicker), 아이들(idle) 등을 포함한다.
제어부(120)는 용어 출현 빈도(TF)-용어 출현 문서 숫자의 역수(IDF)가 체크된 리뷰에 대한 데이터 중에서 텍스트 분석에 큰 의미가 없는 불용어(stop word)를 제거하여 복수개의 키워드만을 추출한다(S150).
다음으로, 도 1, 도 2 및 도 4를 참조하여 본 발명의 데이터 분석 방법 중 카테고리 데이터 군집화 알고리즘(S200 ~ S300)의 세부적인 동작을 설명한다.
키워드 추출 알고리즘(S100)을 통해 도출된 복수개의 키워드를 기 설정된 복수 장르 및 복수의 카테고리 별로 분류한 후에(S200), 복수 장르 각각의 복수 카테고리 중에서 서로 중복되는 키워드의 존재 여부에 따라, 중복되는 키워드의 리스트를 해당 장르의 군집화 데이터로 분류하거나, 다른 카테고리의 중복된 키워드의 리스트를 해당 카테고리의 군집화 데이터로 분류한다(S300).
즉, 제어부(120)가 키워드 추출 알고리즘(S100)을 통해 도출된 복수개의 키워드를 기 설정된 복수 장르 및 복수 장르에 속한 복수의 카테고리 별로 분류한다(S210).
통신부(110)가 복수 장르(A 장르, B 장르, C 장르 ??)의 키워드 리스트를 수신받으면(S320), 제어부(120)가 복수 장르의 키워드 리스트를 검색하여(S330), 중복된 키워드가 존재하는지 여부를 판단한다(S340).
여기에서, 장르는 예시적으로 시뮬레이션(simulation), 액션(action), 역할 수행 게임(Role Playing Game, RPG), 캐주얼(casual), 퍼즐(puzzle) 등을 포함한다.
만일, 복수 장르의 키워드 리스트 중에서 중복된 키워드가 존재하는 것으로 판단된 경우 제어부(120)는 키워드 리스트에서 해당 중복 키워드를 제거하고(S350), 중복된 키워드가 존재하지 않는 것으로 판단된 경우 제어부(120)는 복수 장르 중 하나의 장르(A 장르)에서 다른 복수 카테고리(b 카테고리, c 카테고리??)의 키워드 리스트를 검색한다(S355).
한편, 하나의 장르(A 장르)의 다른 복수 카테고리(b 카테고리, c 카테고리??) 중에서 중복된 키워드가 존재하는지 여부를 판단한다(S360).
만일, 중복된 키워드가 존재하는 것으로 판단된 경우 제어부(120)가 중복되는 키워드의 리스트를 해당 장르(A 장르)의 군집화 데이터로 분류하고(S370), 중복된 키워드가 존재하지 않는 것으로 판단된 경우 제어부(120)가 다른 카테고리의 중복된 키워드의 리스트를 해당 장르(A 장르)에서 해당 카테고리(a 카테고리)의 군집화 데이터로 분류한다(S375).
다음으로, 도 1, 도 2 및 도 5 내지 도 7을 참조하여 본 발명의 데이터 분석 방법 중 상위 장르 추천 알고리즘(S400, S400')의 세부적인 동작을 설명한다.
제어부(120)는 복수개의 콘텐츠 IP의 키워드 리스트와 복수 장르의 키워드 리스트 중에서 중복된 키워드의 존재 여부 및 단어 유사도에 따라, 추천 장르 리스트를 추출하고 세부 카테고리 추천 리스트를 작성한다(S400).
즉, 통신부(110)가 입력 데이터로서, 콘텐츠 IP 데이터 세트에서 콘텐츠 IP 키워드 리스트를 수신받는다(S410).
또한, 통신부(110)가 비교 데이터로서, 게임 데이터 세트에서 복수 장르(A 장르, B 장르, C 장르)의 키워드 리스트를 수신받는다(S420).
제어부(120)는 콘텐츠 IP 키워드 리스트와 복수 장르(A 장르, B 장르, C 장르)의 키워드 리스트를 검색하여(S430), 중복되는 단어가 존재하는지 여부를 판단한다(S440).
만일, 상기 키워드 리스트들 중에서 중복되는 단어가 존재하지 않는 것으로 판단된 경우 제어부(120)는 세부 카테고리 비교용 콘텐츠 IP 데이터를 추출하고(S450), 중복되는 단어가 존재하는 것으로 판단된 경우 제어부(120)는 상위 장르 추천 알고리즘 동작을 종료한다.
또한, 제어부(120)는 상기 키워드 리스트들 중에서 단어 유사도가 기 설정된 제1 기준치 이상인지 여부를 판단한다(S460).
만일, 단어 유사도가 기 설정된 제1 기준치 이상인 것으로 판단된 경우 제어부(120)는 추천 장르 리스트(A 장르, B 장르 등)를 추출하고(S470), 단어 유사도가 기 설정된 제1 기준치 미만인 것으로 판단된 경우 장르 추천할 의미가 없는 단어이므로 제어부(120)는 상위 장르 추천 알고리즘 동작을 종료한다.
한편, 제어부(120)는 단계(S450)에서 추출된 세부 카테고리 비교용 콘텐츠 IP 데이터와, 단계(S470)에서 추출된 장르 리스트(A 장르, B 장르)의 데이터베이스 각각에 저장되어 있는 세부 카테고리별 군집화 데이터 중 단어 유사도를 판단한다(S481).
만일, 단어 유사도가 기 설정된 제2 기준치 이상인 것으로 판단된 경우 제어부(120)는 성별, 연령별 가중치를 계산하고(S483), 단어 유사도가 기 설정된 제2 기준치 미만인 것으로 판단된 경우 제어부(120)는 상위 장르 추천 알고리즘 동작을 종료한다.
여기에서, 가중치의 계산은 콘텐츠 IP 또는 게임의 장르별로 분석되어 저장된 빅데이터를 활용하여 다양한 규칙을 적용해 수행할 수 있다.
예를 들어, 콘텐츠 IP 또는 게임의 내용에 대한 관련도가 높은 정도에 따라 가중치를 높게 설정하는 규칙, 성별 또는 연령별 등의 정형 데이터에 대하여 사용자의 기호에 적합한 정도에 따라 가중치를 높게 설정하는 규칙 등을 적용하여 가중치를 계산할 수 있다.
제어부(120)는 단계(S483)에서 계산된 가중치를 기초로 하여 세부 카테고리별 점수를 산출한다(S484).
제어부(120)는 단계(S484)에서 산출된 세부 카테고리별 점수를 기초로 하여 세부 카테고리 추천 리스트를 작성하여(S485), 도 7에서 도시한 바와 같이 콘텐츠 IP 키워드 리스트와 게임 장르의 키워드 리스트에서 키워드의 일치율 비교 그래프, 상위 5위 장르 비교 그래프, 상위 10위 카테고리 비교 그래프, 유사 게임 아이콘, 상위 10위 키워드 모음 등을 디스플레이부(130)를 통해 시각화한다(S486).
이와 같이, 본 발명의 데이터 분석 방법은 다양한 콘텐츠 IP와 게임 산업 분야 간 유의미한 키워드를 도출하고 이를 비교 및 분석함으로써, 콘텐츠 IP 활용 게임과 같은 융합 콘텐츠 산업에 적합한 데이터를 도출한다.
또한, 분석된 콘텐츠 IP를 기준으로 군집화한 게임 세부 카테고리 DB를, 성별 데이터 가중치 알고리즘을 적용하여 비교한 후에, 콘텐츠 IP의 키워드와 일치율이 높은 게임의 세부 카테고리 순으로 데이터를 시각화하여 사용자에게 제공한다.
이를 통하여, 본 발명은 이종 산업 분야 간 콘텐츠 IP를 활용한 데이터 분석 방법을 통해 보다 빠르고 정확도 높은 콘텐츠 IP와 게임산업 분석이 가능하게 되어, 데이터 분석에 소요되는 비용 및 인력을 절감함으로써, 중소 규모의 다양한 콘텐츠 IP 개발업체나 게임 개발업체의 원활한 IP 활용 융합 콘텐츠 시장 진출을 지원할 수 있게 된다.
이상에서 전술한 본 발명의 일 실시예에 따른 데이터 분석 방법은, 통신부(110), 제어부(120) 및 디스플레이부(130)를 포함하는 데이터 분석 장치(100)의 하드웨어와 결합되어 실행되기 위해 프로그램(또는 어플리케이션)으로 구현되어 매체에 저장될 수 있다.
상기 전술한 프로그램은, 상기 컴퓨터가 프로그램을 읽어 들여 프로그램으로 구현된 상기 방법들을 실행시키기 위하여, 상기 컴퓨터의 프로세서(CPU)가 상기 컴퓨터의 장치 인터페이스를 통해 읽힐 수 있는 C, C++, JAVA, 기계어 등의 컴퓨터 언어로 코드화된 코드(Code)를 포함할 수 있다. 이러한 코드는 상기 방법들을 실행하는 필요한 기능들을 정의한 함수 등과 관련된 기능적인 코드(Functional Code)를 포함할 수 있고, 상기 기능들을 상기 컴퓨터의 프로세서가 소정의 절차대로 실행시키는데 필요한 실행 절차 관련 제어 코드를 포함할 수 있다. 또한, 이러한 코드는 상기 기능들을 상기 컴퓨터의 프로세서가 실행시키는데 필요한 추가 정보나 미디어가 상기 컴퓨터의 내부 또는 외부 메모리의 어느 위치(주소 번지)에서 참조되어야 하는지에 대한 메모리 참조관련 코드를 더 포함할 수 있다. 또한, 상기 컴퓨터의 프로세서가 상기 기능들을 실행시키기 위하여 원격(Remote)에 있는 어떠한 다른 컴퓨터나 서버 등과 통신이 필요한 경우, 코드는 상기 컴퓨터의 통신 모듈을 이용하여 원격에 있는 어떠한 다른 컴퓨터나 서버 등과 어떻게 통신해야 하는지, 통신 시 어떠한 정보나 미디어를 송수신해야 하는지 등에 대한 통신 관련 코드를 더 포함할 수 있다.
상기 저장되는 매체는, 레지스터, 캐쉬, 메모리 등과 같이 짧은 순간 동안 데이터를 저장하는 매체가 아니라 반영구적으로 데이터를 저장하며, 기기에 의해 판독(reading)이 가능한 매체를 의미한다. 구체적으로는, 상기 저장되는 매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플로피디스크, 광 데이터 저장장치 등이 있지만, 이에 제한되지 않는다. 즉, 상기 프로그램은 상기 컴퓨터가 접속할 수 있는 다양한 서버 상의 다양한 기록매체 또는 사용자의 상기 컴퓨터상의 다양한 기록매체에 저장될 수 있다. 또한, 상기 매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어, 분산방식으로 컴퓨터가 읽을 수 있는 코드가 저장될 수 있다.
본 발명의 실시예와 관련하여 설명된 방법 또는 알고리즘의 단계들은 하드웨어로 직접 구현되거나, 하드웨어에 의해 실행되는 소프트웨어 모듈로 구현되거나, 또는 이들의 결합에 의해 구현될 수 있다. 소프트웨어 모듈은 RAM(Random Access Memory), ROM(Read Only Memory), EPROM(Erasable Programmable ROM), EEPROM(Electrically Erasable Programmable ROM), 플래시 메모리(Flash Memory), 하드 디스크, 착탈형 디스크, CD-ROM, 또는 본 발명이 속하는 기술 분야에서 잘 알려진 임의의 형태의 컴퓨터 판독가능 기록매체에 상주할 수도 있다.
이상, 첨부된 도면을 참조로 하여 본 발명의 실시예를 설명하였지만, 본 발명이 속하는 기술분야의 통상의 기술자는 본 발명이 그 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 실시될 수 있다는 것을 이해할 수 있을 것이다. 그러므로, 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며, 제한적이 아닌 것으로 이해해야만 한다.
10: 복수개의 포털 사이트
20: 복수개의 SNS 앱
100: 데이터 분석 장치
110: 통신부
120: 제어부
130: 디스플레이부

Claims (10)

  1. 장치에 의해 수행되는 방법에 있어서,
    (a) 획득된 복수개의 콘텐츠 IP에 대한 리뷰와 게임에 대한 리뷰 각각에서 복수개의 키워드를 도출하는 단계;
    (b) 상기 도출된 복수개의 키워드를 기 설정된 복수 장르 및 상기 복수 장르에 속한 복수의 카테고리 별로 분류한 후에, 상기 복수 장르 각각의 복수 카테고리 중에서 서로 중복되는 키워드의 존재 여부에 따라, 중복되는 키워드의 리스트를 해당 장르의 군집화 데이터로 분류하거나, 다른 카테고리의 중복된 키워드의 리스트를 해당 카테고리의 군집화 데이터로 분류하는 단계; 및
    (c) 상기 복수개의 콘텐츠 IP의 키워드 리스트와 복수 장르의 키워드 리스트 중에서 중복된 키워드의 존재 여부 및 단어 유사도에 따라, 추천 장르 리스트를 추출하고 세부 카테고리 추천 리스트를 작성하는 단계;
    를 포함하는 것을 특징으로 하는,
    이종 산업 분야 간 콘텐츠 IP를 활용한 데이터 분석 방법.
  2. 제 1 항에 있어서,
    상기 (a) 단계는
    (a-1) 통신부가 상기 리뷰에 대한 데이터를 수신받는 단계;
    (a-2) 제어부가 상기 리뷰에 대한 데이터를 전달받아 견해 마이닝을 수행하여 상기 리뷰에 대한 데이터 내에 내포된 감성을 분석하는 단계;
    (a-3) 상기 제어부가 상기 리뷰에 대한 데이터가 긍정적 리뷰인지 여부를 판단하는 단계;
    (a-4) 상기 리뷰에 대한 데이터가 긍정적 리뷰인 것으로 판단된 경우, 상기 제어부가 텍스트 마이닝을 수행하여 용어 출현 빈도-용어 출현 문서 숫자의 역수를 체크하는 단계; 및
    (a-5) 상기 체크된 리뷰에 대한 데이터 중에서 상기 제어부가 불용어를 제거하여 상기 복수개의 키워드만을 추출하는 단계;
    를 포함하는 것을 특징으로 하는,
    이종 산업 분야 간 콘텐츠 IP를 활용한 데이터 분석 방법.
  3. 제 2 항에 있어서,
    상기 (b) 단계는
    (b-1) 상기 제어부가 상기 도출된 복수개의 키워드를 상기 복수 장르 및 상기 복수의 카테고리 별로 분류하는 단계;
    (b-2) 상기 통신부가 상기 복수 장르의 키워드 리스트를 수신받는 단계;
    (b-3) 상기 제어부가 상기 복수 장르의 키워드 리스트를 검색하여, 중복된 키워드가 존재하는지 여부를 판단하는 단계;
    (b-4) 상기 복수 장르의 키워드 리스트 중에서 중복된 키워드가 존재하는 것으로 판단된 경우 상기 제어부가 키워드 리스트에서 해당 중복 키워드를 제거하는 단계;
    (b-5) 상기 중복된 키워드가 존재하지 않는 것으로 판단된 경우 상기 제어부가 상기 복수 장르 중 하나의 장르에서 다른 복수 카테고리의 키워드 리스트를 검색하는 단계;
    (b-6) 상기 하나의 장르의 다른 복수 카테고리 중에서 중복된 키워드가 존재하는지 여부를 판단하는 단계;
    (b-7) 상기 다른 복수 카테고리 중에서 중복된 키워드가 존재하는 것으로 판단된 경우 상기 제어부가 중복된 키워드의 리스트를 상기 해당 장르의 군집화 데이터로 분류하는 단계; 및
    (b-8) 상기 다른 복수 카테고리 중에서 중복된 키워드가 존재하지 않는 것으로 판단된 경우 상기 제어부가 해당 장르에서 다른 카테고리의 중복된 키워드의 리스트를 상기 해당 카테고리의 군집화 데이터로 분류하는 단계;
    를 포함하는 것을 특징으로 하는,
    이종 산업 분야 간 콘텐츠 IP를 활용한 데이터 분석 방법.
  4. 제 3 항에 있어서,
    상기 (c) 단계는
    (c-1) 상기 통신부가 콘텐츠 IP 데이터 세트에서 콘텐츠 IP 키워드 리스트를 입력 데이터로 수신받는 단계;
    (c-2) 상기 통신부가 게임 데이터 세트에서 상기 복수 장르의 키워드 리스트를 비교 데이터로 수신받는 단계;
    (c-3) 상기 제어부가 상기 콘텐츠 IP 키워드 리스트와 상기 복수 장르의 키워드 리스트를 검색하여, 중복된 키워드가 존재하는지 여부를 판단하는 단계;
    (c-4) 상기 키워드 리스트들 중에서 중복되는 단어가 존재하지 않는 것으로 판단된 경우 상기 제어부가 세부 카테고리 비교용 콘텐츠 IP 데이터를 추출하는 단계;
    (c-5) 상기 중복된 키워드가 존재하는 것으로 판단된 경우 상기 제어부가 상위 장르 추천 알고리즘 동작을 종료하는 단계;
    (c-6) 상기 제어부가 상기 키워드 리스트들 중에서 단어 유사도가 기 설정된 제1 기준치 이상인지 여부를 판단하는 단계;
    (c-7) 단어 유사도가 상기 제1 기준치 이상인 것으로 판단된 경우 상기 제어부가 상기 추천 장르 리스트를 추출하는 단계; 및
    (c-8) 단어 유사도가 상기 제1 기준치 미만인 것으로 판단된 경우 상기 제어부가 상기 상위 장르 추천 알고리즘 동작을 종료하는 단계;
    를 포함하는 것을 특징으로 하는,
    이종 산업 분야 간 콘텐츠 IP를 활용한 데이터 분석 방법.
  5. 제 4 항에 있어서,
    상기 (c-8) 단계 이후에,
    상기 제어부가 상기 추출된 세부 카테고리 비교용 콘텐츠 IP 데이터와, 상기 추출된 장르 리스트의 데이터베이스 각각에 저장되어 있는 상기 해당 카테고리의 군집화 데이터 중 단어 유사도를 판단하는 단계;
    상기 해당 카테고리의 군집화 데이터 중 단어 유사도가 기 설정된 제2 기준치 이상인 것으로 판단된 경우 상기 제어부가 성별, 연령별 가중치를 계산하는 단계;
    상기 제어부가 상기 계산된 가중치를 기초로 하여 세부 카테고리별 점수를 산출하는 단계;
    상기 제어부가 상기 산출된 세부 카테고리별 점수를 기초로 하여 상기 세부 카테고리 추천 리스트를 작성하여 디스플레이부를 통해 시각화하는 단계; 및
    상기 해당 카테고리의 군집화 데이터 중 단어 유사도가 상기 제2 기준치 미만인 것으로 판단된 경우 상기 제어부가 상기 상위 장르 추천 알고리즘 동작을 종료하는 단계;
    를 더 포함하는 것을 특징으로 하는,
    이종 산업 분야 간 콘텐츠 IP를 활용한 데이터 분석 방법.
  6. 제 3 항에 있어서,
    상기 복수개의 콘텐츠 IP는
    동영상, 음악, 웹 툰 및 전자 서적 중 어느 하나 이상을 포함하고,
    상기 복수 장르는
    시뮬레이션(simulation), 액션(action), 역할 수행 게임(Role Playing Game, RPG), 캐주얼(casual) 및 퍼즐(puzzle) 중 어느 하나 이상을 포함하며,
    상기 복수 카테고리는
    팜(farm), 3x3, 퀴즈, 카 레이싱, 해크 앤 슬래시(Hack n slash), 플랫포머(platformer), 로그라이크(Roguelike), 클릭커(clicker) 및 아이들(idle) 중 어느 하나 이상을 포함하는 것을 특징으로 하는,
    이종 산업 분야 간 콘텐츠 IP를 활용한 데이터 분석 방법.
  7. 제 5 항에 있어서,
    상기 시각화되는 데이터는
    콘텐츠 IP 키워드 리스트와 게임 장르의 키워드 리스트에서 키워드의 일치율, 상기 복수 장르의 순위 리스트, 상기 복수 카테고리의 순위 리스트, 유사 게임 리스트, 키워드 모음 중 어느 하나 이상을 포함하는 것을 특징으로 하는,
    이종 산업 분야 간 콘텐츠 IP를 활용한 데이터 분석 방법.
  8. 제 1 항에 있어서,
    상기 데이터 분석 방법은
    이종 산업 분야 간 복수개의 콘텐츠 IP를 활용하여 게임을 제작하는 콘텐츠 IP 활용 게임에 적용될 수 있는 것을 특징으로 하는,
    이종 산업 분야 간 콘텐츠 IP를 활용한 데이터 분석 방법.
  9. 하드웨어인 컴퓨터와 결합되어, 상기 제1 항 내지 제8 항 중 어느 한 항의 이종 산업 분야 간 콘텐츠 IP를 활용한 데이터 분석 방법을 수행하기 위해 컴퓨터 판독 가능한 기록매체에 저장된, 컴퓨터 프로그램.
  10. 획득된 복수개의 콘텐츠 IP에 대한 리뷰와 게임에 대한 리뷰에 대한 데이터, 기 설정된 복수 장르의 키워드 리스트 및 콘텐츠 IP 키워드 리스트를 수신받는 통신부;
    상기 리뷰 각각에서 복수개의 키워드를 도출하고, 상기 복수개의 콘텐츠 IP의 키워드 리스트와 상기 복수 장르의 키워드 리스트 중에서 중복된 키워드의 존재 여부 및 단어 유사도에 따라, 추천 장르 리스트를 추출하고 세부 카테고리 추천 리스트를 작성하는 제어부; 및
    상기 작성된 세부 카테고리 추천 리스트를 화면에 시각화하는 디스플레이부;
    를 포함하고,
    상기 제어부는,
    상기 도출된 복수개의 키워드를 상기 복수 장르 및 상기 복수 장르에 속한 복수의 카테고리 별로 분류한 후에, 상기 복수 장르 각각의 복수의 카테고리 중에서 서로 중복되는 키워드의 리스트를 해당 장르의 군집화 데이터로 분류하거나, 다른 카테고리의 중복된 키워드의 리스트를 해당 카테고리의 군집화 데이터로 분류하는 것을 특징으로 하는,
    이종 산업 분야 간 콘텐츠 IP를 활용한 데이터 분석 장치.
KR1020220008319A 2022-01-20 2022-01-20 이종 산업 분야 간 콘텐츠 ip를 활용한 데이터 분석 방법 및 장치 KR20230112271A (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020220008319A KR20230112271A (ko) 2022-01-20 2022-01-20 이종 산업 분야 간 콘텐츠 ip를 활용한 데이터 분석 방법 및 장치

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020220008319A KR20230112271A (ko) 2022-01-20 2022-01-20 이종 산업 분야 간 콘텐츠 ip를 활용한 데이터 분석 방법 및 장치

Publications (1)

Publication Number Publication Date
KR20230112271A true KR20230112271A (ko) 2023-07-27

Family

ID=87433234

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020220008319A KR20230112271A (ko) 2022-01-20 2022-01-20 이종 산업 분야 간 콘텐츠 ip를 활용한 데이터 분석 방법 및 장치

Country Status (1)

Country Link
KR (1) KR20230112271A (ko)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002123539A (ja) 2000-10-16 2002-04-26 Ntt Docomo Tokai Inc 情報検索方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002123539A (ja) 2000-10-16 2002-04-26 Ntt Docomo Tokai Inc 情報検索方法

Similar Documents

Publication Publication Date Title
CN104765874B (zh) 用于检测点击作弊的方法及装置
US9348934B2 (en) Systems and methods for facilitating open source intelligence gathering
WO2019085355A1 (zh) 互联网新闻的舆情聚类分析方法、应用服务器及计算机可读存储介质
US8745067B2 (en) Presenting comments from various sources
US8782037B1 (en) System and method for mark-up language document rank analysis
US8630972B2 (en) Providing context for web articles
JP5575902B2 (ja) クエリのセマンティックパターンに基づく情報検索
US10169449B2 (en) Method, apparatus, and server for acquiring recommended topic
US9639622B2 (en) Image processing system, image processing method, program, and non-transitory information storage medium
Liu et al. Identifying web spam with the wisdom of the crowds
US20150186503A1 (en) Method, system, and computer readable medium for interest tag recommendation
JP6538277B2 (ja) 検索クエリ間におけるクエリパターンおよび関連する総統計の特定
US20110264651A1 (en) Large scale entity-specific resource classification
US8793120B1 (en) Behavior-driven multilingual stemming
US9860337B1 (en) Machine-based identification of content with differing opinions
US8825620B1 (en) Behavioral word segmentation for use in processing search queries
US9245035B2 (en) Information processing system, information processing method, program, and non-transitory information storage medium
US9367638B2 (en) Surfacing actions from social data
US10467255B2 (en) Methods and systems for analyzing reading logs and documents thereof
US10521421B2 (en) Analyzing search queries to determine a user affinity and filter search results
US20210133267A1 (en) Indexing native application data
CN112347327A (zh) 网站检测方法、装置、可读存储介质及计算机设备
Wei et al. Online education recommendation model based on user behavior data analysis
US10339148B2 (en) Cross-platform computer application query categories
KR20230112271A (ko) 이종 산업 분야 간 콘텐츠 ip를 활용한 데이터 분석 방법 및 장치