KR102562791B1 - 소셜미디어 데이터 기반 콘텐츠 소재 탐색방법 - Google Patents

소셜미디어 데이터 기반 콘텐츠 소재 탐색방법 Download PDF

Info

Publication number
KR102562791B1
KR102562791B1 KR1020230009402A KR20230009402A KR102562791B1 KR 102562791 B1 KR102562791 B1 KR 102562791B1 KR 1020230009402 A KR1020230009402 A KR 1020230009402A KR 20230009402 A KR20230009402 A KR 20230009402A KR 102562791 B1 KR102562791 B1 KR 102562791B1
Authority
KR
South Korea
Prior art keywords
channel
video
keyword
youtube
data
Prior art date
Application number
KR1020230009402A
Other languages
English (en)
Inventor
민상현
Original Assignee
주식회사 두디스
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 두디스 filed Critical 주식회사 두디스
Priority to KR1020230009402A priority Critical patent/KR102562791B1/ko
Application granted granted Critical
Publication of KR102562791B1 publication Critical patent/KR102562791B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/783Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/7844Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using original textual content or text extracted from visual content or transcript of audio data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3347Query execution using vector based model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/71Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/73Querying
    • G06F16/738Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/75Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/247Thesauruses; Synonyms
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Computational Linguistics (AREA)
  • Business, Economics & Management (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Library & Information Science (AREA)
  • Tourism & Hospitality (AREA)
  • Software Systems (AREA)
  • Economics (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

본 발명은 유튜브 채널에서 키워드를 분석하는 유튜브 채널 분석단계; 상기 유튜브 채널 분석단계를 거친 후 빈도수에 기반하여 키워드를 추출하는 키워드 추출단계; 상기 유튜브 채널 분석단계를 거친 후 상기 유튜브 채널에서 채널 태그를 추출하는 채널 태그 추출단계; 상기 키워드 추출단계와 채널 태그 추출단계를 거친 후 상기 유튜브 채널에서 추출된 탐색어에 기반하여 카테고리를 분류하는 카테고리 분류단계; 및 상기 카테고리 분류단계를 거친 후 인공지능 기능에 기반하여 상기 유튜브 채널에서 추출된 탐색어를 저장하는 탐색어 저장단계;를 포함하여 이루어지는 것을 특징으로 한다.

Description

소셜미디어 데이터 기반 콘텐츠 소재 탐색방법{Content Source Search Method based on Social Media Data}
본 발명은 소셜미디어 데이터 기반 콘텐츠 소재 탐색방법에 관한 것으로, 보다 상세하게는 유튜브 채널 별 핵심 키워드를 통해서 소셜미디어 데이터를 수집 및 분석하여 콘텐츠 소재의 트렌드를 탐색하는 소셜미디어 데이터 기반 콘텐츠 소재 탐색방법에 관한 것이다.
인터넷 시대가 개막하면서, 텍스트 정보 대신 이미지 정보가, 이미지 정보 대신 동영상 정보를 통하여 컨텐츠를 형성하고 제공하는 기술이 급격하게 발전하고 있다. 특히, 최근에는 인터넷 사이트 중에서도 Youtube와 같은 동영상 플랫폼과, Afreeca TV, Twitch TV, TV 다음팟 등과 같은 인터넷 방송 플랫폼과, 네이버, 구글, 다음, 야후 등과 같은 포털 사이트 플랫폼을 통하여 다양한 이미지 및 영상 정보를 확인하고 즐길 수 있는 다양한 플랫폼을 이용하는 사용자들이 폭발적으로 증가하고 있다.
이와 같이 전국적인 유무선 인터넷 인프라가 갖추어짐과 동시에 스마트 폰 태블릿 등의 모바일 기기의 급속한 보급에 따라 온라인 광고 시장은 하루가 다르게 성장하고 있다.
일반적으로, 인터넷 사용자의 수가 매우 방대한 것을 감안할 때, 온라인 광고를 제공하는 것은 놀라운 파급력을 갖는 광고 효과를 기대할 수 있다.
그러나, 타켓팅이 제대로 되지 않아서 관심 또는 관련이 없는 인터넷 사용자에게도 온라인 광고가 무분별하게 제공됨으로써 광고의 효율성이 떨어지고, 심지어 광고를 하고자 하는 대상이나 그 기업에 대한 거부감 마저 가져올 수 있는 문제점이 발생할 수 있다.
이에 따라, 관심이나 흥미를 갖는 소비자를 타겟으로 하여 온라인 광고를 제공하는 온라인 타겟 광고에 대한 관심과 연구가 활발하게 이루어지고 있다.
대한민국 공개특허 제10-2022-0063881호(2022.05.18.)
따라서, 본 발명은 상기와 같은 문제점을 해결하기 위하여 안출된 것으로서, 본 발명의 해결하고자 하는 과제는 키워드, 채널 태그를 추출하여 유튜브 채널의 카테고리를 분류하는 소셜미디어 데이터 기반 콘텐츠 소재 탐색방법을 제공하는 것이다.
본 발명의 또 다른 목적은, 인공지능 기능에 기반하여 유튜브 채널에서 추출된 탐색어를 저장하고 탐색어와 코사인 벡터의 유사도를 계산하여 근접 유사어를 추출하는 소셜미디어 데이터 기반 콘텐츠 소재 탐색방법을 제공하는 것이다.
다만, 본 발명에서 이루고자 하는 기술적 과제들은 이상에서 언급한 기술적 과제들로 제한되지 않으며, 언급하지 않은 또 다른 기술적 과제들은 아래의 기재로부터 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 명확하게 이해될 수 있을 것이다.
본 발명은 상기와 같은 종래기술의 문제점을 개선하기 위하여 창출된 것으로, 유튜브 채널에서 키워드를 분석하는 유튜브 채널 분석단계; 상기 유튜브 채널 분석단계를 거친 후 빈도수에 기반하여 키워드를 추출하는 키워드 추출단계; 상기 유튜브 채널 분석단계를 거친 후 상기 유튜브 채널에서 채널 태그를 추출하는 채널 태그 추출단계; 상기 키워드 추출단계와 채널 태그 추출단계를 거친 후 상기 유튜브 채널에서 추출된 탐색어에 기반하여 카테고리를 분류하는 카테고리 분류단계; 및 상기 카테고리 분류단계를 거친 후 인공지능 기능에 기반하여 상기 유튜브 채널에서 추출된 탐색어를 저장하는 탐색어 저장단계;를 포함하여 이루어질 수 있다.
또한, 일 실시예에서, 상기 키워드 추출단계는, 상기 유튜브 채널에서 설정된 키워드와 관련된 영상제목을 추출하는 영상제목 추출단계; 및 상기 영상제목 추출단계를 거친 후 설정된 키워드와 관련된 영상태그를 추출하는 영상태그 추출단계;를 포함하여 이루어질 수 있다.
또한, 일 실시예에서, 상기 카테고리 분류단계는, 상기 유튜브 채널에서 동일 카테고리의 채널을 선정하는 동일 카테고리 채널 선정단계; 상기 동일 카테고리 채널 선정단계를 거친 후 상기 유튜브 채널에서 영상을 선정하는 영상선정단계; 상기 영상선정단계를 거친 후 상기 유튜브 채널의 카테고리에 따라 달라지는 의미를 추적해 키워드를 추출하는 의미기반 키워드 추출단계; 및 상기 영상선정단계를 거친 후 상기 유튜브 채널의 카테고리에 따라 달라지는 영상태그를 추출하는 영상태그 추출단계;를 포함하여 이루어질 수 있다.
또한, 일 실시예에서, 상기 탐색어 저장단계는, 탐색어 사전에 저장된 키워드를 이용해 매체 데이터를 저장하는 데이터 저장단계; 상기 데이터 저장단계를 거친 후 저장된 매체 데이터를 이용해 탐색어와 코사인 벡터의 근접 값을 계산하는 코사인 유사도 계산단계; 및 상기 코사인 유사도 계산단계를 거친 후 저장된 매체 데이터를 이용해 탐색어와 코사인 벡터의 근접한 유사어를 추출하는 유사어 추출단계;를 포함하여 이루어질 수 있다.
또한, 일 실시예에서, 상기 데이터 저장단계는, 상기 유튜브 채널이나 인터넷 포털 사이트에서 연관어룰 수집하여 저장하는 연관어 수집 저장단계; 및 상기 연관어 수집 저장단계를 거친 후 커뮤니티, SNS 및 뉴스를 통해서 탐색어와 연관된 키워드를 수집하여 분석하는 매스미디어 매체 분석단계;를 포함하여 이루어질 수 있다.
또한, 일 실시예에서, 상기 매스미디어 매체 분석단계는, 입력어와 탐색어를 통해 유추되는 연관 키워드를 입력하는 키워드 입력단계; 상기 키워드 입력단계를 거친 후 수집해둔 유튜브 채널 데이터에서 설정된 키워드 조합으로 메타 데이터를 분석하여 상기 유튜브 채널의 영상 데이터를 조회하는 영상 데이터 조회단계; 상기 영상 데이터 조회단계를 거친 후 분석한 매타 데이터를 정렬하여 사용자에게 설정된 조건의 소재를 제안하는 소재 추천단계; 상기 소재 추천단계를 거친 후 제안한 소재를 이해하기 위한 매체 데이터와 영상 자료를 소개하는 글감 추천단계; 및 상기 글감 추천단계를 거친 후 사용자와 구독자 구간이 같은 채널의 영상을 추천하는 참고영상 추천단계;를 포함하여 이루어질 수 있다.
또한, 일 실시예에서, 상기 의미기반 키워드 추출단계는, 상기 영상선정단계를 거친 상기 영상에서 의미기반 키워드에 연관된 제목을 추출하는 제목추출단계; 및 상기 영상선정단계를 거친 상기 영상에서 의미기반 키워드에 연관된 썸네일을 추출하는 이미지 텍스트 추출단계;를 포함하여 이루어질 수 있다.
본 발명의 일실시예에 따르면, 인공지능 기능에 기반하여 유튜브 채널에서 추출된 탐색어를 저장하고 탐색어와 코사인 벡터의 유사도를 계산하여 근접 유사어를 추출할 수 있다.
또한, 본 발명의 일실시예에 따르면, 연관어 수집 저장단계에서 유튜브 채널이나 인터넷 포털 사이트에서 연관어룰 수집하여 저장하고, 매스미디어 매체 분석단계에서 각종 커뮤니티, SNS 및 뉴스를 통해서 탐색어와 연관된 키워드를 수집하여 분석할 수 있다.
다만, 본 발명에서 얻을 수 있는 효과는 이상에서 언급한 효과들로 제한되지 않으며, 언급하지 않은 또 다른 효과들은 아래의 기재로부터 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 명확하게 이해될 수 있을 것이다.
본 명세서에서 첨부되는 다음의 도면들은 본 발명의 바람직한 실시예를 예시하는 것이며, 후술하는 발명의 상세한 설명과 함께 본 발명의 기술사상을 더욱 이해시키는 역할을 하는 것이므로, 본 발명은 그러한 도면에 기재된 사항에만 한정되어서 해석되어서는 아니된다.
도 1은 본 발명의 일실시예에 따른 소셜미디어 데이터 기반 콘텐츠 소재 탐색방법의 전체순서도이다.
도 2는 키워드 출출단계의 세부순서도이다.
도 3은 카테고리 분류단계의 세부순서도이다.
도 4는 탐색어 저장단계의 세부순서도이다.
도 5는 데이터 저장단계의 세부순서도이다.
도 6은 매스미디어 매체 분석단계의 세부순서도이다.
도 7은 의미기반 키워드 추출단계의 세부순서도이다.
도 8은 본 발명의 일실시예에 따른 채널별 콘텐츠 키워드를 분석하는 흐름의 예를 도시한 도면이다.
도 9는 연관어 및 매체데이터를 이용한 유사 키워드를 추천하는 인공지능 학습의 개념을 나타낸 도면이다.
도 10은 매체데이터의 트랜드를 분석하는 흐름의 예를 도시한 도면이다.
아래에서는 첨부한 도면을 참고로 하여 본 발명의 실시 예에 대하여 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 상세히 설명한다. 그러나 본 발명에 관한 설명은 구조적 내지 기능적 설명을 위한 실시 예에 불과하므로, 본 발명의 권리범위는 본문에 설명된 실시 예에 의하여 제한되는 것으로 해석되어서는 아니 된다. 즉, 실시 예는 다양한 변경이 가능하고 여러 가지 형태를 가질 수 있으므로 본 발명의 권리범위는 기술적 사상을 실현할 수 있는 균등물들을 포함하는 것으로 이해되어야 한다. 또한, 본 발명에서 제시된 목적 또는 효과는 특정 실시예가 이를 전부 포함하여야 한다거나 그러한 효과만을 포함하여야 한다는 의미는 아니므로, 본 발명의 권리범위는 이에 의하여 제한되는 것으로 이해되어서는 아니 될 것이다.
본 발명에서 서술되는 용어의 의미는 다음과 같이 이해되어야 할 것이다.
"제1", "제2" 등의 용어는 하나의 구성요소를 다른 구성요소로부터 구별하기 위한 것으로, 이들 용어들에 의해 권리범위가 한정되어서는 아니 된다. 예를 들어, 제1 구성요소는 제2 구성요소로 명명될 수 있고, 유사하게 제2 구성요소도 제1 구성요소로 명명될 수 있다. 어떤 구성요소가 다른 구성요소에 "연결되어" 있다고 언급된 때에는, 그 다른 구성요소에 직접적으로 연결될 수도 있지만, 중간에 다른 구성요소가 존재할 수도 있다고 이해되어야 할 것이다. 반면에, 어떤 구성요소가 다른 구성요소에 "직접 연결되어" 있다고 언급된 때에는 중간에 다른 구성요소가 존재하지 않는 것으로 이해되어야 할 것이다. 한편, 구성요소들 간의 관계를 설명하는 다른 표현들, 즉 "~사이에"와 "바로 ~사이에" 또는 "~에 이웃하는"과 "~에 직접 이웃하는" 등도 마찬가지로 해석되어야 한다.
단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한 복수의 표현을 포함하는 것으로 이해되어야 하고, "포함하다" 또는 "가지다" 등의 용어는 설시된 특징, 숫자, 단계, 동작, 구성요소, 부분품 또는 이들을 조합한 것이 존재함을 지정하려는 것이며, 하나 또는 그 이상의 다른 특징이나 숫자, 단계, 동작, 구성요소, 부분품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.
여기서 사용되는 모든 용어들은 다르게 정의되지 않는 한, 본 발명이 속하는 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 가진다. 일반적으로 사용되는 사전에 정의되어 있는 용어들은 관련 기술의 문맥상 가지는 의미와 일치하는 것으로 해석되어야 하며, 본 발명에서 명백하게 정의하지 않는 한 이상적이거나 과도하게 형식적인 의미를 지니는 것으로 해석될 수 없다.
도 1은 본 발명의 일실시예에 따른 소셜미디어 데이터 기반 콘텐츠 소재 탐색방법의 전체순서도이고, 도 2는 키워드 출출단계의 세부순서도이며, 도 3은 카테고리 분류단계의 세부순서도이고, 도 4는 탐색어 저장단계의 세부순서도이며, 도 5는 데이터 저장단계의 세부순서도이고, 도 6은 매스미디어 매체 분석단계의 세부순서도이며, 도 7은 의미기반 키워드 추출단계의 세부순서도이고, 도 8은 본 발명의 일실시예에 따른 채널별 콘텐츠 키워드를 분석하는 흐름의 예를 도시한 도면이며, 도 9는 연관어 및 매체데이터를 이용한 유사 키워드를 추천하는 인공지능 학습의 개념을 나타낸 도면이고, 도 10은 매체데이터의 트랜드를 분석하는 흐름의 예를 도시한 도면이다.
도 1 내지 도 10에 도시된 바와 같이, 본 발명은 유튜브 채널 분석단계(S100), 키워드 추출단계(S200), 채널 태그 추출단계(S300), 카테고리 분류단계(S400) 및 탐색어 저장단계(S500)을 포함하여 이루어질 수 있다.
유튜브 채널 분석단계(S100)는 유튜브 채널에서 키워드를 분석하는 단계이다.
키워드 추출단계(S200)는 유튜브 채널 분석단계(S100)를 거친 후 빈도수에 기반하여 키워드를 추출하는 단계이다.
키워드 추출단계(S200)는 영상제목 추출단계(S210) 및 영상태그 추출단계(S220)를 포함하여 이루어질 수 있다.
영상제목 추출단계(S210)는 유튜브 채널(10)에서 설정된 키워드와 관련된 영상제목을 추출하는 단계이다.
영상태그 추출단계(S220)는 영상제목 추출단계(S210)를 거친 후 설정된 키워드와 관련된 영상태그를 추출하는 단계이다.
채널 태그 추출단계(S300)는 유튜브 채널 분석단계(S100)를 거친 후 유튜브 채널(10)에서 채널 태그를 추출하는 단계이다. 구체적으로, 채널 태그 추출단계(S300)는 키워드 추출단계(S200)에서의 키워드 추출과 같이 또는 동시에 유튜브 채널(10)에서 채널 태그를 추출할 수 있다.
카테고리 분류단계(S400)는 키워드 추출단계(S200)와 채널 태그 추출단계(S300)를 거친 후 유튜브 채널(10)에서 추출된 탐색어에 기반하여 카테고리를 분류하는 단계이다.
카테고리 분류단계(S400)는 동일 카테고리 채널 선정단계(S410), 영상선정단계(S420), 의미기반 키워드 추출단계(S430) 및 영상태그 추출단계(S440)를 포함하여 이루어질 수 있다.
동일 카테고리 채널 선정단계(S410)는 유튜브 채널(10)에서 동일 카테고리의 채널을 선정하는 단계이다.
영상선정단계(S420)는 동일 카테고리 채널 선정단계(S410)를 거친 후 유튜브 채널(10)에서 영상을 선정하는 단계이다.
의미기반 키워드 추출단계(S430)는 영상선정단계(S410)를 거친 후 유튜브 채널(10)의 카테고리에 따라 달라지는 의미를 추적해 키워드를 추출하는 단계이다.
의미기반 키워드 추출단계(S430)는 제목추출단계(S432) 및 이미지 텍스트 추출단계(S434)를 포함하여 이루어질 수 있다.
제목추출단계(S432)는 영상선정단계(S420)를 거친 영상에서 의미기반 키워드에 연관된 제목을 추출하는 단계이다.
이미지 텍스트 추출단계(S434)는 영상선정단계(S420)를 거친 영상에서 의미기반 키워드에 연관된 썸네일을 추출하는 단계이다.
영상태그 추출단계(S440)는 영상선정단계(S410)를 거친 후 유튜브 채널(10)의 카테고리에 따라 달라지는 영상태그를 추출하는 단계이다.
탐색어 저장단계(S500)는 카테고리 분류단계(S400)를 거친 후 인공지능 기능에 기반하여 유튜브 채널(10)에서 추출된 탐색어를 저장하는 단계이다.
탐색어 저장단계(S500)는 데이터 저장단계(S510), 코사인 유사도 계산단계(S520) 및 유사어 추출단계(S530)를 포함하여 이루어질 수 있다.
데이터 저장단계(S510)는 탐색어 사전에 저장된 키워드를 이용해 매체 데이터를 저장하는 단계이다.
데이터 저장단계(S510)는 연관어 수집 저장단계(S512) 및 매스미디어 매체 분석단계(S514)를 포함하여 이루어질 수 있다.
연관어 수집 저장단계(S512)는 유튜브 채널(10)이나 인터넷 포털 사이트에서 연관어룰 수집하여 저장하는 단계이다. 구체적으로, 도 9를 참고하면, 연관어 수집 저장단계(S512)에서는 네이버 연관검색어, 구글 트랜드 관련 검색어, 유튜브 검색어 자동완성을 통해서 사용자가 소재로 다룰 수 있을 만한 탐색어와 연관된 키워드를 수집하여 저장할 수 있다.
매스미디어 매체 분석단계(S514)는 연관어 수집 저장단계(S512)를 거친 후 커뮤니티, SNS 및 뉴스를 통해서 탐색어와 연관된 키워드를 수집하여 분석하는 단계이다. 구체적으로, 매스미디어 매체 분석단계(S514)에서는 인스타그램, 페이스북, 트위치 등의 SNS와, 보배드림, 클리앙, 펨코, 웃대, 인스타즈, 인벤, 엠팍, 뽐뿌, 루리웹, 더쿠 등의 커뮤니티와, 각종 뉴스 등을 통해서 탐색어와 연관된 키워드를 수집하여 분석할 수 있다.
매스미디어 매체 분석단계(S514)는 키워드 입력단계(S5141), 영상 데이터 조회단계(S5142), 소재 추천단계(S5143), 글감 추천단계(S5144) 및 참고영상 추천단계(S5145)를 포함하여 이루어질 수 있다.
키워드 입력단계(S5141)는 입력어와 탐색어를 통해 유추되는 연관 키워드를 입력하는 단계이다. 구체적으로, 키워드 입력단계(S5141)에서는 날짜, 이슈에 따라 서버에서 탐색 키워드를 임의 지정할 수 있는데, 예를 들어, 새해, 연말, 할로윈, 러시아 등이다, 또한, 전술한 바와 같이, 입력어와 탐색어를 통해 유추되는 연관 키워드를 입력할 수 있는데, 입력어의 유사어, 탐색어의 유사어 등을 통해서도 유추되는 연관 키워드를 입력할 수 있다.
영상 데이터 조회단계(S5142)는 키워드 입력단계(S5141)를 거친 후 수집해둔 유튜브 채널 데이터에서 설정된 키워드 조합으로 메타 데이터를 분석하여 유튜브 채널(10)의 영상 데이터를 조회하는 단계이다. 구체적으로, 영상 데이터 조회단계(S5142)에서는 수집해둔 유튜브 채널 데이터에서 다양한 키워드 조합으로 메타 데이터의 분석이 가능한데, 상기의 조합은 입력어+탐색어, 탐색어+연관어, 유사어+연관어 등일 수 있다.
또한, 영상 데이터 조회단계(S5142)에서는 영상을 올린 채널의 구독자수에 따라 구독자 구간을 분리하고, 영상의 일일 조회수는 금일 조회수 빼기 작일 조회수를 의미하며, 영상 올린 채널의 평균 조회수인 성과는 평균 조회수 대비 영상 조회수로 나타낼 수 있다.
또한, 영상개수에서 경쟁강도는 영상수 대비 영상 일일 조회수로 나타낼 수 있다.
소재 추천단계(S5143)는 영상 데이터 조회단계(S5142)를 거친 후 분석한 매타 데이터를 정렬하여 사용자에게 설정된 조건의 소재를 제안하는 단계이다. 구체적으로, 소재 추천단계(S5143)에서는 영상 조회수에서 최근 조회수가 높은 키워드, 영상을 올린 채널의 평균조회수에서 검색 및 탐색 기능으로 많이 유입된 키워드 및 경쟁강도가 낮은 키워드를 통해서 소재를 추천할 수 있다.
글감 추천단계(S5144)는 소재 추천단계(S5143)를 거친 후 제안한 소재를 이해하기 위한 매체 데이터와 영상 자료를 소개하는 단계이다. 구체적으로, 글감 추천단계(S5144)에서는 전술한 바와 같은 뉴스, 커뮤니티, SNS를 통해서 추천할 수 있다.
참고영상 추천단계(S5145)는 글감 추천단계(S5144)를 거친 후 사용자와 구독자 구간이 같은 채널의 영상을 추천하는 단계이다.
코사인 유사도 계산단계(S520)는 데이터 저장단계(S510)를 거친 후 저장된 매체 데이터를 이용해 탐색어와 코사인 벡터의 근접 값을 계산하는 단계이다.
유사어 추출단계(S530)는 코사인 유사도 계산단계(S520)를 거친 후 저장된 매체 데이터를 이용해 탐색어와 코사인 벡터의 근접한 유사어를 추출하는 단계이다.
구체적으로, 코사인 유사도(cosine similarity)는 내적공간의 두 벡터간 각도의 코사인값을 이용하여 측정된 벡터간의 유사한 정도를 의미하는 것으로, 어떤 개수의 차원에도 적용이 가능하여 흔히 다차원의 양수 공간에서의 유사도 측정에 자주 이용된다. 예를 들어 정보 검색 및 텍스트 마이닝 분야에서, 단어 하나 하나는 각각의 차원을 구성하고 문서는 각 단어가 문서에 나타나는 회수로 표현되는 벡터값을 가진다. 이러한 다차원 공간에서 코사인 유사도는 두 문서의 유사를 측정하는 매우 유용한 방법이다.
또한, 유사어 추출단계(S530)를 통해 추출된 유사어로 매스미디어 매체 분석단계(S514)에서 다시 한번 매체 데이터를 검색하고 저장할 수 있다.
상술한 바와 같이 개시된 본 발명의 바람직한 실시예들에 대한 상세한 설명은 당업자가 본 발명을 구현하고 실시할 수 있도록 제공되었다. 상기에서는 본 발명의 바람직한 실시 예들을 참조하여 설명하였지만, 해당 기술 분야의 숙련된 당업자는 본 발명의 영역으로부터 벗어나지 않는 범위 내에서 본 발명을 다양하게 수정 및 변경시킬 수 있음을 이해할 수 있을 것이다. 예를 들어, 당업자는 상술한 실시 예들에 기재된 각 구성을 서로 조합하는 방식으로 이용할 수 있다. 따라서, 본 발명은 여기에 나타난 실시형태들에 제한되려는 것이 아니라, 여기서 개시된 원리들 및 신규한 특징들과 일치하는 최광의 범위를 부여하려는 것이다.
본 발명은 본 발명의 정신 및 필수적 특징을 벗어나지 않는 범위에서 다른 특정한 형태로 구체화될 수 있다. 따라서, 상기의 상세한 설명은 모든 면에서 제한적으로 해석되어서는 아니 되고 예시적인 것으로 고려되어야 한다. 본 발명의 범위는 첨부된 청구항의 합리적 해석에 의해 결정되어야 하고, 본 발명의 등가적 범위 내에서의 모든 변경은 본 발명의 범위에 포함된다. 본 발명은 여기에 나타난 실시형태들에 제한되려는 것이 아니라, 여기서 개시된 원리들 및 신규한 특징들과 일치하는 최광의 범위를 부여하려는 것이다. 또한, 특허청구범위에서 명시적인 인용 관계가 있지 않은 청구항들을 결합하여 실시 예를 구성하거나 출원 후의 보정에 의해 새로운 청구항으로 포함할 수 있다.
10 : 유튜브 채널

Claims (7)

  1. 유튜브 채널에서 키워드를 분석하는 유튜브 채널 분석단계;
    상기 유튜브 채널 분석단계를 거친 후 빈도수에 기반하여 키워드를 추출하는 키워드 추출단계;
    상기 유튜브 채널 분석단계를 거친 후 상기 유튜브 채널에서 채널 태그를 추출하는 채널 태그 추출단계;
    상기 키워드 추출단계와 채널 태그 추출단계를 거친 후 상기 유튜브 채널에서 추출된 탐색어에 기반하여 카테고리를 분류하는 카테고리 분류단계; 및
    상기 카테고리 분류단계를 거친 후 인공지능 기능에 기반하여 상기 유튜브 채널에서 추출된 탐색어를 저장하는 탐색어 저장단계;를 포함하여 이루어지되,
    상기 탐색어 저장단계는,
    탐색어 사전에 저장된 키워드를 이용해 매체 데이터를 저장하는 데이터 저장단계;
    상기 데이터 저장단계를 거친 후 저장된 매체 데이터를 이용해 탐색어와 코사인 벡터의 근접 값을 계산하는 코사인 유사도 계산단계; 및
    상기 코사인 유사도 계산단계를 거친 후 저장된 매체 데이터를 이용해 탐색어와 코사인 벡터의 근접한 유사어를 추출하는 유사어 추출단계;를 포함하여 이루어지고,상기 데이터 저장단계는,
    상기 유튜브 채널이나 인터넷 포털 사이트에서 연관어룰 수집하여 저장하는 연관어 수집 저장단계; 및
    상기 연관어 수집 저장단계를 거친 후 커뮤니티, SNS 및 뉴스를 통해서 탐색어와 연관된 키워드를 수집하여 분석하는 매스미디어 매체 분석단계;를 포함하여 이루어지며,
    상기 매스미디어 매체 분석단계는,
    입력어와 탐색어를 통해 유추되는 연관 키워드를 입력하는 키워드 입력단계;
    상기 키워드 입력단계를 거친 후 수집해둔 유튜브 채널 데이터에서 설정된 키워드 조합으로 메타 데이터를 분석하여 상기 유튜브 채널의 영상 데이터를 조회하는 영상 데이터 조회단계;
    상기 영상 데이터 조회단계를 거친 후 분석한 매타 데이터를 정렬하여 사용자에게 설정된 조건의 소재를 제안하는 소재 추천단계;
    상기 소재 추천단계를 거친 후 제안한 소재를 이해하기 위한 매체 데이터와 영상 자료를 소개하는 글감 추천단계; 및
    상기 글감 추천단계를 거친 후 사용자와 구독자 구간이 같은 채널의 영상을 추천하는 참고영상 추천단계;를 포함하여 이루어지는 것을 특징으로 하는 소셜미디어 데이터 기반 콘텐츠 소재 탐색방법.
  2. 청구항 1에 있어서,
    상기 키워드 추출단계는,
    상기 유튜브 채널에서 설정된 키워드와 관련된 영상제목을 추출하는 영상제목 추출단계; 및
    상기 영상제목 추출단계를 거친 후 설정된 키워드와 관련된 영상태그를 추출하는 영상태그 추출단계;를 포함하여 이루어지는 것을 특징으로 하는 소셜미디어 데이터 기반 콘텐츠 소재 탐색방법.
  3. 청구항 1에 있어서,
    상기 카테고리 분류단계는,
    상기 유튜브 채널에서 동일 카테고리의 채널을 선정하는 동일 카테고리 채널 선정단계;
    상기 동일 카테고리 채널 선정단계를 거친 후 상기 유튜브 채널에서 영상을 선정하는 영상선정단계;
    상기 영상선정단계를 거친 후 상기 유튜브 채널의 카테고리에 따라 달라지는 의미를 추적해 키워드를 추출하는 의미기반 키워드 추출단계; 및
    상기 영상선정단계를 거친 후 상기 유튜브 채널의 카테고리에 따라 달라지는 영상태그를 추출하는 영상태그 추출단계;를 포함하여 이루어지는 것을 특징으로 하는 소셜미디어 데이터 기반 콘텐츠 소재 탐색방법.
  4. 삭제
  5. 삭제
  6. 삭제
  7. 청구항 3에 있어서,
    상기 의미기반 키워드 추출단계는,
    상기 영상선정단계를 거친 상기 영상에서 의미기반 키워드에 연관된 제목을 추출하는 제목추출단계; 및
    상기 영상선정단계를 거친 상기 영상에서 의미기반 키워드에 연관된 썸네일을 추출하는 이미지 텍스트 추출단계;를 포함하여 이루어지는 것을 특징으로 하는 소셜미디어 데이터 기반 콘텐츠 소재 탐색방법.
KR1020230009402A 2023-01-25 2023-01-25 소셜미디어 데이터 기반 콘텐츠 소재 탐색방법 KR102562791B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020230009402A KR102562791B1 (ko) 2023-01-25 2023-01-25 소셜미디어 데이터 기반 콘텐츠 소재 탐색방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020230009402A KR102562791B1 (ko) 2023-01-25 2023-01-25 소셜미디어 데이터 기반 콘텐츠 소재 탐색방법

Publications (1)

Publication Number Publication Date
KR102562791B1 true KR102562791B1 (ko) 2023-08-03

Family

ID=87567901

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020230009402A KR102562791B1 (ko) 2023-01-25 2023-01-25 소셜미디어 데이터 기반 콘텐츠 소재 탐색방법

Country Status (1)

Country Link
KR (1) KR102562791B1 (ko)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20220011294A (ko) * 2020-07-21 2022-01-28 버즈앤비 주식회사 인공지능 기반의 카테고리 분류 장치 및 방법
KR20220013772A (ko) * 2020-07-27 2022-02-04 버즈앤비 주식회사 키워드의 트렌드 분석 장치 및 방법
KR20220063881A (ko) 2020-11-11 2022-05-18 버즈앤비 주식회사 동영상 채널 시청자의 연관 관심사 추출 장치 및 방법
KR20220088369A (ko) * 2020-12-18 2022-06-27 주식회사 에어딥 트렌드분석 기반 ai 자동 해시태그 추천 방법
KR102439321B1 (ko) * 2022-05-04 2022-09-05 한국데이터플랫폼 주식회사 문장 의미를 분석하여 찾아주는 시맨틱 분석 제공 시스템

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20220011294A (ko) * 2020-07-21 2022-01-28 버즈앤비 주식회사 인공지능 기반의 카테고리 분류 장치 및 방법
KR20220013772A (ko) * 2020-07-27 2022-02-04 버즈앤비 주식회사 키워드의 트렌드 분석 장치 및 방법
KR20220063881A (ko) 2020-11-11 2022-05-18 버즈앤비 주식회사 동영상 채널 시청자의 연관 관심사 추출 장치 및 방법
KR20220088369A (ko) * 2020-12-18 2022-06-27 주식회사 에어딥 트렌드분석 기반 ai 자동 해시태그 추천 방법
KR102439321B1 (ko) * 2022-05-04 2022-09-05 한국데이터플랫폼 주식회사 문장 의미를 분석하여 찾아주는 시맨틱 분석 제공 시스템

Similar Documents

Publication Publication Date Title
Ristoski et al. A machine learning approach for product matching and categorization
Figueiredo et al. Assessing the quality of textual features in social media
US8909626B2 (en) Determining user preference of items based on user ratings and user features
Chehal et al. Implementation and comparison of topic modeling techniques based on user reviews in e-commerce recommendations
US20080294625A1 (en) Item recommendation system
JP2019531547A (ja) 視覚検索クエリによるオブジェクト検出
US20100223258A1 (en) Information retrieval system and method using a bayesian algorithm based on probabilistic similarity scores
US20090254455A1 (en) System and method for virtual canvas generation, product catalog searching, and result presentation
CN105488233A (zh) 阅读信息推荐方法和系统
US20130036121A1 (en) System and method for recommending blog
An et al. Automatic generation of personas using youtube social media data
US20160196593A1 (en) System and method for tracking filter activity and monitoring trends associated with said activity
Soriano et al. Text mining in computational advertising
CN102831543A (zh) 一种电子商务推荐方法
KR101758695B1 (ko) 소셜 테이스트 분석 기반 다중 한류 콘텐츠 검색 및 추천 시스템
Kim et al. Exploring characteristics of video consuming behaviour in different social media using K-pop videos
Heggo et al. Hybrid information filtering engine for personalized job recommender system
RU2683482C2 (ru) Метод отображения релевантной контекстно-зависимой информации
Kahya-Özyirmidokuz Analyzing unstructured Facebook social network data through web text mining: A study of online shopping firms in Turkey
Hashemzadeh et al. Using a data mining tool and fp-growth algorithm application for extraction of the rules in two different dataset
Deldjoo et al. How to combine visual features with tags to improve movie recommendation accuracy?
Zhang et al. Measuring similarity between brands using followers' post in social media
KR102562791B1 (ko) 소셜미디어 데이터 기반 콘텐츠 소재 탐색방법
Goyal et al. A robust approach for finding conceptually related queries using feature selection and tripartite graph structure
Zhu et al. Videotopic: Modeling user interests for content-based video recommendation

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right
GRNT Written decision to grant