KR20230007571A

KR20230007571A - 검열된 미디어 코퍼스에의 통합을 위한 미디어 소스 측정

Info

Publication number: KR20230007571A
Application number: KR1020237000367A
Authority: KR
Inventors: 스콧 페터슨
Original assignee: 구글 엘엘씨
Priority date: 2018-06-29
Filing date: 2018-06-29
Publication date: 2023-01-12
Also published as: KR102486241B1; AU2018429394B2; KR20200126424A; AU2018429394A1; CA3096368A1; CN111919210A; EP3610348A1; US20210103623A1; CA3096368C; WO2020005295A1

Abstract

본 개시내용은 제약된 미디어 코퍼스에 콘텐츠를 통합할 때 사용하기 위해 미디어 소스들을 측정하고 선택하기 위해 검색 이벤트들을 분석하기 위한 기술을 제공한다. 예시적인 방법은 제1 미디어 코퍼스의 복수의 검색 이벤트의 검색 특성을 결정하는 단계; 제2 미디어 코퍼스의 검색 이벤트들의 세트를 식별하는 단계 - 검색 이벤트들의 세트는 검색 특성에 대응하고 복수의 미디어 소스를 참조하는 검색 이벤트를 포함함 -; 검색 이벤트들의 세트로부터 제2 미디어 코퍼스에 연관된 미디어 소스들의 세트를 추출하는 단계; 처리 디바이스에 의해, 미디어 소스의 측정치에 기초하여 미디어 소스들의 세트로부터 미디어 소스를 선택하는 단계 - 측정치는 미디어 소스를 참조하는 검색 이벤트들에 기초함 -; 및 제2 미디어 코퍼스에 연관된 미디어 소스로부터 제1 미디어 코퍼스 내로 콘텐츠를 통합하는 단계를 포함한다.

Description

검열된 미디어 코퍼스에의 통합을 위한 미디어 소스 측정{MEDIA SOURCE MEASUREMENT FOR INCORPORATION INTO A CENSORED MEDIA CORPUS}

본 개시내용은 콘텐츠 공유 플랫폼들의 분야에 관한 것으로, 특히 미디어 항목들의 식별을 향상시키기 위해 미디어 소스들을 측정하는 것에 관한 것이다.

최신의 콘텐츠 공유 네트워크들은 사용자들이 미디어 콘텐츠에 액세스하고 미디어 콘텐츠를 소비하는 것을 가능하게 한다. 콘텐츠 공유 네트워크들은 종종 사용자들이 미디어 콘텐츠를 저장하고 다른 사용자들과 공유하는 것을 허용하는 양태들을 포함한다. 미디어 콘텐츠는 비디오 콘텐츠, 오디오 콘텐츠, 다른 콘텐츠 또는 이들의 조합을 포함할 수 있다. 콘텐츠는 전문 콘텐츠 제작자들로부터의 콘텐츠, 예를 들어, 영화, 텔레비전 클립 및 음악은 물론, 아마추어 콘텐츠 제작자들로부터의 콘텐츠, 예를 들어, 비디오 블로깅 및 짧은 오리지널 비디오들을 포함할 수 있다. 미디어 콘텐츠는 종종 콘텐츠의 사용과 보급을 장려하기 위해 최소한의 제약으로 공유된다.

이하는 본 개시내용의 일부 양태들의 기본적인 이해를 제공하기 위한 본 개시내용의 간략화된 요약이다. 이러한 요약은 본 개시내용의 포괄적인 개요가 아니다. 이는 본 개시내용의 핵심적인 또는 중요한 요소들을 식별하거나, 본 개시내용의 특정 실시예들의 임의의 범위 또는 청구항들의 임의의 범위를 설명하도록 의도되지 않는다. 이것의 유일한 목적은 나중에 제시되는 보다 상세한 설명의 서두로서, 본 개시내용의 일부 개념들을 단순화된 형태로 제시하는 것이다.

본 개시내용의 제1 양태에서는, 방법이 제공된다. 방법은 제1 미디어 코퍼스의 복수의 검색 이벤트의 검색 특성을 결정하는 단계; 제2 미디어 코퍼스의 검색 이벤트들의 세트를 식별하는 단계 - 검색 이벤트들의 세트는 검색 특성에 대응하고, 복수의 미디어 소스를 참조하는 검색 이벤트를 포함함 -; 검색 이벤트들의 세트로부터 제2 미디어 코퍼스에 연관된 미디어 소스들의 세트를 추출하는 단계; 처리 디바이스에 의해, 미디어 소스의 측정치에 기초하여 미디어 소스들의 세트로부터 미디어 소스를 선택하는 단계 - 측정치는 미디어 소스를 참조하는 검색 이벤트들에 기초함 -; 및 제2 미디어 코퍼스에 연관된 선택된 미디어 소스로부터 제1 미디어 코퍼스 내로 콘텐츠를 통합하는 단계를 포함한다.

방법은 제1 미디어 코퍼스의 복수의 검색 이벤트를 포함하는 로그를 분석하는 단계를 더 포함할 수 있고, 복수의 검색 이벤트 중 적어도 하나는 검색어를 포함하고 검색 특성에 링크된다.

검색 특성은 지식 그래프 식별자를 포함할 수 있다.

제1 미디어 코퍼스는 특정 연령 범위 내의 개인들의 클래스에 대한 콘텐츠 특성들을 포함하는 미디어 항목들의 컬렉션을 포함할 수 있다.

미디어 소스는 미디어 채널을 포함할 수 있고, 콘텐츠는 비디오 콘텐츠를 포함한다.

미디어 소스들의 세트를 추출하는 단계는 제2 미디어 코퍼스의 검색 이벤트들의 세트에 의해 참조되는 미디어 채널들의 세트를 식별하는 단계를 포함할 수 있다.

제2 미디어 코퍼스에 연관된 미디어 소스들의 세트로부터 미디어 소스를 선택하는 단계는: 세트 내에서 미디어 소스를 참조하는 검색 이벤트들을 식별하는 단계 - 식별된 검색 이벤트들 각각은 미디어 소스들의 순서를 포함함 -; 순서 내에서의 미디어 소스의 위치를 결정하는 단계; 검색 특성에 대응하는 검색 이벤트들의 세트 내의 검색 이벤트들의 양 및 미디어 소스의 위치에 기초하여 미디어 소스의 측정치를 계산하는 단계; 및 최대의 미리 결정된 측정치를 갖는 미디어 소스를 선택하는 단계를 포함할 수 있다.

미리 결정된 측정치는 최대 측정치일 수 있다.

방법은 검색 이벤트들의 세트 내에서의 미디어 소스의 평균 순위 r, 및 미디어 소스의 위반 값 pv에 기초하여, 이하의 수학식: 측정치 = 1/(r*(pv+1))을 고려하여 미디어 소스의 측정치를 계산하는 단계를 더 포함할 수 있다.

제1 미디어 코퍼스의 복수의 검색 이벤트의 검색 특성을 결정하는 단계는: 제1 미디어 코퍼스의 검색 이벤트들을 복수의 그룹으로 분류하는 단계; 미리 결정된 임계값에 기초하여 복수의 그룹 중의 하나 이상의 그룹을 선택하는 단계; 검색 이벤트들의 하나 이상의 그룹에 연관된 복수의 검색 특성을 식별하는 단계; 복수의 검색 특성을 고유한 검색 특성들의 세트에 통합하는 단계; 및 검색 특성에 연관된 검색 이벤트들의 양에 기초하여 고유한 검색 특성들의 세트로부터 검색 특성을 선택하는 단계를 포함할 수 있다.

본 개시내용의 제2 양태에서는, 메모리; 및 메모리에 통신가능하게 결합되고 제1 양태에 따른 방법을 수행하도록 구성되는 처리 디바이스를 포함하는 시스템이 제공된다.

본 개시내용의 제3 양태에서는, 처리 디바이스로 하여금 제1 양태에 따른 방법을 수행하게 하는 명령어들을 포함하는 비-일시적 컴퓨터 판독가능한 저장 매체가 제공된다.

본 개시내용은 첨부 도면 중의 도면들에서 제한이 아닌 예로서 도시된다.
도 1은 본 개시내용의 구현에 따른 예시적인 시스템 아키텍처를 도시한다.
도 2는 본 개시내용의 구현에 따른 컴포넌트들 및 모듈들을 갖는 예시적인 컴퓨팅 디바이스를 도시하는 블록도이다.
도 3은 본 개시내용의 구현에 따른 방법의 예를 도시하는 흐름도이다.
도 4는 본 개시내용의 구현에 따른 컴퓨팅 디바이스의 다른 예를 도시하는 블록도이다.
이러한 도면들은 이하의 상세한 설명과 관련하여 관찰될 때 더 잘 이해될 수 있다.

최신의 콘텐츠 공유 플랫폼들은 종종 사용자가 콘텐츠를 더 잘 찾고 소비할 수 있도록 콘텐츠를 체계화(organize)한다. 콘텐츠는 임의의 방식으로 체계화될 수 있으며, 종종 복수의 미디어 소스로 체계화된다. 미디어 소스들은 미디어 채널들과 유사한 방식으로 기능할 수 있으며, 공통 소스로부터 입수가능한 콘텐츠 또는 공통 토픽 또는 테마를 갖는 콘텐츠에 기초할 수 있다. 콘텐츠 공유 플랫폼은 또한 개인들의 특정 클래스들(예를 들어, 어린이)에 기초하여 콘텐츠를 체계화할 수 있다. 이러한 클래스들의 개인들이 이용할 수 있는 콘텐츠는 부적절한 콘텐츠가 포함되지 않도록 신중하게 선택될 필요가 있을 수 있다. 소비에 이용가능한 콘텐츠와 이용가능하지 않은 콘텐츠를 식별하는 것은 콘텐츠 큐레이션이라고 지칭될 수 있다.

콘텐츠 큐레이션은 어느 콘텐츠 단편들이 개인들의 특정 클래스에 적합한지를 선택하는 것을 수반할 수 있으며, 수동 또는 자동 콘텐츠 큐레이션을 포함할 수 있다. 미디어 소스들은 선택 기술들을 활용하고 임의의 콘텐츠 제약들을 우회하는 콘텐츠를 제공하도록 인센티브를 제공받기 때문에, 콘텐츠 큐레이션은 종종 어려운 일이다. 콘텐츠 제약들은 종종 디지털 미디어의 콘텐츠를 분석함으로써 시행된다. 일례에서, 콘텐츠 공유 플랫폼은 특정 유형의 부적절한 콘텐츠를 식별하고 제거할 수 있는 커스텀화된 콘텐츠 분류기들(예를 들어, 머신 학습 분류기들)을 생성할 수 있다. 디지털 이미지 처리 기술들은 리소스 집약적일 수 있고 커스텀화된 콘텐츠 분류기들은 트레이닝하는 데 시간이 걸릴 수 있기 때문에, 콘텐츠 자체를 분석하는 것은 문제가 될 수 있다.

본 개시내용의 양태들 및 구현들은, 콘텐츠 자체의 분석에만 기초하는 것에 대조적으로, 콘텐츠의 소스의 분석에 기초하여, 콘텐츠를 통합하거나 제약하는 기술에 관한 것이다. 일례에서, 기술은 소비할 콘텐츠를 식별하려고 시도하는 최종 사용자들에 의해 개시된 검색 질의들에 대응할 수 있는 검색 이벤트들을 분석하는 것을 수반할 수 있다. 검색 이벤트들 중 일부는 제1 미디어 코퍼스(media corpus)에 대응할 수 있고, 검색 이벤트들 중 일부는 제2 미디어 코퍼스에 대응할 수 있다. 제1 미디어 코퍼스는 개인들의 특정 클래스(예를 들어, 어린이)에 적합하다고 간주되는 제약된 콘텐츠 세트(예를 들어, 검열된 미디어 코퍼스)를 포함할 수 있고, 제2 미디어 코퍼스는 더 크고 덜 제약된 콘텐츠 세트(예를 들어, 일반 미디어 코퍼스)를 포함할 수 있다. 기술은 제1 미디어 코퍼스의 검색 이벤트들에 공통적인 검색 특성들(예를 들어, 토픽들, 테마들)을 결정하기 위해 제1 미디어 코퍼스의 검색 이벤트들을 분석할 수 있다. 이는 콘텐츠 소비자가 흥미있어 하지만 제1 미디어 코퍼스에서 누락된 콘텐츠를 나타낼 수 있다.

기술은 동일하거나 유사한 검색 특성들에 대응하는 제2 미디어 코퍼스의 검색 이벤트들의 세트를 식별하기 위해 검색 특성들을 사용할 수 있다. 제2 미디어 코퍼스의 검색 이벤트들의 세트는 검색 특성들에 관련된 복수의 미디어 소스(예를 들어, 검색되는 비디오 콘텐츠를 제공하는 미디어 채널들)를 참조하는 검색 이벤트들을 포함할 수 있다. 기술은 제2 미디어 코퍼스의 검색 이벤트들을 분석하여 미디어 소스들의 세트를 추출하고 미디어 소스들 각각에 대한 측정치를 계산할 수 있다. 측정치는 미디어 소스의 평판 등급(예를 들어, 신뢰 점수)으로서 기능할 수 있으며, 미디어 소스를 참조하는 검색 이벤트들의 수는 물론, 미디어 소스에 연관된 등급 및 위반에 기초할 수 있다. 측정치들은 콘텐츠를 제1 미디어 코퍼스에 통합하기 위해 사용될 수 있는 제2 미디어 코퍼스의 미디어 소스를 선택하기 위해 사용될 수 있다. 유리한 측정치들(예를 들어, 높은 신뢰도 점수)을 가진 소스들을 선택하면, 제1 미디어 코퍼스에 통합되는 콘텐츠를 향상시킬 수 있고, 콘텐츠가 제1 미디어 코퍼스의 소비자들(예를 들어, 어린이 시청자)이 수용할 수 없을 부적절한 콘텐츠를 포함할 위험성을 최소화할 수 있다.

본 명세서에 설명된 시스템들 및 방법들은 콘텐츠 공유 플랫폼에서 공유되는 것에 관해 콘텐츠를 결정하고 제약하는 방법에 연관된 기술적 문제들을 해결함으로써, 콘텐츠 공유 플랫폼들의 기술 분야를 향상시키는 기술을 포함한다. 특히, 개시된 기술은 미디어 소스 측정치들을 통합함으로써 콘텐츠 큐레이션 및 제약 기술들을 개선하고, 그에 의해 기술들은 부적절한 콘텐츠를 더 정확하게 검출할 수 있고 분류기 악용에 더 저항성이 있을 수 있게 된다. 이는 콘텐츠만 단독으로 분석하는 것에 추가하여 또는 그에 대한 대안으로서 미디어 소스의 분석을 포함함으로써 달성될 수 있다. 검색어들의 과거 사용자 선택들 및 특정 검색 결과들을 포함하는 검색 이벤트들을 분석함으로써 정확도가 더 향상될 수 있다.

도 1은 본 개시내용의 구현에 따라 미디어 소스들을 측정하고 콘텐츠를 제약된 미디어 코퍼스에 통합하기 위한 예시적인 시스템 아키텍처(100)를 도시한다. 시스템 아키텍처(100)는 콘텐츠 공유 플랫폼(110), 컴퓨팅 디바이스(120), 하나 이상의 클라이언트 디바이스(120A-Z), 및 네트워크(140)를 포함할 수 있다.

콘텐츠 공유 플랫폼(110)은 사용자에게 미디어 항목들에의 액세스를 제공하고/거나 미디어 항목들을 사용자에게 제공하기 위해 사용될 수 있는 하나 이상의 컴퓨팅 디바이스(예를 들어, 랙마운트 서버, 서버 컴퓨터, 개인용 컴퓨터, 메인 프레임 컴퓨터, 랩톱 컴퓨터, 태블릿 컴퓨터, 데스크톱 컴퓨터, 라우터 등), 데이터 저장소(예를 들어, 하드 디스크, 메모리, 데이터베이스), 네트워크, 소프트웨어 컴포넌트, 및/또는 하드웨어 컴포넌트일 수 있다. 예를 들어, 콘텐츠 공유 플랫폼(110)은 사용자가 미디어 항목들을 소비, 업로드, 검색, 승인("좋아요"), 싫어요, 및/또는 달리 댓글을 다는 것을 허용할 수 있다. 콘텐츠 공유 플랫폼(110)은 사용자들에게 미디어 항목들(114A-Z)에 대한 액세스를 제공하는 하나 이상의 웹 사이트(예를 들어, 웹 페이지) 또는 하나 이상의 애플리케이션(예를 들어, 모바일 앱)을 포함할 수 있다.

미디어 항목들(114A-Z)은 디지털 비디오, 디지털 영화, 디지털 사진, 디지털 음악, 웹사이트 콘텐츠, 소셜 미디어 업데이트, 전자 서적(e-북), 전자 잡지, 디지털 신문, 디지털 오디오 북, 전자 저널, 웹 블로그, RSS(real simple syndication) 피드, 전자 만화책, 소프트웨어 애플리케이션 등을 포함할 수 있지만 그에 제한되지는 않는다. 일부 구현들에서, 미디어 항목은 콘텐츠 항목으로 지칭될 수 있고, 인터넷을 통해 및/또는 모바일 디바이스 애플리케이션을 통해 소비될 수 있다. 간결함과 단순함을 위해, 온라인 비디오(이하, 비디오라고도 지칭됨)는 본 문서 전체에 걸쳐서 미디어 항목의 예로서 사용된다. 본 명세서에 사용될 때, "미디어", "미디어 항목", "온라인 미디어 항목", "디지털 미디어", "디지털 미디어 항목", "콘텐츠" 및 "콘텐츠 항목"은 디지털 미디어 항목을 엔티티에 제시하도록 구성되는 소프트웨어, 펌웨어 또는 하드웨어를 사용하여 실행되거나 로딩될 수 있는 전자 파일 또는 기록을 포함할 수 있다. 일 구현에서, 콘텐츠 공유 플랫폼(110)은 하나 이상의 데이터 저장소를 사용하여 미디어 항목들(114A-Z)을 저장할 수 있다. 미디어 항목들은 제1 미디어 코퍼스, 제2 미디어 코퍼스, 또는 이들의 조합에 연관될 수 있다.

제1 미디어 코퍼스(116A) 및 제2 미디어 코퍼스(116B)는 각각 콘텐츠 공유 플랫폼(110)에서 이용가능한 미디어 항목들의 컬렉션일 수 있다. 제1 미디어 코퍼스(116A)는 특정 클래스의 개인들에 더 적합하도록 의도된 콘텐츠를 포함하는 제약된 컬렉션일 수 있다. 제약된 컬렉션은 또한 검열된 컬렉션, 보호된 컬렉션, 다른 컬렉션, 또는 이들의 조합으로 지칭될 수 있다. 제1 미디어 코퍼스(116A)는 제1 미디어 코퍼스(116A)에 연관된 개인들의 특정 클래스에 기초하여 하나 이상의 콘텐츠 특성을 포함하거나 배제하는 미디어 항목들을 가질 수 있다. 특정 클래스의 개인들은 그 클래스의 하나 이상의 인간 특성에 연관될 수 있으며, 성숙도 수준(예를 들어, 연령대), 정신 능력(예를 들어, 4학년 이해도 수준), 장애(예를 들어, 색맹, 청각 장애, 시각 장애), 다른 일반적인 특징들, 또는 이들의 조합에 관련될 수 있다. 미디어 항목들의 콘텐츠 특성들은 콘텐츠의 주제에 관련될 수 있으며, 폭력, 욕설, 과도한 노출, 약물 남용, 다른 분류, 또는 이들의 조합의 존재 또는 부재를 나타낼 수 있다. 콘텐츠 특성들은 하나 이상의 분류 또는 범주(예를 들어, 일반 청중(G), 보호자 동반 권고(PG), 보호자의 엄격한 지도 필수(PG-13), 제한(R))에 관련될 수 있다. 콘텐츠 특성들은 또한 특정 캐릭터들(예를 들어, 메인 캐릭터), 시각적 양태들(예를 들어, 애니메이션, 비-애니메이션), 오디오 양태들(예를 들어, 언어 로케일, 단어 복잡성), 다른 콘텐츠 특성들, 또는 이들의 조합의 존재 또는 부재에 관련될 수 있다.

제2 미디어 코퍼스(116B)는 콘텐츠 공유 플랫폼(110)에서 이용가능한 콘텐츠의 일부 또는 전부에 연관된 미디어 항목들의 일반적인 컬렉션일 수 있다. 제2 미디어 코퍼스(116B)는 제1 미디어 코퍼스(116A)보다 덜 제약될 수 있다(예를 들어, 덜 검열될 수 있음). 제1 미디어 코퍼스(116A) 및 제2 미디어 코퍼스(116B)에 연관된 미디어 항목들의 컬렉션들은 중첩될 수 있거나, 제1 미디어 코퍼스(116A)의 미디어 항목들의 컬렉션은 하나 이상의 컬렉션에 독점적이고 다른 컬렉션들로부터 제외되는 미디어 항목들을 포함할 수 있다. 일례에서, 제1 미디어 코퍼스(116A)는 제2 미디어 코퍼스(116B)에서 이용가능한 콘텐츠의 일부가 없는 제약된 미디어 코퍼스일 수 있다. 제약된 미디어 코퍼스는 개인들의 하나 이상의 특정 클래스(예를 들어, 특정 연령 범위의 어린이)에 대한 콘텐츠 특성들을 가진 미디어 항목들을 포함할 수 있다.

미디어 소스들(112A-Z)은 미디어 채널들과 유사한 방식으로 기능할 수 있고, 공통 소스로부터 입수가능한 콘텐츠 또는 공통 토픽 또는 테마를 갖는 콘텐츠에 기초할 수 있다. 미디어 소스들(112A-Z)은 하나 이상의 사용자에게 미디어 항목들을 제공할 수 있고, 공통 소스로부터 입수가능한 콘텐츠 또는 공통 토픽 또는 테마를 갖는 데이터 콘텐츠를 식별할 수 있다. 미디어 소스들(112A-Z)은 콘텐츠 공유 플랫폼에 미디어 항목을 추가하거나 콘텐츠 공유 플랫폼에 이미 존재하는 기존 미디어 항목들을 식별함으로써 미디어를 제공할 수 있다. 미디어 항목들은 엔티티에 의해 콘텐츠 공유 플랫폼(110)에 추가될 수 있고, 엔티티에 의해 생성된 사용자 생성 콘텐츠(예를 들어, 오리지널 콘텐츠)를 포함할 수 있거나, 콘텐츠 공유 플랫폼(110)에서 이용가능해지도록 추가되거나 재생되는 기존 콘텐츠를 포함할 수 있다. 미디어 항목들은 엔티티에 의해 선택된 디지털 콘텐츠, 엔티티에 의해 이용가능하게 된 디지털 콘텐츠, 엔티티에 의해 업로드된 디지털 콘텐츠, 콘텐츠 제공자에 의해 선택된 디지털 콘텐츠, 방송사에 의해 선택된 디지털 콘텐츠 등을 포함할 수 있다. 예를 들어, 미디어 소스(112A)는 하나 이상의 비디오를 포함할 수 있다.

미디어 소스들(112A-Z) 각각은 각각의 미디어 소스에 대한 입력을 제공하는 엔티티(예를 들어, 소유자)에 연관될 수 있다. 입력은 미디어 소스를 대신하여 액션들을 개시할 수 있으며 미디어 소스의 활동에 기인할 수 있다. 입력은 인간 사용자 또는 봇(bot)(예를 들어, 소프트웨어 봇, 웹 로봇, 인터넷 봇)에 의해 제공된 사용자 입력일 수 있다. 미디어 소스의 활동들은 콘텐츠 공유 플랫폼(110)에 의해 제공되고 시행되는 정책들(예를 들어, 지침, 표준, 규칙, 규정, 모범 사례)을 준수하거나 위반할 수 있다. 정책들을 위반하는 미디어 소스의 활동들은 미디어 소스, 엔티티, 미디어 항목 또는 이들의 조합에 연관된 위반 값(pv)에 의해 표현될 수 있다. 위반 값은 숫자 또는 비-숫자 값일 수 있으며, 하나 이상의 정수, 10진수 값, 백분율, 문자, 비율, 다른 값 또는 이들의 조합을 포함한다. 일례에서, 위반 값은 미디어 소스가 존재하는 동안 또는 특정 기간(예를 들어, 하루, 일주일, 일년, 십년 등)에 걸쳐 발생한 하나 이상의 위반(예를 들어, 부적절한 미디어 항목 업로드들의 인스턴스들)의 누적 카운트일 수 있다. 미디어 소스에 연관된 활동은 디지털 콘텐츠를 이용가능하게 만드는 것, 다른 미디어 소스에 연관된 기존 디지털 콘텐츠 선택(예를 들어, 좋아요, 링크, 태깅), 디지털 콘텐츠에 대한 댓글달기 등을 포함할 수 있다. 미디어 소스에 연관된 활동들은 미디어 소스에 연관된 활동 피드 또는 프로필에 수집될 수 있다. 미디어 소스의 소유자가 아닌 사용자들은 미디어 소스의 활동 피드로부터 정보를 제공받기 위해 하나 이상의 미디어 소스를 구독할 수 있다. 사용자가 복수의 미디어 소스를 구독하는 경우, 사용자가 구독하는 각각의 미디어 소스에 대한 활동 피드는 신디케이트된 활동 피드로 결합할 수 있다. 신디케이트된 활동 피드로부터의 정보가 사용자에게 제시될 수 있다.

컴퓨팅 디바이스(120)는 제1 미디어 코퍼스(116A), 제2 미디어 코퍼스(116B), 또는 이들의 조합으로부터 콘텐츠를 추가하거나 제거하기 위해 콘텐츠 공유 플랫폼(110)의 양태들을 분석할 수 있는 하나 이상의 컴퓨팅 디바이스(예를 들어, 랙마운트 서버, 서버 컴퓨터 등)일 수 있다. 컴퓨팅 디바이스(120)는 콘텐츠 공유 플랫폼(110)과 통합될 수 있거나 콘텐츠 공유 플랫폼(110)으로부터 분리될 수 있다. 일례에서, 컴퓨팅 디바이스(120)는 이벤트 분석 컴포넌트(122), 미디어 소스 분석 컴포넌트(124) 및 콘텐츠 통합 컴포넌트(126)를 포함할 수 있다. 이벤트 분석 컴포넌트(122)는 컴퓨팅 디바이스(120)가 콘텐츠 공유 플랫폼(110)의 검색 이벤트를 분석하는 것을 가능하게 할 수 있다. 검색 이벤트들은 소비할 콘텐츠를 식별하려고 시도하는 최종 사용자들에 의해 개시되는 검색 질의들에 대응할 수 있다. 검색 이벤트들 중 일부는 제1 미디어 코퍼스(116A)에 대응할 수 있고, 검색 이벤트들 중 일부는 제2 미디어 코퍼스(116B)에 대응할 수 있다. 검색 이벤트들은 각각의 미디어 코퍼스 내에서 검색되고 있는 특성(예를 들어, 토픽)을 나타내는 데이터를 제공할 수 있다. 검색 이벤트들은 또한 제1 미디어 코퍼스(116A)에서 검색되고 있는 특성들에 관련된 콘텐츠를 제공하는 데이터 관련 미디어 소스들(112A-Z)을 제공할 수 있다. 미디어 소스 분석 컴포넌트(124)는 제2 미디어 코퍼스(116B)의 검색 이벤트들로부터 추출된 미디어 소스들을 분석하고 측정할 수 있다. 다음으로, 콘텐츠 통합 컴포넌트(126)는 미디어 소스들 중 하나(예를 들어, 최대 측정치를 갖는 미디어 소스)를 선택하고, 콘텐츠 통합(118)을 수행하여, 제2 미디어 코퍼스(116B)로부터의 콘텐츠를 포함하도록 제1 미디어 코퍼스(116A)를 업데이트할 수 있다. 컴포넌트들(122, 124, 및 126) 및 그들의 기능에 대한 추가의 설명은 도 2와 관련하여 아래에서 더 상세하게 설명된다.

클라이언트 디바이스들(130A-Z)은 각각 개인용 컴퓨터들(PC), 랩톱들, 이동전화기들, 스마트 폰들, 태블릿 컴퓨터들, 넷북 컴퓨터들 등과 같은 컴퓨팅 디바이스들을 포함할 수 있다. 일부 구현들에서, 클라이언트 디바이스(130A-Z)는 또한 "사용자 디바이스들"로 지칭될 수 있다. 각각의 클라이언트 디바이스는 사용자가 이미지들, 비디오들, 웹 페이지들, 문서들 등과 같은 미디어 항목을 볼 수 있게 하는 미디어 뷰어(132A-Z)를 포함할 수 있다. 일례에서, 미디어 뷰어는 독립형 또는 전용 애플리케이션(예를 들어, 모바일 애플리케이션)의 일부일 수 있다. 다른 예에서, 미디어 뷰어(132A-Z)는 웹 서버에 의해 서빙되는 콘텐츠(예를 들어, HTML(Hyper Text Markup Language) 페이지와 같은 웹 페이지들, 디지털 미디어 항목들 등)를 액세스, 검색, 제시 및/또는 탐색할 수 있는 일반 웹 브라우저에 통합될 수 있다. 어느 예에서든, 미디어 뷰어들(132A-Z)은 클라이언트 디바이스들(120A-Z)이 사용자에게 미디어 항목들(예를 들어, 디지털 비디오, 디지털 이미지, 전자 서적 등)을 제시하는 것을 가능하게 할 수 있다. 미디어 뷰어는 사용자에게 콘텐츠(예를 들어, 미디어 항목)를 렌더링, 디스플레이 및/또는 제시할 수 있다. 미디어 뷰어들(132A-Z)은 컴퓨팅 디바이스(120) 및/또는 콘텐츠 공유 플랫폼(110)에 의해 클라이언트 디바이스들(130A-Z)에 제공될 수 있다.

일반적으로, 일 구현에서, 컴퓨팅 디바이스(120), 콘텐츠 공유 플랫폼(110) 또는 클라이언트 디바이스들(120A-Z)에 의해 수행되는 것으로서 설명된 기능들은 다른 구현들에서 다른 디바이스들 또는 플랫폼들 중 하나 이상에 의해 수행될 수 있다. 추가로, 특정 컴포넌트에 부여된 기능은 함께 동작하는 상이한 또는 복수의 컴포넌트에 의해 수행될 수 있다. 콘텐츠 공유 플랫폼(110)은 또한 적절한 애플리케이션 프로그래밍 인터페이스들을 통해 다른 시스템들 또는 디바이스들에 제공되는 서비스로서 액세스될 수 있으며, 따라서 웹 사이트들에서의 사용으로 제한되지 않는다. 본 개시내용의 구현들은 콘텐츠 공유 플랫폼들에 관련하여 논의되지만, 구현들은 또한 사용자들 사이의 접속들을 제공하는 소셜 네트워크 서비스(150)의 하나 이상의 특징을 포함할 수 있다.

여기에서 논의된 시스템들이 클라이언트 디바이스들 또는 사용자들에 관한 개인 정보를 수집하거나 개인 정보를 사용할 수 있는 상황들에서, 사용자들은 콘텐츠 공유 플랫폼(110)이 사용자 정보(예를 들어, 사용자의 소셜 네트워크, 소셜 액션들 또는 활동들, 직업, 사용자의 선호도들, 또는 사용자의 현재 위치에 관한 정보)를 수집할 수 있는지 여부를 제어하거나, 사용자에 더 관련이 있을 수 있는 콘텐츠 서버로부터 콘텐츠를 수신할지 여부 및/또는 수신하는 방법을 제어할 기회를 제공받을 수 있다. 추가로, 특정 데이터는 개인 식별 정보가 제거되도록, 저장 또는 사용 전에 하나 이상의 방식으로 처리될 수 있다. 예를 들어, 사용자의 신원은 사용자에 대한 개인 식별 정보가 결정되지 못하도록 처리될 수 있거나, 위치 정보가 획득되는 사용자의 지리적 위치가 (예컨대, 도시, 우편 번호, 또는 주 수준으로) 일반화될 수 있고, 그에 의해 사용자의 구체적인 위치가 결정될 수 없게 된다. 따라서, 사용자는 사용자에 관한 정보가 어떻게 수집될지 및 콘텐츠 공유 플랫폼(110)에 의해 어떻게 사용될지에 대한 제어권을 가질 수 있다.

네트워크(140)는 공중 네트워크(예를 들어, 인터넷), 개인 네트워크(예를 들어, 근거리 네트워크(LAN) 또는 광역 네트워크(WAN)), 유선 네트워크(예를 들어, 이더넷 네트워크), 무선 네트워크(예를 들어, 802.11 네트워크 또는 Wi-Fi 네트워크), 셀룰러 네트워크(예를 들어, LTE(Long Term Evolution) 네트워크), 라우터, 허브, 스위치, 서버 컴퓨터, 및/또는 이들의 조합을 포함할 수 있다.

도 2는 본 개시내용의 하나 이상의 양태에 따라 콘텐츠를 제1 미디어 코퍼스(예를 들어, 검열된 컬렉션)에 통합하기 위해 미디어 소스를 식별하고 선택하기 위해 검색 이벤트들을 분석하기 위한 기술을 포함하는 예시적인 컴퓨팅 디바이스(120)를 예시하는 블록도를 도시한다. 컴퓨팅 디바이스(120)는 이벤트 분석 컴포넌트(122), 미디어 소스 분석 컴포넌트(124), 및 콘텐츠 통합 컴포넌트(126)를 포함할 수 있다. 더 많거나 더 적은 컴포넌트 또는 모듈이 일반성의 손실 없이 포함될 수 있다. 예를 들어, 2개 이상의 컴포넌트가 단일 컴포넌트로 결합될 수 있거나, 컴포넌트의 특징들이 2개 이상의 컴포넌트로 분할될 수 있다. 일 구현에서, 하나 이상의 컴포넌트는 상이한 컴퓨팅 디바이스들(예를 들어, 서버 디바이스 및 클라이언트 디바이스)에 상주할 수 있다.

이벤트 분석 컴포넌트(122)는 컴퓨팅 디바이스(120)가 콘텐츠 공유 플랫폼(110)의 검색 이벤트들로부터 도출된 검색 이벤트 데이터(242)를 분석하는 것을 가능하게 할 수 있다. 일례에서, 이벤트 분석 컴포넌트(122)는 이벤트 액세스 모듈(212), 통계 모듈(214) 및 특성 결정 모듈(216)을 포함할 수 있다.

이벤트 액세스 모듈(212)은 컴퓨팅 디바이스(120)가 콘텐츠 공유 플랫폼의 검색 이벤트들에 액세스하는 것을 가능하게 할 수 있다. 검색 이벤트들은 소비할 콘텐츠를 식별하려고 시도하는 클라이언트 디바이스들에 의해 개시된 검색 요청들 또는 검색 질의들에 대응할 수 있다. 검색 이벤트는 하나 이상의 검색어, 검색 결과, 사용자 선택, 다른 데이터, 또는 이들의 조합을 포함하거나 표시할 수 있다. 검색어들은 텍스트 데이터(예를 들어, 키워드), 이미지 데이터(예를 들어, 사진), 오디오 데이터(예를 들어, 사운드 트랙), 다른 데이터, 또는 이들의 조합을 포함할 수 있다. 검색 결과들은 하나 이상의 미디어 항목, 미디어 소스, 다른 데이터, 또는 이들의 조합을 포함할 수 있다. 검색 이벤트들은 하나 이상의 통신 채널(예를 들어, 검색 API, 로그 API, 엔터프라이즈 버스) 또는 하나 이상의 데이터 구조로부터 액세스될 수 있다. 일례에서, 검색 이벤트들은 로그 데이터 구조로부터 액세스될 수 있다.

로그 데이터 구조는 각각의 검색 이벤트들을 표현하는 하나 이상의 엔트리를 포함할 수 있다. 로그 데이터 구조는 로그 파일, 로그 데이터베이스, 다른 로그 데이터 구조, 또는 이들의 조합을 포함할 수 있다. 로그 데이터 구조는 이벤트 로그, 웹 로그, 데이터 로그, 메시지 로그, 트랜잭션 로그, 저널, 다른 이벤트 추적 구성, 또는 이들의 조합으로 지칭될 수 있다. 일례에서, 제1 미디어 코퍼스 및 제2 미디어 코퍼스는 별개의 로그 데이터 구조들을 가질 수 있다. 다른 예에서, 제1 미디어 코퍼스 및 제2 미디어 코퍼스는 하나 이상의 로그 데이터 구조를 공유할 수 있으며, 로그 데이터 구조들 또는 이벤트들은 그들이 제1 미디어 코퍼스, 제2 미디어 코퍼스, 또는 이들의 조합에 대응하는지를 나타낼 수 있다. 어느 예에서든, 이벤트 액세스 모듈(212)은 로그 데이터 구조에 액세스할 수 있고, 하나 이상의 검색 이벤트의 부분들에 대응하는 검색 이벤트 데이터를 검색할 수 있다.

통계 모듈(214)은 검색 이벤트들을 분석하고, 검색 이벤트들에 기초하여 통계 데이터를 결정할 수 있다. 통계 데이터는 하나 이상의 검색 이벤트 또는 하나 이상의 검색 이벤트 그룹을 나타낼 수 있고, 검색 이벤트의 발생량 또는 그룹 내의 검색 이벤트들의 수를 나타낼 수 있다. 통계 모듈(214)은 미디어 코퍼스의 검색 이벤트들을 하나 이상의 그룹으로 체계화하는 클러스터링, 분류, 배열, 다른 동작 또는 이들의 조합을 포함하는 동작들을 수행할 수 있다. 그룹 내의 검색 이벤트들은 특정 기간, 언어 로케일, 지리적 영역, 미디어 코퍼스, 검색 특성, 다른 양태, 또는 이들의 조합에 대응할 수 있다. 일례에서, 통계 모듈(214)은 각각의 언어 로케일(예를 들어, 영어 로케일, 스페인어 로케일, 러시아어 로케일, 일본어 로케일 등)에서 응답(예를 들어, 클릭)으로 가장 인기있는 검색 이벤트들(예를 들어, 검색 질의들)을 나타낼 수 있다. 다른 예에서, 통계 모듈(214)은 특정 검색 특성에 관련된 검색 이벤트들의 그룹 내에서 가장 인기있는 미디어 소스들을 나타낼 수 있다. 어느 예에서든, 그룹은 제1 미디어 코퍼스, 제2 미디어 코퍼스, 또는 이들의 조합에 특정한 검색 이벤트들을 포함할 수 있다.

특성 결정 모듈(216)은 검색 이벤트들의 그룹에 연관된 하나 이상의 검색 특성을 결정할 수 있다. 검색 특성은 특성 데이터(244)로서 저장될 수 있고, 검색 이벤트 또는 검색 이벤트들의 그룹에 관련된 임의의 특성일 수 있다. 위에서 논의된 바와 같이, 검색 이벤트는 검색 요청 또는 검색 질의일 수 있으며, 하나 이상의 검색어 및 검색 결과에 연관될 수 있다. 검색어들은 문자적 의미, 의미론적 의미, 또는 이들의 조합에 연관될 수 있다. 검색 특성은 검색 이벤트에 연관된 의미를 표현할 수 있으며, 토픽, 테마, 주제, 분류, 카테고리, 다른 개념, 또는 이들의 조합과 동일하거나 유사할 수 있다. 검색 특성들은 검색 이벤트들 중 하나 이상, 또는 검색 이벤트들의 부분에 연관될 수 있다. 예를 들어, 검색 특성들은 전체로서의 검색 이벤트에 연관될 수 있거나, 검색어들, 검색 결과들 또는 사용자 선택 데이터 중 하나 이상과 같은 검색 이벤트의 부분, 다른 부분 또는 이들의 조합에 연관될 수 있다.

특성 결정 모듈(216)은 인기 검색 이벤트들(예를 들어, 가장 인기있는 검색 질의들)에 연관된 검색 특성들을 결정하기 위해 이벤트 액세스 모듈(212) 및 통계 모듈(214)의 데이터에 액세스할 수 있다. 위에서 논의된 바와 같이, 통계 모듈(214)은 제1 미디어 코퍼스 내에서 가장 인기있는 검색 이벤트 그룹을 식별할 수 있다. 가장 인기있는 검색 이벤트 그룹은 검열된 미디어 항목 컬렉션일 수 있는 제1 미디어 코퍼스로부터 사용자들이 액세스를 요청하고 이는 콘텐츠를 표현할 수 있다. 콘텐츠는 제1 미디어 코퍼스 내에서 이용가능할 수도 있고 이용가능하지 않을 수도 있지만, 검색 이벤트들의 존재는 콘텐츠가 포함되는 것에 대한 바람을 나타낼 수 있다. 특성 결정 모듈(216)은 그룹에 연관된 검색 특성들을 식별하기 위해 그룹들 각각을 분석할 수 있다.

일례에서, 특성 결정 모듈(216)은 하나 이상의 검색어 또는 검색 특성에 기초하여 제1 미디어 코퍼스의 검색 이벤트들을 복수의 그룹으로 분류하거나 클러스터링함으로써 제1 미디어 코퍼스의 복수의 검색 이벤트의 검색 특성을 결정할 수 있다. 다음으로, 특성 결정 모듈(216)은 미리 결정된 임계값에 기초하여 복수의 그룹 중의 하나 이상의 그룹을 선택할 수 있다. 임계값은 검색 이벤트들의 수, 그룹 내의 검색 이벤트들의 수, 그룹들의 수, 다른 수, 또는 이들의 조합에 기초할 수 있다. 다음으로, 특성 결정 모듈(216)은 미리 결정된 임계값을 만족하는(예를 들어, 초과 또는 미만) 하나 이상의 검색 이벤트 그룹에 연관된 복수의 검색 특성을 식별할 수 있다. 검색 특성들은 동일하거나 유사한 검색 특성들을 제거하거나 병합하는 고유한 검색 특성들의 세트로 통합되어 줄어들 수 있다. 일례에서, 특성 결정 모듈(216)은 특정 지속시간(예를 들어, 지난 하루, 일주일, 1개월 등) 동안 및/또는 하나 이상의 언어 로케일 각각에서의 사용자 선택과 함께 검색 이벤트들의 상위 X%(예를 들어, 20%)를 구성하는, 제1 미디어 코퍼스로부터의 검색 이벤트 그룹들을 분석할 수 있다.

검색 특성들은 지식 그래프의 하나 이상의 식별자에 의해 표현될 수 있다. 지식 그래프는 온톨로지 데이터와 지식 그래프 식별자들을 저장하는 데이터 구조일 수 있다. 온톨로지 데이터는 사실적 항목들의 공식적 또는 비공식적 이름들 및 정의, 및 사실적 항목들의 유형들, 속성들 및 상호관계들을 포함할 수 있다. 지식 그래프 식별자들(KG ID)은 특정 개념(예를 들어, 사실적 항목들, 토픽, 테마)에 대응하는 식별 데이터(예를 들어, 숫자 또는 비-숫자 데이터)를 포함할 수 있다. 지식 그래프 식별자는 미디어 항목(예를 들어, 비디오), 미디어 소스(예를 들어, 비디오 채널), 검색 이벤트(예를 들어, 검색어 또는 검색 결과), 다른 객체, 또는 이들의 조합에 의해 할당, 링크 또는 연관될 수 있고, 객체가 지식 그래프 식별자에 대응하는 개념에 관련이 있는지를 나타낼 수 있다. 지식 그래프는 지식 기반, 지식 엔진, 지식 조직, 다른 사실 저장소, 또는 이들의 조합과 동일하거나 유사할 수 있다. 일례에서, 모든 미디어 항목의 특성들을 다루는 단일 지식 그래프가 존재할 수 있다. 다른 예에서, 복수의 지식 그래프가 존재할 수 있으며, 각각은 특정 분야 또는 영역을 포함할 수 있다.

특성 결정 모듈(216)은 또한 검색 이벤트들 또는 검색 이벤트 그룹들을 검색 특성들에 연관시킬 수 있다. 일례에서, 특성 결정 모듈(216)은 검색 이벤트들을 대응하는 검색 특성들에 연관시킬 수 있다(예를 들어, 할당, 라벨링). 다른 예에서, 특성 결정 모듈(216)은 검색 특성들을 이미 할당받은 검색 이벤트들에 액세스하고 그것들을 분석할 수 있다. 검색 특성들은 컴퓨팅 디바이스(120), 콘텐츠 공유 플랫폼, 다른 컴퓨팅 디바이스, 또는 이들의 조합에 의해 할당되었을 수 있다.

미디어 소스 분석 컴포넌트(124)는 제1 미디어 코퍼스의 검색 특성들에 기초하여 제2 미디어 코퍼스의 검색 이벤트들을 분석함으로써 미디어 소스들을 발견할 수 있다. 다음으로, 미디어 소스 분석 컴포넌트(124)는 미디어 소스들을 분석하고, 미디어 소스들의 평판(예를 들어, 신뢰도)을 표현하는 측정치들을 계산할 수 있다. 일례에서, 미디어 소스 분석 컴포넌트(124)는 이벤트 세트 생성 모듈(222), 소스 추출 모듈(224), 및 측정치 계산 모듈(226)을 포함할 수 있다.

이벤트 세트 생성 모듈(222)은 제1 미디어 코퍼스로부터 도출된 하나 이상의 검색 특성에 대응하는, 제2 미디어 코퍼스의 검색 이벤트들의 세트를 식별할 수 있다. 이벤트 세트 생성 모듈(222)은 제2 미디어 코퍼스에 연관된 로그 데이터 구조를 스캔할 수 있고, 하나 이상의 검색 특성에 관련된 검색 이벤트들을 반환할 수 있다. 이벤트 세트 생성 모듈(222)은 이러한 검색 이벤트들을 이벤트 세트 데이터(246)로서 저장할 수 있다. 검색 이벤트들 각각은 하나 이상의 미디어 소스를 참조하는 검색 결과들을 포함할 수 있다. 참조들은 검색 엔진으로부터 반환된 검색 결과들과 동일하거나 유사할 수 있으며, 미디어 소스로부터 입수가능한 미디어 항목에의 링크들을 포함할 수 있다.

소스 추출 모듈(224)은 검색 이벤트들의 세트를 분석하고, 미디어 소스들을 추출할 수 있다. 세트 내에 많은 검색 이벤트가 존재할 수 있으며, 검색 이벤트들 중 하나 이상이 동일한 미디어 소스들을 참조할 수 있다. 소스 추출 모듈(224)은 검색 이벤트들의 소스들을 결합(예를 들어, 필터링, 병합, 중복제거)하고, 고유한 미디어 소스들의 세트를 생성할 수 있다. 세트 내의 미디어 소스들 각각은 제2 미디어 코퍼스에 연관될 수 있고, 미디어 소스를 식별하는 데이터는 소스 세트 데이터(248) 내에 저장될 수 있다. 일례에서, 미디어 소스들은 비디오 콘텐츠를 제공하는 미디어 채널들일 수 있다.

측정치 계산 모듈(226)은 미디어 소스들의 세트를 분석할 수 있고, 미디어 소스들에 대한 측정치들을 생성할 수 있다. 측정치들은 데이터 저장소(240)에 측정 데이터(249)로서 저장될 수 있다. 측정치들은 등급, 점수, 포인트, 가중치, 품질, 순위, 다른 평가치, 또는 이들의 조합과 동일하거나 유사할 수 있다. 측정치들은 숫자 또는 비-숫자 데이터를 포함할 수 있고, 정책들을 위반하거나 위반하지 않는 미디어 항목들을 제공하는 것에 대한 미디어 소스의 평판을 나타낼 수 있다. 미디어 소스에 대한 측정치는 미디어 소스를 참조하는 검색 이벤트들의 양, 및/또는 검색 이벤트들의 검색 결과들 내에서의 미디어 소스의 순위에 기초할 수 있다. 일례에서, 미디어 소스의 측정치는 검색 이벤트들의 세트에서의 미디어 소스의 평균 순위(r) 및 미디어 소스의 위반 값(pv)에 기초하여, 이하의 수학식: 측정치=1/(r*(pv+1))를 고려하여 계산될 수 있다. 다른 예들에서, 미디어 소스의 측정치는 또한 또는 대안적으로 검색 이벤트들의 검색 결과들에 의해 참조되는 미디어 소스에 관한 과거 사용자 피드백(예를 들어, 클릭 카운트)에 기초할 수 있다.

일례에서, 측정치 계산 모듈(226)은 검색 결과들의 순서를 포함하는 검색 이벤트들을 분석할 수 있다. 측정치 계산 모듈(226)은 미디어 소스의 순서 내의 위치(예를 들어, 순위)를 결정하고, 그것을 측정치 계산의 일부로서 사용할 수 있다. 모듈(226)은 또한 검색 특성에 대응하는 검색 이벤트들의 세트 내의 검색 이벤트들의 양을 고려할 수 있다(예를 들어, 그것을 누적 순위 또는 평균 순위로 하기 위해). 다른 데이터는 측정치를 계산하기 위해 사용될 수 있으며, 위반 값, 참여 값(예를 들어, 좋아요, 공유, 즐겨찾기), 소비 값(예를 들어, 소비의 양 및/또는 지속시간), 시청률 값(예를 들어, 고유 또는 비-고유 시청자들의 수), 다른 값, 또는 이들의 조합을 포함할 수 있다.

콘텐츠 통합 컴포넌트(126)는 미디어 소스를 선택하고, 제2 미디어 코퍼스(116B)로부터 입수가능한 콘텐츠를 포함하도록 제1 미디어 코퍼스(116A)를 업데이트할 수 있다. 일례에서, 콘텐츠 통합 컴포넌트(126)는 소스 선택 모듈(232), 콘텐츠 식별 모듈(234), 및 미디어 코퍼스 업데이트 모듈(236)을 포함할 수 있다.

소스 선택 모듈(232)은 소스 추출 모듈(224)에 의해 식별된 미디어 소스들의 세트로부터 미디어 소스를 선택할 수 있다. 선택은 측정치 계산 모듈(226)의 하나 이상의 측정에 기초할 수 있다. 일례에서, 소스 선택 모듈(232)은 측정치들에 기초하여 미디어 소스들의 세트를 정렬하고, 최고 또는 최저 값을 가진 미디어 소스를 선택할 수 있다.

콘텐츠 식별 모듈(234)은 선택된 미디어 소스에 기초하여 콘텐츠를 식별할 수 있다. 일례에서, 미디어 소스는 특정 미디어 항목을 식별할 수 있다. 다른 예에서, 미디어 소스는 복수의 상이한 미디어 항목을 제공하는 미디어 채널을 식별할 수 있고, 콘텐츠 식별 모듈(234)은 검색 특성들에 대응하는 미디어 항목을 식별하기 위해 미디어 채널을 검색할 수 있다. 어느 예에서든, 컴퓨팅 디바이스는 미디어 항목 또는 미디어 항목 식별 데이터(예를 들어, 링크)에 액세스하고, 정보를 미디어 코퍼스 업데이트 모듈(236)에 제공할 수 있다.

미디어 코퍼스 업데이트 모듈(236)은 제2 미디어 코퍼스의 미디어 항목을 포함하도록 제1 미디어 코퍼스를 업데이트할 수 있다. 제2 미디어 코퍼스는 동일하거나 유사한 미디어 항목들을 포함할 수 있고, 콘텐츠 식별 모듈(234)에 의해 제공되는 데이터를 고려하여, 선택된 미디어 소스로부터 미디어 항목을 선택할 수 있다. 콘텐츠를 제1 미디어 코퍼스에 통합하는 것은 제1 미디어 코퍼스에 연관된 미디어 항목들의 컬렉션의 미디어 식별 데이터를 업데이트하는 것을 수반할 수 있다. 일례에서, 미디어 항목의 콘텐츠는 업데이트 동안 수정되거나 복사되지 않을 수 있고, 미디어 항목의 식별 정보만이 업데이트에 수반될 수 있다. 다른 예에서, 미디어 항목의 콘텐츠는 제1 미디어 코퍼스에 의해 액세스가능한 새로운 저장 위치로 복사(예를 들어, 중복, 복제)될 수 있다.

데이터 저장소(240)는 메모리(예를 들어, 랜덤 액세스 메모리), 캐시, 드라이브(예를 들어, 하드 드라이브), 플래시 드라이브, 데이터베이스 시스템, 또는 데이터를 저장할 수 있는 다른 유형의 컴포넌트 또는 디바이스일 수 있다. 또한, 데이터 저장소(240)는 또한 복수의 컴퓨팅 디바이스(예를 들어, 복수의 서버 컴퓨터)에 걸쳐있을 수 있는 복수의 저장 컴포넌트(예를 들어, 복수의 드라이브 또는 복수의 데이터베이스)를 또한 포함할 수 있다.

도 3은 본 개시내용의 하나 이상의 양태에 따라 콘텐츠를 제약된 미디어 코퍼스에 통합할 때 사용할 미디어 소스들을 식별하기 위해 검색 이벤트들을 분석하기 위한 방법(300)의 하나의 실례의 흐름도를 도시한다. 방법(300) 및 그것의 개별 기능들, 루틴들, 서브루틴들 또는 동작들 각각은 방법을 실행하는 컴퓨터 디바이스의 하나 이상의 프로세서에 의해 수행될 수 있다. 특정 구현들에서, 방법(300)은 단일 컴퓨팅 디바이스에 의해 수행될 수 있다. 대안적으로, 방법들(300)은 둘 이상의 컴퓨팅 디바이스에 의해 수행될 수 있으며, 각각의 컴퓨팅 디바이스는 방법의 하나 이상의 개별 기능, 루틴, 서브루틴 또는 동작을 실행한다.

설명의 간략화를 위해, 본 개시내용의 방법들은 일련의 동작들로서 도시되고 설명된다. 그러나, 본 개시내용에 따른 동작들은 다양한 순서로 및/또는 동시에, 그리고 본 명세서에 제시되고 설명되지 않은 다른 동작들과 함께 발생할 수 있다. 또한, 개시된 주제에 따른 방법들을 구현하기 위해, 도시된 모든 동작이 요구되는 것은 아닐 수 있다. 추가적으로, 본 기술분야의 통상의 기술자는 방법들이 상태도를 통한 일련의 상호관련된 상태들 또는 이벤트들로서 대안적으로 표현될 수 있음을 이해하고 인식할 것이다. 추가적으로, 본 명세서에 개시된 방법들은 그러한 방법들을 컴퓨팅 디바이스들에 전송 및 전달하는 것을 용이하게 하기 위해 제조 물품 상에 저장될 수 있음을 이해해야 한다. 본 명세서에서 사용될 때, "제조 물품"이라는 용어는 임의의 컴퓨터 판독가능한 디바이스 또는 저장 매체로부터 액세스가능한 컴퓨터 프로그램을 포괄하도록 의도된다. 일 구현에서, 방법(300)은 도 1 및 도 2의 컴포넌트들(122, 124 및 126)에 의해 수행될 수 있다.

방법(300)은 서버 디바이스 또는 클라이언트 디바이스의 처리 디바이스들에 의해 수행될 수 있으며, 블록(302)에서 시작할 수 있다. 블록(302)에서, 처리 디바이스는 제1 미디어 코퍼스의 복수의 검색 이벤트의 검색 특성을 결정할 수 있다. 검색 특성을 결정하는 것은 하나 이상의 검색 특성에 기초하여 제1 미디어 코퍼스의 검색 이벤트들을 복수의 그룹으로 분류하는 것을 수반할 수 있다. 복수의 그룹 중 하나 이상은 미리 결정된 임계값(예를 들어, 가장 인기있는 그룹)에 기초하여 선택될 수 있다. 처리 디바이스는 하나 이상의 검색 이벤트 그룹에 연관된 복수의 검색 특성을 식별하고, 복수의 검색 특성을 고유한 검색 특성들의 세트로 통합할 수 있다. 다음으로, 처리 디바이스는 검색 특성에 연관된 검색 이벤트들의 양에 기초하여 고유한 검색 특성들의 세트로부터 검색 특성을 선택할 수 있다. 일례에서, 검색 특성들을 결정하는 것은 제1 미디어 코퍼스의 검색 이벤트들을 포함하는 로그(예를 들어, 로그 데이터 구조)를 분석하는 것을 수반할 수 있다. 제1 미디어 코퍼스의 검색 이벤트들 각각은 검색어를 포함할 수 있고, 검색 특성에 링크될 수 있다(예를 들어, 라벨링됨).

블록(304)에서, 처리 디바이스는 제2 미디어 코퍼스의 검색 이벤트들의 세트를 식별할 수 있다. 검색 이벤트들의 세트는 검색 특성에 대응할 수 있고, 복수의 미디어 소스를 참조하는 검색 이벤트를 포함할 수 있다. 검색 특성은 지식 그래프 식별자일 수 있고, 처리 디바이스는 제2 미디어 코퍼스의 검색 이벤트들을 통해 검색하여, 제1 미디어 코퍼스로부터 발견된 지식 그래프 식별자에 관련된 검색 이벤트들의 세트를 식별할 수 있다. 일례에서, 처리 디바이스는 제2 미디어 코퍼스의 검색 이벤트들을 포함하는 로그를 분석함으로써 세트를 식별할 수 있다. 제2 미디어 코퍼스의 검색 이벤트들 각각은 검색어, 및 복수의 미디어 소스를 참조하는 검색 결과들을 포함할 수 있다.

블록(306)에서, 처리 디바이스는 검색 이벤트들의 세트로부터 제2 미디어 코퍼스에 연관된 미디어 소스들의 세트를 추출할 수 있다. 각각의 미디어 소스는 비디오 콘텐츠를 제공하는 미디어 채널일 수 있고, 미디어 소스들의 세트를 추출하는 것은 제2 미디어 코퍼스의 검색 이벤트들의 세트에 의해 참조되는 미디어 채널들의 세트를 식별하는 것을 수반할 수 있다. 일례에서, 제1 미디어 코퍼스는 제약된 비디오 코퍼스(예를 들어, 검열된 코퍼스)를 포함할 수 있고, 제2 미디어 코퍼스에서 이용가능한 콘텐츠의 일부가 없을 수 있다. 제약된 비디오 코퍼스는 특정 클래스의 개인들을 수용하는 콘텐츠 특성들을 가진 미디어 항목들의 컬렉션일 수 있다. 개인들의 클래스는 어린이 시청자들의 특정 연령 범위에 기초할 수 있다.

블록(308)에서, 처리 디바이스는 미디어 소스의 측정치에 기초하여 미디어 소스들의 세트로부터 미디어 소스를 선택할 수 있다. 측정치는 미디어 소스를 참조하는 검색 이벤트들에 기초할 수 있다. 세트로부터 미디어 소스를 선택하는 것은 미디어 소스를 참조하는 검색 이벤트들을 식별하는 것을 수반할 수 있다. 일례에서, 식별된 검색 이벤트들 각각은 참조된 미디어 소스들에 대한 순서를 포함할 수 있고, 처리 디바이스는 순서 내에서 특정 미디어 소스의 위치를 결정할 수 있다. 처리 디바이스는 검색 특성에 대응하는 세트의 검색 이벤트들의 위치 및 양에 기초하여 특정 미디어 소스에 대한 측정치를 계산할 수 있다. 다음으로, 처리 디바이스는 최대 측정치를 갖는 미디어 소스를 선택할 수 있다. 일례에서, 처리 디바이스는 검색 이벤트들의 세트에서의 미디어 소스의 평균 순위(r) 및 미디어 소스의 위반 값(pv)에 기초하여, 이하의 수학식: 측정치=1/(r*(pv+1))을 고려하여 미디어 소스의 측정치를 계산할 수 있다.

블록(310)에서, 처리 디바이스는 콘텐츠를 제2 미디어 코퍼스에 연관된 미디어 소스로부터 제1 미디어 코퍼스에 통합할 수 있다. 콘텐츠를 제1 미디어 코퍼스에 통합하는 것은 제1 미디어 코퍼스에 연관된 미디어 항목들의 컬렉션의 미디어 식별 데이터를 업데이트하는 것을 수반할 수 있다. 일례에서, 미디어 항목들의 콘텐츠는 업데이트 동안 이동되거나 복사되지 않을 수 있고, 미디어 항목의 식별 정보만이 업데이트에 수반될 수 있다. 다른 예에서, 미디어 항목의 콘텐츠는 제1 미디어 코퍼스에 의해 액세스가능한 새로운 저장 위치로 복사(예를 들어, 중복, 복제)될 수 있다. 블록(310)을 참조하여 위에서 설명된 동작들을 완료하는 것에 응답하여, 방법은 종료될 수 있다.

도 4는 본 개시내용의 하나 이상의 양태에 따라 동작하는 컴퓨터 시스템의 블록도를 도시한다. 다양한 실례들에서, 컴퓨터 시스템(400)은 도 1 및 도 2의 컴퓨팅 디바이스(120)에 대응할 수 있다. 컴퓨터 시스템은 가상화를 지원하는 데이터 센터 내에 포함될 수 있다. 특정 구현들에서, 컴퓨터 시스템(400)은 (예를 들어, 근거리 통신망(LAN), 인트라넷, 엑스트라넷, 또는 인터넷과 같은 네트워크를 통해) 다른 컴퓨터 시스템들에 접속될 수 있다. 컴퓨터 시스템(400)은 클라이언트-서버 환경에서 서버 또는 클라이언트 컴퓨터의 용량으로, 또는 피어-투-피어 또는 분산 네트워크 환경에서 피어 컴퓨터로서 동작할 수 있다. 컴퓨터 시스템(400)은 해당 디바이스에 의해 취해질 액션들을 지정하는 명령어들의 세트(순차적 또는 기타)을 실행할 수 있는 개인용 컴퓨터(PC), 태블릿 PC, 셋톱 박스(STB), PDA(Personal Digital Assistant), 셀룰러 폰, 웹 기기, 서버, 네트워크 라우터, 스위치 또는 브리지, 또는 임의의 디바이스에 의해 제공될 수 있다. 또한, "컴퓨터"라는 용어는 본 명세서에 설명된 방법들 중 임의의 하나 이상을 수행하기 위해 명령어 세트(또는 복수의 명령어 세트)를 개별적으로 또는 공동으로 실행하는 컴퓨터들의 임의의 컬렉션을 포함해야 한다.

추가 양태에서, 컴퓨터 시스템(400)은 버스(408)를 통해 서로 통신할 수 있는, 처리 디바이스(402), 휘발성 메모리(404)(예를 들어, 랜덤 액세스 메모리(RAM)), 비-휘발성 메모리(406)(예를 들어, 판독 전용 메모리(ROM) 또는 전기 소거가능한 프로그래밍가능한 ROM(EEPROM)) 및 데이터 저장 디바이스(416)를 포함할 수 있다.

처리 디바이스(402)는 (예를 들어, CISC(complex instruction set computing) 마이크로프로세서, RISC(reduced instruction set computing) 마이크로프로세서, VLIW(very long instruction word) 마이크로프로세서, 다른 유형의 명령어 세트들을 구현하는 마이크로프로세서, 또는 명령어 세트들의 유형들의 조합을 구현하는 마이크로프로세서와 같은) 범용 프로세서, 또는 (예를 들어, ASIC(application specific integrated circuit), FPGA(field programmable gate array), DSP(digital signal processor), 또는 네트워크 프로세서와 같은) 특수화된 프로세서와 같은 하나 이상의 프로세서에 의해 제공될 수 있다.

컴퓨터 시스템(400)은 네트워크 인터페이스 디바이스(422)를 더 포함할 수 있다. 컴퓨터 시스템(400)은 또한 비디오 디스플레이 유닛(410)(예를 들어, LCD), 영숫자 입력 디바이스(412)(예를 들어, 키보드), 커서 제어 디바이스(414)(예를 들어, 마우스) 및 신호 생성 디바이스(420)를 포함할 수 있다.

데이터 저장 디바이스(416)는 방법(300)을 구현하기 위한 명령어들 및 도 1 및 도 2의 미디어 소스 분석 컴포넌트(124)를 위한 명령어들을 포함하여, 본 명세서에 설명된 방법들 또는 기능들 중 임의의 하나 이상을 인코딩하는 명령어들(426)을 저장할 수 있는 비-일시적 컴퓨터 판독가능한 저장 매체(424)를 포함할 수 있다.

명령어들(426)은 또한 컴퓨터 시스템(400)에 의한 실행 동안 휘발성 메모리(404) 내에 및/또는 처리 디바이스(402) 내에 완전히 또는 부분적으로 상주할 수 있으므로, 휘발성 메모리(404) 및 처리 디바이스(402)는 또한 머신 판독가능한 저장 매체를 구성할 수 있다.

컴퓨터 판독가능한 저장 매체(424)는 실례들에서 단일 매체인 것으로 도시되어 있지만, "컴퓨터 판독가능한 저장 매체"라는 용어는 하나 이상의 실행가능한 명령어 세트를 저장하는 단일 매체 또는 복수의 매체(예를 들어, 중앙 집중식 또는 분산형 데이터베이스, 및/또는 연관된 캐시들 및 서버들)을 포함할 것이다. "컴퓨터 판독가능한 저장 매체"라는 용어는 또한 컴퓨터에 의해 실행되어 컴퓨터로 하여금 본 명세서에 설명된 방법들 중 임의의 하나 이상을 수행하게 하는 명령어 세트를 저장 또는 인코딩할 수 있는 임의의 유형의 매체를 포함할 것이다. "컴퓨터 판독가능한 저장 매체"라는 용어는 고체 상태 메모리들, 광학 매체들, 및 자기 매체들을 포함하지만 이에 제한되지는 않는다.

본 명세서에 설명된 방법들, 컴포넌트들, 및 특징들은 개별 하드웨어 컴포넌트들에 의해 구현될 수 있거나, ASICS, FPGA, DSP 또는 유사한 디바이스들과 같은 다른 하드웨어 컴포넌트들의 기능에 통합될 수 있다. 추가로, 방법들, 컴포넌트들 및 특징들은 하드웨어 리소스들 내의 펌웨어 모듈들 또는 기능 회로에 의해 구현될 수 있다. 또한, 방법들, 컴포넌트들, 및 특징들은 하드웨어 리소스들 및 컴퓨터 프로그램 컴포넌트들의 임의의 조합으로, 또는 컴퓨터 프로그램으로 구현될 수 있다.

달리 구체적으로 언급되지 않는 한, "개시", "전송", "수신", "분석" 등과 같은 용어들은 컴퓨터 시스템 레지스터들 또는 메모리들 내의 물리적(전자적) 수량으로 표현된 데이터를, 컴퓨터 시스템 메모리들 또는 레지스터들, 또는 다른 그러한 정보 저장, 전송 또는 디스플레이 디바이스들 내의 물리적 수량들로서 유사하게 표현되는 다른 데이터로 조작하고 변환하는, 컴퓨터 시스템들에 의해 수행되거나 구현되는 액션들 및 프로세스들을 지칭한다. 또한, 본 명세서에서 사용되는 용어 "제1", "제2", "제3", "제4" 등은 상이한 요소들을 구별하기 위한 라벨들로서 의도되며, 그 숫자 지정에 따른 서수적 의미는 갖지 않을 수 있다.

본 명세서에 설명된 예들은 또한 본 명세서에 설명된 방법들을 수행하기 위한 장치에 관한 것이다. 이 장치는 여기에 설명된 방법들을 수행하기 위해 특별히 구성될 수 있거나, 컴퓨터 시스템에 저장된 컴퓨터 프로그램에 의해 선택적으로 프로그래밍된 범용 컴퓨터 시스템을 포함할 수 있다. 그러한 컴퓨터 프로그램은 컴퓨터 판독가능한 유형의 저장 매체에 저장될 수 있다.

본 명세서에 설명된 방법들 및 실례들은 본질적으로 임의의 특정 컴퓨터 또는 다른 장치에 관련되지 않는다. 다양한 범용 시스템들이 본 명세서에 설명된 교시에 따라 사용될 수 있거나, 방법들(300) 및/또는 그것의 개별 기능들, 루틴들, 서브루틴들 또는 동작들 각각을 수행하기 위해 보다 전문화된 장치를 구성하는 것이 편리함을 입증할 수 있다. 이러한 다양한 시스템들에 대한 구조의 예들은 위의 설명에 제시된다.

상술한 설명은 설명하기 위한 것이지 한정하도록 의도된 것은 아니다. 본 개시내용은 구체적인 실례들 및 구현들을 참조하여 설명되었지만, 본 개시내용은 설명된 예들 및 구현들에 제한되지 않음이 인식될 것이다. 본 개시내용의 범위는, 첨부된 청구항들에 부여되는 등가물들의 전체 범위와 함께, 이하의 청구항들을 참조하여 결정되어야 한다.

Claims

방법으로서,
제1 미디어 코퍼스(first media corpus)의 검색 특성을 결정하는 단계;
제2 미디어 코퍼스의 검색 이벤트들의 세트를 식별하는 단계 - 상기 검색 이벤트들의 세트는 상기 검색 특성에 대응하고 미디어 소스를 참조하는 검색 이벤트를 포함함 -;
상기 미디어 소스의 측정치가 측정치 기준(measurement criterion)을 만족하는지 여부를 결정하는 단계 - 상기 측정치는 상기 미디어 소스를 참조하는 상기 검색 이벤트에 기초함 -; 및
상기 미디어 소스의 상기 측정치가 상기 측정치 기준을 만족한다는 결정에 응답하여, 상기 제2 미디어 코퍼스에 연관된 상기 미디어 소스로부터 상기 제1 미디어 코퍼스 내로 콘텐츠를 통합하는 단계
를 포함하는, 방법.
제1항에 있어서,
상기 제1 미디어 코퍼스의 상기 검색 이벤트들의 세트를 포함하는 로그를 분석하는 단계
를 더 포함하고,
상기 검색 이벤트들의 세트 중 적어도 하나는 검색어를 포함하고 상기 검색 특성에 링크되는, 방법.
제1항 또는 제2항에 있어서,
상기 검색 특성은 지식 그래프 식별자를 포함하는, 방법.
제1항 또는 제2항에 있어서,
상기 제1 미디어 코퍼스는 특정 연령 범위 내의 개인들의 클래스에 대한 콘텐츠 특성들을 포함하는 미디어 항목들의 컬렉션을 포함하는, 방법.
제1항 또는 제2항에 있어서,
상기 미디어 소스는 미디어 채널을 포함하고, 상기 콘텐츠는 비디오 콘텐츠를 포함하는, 방법.
제1항 또는 제2항에 있어서,
상기 제2 미디어 코퍼스의 상기 검색 이벤트들의 세트에 의해 참조되는 미디어 채널들의 세트를 식별하는 단계
를 더 포함하는 방법.
제1항 또는 제2항에 있어서,
상기 미디어 소스를 참조하는 상기 세트 내의 검색 이벤트들을 식별하는 단계 - 식별된 검색 이벤트들 각각은 미디어 소스들의 순서를 포함함 -;
상기 순서 내에서의 상기 미디어 소스의 위치를 결정하는 단계; 및
상기 검색 특성에 대응하는 상기 검색 이벤트들의 세트 내의 검색 이벤트들의 양 및 상기 미디어 소스의 위치에 기초하여 상기 미디어 소스의 상기 측정치를 계산하는 단계;
를 더 포함하는 방법.
제1항 또는 제2항에 있어서,
상기 검색 이벤트들의 세트 내에서의 상기 미디어 소스의 평균 순위 r, 및 상기 미디어 소스의 위반 값(violation value) pv에 기초하여, 이하의 수학식:
측정치=1/(r*(pv+1))
을 고려하여 상기 미디어 소스의 상기 측정치를 계산하는 단계
를 더 포함하는, 방법.
제1항 또는 제2항에 있어서, 상기 제1 미디어 코퍼스의 상기 검색 특성을 결정하는 단계는:
상기 제1 미디어 코퍼스의 검색 이벤트들을 복수의 그룹으로 분류하는 단계;
미리 결정된 임계값에 기초하여 상기 복수의 그룹 중의 하나 이상의 그룹을 선택하는 단계;
검색 이벤트들의 상기 하나 이상의 그룹에 연관된 복수의 검색 특성을 식별하는 단계;
상기 복수의 검색 특성을 고유한 검색 특성들의 세트에 통합하는 단계; 및
상기 검색 특성에 연관된 검색 이벤트들의 양에 기초하여 상기 고유한 검색 특성들의 세트로부터 상기 검색 특성을 선택하는 단계
를 포함하는, 방법.
제1항 또는 제2항에 있어서,
상기 미디어 소스의 상기 측정치가 상기 측정치 기준을 만족한다고 결정하는 것은 상기 미디어 소스의 상기 측정치가 상기 제2 미디어 코퍼스의 다른 미디어 소스들의 다른 측정치들보다 크다고 결정하는 것을 포함하는, 방법.
시스템으로서,
메모리; 및
상기 메모리에 통신가능하게 결합되고, 제1항 또는 제2항의 방법을 수행하도록 구성되는 처리 디바이스
를 포함하는 시스템.
컴퓨터 판독가능한 저장 매체로서,
처리 디바이스로 하여금 제1항 또는 제2항의 방법을 수행하게 하는 명령어들을 포함하는 컴퓨터 판독가능한 저장 매체.