KR20170134588A - 자연 언어 프로세싱을 이용한 토픽 인덱스의 생성 - Google Patents

자연 언어 프로세싱을 이용한 토픽 인덱스의 생성 Download PDF

Info

Publication number
KR20170134588A
KR20170134588A KR1020177031686A KR20177031686A KR20170134588A KR 20170134588 A KR20170134588 A KR 20170134588A KR 1020177031686 A KR1020177031686 A KR 1020177031686A KR 20177031686 A KR20177031686 A KR 20177031686A KR 20170134588 A KR20170134588 A KR 20170134588A
Authority
KR
South Korea
Prior art keywords
topic
content
topics
subset
identifying
Prior art date
Application number
KR1020177031686A
Other languages
English (en)
Other versions
KR102047923B1 (ko
Inventor
브라이언 데이비드 마르쉬
Original Assignee
구글 엘엘씨
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 구글 엘엘씨 filed Critical 구글 엘엘씨
Publication of KR20170134588A publication Critical patent/KR20170134588A/ko
Application granted granted Critical
Publication of KR102047923B1 publication Critical patent/KR102047923B1/ko

Links

Images

Classifications

    • G06F17/30026
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/1066Session management
    • H04L65/1069Session establishment or de-establishment
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/43Querying
    • G06F16/432Query formulation
    • G06F16/433Query formulation using audio data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/71Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/783Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/7844Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using original textual content or text extracted from visual content or transcript of audio data
    • G06F17/30796

Abstract

대화 이벤트에 대한 토픽 인덱스를 생성하고 토픽 인덱스에 기반하여 콘텐츠 아이템을 생성하기 위한 시스템들 및 방법들이 개시된다. 방법은 대화 이벤트에 대응하는 제 1 콘텐츠 아이템으로부터 복수의 토픽(topic)들을 프로세싱 디바이스가 추출하는 단계, 및 대화 이벤트에 대한 토픽 인덱스를 생성하는 단계를 포함한다. 토픽 인덱스는 제 1 콘텐츠 아이템으로부터의 콘텐츠 세그먼트와 복수의 토픽들 각각을 연관시킨다. 방법은 복수의 토픽들내의 하나 또는 그 초과의 토픽들의 서브세트를 식별하는 단계 및 토픽들의 서브세트의 하나 또는 그 초과의 토픽들 각각의 개개의 콘텐츠 세그먼트를 포함하는 제 2 콘텐츠 아이템을 생성하는 단계를 더 포함한다.

Description

자연 언어 프로세싱을 이용한 토픽 인덱스의 생성
[0001] 본 개시내용은 컨퍼런싱 분야에 관한 것으로, 특히 대화 이벤트에 대한 토픽 인덱스를 생성하는 것에 관한 것이다.
[0002] 대화 이벤트들, 이를 테면, 인터넷을 통한 미디어 컬레버레이션들(예컨대, 비디오 컨퍼런스들, 원격진료 등)은, 광대역 연결의 이점을 취하는 광대역 액세스 및 애플리케이션들이 급증함에 따라 점점 일반화되고 있다. 대화 이벤트들을 지원하기 위한 애플리케이션들은 브라우저-기반일 수 있거나, 또는 브라우저와는 독립적으로 실행될 수 있다.
[0003] 다음은, 이러한 양상들의 기본적인 이해를 제공하기 위해 본 개시내용의 다양한 양상들의 간략화된 요약을 제시한다. 이 요약은 본 개시내용의 광범위한 개요가 아니다. 이는, 본 개시내용의 핵심 또는 중요한 엘리먼트들을 식별하려고 의도되지 않으며, 본 개시내용의 특정 구현들의 임의의 범위 또는 청구항들의 임의의 범위를 기술하려고 의도되지도 않는다. 그 유일한 목적은, 이후에 제시되는 보다 상세한 설명에 대한 서두로서 간략화된 형태로 본 개시내용의 일부 개념들을 제시하는 것이다.
[0004] 본 개시의 일 양상에서, 방법은 프로세싱 디바이스에 의해, 대화 이벤트에 대응하는 제 1 콘텐츠 아이템으로부터 복수의 토픽들을 추출하는 단계, 및 대화 이벤트에 대한 토픽 인덱스를 생성하는 단계를 포함한다. 토픽 인덱스는 복수의 토픽들 각각을 제 1 콘텐츠 아이템으로부터의 콘텐츠 세그먼트와 연관시킨다. 방법은, 복수의 토픽들 내의 하나 또는 그 초과의 토픽들의 서브세트를 식별하는 단계, 및 토픽들의 서브세트의 하나 또는 그 초과의 각각의 토픽들의 각각의 콘텐츠 세그먼트를 포함하는 제 2 콘텐츠 아이템을 생성하는 단계를 더 포함한다.
[0005] 상기 설명된 방법의 동작들을 수행하기 위한 컴퓨팅 디바이스들 및 본원에 설명된 다양한 구현들이 개시된다. 상기 설명된 방법과 연관되는 동작들을 수행하기 위한 명령들을 저장하는 컴퓨터-판독가능 매체 및 본원에 설명된 다양한 구현들이 또한 개시된다.
[0006] 본 개시내용은, 첨부된 도면들의 도시들에서, 제한이 아닌 예로서 예시된다.
[0007] 도 1은 본 개시내용의 구현에 따른 예시적인 시스템 아키텍처를 예시한다.
[0008] 도 2는 본 개시내용의 구현에 따른 컨퍼런스 플랫폼 및 콘텐츠 인덱싱 컴포넌트를 예시하는 블록도이다.
[0009] 도 3a는 본 개시내용의 구현에 따른 토픽 인덱스를 포함하는 콘텐츠 아이템 레코드를 예시하는 블록도이다.
[0010] 도 3b는 본 개시내용의 구현에 따른 마스터 토픽 인덱스를 예시하는 블록도이다.
[0011] 도 4는 본 개시내용의 구현에 따른 미디어 컬레버레이션 서비스/애플리케이션의 예시적인 그래픽 사용자 인터페이스 윈도우를 예시하는 블록도이다.
[0012] 도 5는 본 개시내용의 구현에 따른 대화 이벤트에 대한 토픽 인덱스를 생성하기 위한 방법을 예시하는 흐름도이다.
[0013] 도 6은 본 개시내용의 구현에 따른 미디어 컬레버레이션 인터페이스를 예시하는 블록도이다.
[0014] 도 7a는 본 개시내용의 구현에 따른 제 1 미디어 아이템으로부터 제 2 미디어 아이템을 생성하기 위해 토픽 인덱스를 사용하는 것을 예시하는 블록도이다.
[0015] 도 7b는 본 개시내용의 구현에 따른 다수의 미디어 아이템들로부터 미디어 아이템을 생성하기 위해 토픽 인덱스를 사용하는 것을 예시하는 블록도이다.
[0016] 도 8은 본 개시내용의 구현에 따른 랭킹 토픽들을 위한 방법을 예시하는 흐름도이다.
[0017] 도 9는 본 개시내용의 구현에 따른 예시적인 컴퓨터 시스템을 예시하는 블록도이다.
[0018] 본 개시내용의 양상들 및 구현들은 자연 언어 프로세싱 기술들에 기반하여 대화 이벤트들에 대한 토픽 인덱스들을 생성하는 것에 관한 것이다. 개시된 시스템들 및 방법들은 라이브 콘텐츠, 사전-레코딩된 콘텐츠, 및 미디어 컬레버레이션들에 적용될 수 있다. 라이브 콘텐츠는 실시간으로 (예컨대, 의도하지 않은 지연이 있거나 또는 이러한 지연 없이, 또는 콘텐츠의 생성으로부터 지정된 시간 제한(예컨대 50 마이크로초 미만) 이내에) 브로드캐스팅되거나 또는 스트리밍되는 콘텐츠를 지칭한다. 사전-레코딩된 콘텐츠는 그 콘텐츠의 생성 시간으로부터 의도된 지연을 가지고 브로드캐스팅되거나 또는 스트리밍되는 콘텐츠를 지칭한다(예컨대, 콘텐츠 생성과 콘텐츠 브로드캐스팅 또는 스트리밍 사이에 지정된 시간 제약은 없음). 미디어 컬레버레이션들(예컨대, 오디오 및/또는 비디오 컨퍼런스들, 오디오 및/또는 비디오 채트들, 오디오 및/또는 비디오 컨퍼런스 룸들, 오디오 및/또는 비디오 채트 룸들 등)은 참가자들/사용자들 간의 통신들을 지칭하며, 미디어 컬레버레이션에서 콘텐츠/미디어 스트림들(예컨대, 라이브 오디오 및/또는 비디오 콘텐츠, 레코딩된 오디오 및/또는 비디오 콘텐츠 등)이 하나 또는 그 초과의 참가자들/사용자들의 디바이스들에 의해 송신되며, 복합 콘텐츠/미디어 스트림에 결합될 수 있다.
[0019] 본원에서 사용된 바와 같이, "대화 이벤트"라는 용어는, 대화의 발화된 그리고/또는 작성된 언어가 둘 또는 그 초과의 사용자들의 각각의 클라이언트 디바이스들을 사용하여 둘 또는 그 초과의 사용자들 간에 교환되는, 둘 또는 그 초과의 사용자들 간의 유지되는 대화를 지칭한다. 대화 이벤트들은 라이브 또는 사전-기록된 콘텐츠를 포함할 수 있으며, 미디어 컬레버레이션들, 이를테면, 비디오 및/또는 오디오 회의, 텍스트-기반 채트들, 슬라이드쇼 프레젠테이션들, 온라인 강의들/세미나들, 단문 메시지 서비스 통신들, 오디오 통신들 등의 형태일 수 있다.
[0020] 본원에서 사용되는 바와 같이, "콘텐츠 아이템"이라는 용어는 오디오 클립들, 무비 클립들, TV 클립들 및 뮤직 비디오들은 물론, 비디오 블로깅, 짧은 오리지날 비디오들, 화상들, 사진들, 다른 멀티미디어 콘텐츠 등과 같은 콘텐츠를 포함한다. 콘텐츠 아이템들은, 제품들의 프리젠테이션들(예컨대, 온라인 판매자로부터의 제품 목록들), 기사들(예컨대, 리뷰들, 뉴스 기사들, 제품 설명들 등), 채트 다이얼로그, 슬라이드쇼 프리젠테이션 또는 디스플레이 및/또는 오디오 디바이스를 사용하여 제시될 수 있는 임의의 다른 타입의 문맥 데이터를 포함하는 다양한 타입들의 콘텐츠를 또한 지칭할 수 있다.
[0021] 본원에서는 NLP(natural language processing) 기술들을 사용하여 대화 이벤트들로부터 토픽들의 추출을 허용하는 기술들이 다양한 구현들에서 설명된다. NLP는 대화 이벤트(예컨대, 라이브 비디오/오디오 스트림들, 사전-기록된 비디오/오디오 스트림들, 텍스트-기반 대화들 등)와 연관된 콘텐츠로부터 토픽 추출을 수행하는데 사용된다. 예를 들어, 발화된 또는 타이핑된 언어는 다양한 지식 추출 기술들을 사용하여 개념 토픽들로 파싱될 수 있다. 토픽들은 토픽 인덱스를 생성하는데 사용할 수 있으며, 이는 결국 대화 이벤트와 연관된 콘텐츠의 관심 부분들을 찾는데 사용될 수 있다. 또한, 토픽들은, 대화 이벤트들의 수집을 위한 "마스터" 토픽 인덱스를 구축하는데 사용될 수 있어서, 키워드 검색들은 관심의 토픽들과 관련된 그러한 비디오들 및/또는 비디오들의 부분들을 리턴할 수 있다. 또한, 토픽 인덱스들은 콘텐츠에 대한 추천들을 생성하고, 대화 이벤트의 하이라이트 릴들을 생성하고, 다수의 대화 이벤트들의 몽타주들 등을 생성하는데 사용될 수 있다.
[0022] 본원에서 설명된 일부 구현들은 다양한 클라이언트 디바이스들 상에서 동작되는 사용자 인터페이스들로 통합될 수 있다. 사용자 인터페이스는 한 부분에 비디오 콘텐츠를 디스플레이하고 인덱싱된 토픽들의 리스트를 또한 디스플레이할 수 있다. 라이브 비디오 스트림에 대해, NLP가 비디오 스트림에서 토픽들을 추출할 때 리스트가 실시간으로 업데이트될 수 있다. 일부 구현들에서, 대화 이벤트의 사용자/참가자는 리스트의 토픽들을 클릭할 수 있으며, 이는 토픽이 논의된 시기에 대응하는 시간부터 비디오 스트림이 시작되게 할 수 있다.
[0023] 따라서, 구현들은 대화 이벤트가 발생함에 따라 실시간으로 대화 이벤트를 인덱싱하고, 편집자로부터의 입력 없이 자동으로 대화 이벤트의 부분들을 인덱싱 및 식별하고, 인덱싱을 용이하게 하기 위해 대화이벤트들의 참가자들로부터의 직접 또는 간접 피드백을 활용하는 것을 포함(그러나 이것으로 제한되지 않음)하는 몇개의 장점들을 제공한다.
[0024] 도 1은 본 개시내용의 구현에 따른 예시적인 시스템 아키텍처(100)를 예시한다. 시스템 아키텍처(100)는 클라이언트 디바이스들(110A-110Z), 네트워크(105), 데이터 스토어(106), 컨퍼런스 서버(120), NLP(natural language processing) 서버(130), 및 자연 언어 데이터베이스(140)를 포함한다. 시스템 아키텍처(100)의 다양한 디바이스들 각각은 네트워크(105)를 통해 서로 연결될 수 있다. 일 구현에서, 네트워크(105)는 공중 네트워크(예컨대, 인터넷), 사설 네트워크(예컨대, LAN(local area network) 또는 WAN(wide area network)), 유선 네트워크(예컨대, 이더넷 네트워크), 무선 네트워크(예컨대, 802.11 네트워크 또는 Wi-Fi 네트워크), 셀룰러 네트워크(예컨대, LTE(Long Term Evolution) 네트워크), 라우터, 허브들, 스위치들, 서버 컴퓨터들 및/또는 이들의 조합을 포함할 수 있다.
[0025] 일 구현에서, 데이터 스토어(106)는 메모리(예컨대, 랜덤 액세스 메모리), 캐시, 드라이브(예컨대, 하드 드라이브), 플래시 드라이브, 데이터베이스 시스템, 또는 데이터를 저장할 수 있는 다른 타입의 컴포넌트 또는 디바이스일 수 있다. 데이터 스토어(106)는 또한, 또한 다수의 컴퓨팅 디바이스들(예컨대, 다수의 서버 컴퓨터들)에 걸쳐 있을 수 있는 다수의 저장 컴포넌트들(예컨대, 다수의 드라이브들 또는 다수의 데이터베이스들)을 포함할 수 있다. 일부 구현들에서, 데이터 스토어(106)는 클라우드-기반일 수 있다. 시스템 아키텍처(100)의 디바이스들 중 하나 또는 그 초과는 공중 및 사설 데이터를 저장하기 위한 데이터 스토어(106)를 활용할 수 있고, 데이터 스토어(106)는 사설 데이터에 대한 보안 스토리지를 제공하도록 구성될 수 있다. 데이터 스토어(106)는 클라이언트 디바이스들(110A-110Z) 중 어느 것, 컨퍼런스 서버(120)와 NLP 서버(130)의 부분이거나, 이들 간에 분산될 수 있다.
[0026] 일 구현에서, 클라이언트 디바이스들(110A-110Z)은 하나 또는 그 초과의 컴퓨팅 디바이스들, 이를테면, PC(personal computer)들, 랩톱들, 모바일 폰들, 스마트 폰들, 태블릿 컴퓨터들, 넷북 컴퓨터들 등을 포함할 수 있다. 클라이언트 디바이스들(110A-110Z)은 또한 "사용자 디바이스들" 또는 "모바일 디바이스들"로 지칭될 수 있다. 개별적인 사용자는 하나 또는 그 초과의 클라이언트 디바이스들(110A-110Z)(예컨대, 클라이언트 디바이스들(110A-110Z) 중 하나 또는 그 초과)과 연관(예컨대, 소유 및/또는 사용)될 수 있다. 클라이언트 디바이스들(110A-110Z) 각각은 상이한 지리적 위치들에서 상이한 사용자들에 의해 소유 및 활용될 수 있다. 미디어 컬레버레이션들(예컨대, 비디오 컨퍼런스)에 참가하는 사용자들은 본원에서 "컨퍼런스 참가자들"로 지칭될 수 있다.
[0027] 클라이언트 디바이스들(110A-110Z) 각각은 사용자 인터페이스들(111A-111Z)을 각각 구현할 수 있다. 사용자 인터페이스들(111A-111Z) 각각은 개개의 클라이언트 디바이스(110A-110Z)의 사용자가 정보를 컨퍼런스 서버(120) 및 NLP 서버(130) 중 하나 또는 그 초과로 정보를 전송 및 수신하도록 허용할 수 있다. 예컨대, 사용자 인터페이스들(111A-111Z) 중 하나 또는 그 초과는 컨퍼런스 서버(120)에 의해 제공되는 콘텐츠(예컨대, 웹 페이지들, 이를테면, HTML(Hyper Text Markup Language) 페이지들)를 액세스, 리트리브, 제시 및/또는 내비게이팅할 수 있는 웹 브라우저 인터페이스일 수 있다. 일 구현에서, 사용자 인터페이스들(111A-111Z) 중 하나 또는 그 초과는, 개개의 클라이언트 디바이스(110A-110Z)의 사용자가 정보를 컨퍼런스 서버(120) 및/또는 NLP 서버(130)로 전송 및 수신하도록 허용하는 독립형 애플리케이션(예컨대, 모바일 앱, 컨퍼런싱 소프트웨어 등)일 수 있다. 일 구현에서, 사용자 인터페이스들(111A-111Z) 중 하나 또는 그 초과는, 컨퍼런스 참가자들이 비디오 컨퍼런싱, 오디오 컨퍼런싱, 채팅 및/또는 인스턴트 메시징 중 하나 또는 그 초과에 개입하도록 허용하는 컨퍼런스 인터페이스들일 수 있다. 예시적인 사용자 인터페이스(예컨대, 그래픽 사용자 인터페이스 윈도우)가 도 4에 대해 더 상세히 설명된다.
[0028] 각각의 클라이언트 디바이스(110A-110Z)는 미디어 뷰어(112A-112Z)를 각각 더 포함한다. 일 구현에서, 미디어 뷰어들(112A-112Z)은, 사용자들이 콘텐츠, 이를테면, 이미지들, 비디오들, 웹 페이지들, 문헌들 등을 보도록 허용하는 애플리케이션들일 수 있다. 예컨대, 미디어 뷰어(112A)는, 웹 서버에 의해 서빙되는 콘텐츠(예컨대, 웹 페이지들, 이를테면, HTML(Hyper Text Markup Language) 페이지들, 디지털 미디어 아이템들 등)를 액세스, 리트리브, 제시 및/또는 내비게이팅할 수 있는 웹 브라우저일 수 있다. 미디어 뷰어(112A)는 콘텐츠를 사용자에게 렌더링, 디스플레이 및/또는 제시할 수 있다. 미디어 뷰어(112A)는 또한 웹 페이지(예컨대, 온라인 상인에 의해 판매된 제품에 관한 정보를 제공할 수 있는 웹 페이지)에 임베딩된 임베딩된 미디어 플레이어를 디스플레이할 수 있다. 다른 예에서, 미디어 뷰어(112A)는, 사용자들이 디지털 미디어 아이템들(예컨대, 디지털 비디오들, 디지털 이미지들, 전자 북들 등)을 보도록 허용하는 독립형 애플리케이션(예컨대, 모바일 앱)일 수 있다. 일 구현에서, 미디어 뷰어들(112A-112Z)은 또한 비디오가 하나 또는 그 초과의 소스들로부터 수신되고 개개의 사용자 인터페이스들(111A-111Z) 내에서 디스플레이되도록 허용할 수 있다. 예컨대, 클라이언트 디바이스(110A)는, 하나 또는 그 초과의 부가적인 클라이언트 디바이스들에 의해 생성된 비디오 스트림들에 대응할 수 있는 비디오 데이터를 컨퍼런스 서버(120)로부터 수신할 수 있다. 미디어 뷰어(112A)는 (예컨대, 사용자 인터페이스(111A) 내의) 디스플레이를 위해 수신된 비디오 데이터에 기반한 비디오 스트림들 각각에 대응하는 비디오를 생성할 수 있다. 일부 구현들에서, 사용자 인터페이스들(111A-111Z)은 미디어 뷰어들(112A-112Z)과 각각 통합된다.
[0029] 일 구현에서, 컨퍼런스 서버(120)는 본원에 설명된 다양한 특징들을 구현하기에 적절할 수 있는 하나 또는 그 초과의 컴퓨팅 디바이스들(이를테면, 랙마운트 서버, 라우터 컴퓨터, 서버 컴퓨터, 개인 컴퓨터, 메인프레임 컴퓨터, 랩톱 컴퓨터, 태블릿 컴퓨터, 데스크톱 컴퓨터 등), 데이터 스토어들(예컨대, 하드 디스크들, 메모리들, 데이터베이스들), 네트워크들, 소프트웨어 컴포넌트들, 하드웨어 컴포넌트들, 또는 이들의 조합들일 수 있다. 일부 구현들에서, 컨퍼런스 서버(120)는, 예컨대, 스트리밍 비디오 또는 VoIP(voice over IP) 기법들을 사용하여 미디어 컬레버레이션 서비스들, 이를테면, (예컨대, 클라이언트 디바이스들(110A-110Z)의 사용자들 사이의) 오디오 및/또는 비디오 컨퍼런스들을 인에이블할 수 있고, 개인, 엔터테인먼트, 비지니스, 교육 또는 학술-지향 인터랙션들에 사용될 수 있다. 컨퍼런스 서버(120)는 비디오 컨퍼런싱 서비스들을 제공하도록 전용될 수 있거나, 예컨대, 뉴스 서비스들, 소셜 네트워킹 서비스들 및/또는 콘텐츠 호스팅 서비스들을 비롯한 다른 서비스들과 함께 비디오 컨퍼런싱 서비스들을 제공할 수 있다.
[0030] 일 구현에서, 컨퍼런스 서버(120)는 컨퍼런스 플랫폼(200)을 포함한다. 컨퍼런스 플랫폼(200)은, 도 2에 예시된 바와 같이, 호스팅 모듈(202), 인터페이스 모듈(204) 및 콘텐츠 아카이브(206)를 포함한다. 더 많거나 더 적은 컴포넌트들이 일반성의 손실 없이 컨퍼런스 플랫폼(200)에 포함될 수 있다. 예컨대, 모듈들 중 2 개 또는 그 초과는 단일 모듈로 결합될 수 있거나, 모듈들 중 하나는 2 개 또는 그 초과의 모듈들로 분리될 수 있다. 일 구현에서, 모듈들 중 하나 또는 그 초과는 상이한 컴퓨팅 디바이스들 (예컨대, 단일 클라이언트 디바이스 상의, 다수의 클라이언트 디바이스들 사이에 분산되는 등의 상이한 서버 컴퓨터들) 상에 상주할 수 있다.
[0031] 일 구현에서, 호스팅 모듈(202)은 미디어 컬레버레이션들, 이를테면 오디오/비디오 컨퍼런스들, 채트 룸들, 비디오 채트들 등을 개시 및 지원하기 위해 컨퍼런스 플랫폼(200)에 의해 활용될 수 있다. 예컨대, 호스팅 모듈(202)은 미디어 컬레버레이션 세션들을 생성하기 위해 사용자들로부터의 요청들을 수신할 수 있고, 사용자들로부터의 요청들의 수신시 사용자들이 기존의 미디어 컬레버레이션 세션들에 조인하도록 허용할 수 있고, 사용자들이 기존의 미디어 컬레버레이션 세션들에 조인하도록 허가하는 초대들을 사용자들에게 송신하는 것을 가능하게 할 수 있는 것 등을 할 수 있다.
[0032] 일 구현에서, 인터페이스 모듈(204)은, 다양한 참가자들의 클라이언트 디바이스들(110A-110Z) 중 하나 또는 그 초과로부터 다수의 오디오 및/또는 비디오 스트림들을 수신하기 위해 그리고 수신된 스트림들 각각과 연관된 데이터를 포함할 수 있는 복합 스트림을 생성하기 위해 컨퍼런스 플랫폼(200)에 의해 활용될 수 있다. 그런다음, 복합 스트림은 미디어 컬레버레이션 세션(예컨대, 비디오 컨퍼런스)의 다양한 참가자들의 하나 또는 그 초과의 클라이언트 디바이스들(110A-110Z)에 제공될 수 있다. 일부 구현들에서, 복합 스트림은, 개별적인 비디오 스트림들을 추출하기 위해 그리고 개개의 사용자 인터페이스들(111A-111Z)에 의한 프리젠테이션을 위한 비디오 스트림들을 정렬하기 위해 클라이언트 디바이스들(110A-110Z)에 의해 사용될 수 있는 포맷팅 데이터를 포함할 수 있다. 이에 따라, 도 6에 예시된 것처럼, 비디오 컨퍼런스의 각각의 사용자/참가자는 단일 인터페이스/스크린 내에서 콘텐츠 스트림들 중 일부 또는 전부를 동시에 뷰잉할 수 있다.
[0033] 일부 구현들에서, 컨퍼런스 플랫폼(200)에 의해 호스팅되는 미디어 컬레버레이션의 하나 또는 그 초과의 참가자들은 오디오 콘텐츠(예컨대, 참가자의 발화된 음성, 뮤직 등)을 제공/프로젝팅할 수 있으며, 이 오디오 콘텐츠는, 클라이언트 디바이스(예컨대, 클라이언트 디바이스들(110A-110Z) 중 하나)에 의해 수신/프로젝팅될 때, 미디어 컬레버레이션에 통합될 수 있는 오디오 스트림으로서 클라이언트 디바이스에 의해 송신되거나 이와 다른 식으로 제공될 수 있다. 일부 구현들에서, 이러한 오디오 스트림들은 비디오 스트림과 독립적으로 제공될 수 있고(예컨대, 참가자는 미디어 컬레버레이션 동안 오디오-전용 입력을 제공함), 반면 다른 구현들에서, 이러한 오디오 스트림들은 비디오 스트림과 함께 제공(예컨대, 말하고 있는 참가자의 동기화된 비디오 및 오디오를 포함하는 조합된 스트림)될 수 있다.
[0034] 일 구현에서, 미디어 컬레버레이션 데이터를 저장(예컨대, 비디오 및/또는 오디오 스트림 데이터, 채트 데이터 등을 저장)하기 위해 콘텐츠 보관소(206)가 컨퍼런스 플랫폼(200)에 의해 활용될 수 있으며, 이 미디어 컬레버레이션 데이터는 나중에 하나 또는 그 초과의 참가자들에 의해 그들 개개의 클라이언트 디바이스들을 통해 액세스될 수 있다. 일부 구현들에서, 콘텐츠 보관소는 데이터 스토어(106)와 결합될 수 있다. 콘텐츠 보관소는, 공개 대화 이벤트들이 나중에 탐색가능하고 리트리브가능하도록, 공개 대화 이벤트들(예컨대, 공개 비디오 채트들, 공개 오디오 채트들, 공개 텍스트-기반 채트들, 공개 프리젠테이션들 등)과 연관된 콘텐츠를 저장할 수 있다.
[0035] 일 구현에서, 도 1에 예시된 NLP 서버(130)는 콘텐츠 인덱싱 컴포넌트(250)를 포함한다. 도 2에 예시된 것과 같은 콘텐츠 인덱싱 컴포넌트(250)는, 콘텐츠 추출 모듈(252), 토픽 식별 모듈(254), 연관 모듈(256), 및 콘텐츠 생성 모듈(258)을 포함한다. 더 많은 또는 더 적은 수의 컴포넌트들이 보편성을 잃지 않으면서 콘텐츠 인덱싱 컴포넌트(250)에 포함될 수 있다. 예컨대, 2개 또는 그 초과의 모듈들이 단일 모듈로 조합될 수 있거나, 또는 모듈들 중 하나는 2개 또는 그 초과의 모듈들로 분할될 수 있다. 일 구현에서, 모듈들 중 하나 또는 그 초과는 상이한 컴퓨팅 디바이스들(예컨대, 다수의 클라이언트 디바이스들 사이에 분포된 단일 클라이언트 디바이스 상에 상이한 서버 컴퓨터들 등) 상에 상주할 수 있다.
[0036] 일 구현에서, 콘텐츠 추출 모듈(252) 및 토픽 식별 모듈(254)은 대화 이벤트 내 대화의 토픽들을 식별하기 위해 콘텐츠 인덱싱 컴포넌트(250)에 의해 활용될 수 있다. 콘텐츠 추출 모듈(252)은, 예컨대, 토픽 식별자들이 토픽 식별 모듈(254)에 의해 추출되는 텍스트로 오디오를 트랜스크라이브(transcribe)하는데 활용될 수 있다. 다양한 알고리즘들/기법들이, 음성 인식(speech recognition) 및 프로세싱, 음성 세그멘테이션, 토픽 세그멘테이션, 및 작업 세그멘테이션 및 모호성 제거(disambiguation)를 포함하는(그러나, 이에 제한되지 않음) 문맥 정보를 구어(spoken language) 및 문어(written language)로부터 식별하고 추출하기 위해 활용될 수 있다. 일부 구현들에서, 콘텐츠 인덱싱 컴포넌트(250)는, 토픽 추출/식별을 용이하게 하기 위한 단어들 및 문구들의 데이터베이스를 포함할 수 있는, 도 1에 예시된 자연어 데이터베이스(140)에 액세스할 수 있다.
[0037] 일 구현에서, 연관 모듈(256)은 콘텐츠 아이템들의 부분들/세그먼트들을 식별된 토픽들과 연관시키기 위해 콘텐츠 인덱싱 컴포넌트(250)에 의해 활용될 수 있다. 연관은, (예컨대, 데이터 스토어(106)에 저장되는) 하나 또는 그 초과의 콘텐츠 아이템 레코드들(280A-280Z)을 생성함으로써 행해질 수 있다. 콘텐츠 레코드들(280A-280Z) 각각은 개개의 콘텐츠 식별자(282A-282Z) 및 개개의 토픽 인덱스(284A-284Z)를 포함한다.
[0038] 도 3a 및 도 3b는 콘텐츠 아이템들을 토픽 인덱스들과 연관시키기 위한 상이한 데이터 구조들을 예시한다. 일 구현에서, 콘텐츠 아이템 레코드(300)는 단일 콘텐츠 아이템(예컨대, 콘텐츠 아이템 레코드들(280A-280Z) 중 하나 또는 그 초과)에 대응할 수 있다. 콘텐츠 식별자(310)는 콘텐츠 아이템을 로케이팅하거나 또는 인덱싱하는데 사용될 수 있는 정규 식별자(canonical identifier)일 수 있다(예컨대, 콘텐츠 아이템이 영화인 경우, 콘텐츠 식별자(310)는 영화의 제목이다). 일부 구현들에서, 콘텐츠 식별자(310)는 콘텐츠의 고유 식별자(예컨대, 일련 번호)이다. 콘텐츠 아이템 레코드(300)는 또한, 하나 또는 그 초과의 토픽 식별자들(325A-325Z)을 포함하는 토픽 인덱스(320)를 포함한다. 토픽 식별자들(325A-325Z) 각각은, 콘텐츠 아이템의 콘텐츠 세그먼트(330A-330Z)와 더 연관될 수 있다. 예컨대, 콘텐츠 아이템이 비디오 클립인 경우, 콘텐츠 세그먼트(330A)는 비디오 클립 내에서 발생하는 클립의 부분(예컨대, 콘텐츠 아이템의 2-분 마크에서 시작하는 1분-길이 클립)에 대응할 수 있다. 콘텐츠 세그먼트들(330A-330Z)의 크기/길이 및 콘텐츠 아이템 내에서의 위치들에 관한 정보는 토픽 인덱스(320) 내에 포함될 수 있고, 이에 따라 콘텐츠 아이템 그 자체 및 콘텐츠 아이템 내의 세그먼트들이 토픽에 의해 검색가능하게 만든다.
[0039] 일부 구현들에서, 콘텐츠 식별자 리스트들(365A-365Z)과 각각 연관되는 다수의 토픽 식별자들(360A-360Z)을 마스터 토픽 인덱스가 포함한다는 점을 제외하고, 마스터 토픽 인덱스(350)는 콘텐츠 아이템 레코드(300)와 유사할 수 있다. 콘텐츠 식별자 리스트들(365A-365Z)은, 리스트들 내의 각각의 콘텐츠 식별자에 대해, 콘텐츠에 관련된 정보, 이를테면 토픽-관련 세그먼트들 및 그들의 개개의 콘텐츠 아이템들 내에서의 그들의 위치들을 포함할 수 있다. 일부 구현들에서, 토픽 식별자들(360A-360Z)은 또한, 토픽들의 관련성을 결정하기 위해 사용될 수 있는 연관된 스코어들/랭킹들을 포함할 수 있다. 토픽들의 스코어링은 도 8에 대해 더욱 상세히 설명된다.
[0040] 일 구현에서, 도 2에서 예시된 콘텐츠 생성 모듈(258)은, 하나 또는 그 초과의 다른 콘텐츠 아이템들과 연관된 콘텐츠 인덱스들에 기반하여 하나 또는 그 초과의 다른 콘텐츠 아이템들로부터 콘텐츠 아이템들을 생성하기 위해 콘텐츠 인덱싱 컴포넌트(250)에 의해 활용될 수 있다. 생성된 콘텐츠 아이템은 대화 이벤트 동안에 또는 그 후에 결정되는 바와 같은, 이벤트의 중요한 순간들의 사후 요약 또는 정수일 수 있거나, 또는 생성된 콘텐츠 아이템은 이벤트 동안 실시간으로 결정되는 바와 같은, 이벤트의 중요한 순간들의 요약의 실시간 뷰일 수 있다. 사후에 그리고 실시간으로 생성되는 콘텐츠 아이템들은, 그들이 동일한 이벤트에 관련될 때에도 실질적으로 상이할 수 있다. 콘텐츠 생성 모듈(258)의 기능성은 도 5 및 도 7에 대해 더욱 상세히 설명된다.
[0041] 일반적으로, 컨퍼런스 서버(120) 또는 NLP 서버(130) 중 임의의 서버에 의해 수행되는, 일 구현에서 설명된 기능들은 또한, 적절하다면, 다른 구현들에서 클라이언트 디바이스들(110A-110Z) 중 하나 또는 그 초과에 의해 수행될 수 있다. 예컨대, 클라이언트 디바이스(110A)는 콘텐츠 인덱싱 컴포넌트(250)의 기능들을 수행하는 소프트웨어 애플리케이션을 구현할 수 있다. 게다가, 특정 컴포넌트에 기인하는 기능성은 함께 동작하는 다수의 또는 상이한 컴포넌트들에 의해 수행될 수 있다. 일부 구현들에서, NLP 서버(130)는 적절한 애플리케이션 프로그래밍 인터페이스들을 통해 다른 시스템들 또는 디바이스들에 제공되는 서비스로서 액세스될 수 있다.
[0042] 컨퍼런스 플랫폼(200) 및 콘텐츠 인덱싱 컴포넌트(250)는 각각 컨퍼런스 서버(120) 및 NLP 서버(130)에 의해 구현되는 것으로서 설명되었지만, 클라이언트 디바이스들(110A-110Z), 컨퍼런스 서버(120), 또는 NLP 서버(130) 중 임의의 것에 의해 구현될 수 있다. 예로서, 클라이언트 디바이스(예컨대, 클라이언트 디바이스(110A))는, 컨퍼런스 플랫폼(200) 및/또는 콘텐츠 인덱싱 컴포넌트(250)의 기능들 중 일부 또는 전부를 수행하도록 프로그래밍될 수 있다. 다른 예로서, 컨퍼런스 플랫폼(200) 및 콘텐츠 인덱싱 컴포넌트(250)는 컨퍼런스 서버로 함께 결합될 수 있다. 당업자에 의해 인지될 바와 같이, 컨퍼런스 플랫폼(200) 및/또는 콘텐츠 인덱싱 컴포넌트(250)가 클라이언트 디바이스 상에 구현되는 구현들에서, "수신", "송신", "리트리브", "식별", "결정" 등을 하는 컨퍼런스 플랫폼(200) 및/또는 콘텐츠 인덱싱 컴포넌트(250)에 대해 설명된 임의의 기능들은, 네트워크(예컨대, 네트워크(105))에 걸쳐 수행되는 기능들을 지칭하는 것이 아니라, 클라이언트 디바이스 내의 서브-시스템들 또는 서브-모듈들에 의해 수행되는 기능들을 지칭하는 것으로 이해된다.
[0043] 도 4는 본 개시내용의 구현에 따른, 미디어 컬레버레이션 서비스/애플리케이션의 예시적인 GUI(graphical user interface) 윈도우(400)를 예시하는 다이어그램이다. 일 구현에서, GUI 윈도우(400)는 메인 영역(402), 섬네일 영역들(404A-404C), 헤더 영역(406), 채트 영역(408), 및 옵션 영역(410)을 포함한다. 일부 구현들에서, 전부보다는 미만의 섬네일 영역들(404A-404C)이 GUI 윈도우(400)에 존재할 수 있거나, 또는 부가적인 섬네일 영역들이 존재할 수 있다. GUI 윈도우(400)는 클라이언트 디바이스의 미디어 뷰어와 결합하여 사용자 인터페이스로서 디스플레이를 위해 생성될 수 있다(예컨대, 클라이언트 디바이스(110A)의 미디어 뷰어(112A)와 사용자 인터페이스(111A)).
[0044] 일부 구현들에서, 각각의 영역은 미디어 컬레버레이션에의 특정 참가자에 의해 제공된 미디어 콘텐츠(예컨대, 비디오 콘텐츠)를 포함하거나, 도시하거나, 또는 그렇지 않으면 제시할 수 있다. 예컨대, 메인 영역(402)은 미디어 플레이어일 수 있으며, 제1 참가자에 의해 송신된 비디오 스트림(예컨대, 비디오컨퍼런스에의 제1 또는 1차 참가자들의 "룸", 제1 참가자에 의해 공유되는 비디오 클립들 등)을 제시할 수 있는 반면, 섬네일 영역들(404A-404C) 각각은 하나 또는 그 초과의 추가 참가자들에 의해 송신된 비디오 스트림들의 축소 버전, 추가 참가자들과 연관된 정적 이미지들(예컨대, 아바타 등), 추가 참가자들과 연관된 비디오 스트림들의 축소 버전들, 또는 이들의 조합들을 포함할 수 있다. GUI 윈도우(400)의 영역들이 직사각형으로서 도시되지만, 그 영역들 중 하나 또는 그 초과의 영역들은 일부 다른 형상(예컨대, 원, 사다리꼴 등)을 가질 수 있다는 점이 주목되어야 한다. 더욱이, GUI 윈도우(400)의 형상, 사이즈, 및/또는 레이아웃은 GUI 윈도우(400)가 제시될 디바이스에 의존할 수 있다. 예컨대, 도 4에 예시된 바와 같이, GUI 윈도우(400)는 모바일 디바이스에 적절한 방식으로 포맷팅된다.
[0045] 일 구현에서, 메인 영역(402) 및 섬네일 영역들(404A-404C) 각각은 비디오 컬레버레이션에의 하나 또는 그 초과의 참가자들(예컨대, 비디오 컨퍼런스 참가자들)의 개개의 클라이언트 디바이스들에 의해 생성된 비디오 스트림들과 연관될 수 있다. 더욱이, 소정의 구현들에서, 특정 영역은 (예컨대, 섬네일 영역으로부터 주요 영역으로) 변화하거나, 또는 (예컨대, 인터페이스 모듈(204)을 사용하여) 영역과 연관된 참가자가 말을 하고 있는지 아닌지에 따라 상이한 영역들에 디스플레이된 비디오 스트림들을 스와핑할 수 있다. 그러한 변화는 (예컨대, 임의의 사용자 요청을 수신하거나 또는 사용자 상호작용을 검출하지 않고) 자동적으로 수행될 수 있다. 일부 구현들에서, 컨퍼런스 플랫폼(200)은 비디오 스트림을 수신하고, (예컨대, 인터페이스 모듈(204)을 사용하여) 어떤 비디오 스트림이 현재 말하는 사람 또는 일반적으로 주의 집중에 대응하는지(예컨대, 비디오 스트림이 미디어 컬레버레이션, 말하는 사람의 볼륨 레벨, 특정 참가자의 호스트 선택 등을 호스팅하고 있는 참가자에 대응함)를 식별할 수 있다. 일부 구현들에서, GUI 윈도우(400)를 구현하는 클라이언트 디바이스는 컨퍼런스 플랫폼(200)의 인터페이스 모듈(204)에 의해 생성되었던 (예컨대, 클라이언트 디바이스들(110A-110Z) 중 하나 또는 그 초과의 클라이언트 디바이스들에 의해 생성된 비디오/오디오 스트림 데이터를 포함하는) 복합 콘텐츠 스트림을 수신할 수 있다. 클라이언트 디바이스는 복합 콘텐츠 스트림으로부터 콘텐츠(예컨대, 하나 또는 그 초과의 비디오/오디오 스트림들)을 추출하도록 구성될 수 있다. 일 구현에서, 복합 콘텐츠 스트림은 GUI 윈도우(400)의 영역들에 대응하는 기하학적 속성들을 특정하는 메타데이터를 포함하여서, 비디오 스트림들은 복합 콘텐츠 스트림으로부터 추출되고, GUI 윈도우(400) 내에 적합한 영역들에 맵핑될 수 있다.
[0046] 일 구현에서, 섬네일 영역들(404A-404C) 중 하나는 (예컨대, 참가자가 섬네일 영역 상에서 선택/클릭하는 것 또는 그렇지 않으면 섬네일 영역을 활성화하는 것에 대한 응답으로) 메인 영역(402)으로 변환 또는 전환할 수 있고, 그 반대가 될 수도 있다. 일부 구현들에서, 특정 참가자가 비디오 컨퍼런스 중에 말을 하고 있을 때, 참가자의 비디오 스트림이 메인 영역(402) 내에 디스플레이될 수 있다. 예컨대, 제1 참가자에 대응하는 비디오 스트림이 메인 영역(402)에 디스플레이되고, 제1 참가자가 말하고 있지 않은 경우, 제2 참가자의 비디오 스트림은 섬네일 영역들(404A-404C) 중 하나로부터 메인 영역(402)으로 승격시키는 반면, 제1 참가자의 비디오 스트림은 섬네일 영역들(404A-404C) 중 하나로 "강등된다."
[0047] 일 구현에서, 복합 콘텐츠 스트림은 실시간 채트 데이터를 포함할 수 있다. 예컨대, 채트 데이터는 채트 영역(308) 내에 디스플레이될 수 있다. 채트 영역(308)은 기회 입력 채트 메시지들을 사용자/참가자에게 제공하고, 채트 메시지들을 (예컨대, 채트 메시지들을 다른 참가자들의 클라이언트 디바이스로 라우팅하는 컨퍼런스 서버(120)에) 송신할 수 있다. 일 구현에서, 이용가능한 또는 관련된 채트들의 리스트는 사용자에게 제시될 수 있다. 일 구현에서, 채트 논의와 연관된 토픽들의 리스트가 사용자에게 제시될 수 있다. 토픽들 중 하나에 대한 사용자 선택을 수신하는 것에 대한 응답으로, 사용자에게 토픽과 관련된 유사한 채트들의 리스트가 제시될 수 있거나, 또는 현재 채트 논의가, 선택된 토픽이 논의되었던 부분으로 스크롤할 수 있다.
[0048] 일 구현에서, 옵션 지역(410)은 사용자에게 선택가능한 옵션들을 제공할 수 있다. 예컨대, 선택가능한 옵션들은 사용자가 미디어 컬레버레이션(예컨대, 디스플레이 특징들, 볼륨 등)의 세팅들을 조정하고, 미디어 컬레버레이션에 참가하도록 부가적인 사용자들을 초대하고, 콘텐츠 추천들을 수신하고, 콘텐츠 추천들을 제공하고, 미디어 컬레버레이션 및/또는 미디어 컬레버레이션 동안 제시된 콘텐츠에 대해 레이팅 또는 투표하고, 미디어 컬레버레이션의 토픽(예컨대, 현재 논의되는 토픽)과 관련된 콘텐츠를 요청하는 것 등을 허용할 수 있다. 토픽 인덱스들의 생성 및 활용과 관련된 옵션들은 도 5에 대해 더 상세히 설명된다.
[0049] 도 5는 본 개시내용의 구현에 따른 대화 이벤트에 대한 토픽 인덱스를 생성하기 위한 방법(500)을 예시하는 흐름도이고, 도 8은 본 개시내용의 구현에 따른 토픽들을 랭크하기 위한 방법(800)을 예시하는 흐름도이다. 방법들(500 및 800)은 하드웨어(예컨대, 회로, 전용 로직, 프로그램가능 로직, 마이크로코드 등), 소프트웨어(예컨대, 하드웨어 시뮬레이션을 수행하기 위해 프로세싱 디바이스 상에서 실행되는 명령들), 또는 이들의 조합을 포함하는 프로세싱 로직에 의해 수행될 수 있다. 일부 구현들에서, 방법들(500 및 800)은 도 1 및 도 2에 대해 설명된 바와 같은 콘텐츠 인덱싱 컴포넌트(250)에 의해 수행될 수 있다. 방법들(500 및 800)을 설명할 때, 다양한 구현들을 예시하기 위해 도 6, 도 7a 및 도 7b에 대해 참조된다. 도 6, 도 7a 및 도 7b에 제공된 예들은 예시적인 목적들로 의도되고, 제한적인 구현들로 고려되어서는 안됨이 주목된다.
[0050] 방법들(500 및/또는 800)의 동작들은 미디어 컬레버레이션, 및 특히 시스템 아키텍처(예컨대, 시스템 아키텍처(100))의 다양한 구현들에 따른 대화 이벤트(예컨대, 비디오 컨퍼런스, 오디오 컨퍼런스, 라이브 비디오 브로드캐스트, 텍스트-기반 채트, 이들의 조합들 등)에 대해 수행될 수 있다. 일 구현에서, 콘텐츠 스트림들, 이를테면, 클라이언트 디바이스들(예컨대, 클라이언트 디바이스들(110A-110Z))에 의해 생성/캡처된 비디오 스트림들은 컨퍼런스 서버(예컨대, 컨퍼런스 서버(120)의 컨퍼런스 플랫폼(200))에 송신될 수 있고, 이어서, 토픽 추출을 위해 NLP 서버(예컨대, NLP 서버(130)의 콘텐츠 인덱싱 컴포넌트(250))에 송신될 수 있다. 다른 구현에서, 콘텐츠 스트림들은 컨퍼런스 서버에 의해 수신되기 이전에 토픽 추출을 위해 NLP 서버에 송신되고, 이어서 클라이언트 디바이스들에 (예컨대, 합성 콘텐츠 스트림으로서) 송신된다. 다른 구현에서, 콘텐츠 스트림은 제1 클라이언트 디바이스(예컨대, 클라이언트 디바이스(110A))에 의해 생성/캡처되고, 토픽 추출을 수행하는 컨퍼런스 서버(120)에 송신된다. 다른 구현에서, 콘텐츠 스트림은 제1 클라이언트 디바이스(예컨대, 클라이언트 디바이스(110A))에 의해 생성/캡처되고, 하나 또는 그 초과의 부가적인 디바이스들에 송신된다(여기서, 제1 클라이언트 디바이스 및/또는 부가적인 클라이언트 디바이스들 중 하나 또는 그 초과는 토픽 추출을 수행한다).
[0051] 도 5를 참조하면, 방법(500)은, 제1 대화 이벤트에 대응하는 제1 콘텐츠 아이템으로부터 복수의 토픽들이 추출되는 경우 블록(510)에서 시작한다. 일부 구현들에서, 블록(510)은 콘텐츠 추출 모듈(252) 및 토픽 식별 모듈(254)에 의해 수행된다. 일 구현에서, 제1 대화 이벤트는 라이브 비디오 레코딩, 사전-기록된 비디오, 비디오 컨퍼런스, 비디오 채트, 오디오 컨퍼런스, 오디오 채트, 텍스트-기반 채트 또는 이들의 조합들에 대응할 수 있다. 일부 구현들에서, 대화 이벤트가 오디오 성분을 포함하면, 발화된 언어는 (예컨대, 콘텐츠 추출 모듈(252)을 사용하여) 텍스트로 변환되고, 하나 또는 그 초과의 토픽들의 리스트는 토픽 식별 모듈(254)을 사용하여 텍스트로부터 추출될 수 있다. 다른 구현들에서, 대화 이벤트가 완전히 텍스트-기반(이를테면 채트 메시지들의 시퀀스)이면, 토픽 식별은 변환없이 바로 수행될 수 있다. 일부 구현들에서, 토픽 추출은 대화 이벤트 동안 실시간으로 발생한다.
[0052] 일 구현에서, 대화 이벤트는, 사용자들의 각각의 클라이언트 디바이스에 구현된 미디어 컬레버레이션 인터페이스들(예컨대, 사용자 인터페이스들(111A-111Z))을 통해 다수의 사용자들이 액세스할 수 있는 미디어 컬레버레이션일 수 있다. 예컨대, 미디어 컬레버레이션 인터페이스는 도 6에 도시된 GUI 윈도우(600)와 유사할 수 있다. GUI 윈도우(600)는, 대화 이벤트의 참가자와 연관된 비디오 스트림, 라이브 비디오 스트림, 사전-기록된 콘텐츠(예컨대, 온-디맨드 콘텐츠), 정적 이미지들(예컨대, 슬라이드 쇼의 형태), 오디오가 수반되는 프리젠테이션, 이들의 조합들 등을 디스플레이할 수 있는 메인 영역(602)을 포함할 수 있다. 섬네일들(604A-604C)은 미디어 컬레버레이션의 다양한 참가자들(예컨대, 섬네일(604A)과 연관된 제1 참가자, 섬네일(604B)과 연관된 제2 참가자 등)의 비디오 스트림들을 표현할 수 있다. 일 구현에서, 메인 영역(602)의 비디오 스트림의 섬네일 버전이 섬네일(예컨대, 섬네일(604C))로서 디스플레이된다.
[0053] 일부 구현들에서, 메인 영역(602)은 라이브 비디오 스트림을 제시하는 미디어 플레이어이며, 라이브 비디오 스트림은 대화 이벤트, 라이브 브로드캐스트 등의 참가자와 연관된 비디오 스트림일 수 있다. 다른 구현들에서, 메인 영역(602)에 제시된 콘텐츠는 사전-기록된 비디오, 사전-기록된 오디오 클립, 프리젠테이션 등에 대응할 수 있다. 이러한 구현들에서, 메인 영역(602)은 플레이백 영역(610)을 포함할 수 있고, 플레이백 영역은 메인 영역(602) 상에 오버레이로서 또는 메인 영역(602)에 인접하게 디스플레이될 수 있다. (예시된 대로) 플레이백 영역(610)은 플레이백 표시자(612) 및 풀-스크린 모드와 윈도우드 모드 사이에서 메인 영역(602)을 전환시키는 풀-스크린 토글(614)을 포함한다. 승인 표시자(606) 및 비승인 표시자(608)가 GUI 윈도우(600)의 사용자에게 또한 제시되어(예컨대, 메인 영역(602) 상의 오버레이로서, 메인 영역(602)에 인접하게 등) 사용자가 대화 이벤트를 레이팅하게 허용한다. 다른 구현들에서, (예컨대, 대화 이벤트가 비디오 스트림을 포함하지 않으면) 메인 영역(602)은 완전히 생략된다.
[0054] 일부 구현들에서, GUI 윈도우(600)는 채트 윈도우(616)를 포함할 수 있다. 대화 이벤트의 다양한 참가자들은 그들 각각의 클라이언트 디바이스들에서 (예컨대, 메시지 필드(618)를 이용하여) 메시지들을 입력할 수 있으며, 이들은 컨퍼런스 서버(예컨대, 컨퍼런스 서버(120))에 송신되어 대화 이벤트의 참가자들 중 일부 또는 전부가 이들을 이용할 수 있게 될 수 있다. 일부 구현들에서, 채트 윈도우(616)는 메인 영역(602)에 제시된 콘텐츠와 함께 디스플레이된다.
[0055] 도 5를 다시 참조하면, 블록(520)에서, (예컨대, 연관 모듈(256)을 사용하여) 제 1 대화 이벤트에 대한 제 1 토픽 인덱스가 생성된다. 제 1 토픽 인덱스는 제 1 콘텐츠 아이템으로부터의 콘텐츠 세그먼트와 복수의 토픽들 각각을 연관시킨다. 예컨대, 제 1 대화 이벤트에 대한 제 1 콘텐츠 아이템 레코드(예컨대, 콘텐츠 레코드들(280A-280Z) 중 하나 또는 콘텐츠 아이템 레코드(300))가 생성되며, 여기서 제 1 콘텐츠 아이템 레코드는 제 1 콘텐츠 식별자(예컨대, 콘텐츠 식별자들(282A-282Z) 중 하나 또는 콘텐츠 식별자(310)) 및 제 1 토픽 인덱스(예컨대, 토픽 인덱스들(284A-284Z) 중 하나 또는 토픽 인덱스(320))를 포함한다. 제 1 토픽 인덱스는 하나 또는 그 초과의 사용자들에게 콘텐츠를 제시하기 전에 생성되었을 수 있거나, 콘텐츠를 제시하는 동안 실시간으로 생성될 수 있거나 또는 콘텐츠를 제시한 이후에 생성될 수 있다. 일 구현에서, 생성된 토픽 인덱스는 (예컨대, 데이터 스토어(106)에 저장된) 토픽 인덱스들의 데이터베이스에 추가되며, 여기서 데이터베이스의 토픽 인덱스들 중 하나 또는 그 초과는 대화 이벤트(예컨대, 대화 이벤트와 연관된 콘텐츠)에 대응한다. 데이터베이스의 각각의 대화 이벤트는 대화 이벤트의 적어도 하나의 개개의 토픽에 의해 검색가능할 수 있다. 일부 구현들에서, 토픽들 및 콘텐츠 세그먼트들은 다른 데이터, 이를테면 토픽을 논의한 말하는 사람/글쓰는 사람의 아이덴티티(예컨대, 사용자이름), 토픽이 논의된 날짜/시간(예컨대, 토픽의 논의가 시작된 시간, 토픽이 논의된 관련 시간/지속기간 등), 토픽과 관련된 감정 데이터(예컨대, 대화 이벤트에서 참가자들에 의한 찬성/불찬성), 감정을 표현한 참가자들의 아이덴티티(예컨대, 사용자이름) 또는 다른 관련 데이터와 연관될 수 있다. 예컨대, 검색은 사용자 A가 부정적인 감정을 표현한 토픽 T와 관련된 콘텐츠 세그먼트들을 식별하기 위하여 수행될 수 있다.
[0056] 일 구현에서, 콘텐츠가 미리-레코딩된 콘텐츠이면, 사용자의 클라이언트 디바이스는 콘텐츠를 수신하고 GUI 윈도우(600)를 사용하여 콘텐츠를 제시할 수 있다. 클라이언트 디바이스는 또한 콘텐츠와 연관된 콘텐츠 레코드를 수신할 수 있고(예컨대, 콘텐츠 식별자는 콘텐츠를 식별하기 위하여 사용된 정규(canonical) 식별자일 수 있음), 그리고 GUI 윈도우(600)는 토픽 리스트(620)의 토픽 인덱스로부터 토픽들의 리스트를 디스플레이하기 위하여 생성할 수 있다.
[0057] 일 구현에서, 콘텐츠가 라이브 콘텐츠(예컨대, 라이브 비디오 스트림, 라디오 오디오 스트림, 실시간 채트 등)이면, 콘텐츠 레코드는 콘텐츠를 위해 생성될 수 있고 토픽 인덱스는, 콘텐츠가 스트리밍될 때 실시간으로 업데이트될 수 있다. 예컨대, (예컨대, 콘텐츠 추출 모듈(252) 및 토픽 식별 모듈(254)을 사용하여) 새로운 토픽들이 대화 이벤트의 콘텐츠 아이템으로부터 추출되기 때문에 새로운 토픽들은 토픽 리스트(620)에 부가될 수 있다. 예컨대, 콘텐츠 아이템이 라이브 비디오 스트림(예컨대, 메인 영역(602)에서 제시됨)이면, 토픽들은 (예컨대, 구어를 프로세싱함으로써) 라이브 비디오 스트림으로부터 추출되고 그리고 토픽 인덱스에 부가될 수 있고, 토픽 인덱스는 토픽 리스트(620)에 부가될 수 있다. 다른 예로서, 콘텐츠 아이템이 채트(예컨대, 채트 윈도우(616)에서 제시됨)이면, 토픽들은 채트 메시지들로부터 추출되고 토픽 인덱스에 부가될 수 있고, 토픽 인덱스는 토픽 리스트(620)에 부가될 수 있다.
[0058] 다시 도 5를 참조하면, 블록(530)에서, 복수의 토픽들로부터의 하나 또는 그 초과의 토픽들을 포함하여 토픽들의 서브세트가 식별되고, 일부 구현들에서 지정된 토픽들은 관심 있는 것으로 지정된 토픽들에 대응한다. 일부 구현들에서, 서브세트는 단일 토픽을 포함할 수 있다. 예컨대, 단일 토픽은 사용자 피드백에 기반하여 가장 관심있는 토픽인 것으로 지정되었을 수 있다. 일부 구현들에서, 서브세트는 다수의 토픽들을 포함할 수 있다. 예컨대, 토픽들은 사용자 피드백에 기반하여 가장 관심있는 토픽들 중 하나인 것으로 지정되었을 수 있다. 사용자 피드백에 기반하여 토픽들의 서브세트를 식별하는 것은 도 8에 대해 더 상세히 설명된다. 일부 구현들에서, 콘텐츠 요청은 클라이언트 디바이스로부터 수신될 수 있고, 콘텐츠 요청은 토픽 표시자 및 스피커(예컨대, 토픽과 연관된 스피커일 수 있음)의 식별자를 포함한다. 토픽들의 서브세트는 토픽 표시자 및 스피커의 식별자에 기반하여 식별될 수 있다.
[0059] 블록(540)에서, 제 2 콘텐츠 아이템이 생성된다. 제 2 콘텐츠 아이템은 서브세트의 토픽들 각각의 개개의 콘텐츠 세그먼트들(제 1 콘텐츠 아이템의 콘텐츠 세그먼트들)을 포함한다. 예로서, 도 7a는 토픽 인덱스(예컨대, 도 5에 대해 설명된 제 1 토픽 인덱스)에 따라 인덱스된 것으로 제 1 콘텐츠 아이템(700)을 예시한다. 제 1 콘텐츠 아이템(700)은, 콘텐츠 세그먼트들(710A-710Z) 각각의 N개의 토픽들 중 하나 또는 그 초과에 대응하도록, N개의 토픽들(토픽 1 내지 토픽 N)에 기반하여 인덱스되었을 수 있다. 일부 구현들에서, 콘텐츠 세그먼트들(710A-710Z) 중 하나보다 많은 콘텐츠 세그먼트들은 동일한 토픽(예컨대, 콘텐츠 세그먼트(710B) 및 콘텐츠 세그먼트(710F)는 둘 모두 토픽 "공룡들"에 대응할 수 있음)에 대응할 수 있다. 일부 구현들에서, 동일한 토픽은 특정 콘텐츠 아이템에서 다수 번 발생할 수 있다.
[0060] 일부 구현들에서, 콘텐츠 세그먼트들(710A-710Z) 각각은, 비디오 스트림(예컨대, 라이브 비디오 스트림 또는 사전-기록된 비디오 스트림), 오디오 스트림(예컨대, 라이브 오디오 스트림 또는 사전-기록된 오디오 스트림), 프리젠테이션(예컨대, 슬라이드쇼), 또는 텍스트-기반 채트의 콘텐츠 세그먼트들에 대응할 수 있다. 예컨대, 제 1 콘텐츠 아이템이 비디오 및/또는 오디오 스트림이면, 각각의 콘텐츠 세그먼트(710A-710Z)는 시작 시간 및 종료 시간을 가질 수 있다(예컨대, 콘텐츠 세그먼트(710A)는 T0의 시작 시간 및 T1의 종료 시간을 가짐). 콘텐츠 세그먼트들(710A-710Z) 각각의 시작 및 종료 시간들은, 제 1 콘텐츠 아이템 내의 관련된 시간들이 토픽에 의해 로케이팅될 수 있도록 토픽 인덱스와 함께 저장될 수 있다. 다른 예로서, 제 1 콘텐츠 아이템이 슬라이드쇼이면, 콘텐츠 세그먼트들(710A-710Z)은 슬라이드쇼의 하나 또는 그 초과의 슬라이드들에 각각 대응할 수 있다. 다른 예로서, 제 1 콘텐츠 아이템이 텍스트-기반 채트이면, 콘텐츠 세그먼트들(710A-710Z)은 텍스트-기반 채트의 하나 또는 그 초과의 메시지들(예컨대, 채트 윈도우(616)에 디스플레이된 하나 또는 그 초과의 메시지들)에 각각 대응할 수 있다. 일부 구현들에서, 콘텐츠 세그먼트들(710A-710Z) 각각은, 콘텐츠 세그먼트들(710A-710Z)이 제 1 콘텐츠 아이템을 총괄하여 정의하도록(예컨대, 각각의 세그먼트는 전체 비디오를 함께 형성하는 비디오의 비디오 클립임) 제 1 콘텐츠 아이템(700) 내의 연속적이고 인접한 시퀀스들에 대응할 수 있다. 일부 구현들에서, 콘텐츠 세그먼트들(710A-710Z)은, 콘텐츠 세그먼트들(710A-710Z)이 그 전체로 제 1 콘텐츠 아이템(700)을 총괄하여 정의하지 않도록(예컨대, 제 1 콘텐츠 아이템의 "토픽-없는" 세그먼트들은 인덱싱되지 않음) 토픽들이 연관되었던 세그먼트들에 대응할 수 있다.
[0061] 토픽들의 서브세트는, 토픽 식별자들에 대응하는 콘텐츠 세그먼트들을 식별하기 위해 사용되는 토픽 식별자들을 포함한다. 예컨대, 토픽 서브세트(715)가 토픽들 1, 4, 및 6을 포함하면, 콘텐츠 생성 모듈(258)은, 토픽들 1, 4, 및 6에 대응하는 콘텐츠 세그먼트들, 즉, 각각 콘텐츠 세그먼트들(710A, 710D, 및 710F)을 포함하는 제 2 콘텐츠 아이템(720)을 생성할 수 있다. 생성된 콘텐츠 아이템은 (예컨대, 데이터 스토어(106)에) 저장되고 그리고/또는 콘텐츠 아이템을 생성되게 하도록 요청했던 클라이언트 디바이스(예컨대, 클라이언트 디바이스들(110A-110Z) 중 하나)에 송신될 수 있다(예컨대, 클라이언트 디바이스는 제 1 콘텐츠 아이템(700)의 하이라이트 릴에 대한 요청을 제출할 수 있음). 일 구현에서, 콘텐츠 세그먼트들(710A, 710D, 및 710F)은, 콘텐츠 세그먼트들의 관련성(예컨대, 사용자-생성된 스코어들/레이팅들), 콘텐츠 세그먼트들의 시간 지속기간, 인간 에디터 등 중 하나 또는 그 초과에 기반하여 제 2 콘텐츠 아이템(720)에서 연대순으로 배열될 수 있다.
[0062] 일 구현에서, 마스터 토픽 인덱스(예컨대, 마스터 토픽 인덱스(350))는, 다수의 콘텐츠 아이템들로부터 토픽-관련 부분들/클립들의 몽타주를 생성하도록 도 7b에 예시된 바와 같이 다수의 콘텐츠 아이템들로부터 콘텐츠 아이템을 생성하기 위해 사용될 수 있다. 제 1 콘텐츠 아이템(750)은 콘텐츠 세그먼트들(755A-755C)을 포함할 수 있으며, 그 각각은 토픽들 1, 2, 및 3에 각각 대응한다. 유사하게, 제 2 콘텐츠 아이템(760) 및 제 3 콘텐츠 아이템(770) 각각은 콘텐츠 세그먼트들(765A-765C) 및 콘텐츠 세그먼트들(775A-775B)을 각각 포함할 수 있다. 토픽 서브세트(780)는 단일 토픽(토픽 2)을 포함하지만, 1개 초과의 토픽이 서브세트에 포함될 수 있다. 콘텐츠 세그먼트들(755B, 765C, 및 775B)을 포함하는 제 4 콘텐츠 아이템(790)이 생성될 수 있다. 일 구현에서, 콘텐츠 세그먼트들(755B, 765C, 및 775B)은, 콘텐츠 세그먼트들의 관련성(예컨대, 사용자-생성된 스코어들/레이팅들), 콘텐츠 세그먼트들의 시간 지속기간, 인간 에디터 등 중 하나 또는 그 초과에 기반하여 제 4 콘텐츠 아이템(790)에서 연대순으로 배열될 수 있다.
[0063] 일 구현에서, 적어도 하나의 토픽 표시자를 포함하는 콘텐츠 요청이 (예컨대, 토픽 리스트(620)로부터의 사용자 선택에 기반하여 클라이언트 디바이스에서) 수신될 수 있다. 적어도 하나의 토픽 표시자는 토픽 인덱스 내의 토픽들의 서브세트를 식별하기 위해 사용될 수 있다. 일부 구현들에서, 블록(540)에 대해 위에서 설명된 바와 같이, 콘텐츠 요청은 콘텐츠 아이템의 생성을 유도할 수 있고, 그리고 생성된 콘텐츠는 (예컨대, GUI 윈도우(600) 내에서의 표현을 위해) 사용자의 클라이언트 디바이스에 송신될 수 있다. 다른 구현들에서, 새로운 콘텐츠 아이템의 생성을 반드시 초래하지 않고도, GUI 윈도우(600)에서 사용자에게 제시되는 콘텐츠를 콘텐츠 요청이 변경할 수 있다. 사용자는 GUI 윈도우(600)의 토픽 리스트(620)로부터 하나 또는 그 초과의 토픽 표시자들(예컨대, 토픽 표시자(622))을 선택할 수 있고, 그 하나 또는 그 초과의 토픽 표시자들은 콘텐츠 요청으로서 자동적으로 역할을 할 수 있다. 일부 구현들에서, 요청은 현재 제시되는 콘텐츠로 하여금 선택된 토픽에 관련된 부분으로 이동하거나 또는 그로부터 플레이백하게 할 수 있다. 예컨대, 만약 토픽 표시자(622)가 선택된다면, 메인 영역(602) 또는 채트 윈도우(616) 중 하나 또는 그 초과가 토픽에 관련된 콘텐츠의 부분을 제시할 수 있다. 예컨대, 메인 영역(602)의 비디오 스트림은 토픽이 "공룡들"에 대응하는 초기 부분부터 플레이백을 시작할 수 있다. 다른 예로서, 도 6에 예시된 바와 같이, 채트 윈도우(616)는 토픽이 "공룡들"에 대응하는 초기 부분으로 스크롤 업할 수 있다.
[0064] 일부 구현들에서, GUI 윈도우(600)는 옵션(624)을 포함할 수 있다. 사용자는 (예컨대, 하나 또는 그 초과의 선택된 토픽들, 또는 대화 이벤트의 가장 관련된 토픽들에 기반하여) 유사한 콘텐츠를 찾기 위해 옵션(624)을 선택할 수 있고, 클라이언트 디바이스는 콘텐츠에 대한 검색 요청을 (예컨대, 컨퍼런스 서버에 또는 다른 소스에) 제출할 수 있다. 예컨대, GUI 윈도우(600)는 유사한 콘텐츠(예컨대, 현재 또는 선택된 토픽에 관련된 다른 비디오들)의 리스트를 디스플레이하고 그리고/또는 상이한 콘텐츠를 (예컨대, 메인 영역(602)에서) 사용자에게 자동적으로 제시할 수 있다.
[0065] 일부 구현들에서, GUI 윈도우(600)는 옵션(626)을 포함할 수 있다. 사용자는 현재 채트와 유사한 다른 채트들을 찾기 위해 옵션(626)을 선택할 수 있다. 예컨대, 사용자가 옵션(626)을 선택하는 것에 대한 응답으로, GUI 윈도우(600)는 다른 이용가능한 채트들의 리스트를 디스플레이하고 및/또는 현재 채트 토픽, 선택된 채트 토픽 등에 기초하여 다른 채트로 사용자를 자동적으로 이동시킬 수 있다. 예컨대, 만약 (실시간으로 업데이팅되고 있는 토픽 인덱스에 기반하여) 현재 토픽이 "공룡들"이라면, "공룡들"에 관련된 상이한 채트에 조인하기 위한 옵션이 사용자에게 제시될 수 있다.
[0066] 일부 구현들에서, GUI 윈도우(600)는 옵션(628)을 포함할 수 있다. 사용자는 토픽들을 검색하기 위해 옵션(628)을 선택할 수 있다. 예컨대, GU 윈도우(600)는 입력 필드를 사용자에게 제시할 수 있는데, 그 입력 필드에 사용자는 검색할 토픽을 기입할 수 있다. 일 구현에서, 토픽은 NLP 서버에 송신되고, 그 NLP 서버는 마스터 토픽 인덱스(예컨대, 마스터 토픽 인덱스(350))로부터 콘텐츠 아이템들을 식별하고, (비디오, 오디오, 또는 텍스트-기반 콘텐츠 아이템들 중 하나 또는 그 초과를 포함할 수 있는) 콘텐츠 아이템들의 리스트를 리턴한다. 이어서, 콘텐츠 아이템들의 리스트는 GUI 윈도우(600)에 의한 디스플레이를 위해 제시될 수 있다.
[0067] 일부 구현들에서, GUI 윈도우(600)는 옵션(630)을 포함할 수 있다. 사용자는 하이라이트 릴을 보기 위해 옵션(630)을 선택할 수 있다. 예컨대, (예컨대, 메인 영역(602) 내의, 채트 윈도우(616) 내의, 기타 등등 내의) 현재 디스플레이되는 콘텐츠는 콘텐츠 중 관심 부분들은 보여주지만 덜 관심 부분들은 생략하는 그 콘텐츠에 대한 하이라이트 릴로 대체될 수 있다. 도 7a에 대해 설명된 바와 유사한 방식으로 콘텐츠에 대한 하이라이트 릴이 생성될 수 있다. 콘텐츠 중 관심 부분들이 도 8에 대해 설명된 구현들과 같은 다양한 구현들에 따라 결정될 수 있다.
[0068] 일부 구현들에서, GUI 윈도우(600)는 콘텐츠를 추천하기 위한 추천 영역(632)을 포함할 수 있다. 예컨대, 콘텐츠 추천은, 대화 이벤트와 연관된 토픽 인덱스로부터의 토픽들(예컨대, 대화 이벤트의 현재 토픽, 사용자에 의해 선택된 토픽 등)에 기반하여 생성될 수 있다.
[0069] 도 8을 참조하면, 방법(800)은 블록(810)에서 시작되며, 여기서, 라이브 비디오 브로드캐스트 동안 복수의 사용자들로부터 피드백이 수신된다. 방법(800)은 라이브 비디오 브로드캐스트들로 제한되지 않으며, 사전-기록된 콘텐츠 등에 대해 또한 적응될 수 있다는 것이 주목된다. 일 구현에서, 피드백은 라이브 비디오 브로드캐스트 동안 수신된다. 예컨대, 라이브 비디오 브로드캐스트를 수신하는 클라이언트 디바이스들의 사용자들은, 라이브 비디오 브로드캐스트 동안 승인 또는 불승인을 표시할 수 있다. 예컨대, GUI 윈도우(600)를 구현하는 클라이언트 디바이스의 사용자는, 라이브 비디오 피드의 브로드캐스트 동안, 하나 또는 그 초과의 횟수로 승인 표시자(606) 또는 불승인 표시자(608) 중 하나를 클릭할 수 있다. 다른 예로서, 승인 또는 불승인은, 대화 이벤트 동안 구두로 행해진 코멘트들(예컨대, 사용자가 자신의 승인/불승인을 발성함), 비-구두로 행해진 코멘트들(예컨대, 사용자가, 메인 영역(602)에서 제시되는 콘텐츠를 자신이 좋아한다는 것/싫어한다는 것을 메시지 필드(618)에 타이핑하는 것, 상이한 콘텐츠로 스위칭하는 것, 콘텐츠를 "선호하는 콘텐츠"로 지정하는 것 등) 등에 기반하여 결정될 수 있다. 승인 또는 불승인 데이터는 컨퍼런스 서버(예컨대, 컨퍼런스 서버(120)) 또는 NLP 서버(예컨대, NLP 서버(130))에 의해 수집될 수 있다.
[0070] 블록(820)에서, 라이브 비디오 브로드캐스트에 대해 토픽 인덱스가 생성되며, 여기서, 복수의 토픽들 각각은 라이브 비디오 브로드캐스트의 콘텐츠 세그먼트와 연관된다(예컨대, 제 1 토픽은 제 1 콘텐츠 세그먼트와 연관되고, 제 2 토픽은 제 2 콘텐츠 세그먼트와 연관되는 식임). 토픽 인덱스는, 도 5에 대해 설명된 것들(예컨대, 블록(520))과 같은, 본원에서 설명되는 구현들 중 임의의 구현에 따라 (예컨대, 연관 모듈(256)을 사용하여) 생성될 수 있다.
[0071] 블록(830)에서, 복수의 토픽들 각각은, 복수의 사용자들로부터의 수신된 피드백에 기반하여 스코어링된다. 일부 구현들에서, 스코어들은, 사용자가 자신의 승인 또는 불승인을 제공하는 타이밍에 기반하여 특정 토픽들에 맵핑될 수 있다. 예컨대, 도 7a의 제 1 콘텐츠 아이템(700)의 T1 및 T2에 의해 정의된 시간 지속기간 동안 승인 표시자(606)의 사용자 선택이 선택되면, 이것은 토픽 2에 대한 승인의 표시자의 역할을 할 수 있다. 일부 구현들에서, (예컨대, 다수의 클라이언트 디바이스들로부터 수집되는 승인 및 불승인 표시들에 대한) 토픽에 대해 승인 표시가 수신된 횟수와 토픽에 대해 불승인 표시가 수신된 횟수 간의 차이로서 토픽에 대한 스코어가 컴퓨팅될 수 있다. 다른 구현들에서, 토픽들을 스코어링하는 다른 방식들이 활용될 수 있다. 각각의 토픽에 대해, 토픽에 대해 생성된 스코어가 토픽 인덱스에 저장될 수 있다(예컨대, 개개의 토픽 식별자(325A-325Z)와 함께 또는 개개의 토픽 식별자(360A-360Z)와 함께 저장됨).
[0072] 블록(840)에서, 토픽들의 서브세트가 복수의 토픽들로부터 식별된다. 예컨대, 복수의 토픽들로부터의 토픽은, 토픽이 스코어링 조건을 만족시킨다는 것을 결정함으로써 식별된다. 스코어링 조건을 만족시키는 모든 그러한 토픽들은 서브세트에 포함될 수 있다. 일부 구현들에서, 스코어링 조건은, 토픽이 임계 스코어를 초과하는 것일 수 있다. 일부 구현들에서, 스코어링 조건은, 토픽이 임계 랭크 위에 랭킹되는 것(예컨대, 식별된 토픽들이 최상위 10개의 가장 높은 스코어링된 토픽들에 대응함)일 수 있다. 일부 구현들에서, 인간 에디터는, (예컨대, 클라이언트 디바이스들(110A-110Z) 중 하나를 사용하여) 다소간의 토픽들이 토픽들의 서브세트에 부가되어야 하는지 여부를 결정할 수 있다.
[0073] 블록(850)에서, 콘텐츠 아이템은 서브세트의 각각의 주제와 연관된 콘텐츠 세그먼트들로부터 생성된다. 콘텐츠 아이템은 본원에서 설명된 구현들, 예컨대, 도 5(예컨대, 블록(540)) 및 도 7a 및 7b에 대해 설명된 구현들 중 임의의 구현에 따라 생성될 수 있다.
[0074] 설명의 간략성을 위해, 본 개시내용의 방법들의 다양한 구현들이 일련의 동작들로 도시되고 설명된다. 그러나, 본 개시내용에 따른 동작들은, 본원에서 제시되고 설명되지 않은 다른 동작들과 함께, 다양한 순서들로 그리고/또는 동시에 발생할 수 있다. 또한, 개시된 청구대상에 따른 방법들을 구현하기 위해, 예시된 동작들이 모두 요구되는 것은 아니다. 게다가, 당업자는, 방법들이 대안적으로 이벤트들 또는 상태 다이어그램을 통해 상호 관련된 일련의 상태들로서 나타내질 수 있다는 점을 이해하고 인지할 것이다. 부가적으로, 본 명세서에 개시된 방법들의 구현들이, 그러한 방법들을 컴퓨팅 디바이스들에 전송하고 전달하는 것을 가능하게 하기 위해 제조 물품에 저장될 수 있다는 것이 인지되어야 한다. 본원에서 사용되는 바와 같은 "제조 물품"이라는 용어는 임의의 컴퓨터-판독가능 디바이스 또는 저장 매체로부터 액세스 가능한 컴퓨터 프로그램을 포함하도록 의도된다.
[0075] 도 9는, 머신이, 본원에서 논의된 방법론들 중 임의의 하나 또는 그 초과의 방법론들을 수행하게 하기 위한 명령들의 세트가 실행될 수 있는 컴퓨터 시스템(900)의 예시적인 형태의 머신의 도식적인 표현을 예시한다. 대안적인 구현들에서, 머신은 LAN, 인트라넷, 엑스트라넷, 또는 인터넷을 통해 다른 머신들에 연결될 수 있다(예컨대, 네트워킹될 수 있다). 머신은 클라이언트-서버 네트워크 환경에서 서버 또는 클라이언트 머신으로서, 또는 피어-투-피어(또는 분산) 네트워크 환경에서 피어 머신으로서 동작할 수 있다. 머신은 PC(personal computer), 태블릿 PC, STB(set-top box), PDA(Personal Digital Assistant), 셀룰러 전화, 웹 어플라이언스, 서버, 네트워크 라우터, 스위치 또는 브리지, 또는 머신에 의해 취해지는 액션들을 특정하는 (순차적인 또는 다른 방식의) 명령들의 세트를 실행할 수 있는 임의의 머신일 수 있다. 또한, 오직 단일 머신만이 예시되었지만, "머신"이라는 용어는 또한, 본원에서 논의된 방법론들 중 임의의 하나 또는 그 초과의 방법론들을 수행하기 위해 명령들의 세트(또는 다수의 세트들)를 개별적으로 또는 함께 실행하는 머신들의 임의의 집합을 포함하도록 이해되어야 한다. 컴퓨터 시스템(900)의 컴포넌트들 중 일부 또는 전부는, 클라이언트 디바이스들(110A-110Z), 데이터 스토어(106), 컨퍼런스 서버(120), NLP 서버(130), 또는 자연 언어 데이터베이스(140) 중 하나 또는 그 초과에 의해 활용될 수 있거나, 그러한 것들의 예시일 수 있다.
[0076] 예시적인 컴퓨터 시스템(900)은 프로세싱 디바이스(프로세서)(902), 메인 메모리(904)(예컨대, ROM(read-only memory), 플래시 메모리, DRAM(dynamic random access memory), 예컨대, SDRAM(synchronous DRAM) 또는 RDRAM(Rambus DRAM), 등), 정적 메모리(906)(예컨대, 플래시 메모리, SRAM(static random access memory), 등), 및 데이터 저장 디바이스(918)를 포함하며, 이들은 버스(908)를 통해 서로 통신한다.
[0077] 프로세서(902)는 마이크로프로세서, 중앙 프로세싱 유닛 등과 같은 하나 또는 그 초과의 범용 프로세싱 디바이스들을 나타낸다. 더 상세하게, 프로세서(902)는 CISC(complex instruction set computing) 마이크로프로세서, RISC(reduced instruction set computing) 마이크로프로세서, VLIW(very long instruction word) 마이크로프로세서, 또는 다른 명령 세트들을 구현하는 프로세서 또는 명령 세트들의 조합을 구현하는 프로세서들일 수 있다. 프로세서(902)는 또한, ASIC(application specific integrated circuit), FPGA(field programmable gate array), DSP, 네트워크 프로세서 등과 같은 하나 또는 그 초과의 특수-목적 프로세싱 디바이스들일 수 있다. 프로세서(902)는 본원에서 논의된 동작들 및 단계들을 수행하기 위한 명령들(926)을 실행하도록 구성된다.
[0078] 컴퓨터 시스템(900)은 네트워크 인터페이스 디바이스(922)를 더 포함할 수 있다. 컴퓨터 시스템(900)은 또한 비디오 디스플레이 유닛(910)(예컨대, LCD(liquid crystal display) 또는 CRT(cathode ray tube), 또는 터치 스크린), 알파뉴메릭 입력 디바이스(912)(예컨대, 키보드), 커서 제어 디바이스(914)(예컨대, 마우스), 및 신호 생성 디바이스(920)(예컨대, 스피커)를 포함할 수 있다.
[0079] 데이터 저장 디바이스(918)는 본원에서 설명된 방법론들 또는 기능들 중 임의의 하나 또는 그 초과를 구현하는 명령들(926)의 하나 또는 그 초과의 세트들(예컨대, 소프트웨어)이 저장되는 비-일시적 컴퓨터-판독가능 저장 매체(924)를 포함할 수 있다. 명령들(926)은 또한 메인 메모리(904) 내에 그리고/또는 컴퓨터 시스템(900)에 의한 명령들(926)의 실행 동안에는 프로세서(902) 내에 완전하게 또는 적어도 부분적으로 상주할 수 있고, 그 메인 메모리(904) 및 프로세서(902)는 또한 컴퓨터-판독가능 저장 매체를 구성한다. 명령들(926)은 추가로, 네트워크 인터페이스 디바이스(922)를 거쳐 네트워크(974)(예컨대, 네트워크(105))를 통해 송신 또는 수신될 수 있다.
[0080] 일 구현에서, 명령들(926)은 도 1 및 2에 대해 설명된 동일하게-명명된 대응부에 대응할 수 있는 하나 또는 그 초과의 콘텐츠 인덱싱 컴포넌트들(250)에 대한 명령들을 포함한다. 비록 컴퓨터-판독가능 저장 매체(924)가 단일 매체인 것으로 예시적 구현에서 도시되어 있지만, "컴퓨터-판독가능 저장 매체" 또는 "기계-판독가능 저장 매체"라는 용어는 명령들의 하나 또는 그 초과의 세트들을 저장하는 단일 매체 또는 다수의 매체(예컨대, 중앙집중식 또는 분산식 데이터베이스, 및/또는 연관된 캐시들 및 서버들)를 포함하도록 여겨져야 한다. "컴퓨터-판독가능 저장 매체" 또는 "기계-판독가능 저장 매체"라는 용어는 또한, 기계에 의해 실행하기 위한 명령들의 세트를 저장, 인코딩 또는 반송할 수 있고 기계로 하여금 본 개시내용의 방법론들 중 임의의 하나 또는 그 초과를 수행하게 하는 임의의 일시적 또는 비-일시적 컴퓨터-판독가능 저장 매체를 포함하도록 여겨져야 한다. "컴퓨터-판독가능 저장 매체"라는 용어는 그에 따라서 고체-상태 메모리들, 광학 매체 및 자기 매체(그러나 이에 제한되지는 않음)를 포함하도록 여겨져야 한다.
[0081] 전술한 설명에서, 많은 세부사항들이 기술되었다. 그러나, 본 개시내용이 이러한 특정 세부사항들이 없이도 실시될 수 있다는 것이 본 개시내용을 이용하는 당업자에게 자명할 것이다. 일부 경우들에서, 본 개시내용을 모호하지 않게 하기 위해서, 잘-알려진 구조들 및 디바이스들은 상세히 도시되기보다는 블록 다이어그램 형태로 도시된다.
[0082] 상세한 설명 중 일부 부분들은 컴퓨터 메모리 내의 데이터 비트들에 대한 연산들의 심볼 표현들 및 알고리즘들의 측면에서 제시되었을 수 있다. 이러한 알고리즘 설명들 및 표현들은, 자신들의 작업의 실체를 다른 당업자들에게 가장 효과적으로 전달하기 위해 데이터 프로세싱 분야의 당업자들에 의해 사용되는 수단이다. 알고리즘은 본원에서 그리고 일반적으로, 원하는 결과를 유도하는 단계들의 일관적인 시퀀스인 것으로 이해된다. 단계들은 물리적 양들의 물리적 조작들을 필요로 하는 단계들이다. 일반적으로, 비록 필수적이지는 않지만, 이러한 양들은 저장, 전달, 결합, 비교 및 다른 방식으로 조작될 수 있는 전기 또는 자기 신호들의 형태를 취한다. 주로 공통적인 사용의 이유들로 인해서 이러한 신호들을 비트들, 값들, 엘리먼트들, 심볼들, 캐릭터들, 용어들, 수치들 등으로 지칭하는 것이 때로는 편리하다는 것이 입증되었다.
[0083] 그러나, 이러한 그리고 유사한 용어들 전부는 적절한 물리량들과 연관되어야 하며 이러한 양들에 대해 적용되는 단지 편리한 라벨들일 뿐임을 유념해야 한다. 구체적으로 달리 언급되지 않는다면, 다음 논의로부터 명백한 바와 같이, 설명 전반에 걸쳐 "수신", "송신", "생성", "야기", "덧셈(adding)", "뺄셈(subtracting)", "삽입", "포함", "제거", "추출", "분석", "결정", "인에이블링", "식별", "수정" 등과 같은 용어들을 이용한 논의들은, 컴퓨터 시스템의 레지스터들 및 메모리들 내의 물리적(예컨대, 전자적) 양들로서 표현되는 데이터를, 컴퓨터 시스템 메모리들 또는 레지스터들 또는 다른 그러한 정보 저장, 송신 또는 디스플레이 디바이스들 내의 물리량들로서 유사하게 표현되는 다른 데이터로 조작 및 변환하는, 컴퓨터 시스템, 유사한 전자 컴퓨팅 디바이스의 액션들 및 프로세스들과 관련이 있는 것으로 인식된다.
[0084] 본 개시내용은 또한, 본원에서의 동작들을 수행하기 위한 장치, 디바이스, 또는 시스템에 관한 것이다. 이러한 장치, 디바이스, 또는 시스템은 요구되는 목적들을 위해 특별하게 구성될 수 있거나, 또는 컴퓨터 내에 저장된 컴퓨터 프로그램에 의해 선택적으로 활성화 또는 재구성되는 범용 컴퓨터를 포함할 수 있다. 이러한 컴퓨터 프로그램은, 예컨대, 플로피 디스크들, 광학 디스크들, CD-ROM(compact disk read-only memory)들, 자기-광학 디스크들, ROM(read-only memory)들, RAM(random access memory)들, EPROM들, EEPROM들, 자기 또는 광학 카드들, 또는 전자 명령들을 저장하는 데에 적합한 임의의 타입의 매체들을 포함하는(하지만 이에 제한되지 않음) 임의의 타입의 디스크와 같은 컴퓨터- 또는 기계-판독가능 저장 매체에 저장될 수 있다.
[0085] 본원에서 논의된 시스템들이 사용자들에 대한 개인 정보를 수집하거나 또는 개인 정보를 사용할 수 있는 상황들에서, 사용자에게는, 프로그램들 또는 피처들이 사용자 정보(예컨대, 사용자의 소셜 네트워크, 사회적 행동들 또는 활동들, 직업, 사용자의 선호도 또는 사용자의 현재 위치에 대한 정보)를 수집하는 지의 여부를 제어하거나, 또는 사용자와 더 관련이 있을 수 있는 콘텐츠 서버로부터 콘텐츠를 수신하는 지의 여부 그리고/또는 그러한 콘텐츠를 수신하는 방법을 제어할 수 있는 기회가 제공될 수 있다. 또한, 특정 데이터는 개인적으로 식별가능한 정보가 제거될 수 있도록, 저장되거나 사용되기 전에 하나 또는 그 초과의 방식들로 처리될 수 있다. 예컨대, 사용자에 대한 개인적으로 식별가능한 정보가 결정될 수 없도록, 사용자의 아이덴티티가 처리될 수 있거나, 또는 사용자의 특정 위치가 결정될 수 없도록, 사용자의 지리적 위치는 위치 정보가 획득되는 장소로(예컨대, 도시, 우편 번호 또는 스테이트 레벨로) 일반화될 수 있다. 따라서, 사용자는 콘텐츠 서버에 의해 사용자에 대한 정보가 수집되고 사용되는 방법에 대해 제어할 수 있다.
[0086] "예" 또는 "예시적인"이라는 단어들은 예, 사례, 또는 예시의 역할을 하는 것을 의미하도록 본원에서 사용된다. "예" 또는 "예시적인"으로 본원에서 설명되는 임의의 양상 또는 설계가 반드시 다른 양상들 또는 설계들에 비해 바람직한 또는 유리한 것으로 해석될 필요는 없다. 그보다는, "예" 또는 "예시적인"이라는 단어들의 사용은 구체적인 방식으로 개념들을 제공하도록 의도된다. 본 출원에서 사용되는 바와 같이, "또는"이라는 용어는 배타적인 "또는"이 아니라 포괄적인 "또는"을 의미하도록 의도된다. 즉, 다르게 특정되거나 문맥으로부터 분명하지 않은 한, "X는 A 또는 B를 포함한다"는 자연적인 포괄적인 치환들 중 임의의 치환을 의미하도록 의도된다. 즉, X가 A를 포함하거나; X가 B를 포함하거나; 또는 X가 A와 B 둘 모두를 포함하는 경우에, "X는 A 또는 B를 포함한다"는 전술한 사례들 중 어떠한 사례 하에서도 만족된다. 부가하여, 본 출원 및 첨부된 청구항들에서 사용되는 바와 같은 "a" 및 "an"이라는 관사들은, 단수형을 지시하는 것으로 다르게 특정되거나 또는 문맥으로부터 분명하지 않은 한, "하나 또는 그 초과"를 의미하도록 일반적으로 해석되어야 한다. 본 명세서 전체에 걸친 "구현" 또는 "일 구현"에 대한 언급은 구현과 관련하여 설명된 특정 특징, 구조, 또는 특성이 적어도 하나의 구현에 포함되는 것을 의미한다. 따라서, 본 명세서 전체에 걸친 다양한 개소들에서의 "구현" 또는 "일 구현"이라는 문구의 출현들이 반드시 모두 동일한 구현을 나타내고 있는 것은 아니다. 더욱이, 도면들의 소정의 엘리먼트들에 관하여 사용되는 "A-Z" 표기가 엘리먼트들의 특정 개수로 제한하도록 의도된 것이 아니라는 것이 주목된다. 따라서, "A-Z"는 특정 구현에 존재하는 엘리먼트 중 하나 또는 그 초과를 갖는 것으로 해석되어야 한다.
[0087] 위의 설명이 제한적인 것이 아니라 예시적인 것으로 의도된다는 것이 이해되어야 한다. 위의 설명을 읽고 이해할 시에, 다수의 다른 구현들이 당업자에게 자명하게 될 것이다. 그에 따라, 본 개시내용의 범위는 첨부된 청구항들과 더불어 그러한 청구항들에 권리가 부여되는 등가물들의 완전한 범위를 참조하여 결정되어야 한다.

Claims (20)

  1. 방법으로서,
    제 1 대화 이벤트에 대응하는 제 1 콘텐츠 아이템으로부터 복수의 토픽(topic)들을 프로세싱 디바이스가 추출하는 단계;
    상기 제 1 대화 이벤트에 대한 제 1 토픽 인덱스를 상기 프로세싱 디바이스가 생성하는 단계 ― 상기 제 1 토픽 인덱스는 상기 제 1 콘텐츠 아이템으로부터의 콘텐츠 세그먼트와 상기 복수의 토픽들 각각을 연관시킴 ―;
    상기 복수의 토픽들내의 하나 또는 그 초과의 토픽들의 제 1 서브세트를 상기 프로세싱 디바이스가 식별하는 단계; 및
    상기 제 1 서브세트의 하나 또는 그 초과의 토픽들 각각의 개개의 콘텐츠 세그먼트를 포함하는 제 2 콘텐츠 아이템을 상기 프로세싱 디바이스가 생성하는 단계를 포함하는, 방법.
  2. 제 1 항에 있어서,
    적어도 하나의 토픽 표시자를 포함하는 콘텐츠 요청을 클라이언트 디바이스로부터 수신하는 단계 ― 상기 토픽들의 제 1 서브세트를 식별하는 단계는 상기 적어도 하나의 토픽 표시자에 기반하여 상기 토픽들의 제 1 서브세트를 식별하는 단계를 포함함 ―; 및
    상기 제 2 콘텐츠 아이템을 상기 클라이언트 디바이스에 송신하는 단계를 더 포함하는, 방법.
  3. 제 1 항에 있어서,
    말하는 사람의 식별자 및 토픽 표시자를 포함하는 콘텐츠 요청을 클라이언트 디바이스로부터 수신하는 단계 ― 상기 토픽들의 제 1 서브세트를 식별하는 단계는 상기 말하는 사람의 식별자 및 상기 토픽 표시자에 기반하여 상기 토픽들의 제 1 서브세트를 식별하는 단계를 포함함 ―; 및
    상기 제 2 콘텐츠 아이템을 상기 클라이언트 디바이스에 송신하는 단계를 포함하는, 방법.
  4. 제 1 항에 있어서,
    상기 제 1 콘텐츠 아이템은 라이브 비디오 브로드캐스트(live video broadcast)이며;
    상기 방법은,
    상기 라이브 비디오 브로드캐스트 동안 복수의 사용자들로부터 피드백을 수신하는 단계, 및
    상기 피드백에 기반하여 상기 복수의 토픽들 각각에 대한 스코어(score)를 생성하는 단계를 더 포함하며;
    상기 토픽들의 제 1 서브세트를 식별하는 단계는, 복수의 토픽들 각각에 대하여, 상기 토픽의 개개의 스코어가 스코어링 조건(scoring condition)을 만족한다는 결정에 대한 응답으로 상기 토픽들의 제 1 서브세트에 상기 토픽을 포함시키는 단계를 포함하며, 상기 스코어링 조건을 만족하는 것은 임계 랭크를 초과하여 랭크된 것 또는 임계 랭크의 만족감 중 적어도 하나를 포함하는, 방법.
  5. 제 1 항에 있어서,
    토픽 인덱스들의 데이터베이스에 상기 제 1 토픽 인덱스를 추가하는 단계를 더 포함하며, 상기 토픽 인덱스들의 데이터베이스의 각각의 토픽 인덱스는 복수의 대화 이벤트들 중 하나에 대응하며, 상기 복수의 대화 이벤트들 각각은 상기 대화 이벤트의 적어도 하나의 개개의 토픽에 의해 검색가능한, 방법.
  6. 제 5 항에 있어서,
    하나 또는 그 초과의 토픽 표시자들을 수신하는 단계;
    상기 하나 또는 그 초과의 토픽 표시자들에 기반하여 상기 복수의 대화 이벤트들의 제 2 서브세트를 식별하는 단계; 및
    상기 제 2 서브세트의 각각의 대화 이벤트에 대하여, 상기 하나 또는 그 초과의 토픽 표시자들에 대응하는 하나 또는 그 초과의 콘텐츠 세그먼트들을 식별하는 단계를 더 포함하며, 상기 제 2 콘텐츠 아이템을 생성하는 단계는 상기 하나 또는 그 초과의 콘텐츠 세그먼트들로부터 상기 제 2 콘텐츠를 생성하는 단계를 더 포함하는, 방법.
  7. 제 1 항에 있어서,
    상기 제 1 토픽 인덱스는 상기 제 1 대화 이벤트 동안 실시간으로 생성되는, 방법.
  8. 제 1 항에 있어서,
    상기 대화 이벤트는 라이브 비디오 기록, 사전―기록된 비디오, 비디오 채트, 비디오 컨퍼런스 또는 텍스트-기반 채트 중 하나인, 방법.
  9. 시스템으로서,
    메모리, 및
    상기 메모리에 통신가능하게 커플링된 프로세싱 디바이스를 포함하며;
    상기 프로세싱 디바이스는,
    제 1 대화 이벤트에 대응하는 제 1 콘텐츠 아이템으로부터 복수의 토픽들을 추출하며;
    상기 제 1 대화 이벤트에 대한 제 1 토픽 인덱스를 생성하며 ― 상기 제 1 토픽 인덱스는 상기 제 1 콘텐츠 아이템으로부터의 콘텐츠 세그먼트와 상기 복수의 토픽들 각각을 연관시킴 ―;
    상기 복수의 토픽들내의 하나 또는 그 초과의 토픽들의 제 1 서브세트를 식별하며; 그리고
    상기 제 1 서브세트의 하나 또는 그 초과의 토픽들 각각의 개개의 콘텐츠 세그먼트를 포함하는 제 2 콘텐츠 아이템을 생성하는, 시스템.
  10. 제 9 항에 있어서,
    상기 프로세싱 디바이스는, 추가로,
    적어도 하나의 토픽 표시자를 포함하는 콘텐츠 요청을 클라이언트 디바이스로부터 수신하며 ― 상기 토픽들의 제 1 서브세트를 식별하는 것은 상기 적어도 하나의 토픽 표시자에 기반하여 상기 토픽들의 제 1 서브세트를 식별하는 것을 포함함 ―; 그리고
    상기 제 2 콘텐츠 아이템을 상기 클라이언트 디바이스에 송신하는, 시스템.
  11. 제 9 항에 있어서,
    상기 프로세싱 디바이스는, 추가로,
    말하는 사람의 식별자 및 토픽 표시자를 포함하는 콘텐츠 요청을 클라이언트 디바이스로부터 수신하며 ― 상기 토픽들의 제 1 서브세트를 식별하기 위해, 상기 프로세싱 디바이스는 추가로 상기 말하는 사람의 식별자 및 상기 토픽 표시자에 기반하여 상기 토픽들의 제 1 서브세트를 식별함 ―; 그리고
    상기 제 2 콘텐츠 아이템을 상기 클라이언트 디바이스에 송신하는, 시스템.
  12. 제 9 항에 있어서,
    상기 제 1 콘텐츠 아이템은 라이브 비디오 브로드캐스트이며;
    상기 프로세싱 디바이스는, 추가로
    상기 라이브 비디오 브로드캐스트 동안 복수의 사용자들로부터 피드백을 수신하며;
    상기 피드백에 기반하여 상기 복수의 토픽들 각각에 대한 스코어를 생성하며; 그리고
    복수의 토픽들 각각에 대하여, 상기 토픽의 개개의 스코어가 스코어링 조건을 만족한다는 결정에 대한 응답으로 상기 토픽들의 제 1 서브세트에 상기 토픽을 포함시키며, 상기 스코어링 조건을 만족하는 것은 임계 랭크를 초과하여 랭크된 것 또는 임계 랭크의 만족감 중 적어도 하나를 포함하는, 시스템.
  13. 제 9 항에 있어서,
    상기 프로세싱 디바이스는 추가로 토픽 인덱스들의 데이터베이스에 상기 제 1 토픽 인덱스를 추가하며, 상기 토픽 인덱스들의 데이터베이스의 각각의 토픽 인덱스는 복수의 대화 이벤트들 중 하나에 대응하며, 상기 복수의 대화 이벤트들 각각은 상기 대화 이벤트의 적어도 하나의 개개의 토픽에 의해 검색가능한, 시스템.
  14. 제 13 항에 있어서,
    상기 프로세싱 디바이스는, 추가로,
    하나 또는 그 초과의 토픽 표시자들을 수신하며;
    상기 하나 또는 그 초과의 토픽 표시자들에 기반하여 상기 복수의 대화 이벤트들의 제 2 서브세트를 식별하며;
    상기 제 2 서브세트의 각각의 대화 이벤트에 대하여, 상기 하나 또는 그 초과의 토픽 표시자들에 대응하는 하나 또는 그 초과의 콘텐츠 세그먼트들을 식별하며; 그리고
    상기 하나 또는 그 초과의 콘텐츠 세그먼트들로부터 상기 제 2 콘텐츠를 생성하는, 시스템.
  15. 명령들이 저장된 비-일시적 컴퓨터-판독가능 저장 매체로서,
    상기 명령들은 프로세싱 디바이스에 의해 실행될 때, 상기 프로세싱 디바이스로 하여금,
    제 1 대화 이벤트에 대응하는 제 1 콘텐츠 아이템으로부터 복수의 토픽들을 추출하는 동작;
    상기 제 1 대화 이벤트에 대한 제 1 토픽 인덱스를 생성하는 동작 ― 상기 제 1 토픽 인덱스는 상기 제 1 콘텐츠 아이템으로부터의 콘텐츠 세그먼트와 상기 복수의 토픽들 각각을 연관시킴 ―;
    상기 복수의 토픽들내의 하나 또는 그 초과의 토픽들의 제 1 서브세트를 식별하는 동작; 및
    상기 제 1 서브세트의 하나 또는 그 초과의 토픽들 각각의 개개의 콘텐츠 세그먼트를 포함하는 제 2 콘텐츠 아이템을 생성하는 동작을 포함하는 동작들을 수행하게 하는, 비-일시적 컴퓨터-판독가능 저장 매체.
  16. 제 15 항에 있어서,
    상기 동작들은,
    적어도 하나의 토픽 표시자를 포함하는 콘텐츠 요청을 클라이언트 디바이스로부터 수신하는 동작 ― 상기 토픽들의 제 1 서브세트를 식별하는 동작은 상기 적어도 하나의 토픽 표시자에 기반하여 상기 토픽들의 제 1 서브세트를 식별하는 동작을 포함함 ―; 및
    상기 제 2 콘텐츠 아이템을 상기 클라이언트 디바이스에 송신하는 동작을 더 포함하는, 비-일시적 컴퓨터-판독가능 저장 매체.
  17. 제 15 항에 있어서,
    상기 동작들은,
    말하는 사람의 식별자 및 토픽 표시자를 포함하는 콘텐츠 요청을 클라이언트 디바이스로부터 수신하는 동작 ― 상기 토픽들의 제 1 서브세트를 식별하는 동작은 상기 말하는 사람의 식별자 및 상기 토픽 표시자에 기반하여 상기 토픽들의 제 1 서브세트를 식별하는 동작을 포함함 ―; 및
    상기 제 2 콘텐츠 아이템을 상기 클라이언트 디바이스에 송신하는 동작을 더 포함하는, 비-일시적 컴퓨터-판독가능 저장 매체.
  18. 제 15 항에 있어서,
    상기 제 1 콘텐츠 아이템은 라이브 비디오 브로드캐스트이며;
    상기 동작들은,
    상기 라이브 비디오 브로드캐스트 동안 복수의 사용자들로부터 피드백을 수신하는 동작; 및
    상기 피드백에 기반하여 상기 복수의 토픽들 각각에 대한 스코어를 생성하는 동작을 더 포함하며;
    상기 토픽들의 제 1 서브세트를 식별하는 동작은, 복수의 토픽들 각각에 대하여, 상기 토픽의 개개의 스코어가 스코어링 조건을 만족한다는 결정에 대한 응답으로 상기 토픽들의 제 1 서브세트에 상기 토픽을 포함시키는 동작을 포함하며, 상기 스코어링 조건을 만족하는 것은 임계 랭크를 초과하여 랭크된 것 또는 임계 랭크의 만족감 중 적어도 하나를 포함하는, 비-일시적 컴퓨터-판독가능 저장 매체.
  19. 제 15 항에 있어서,
    상기 동작들은 토픽 인덱스들의 데이터베이스에 상기 제 1 토픽 인덱스를 추가하는 동작을 더 포함하며, 상기 토픽 인덱스들의 데이터베이스의 각각의 토픽 인덱스는 복수의 대화 이벤트들 중 하나에 대응하며, 상기 복수의 대화 이벤트들 각각은 상기 대화 이벤트의 적어도 하나의 개개의 토픽에 의해 검색가능한, 비-일시적 컴퓨터-판독가능 저장 매체.
  20. 제 19 항에 있어서,
    상기 동작들은,
    하나 또는 그 초과의 토픽 표시자들을 수신하는 동작;
    상기 하나 또는 그 초과의 토픽 표시자들에 기반하여 상기 복수의 대화 이벤트들의 제 2 서브세트를 식별하는 동작; 및
    상기 제 2 서브세트의 각각의 대화 이벤트에 대하여, 상기 하나 또는 그 초과의 토픽 표시자들에 대응하는 하나 또는 그 초과의 콘텐츠 세그먼트들을 식별하는 동작을 더 포함하며, 상기 제 2 콘텐츠 아이템을 생성하는 동작은 상기 하나 또는 그 초과의 콘텐츠 세그먼트들로부터 상기 제 2 콘텐츠를 생성하는 동작을 포함하는, 비-일시적 컴퓨터-판독가능 저장 매체.

KR1020177031686A 2015-08-24 2016-08-23 자연 언어 프로세싱을 이용한 토픽 인덱스의 생성 KR102047923B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US14/833,599 US10621231B2 (en) 2015-08-24 2015-08-24 Generation of a topic index with natural language processing
US14/833,599 2015-08-24
PCT/US2016/048187 WO2017035136A1 (en) 2015-08-24 2016-08-23 Generation of a topic index with natural language processing

Publications (2)

Publication Number Publication Date
KR20170134588A true KR20170134588A (ko) 2017-12-06
KR102047923B1 KR102047923B1 (ko) 2019-11-22

Family

ID=56843068

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020177031686A KR102047923B1 (ko) 2015-08-24 2016-08-23 자연 언어 프로세싱을 이용한 토픽 인덱스의 생성

Country Status (5)

Country Link
US (1) US10621231B2 (ko)
EP (1) EP3341857B1 (ko)
KR (1) KR102047923B1 (ko)
CN (1) CN107636651B (ko)
WO (1) WO2017035136A1 (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10621231B2 (en) 2015-08-24 2020-04-14 Google Llc Generation of a topic index with natural language processing
WO2023229056A1 (ko) * 2022-05-23 2023-11-30 주식회사 엔씨소프트 비디오 데이터를 이용하여 외부 전자 장치의 화면을 표시하기 위한 정보를 송신하기 위한 전자 장치

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11050845B2 (en) 2016-02-25 2021-06-29 At&T Intellectual Property I, L.P. Method and apparatus for providing configurable event content
US10506089B2 (en) * 2016-08-12 2019-12-10 International Business Machines Corporation Notification bot for topics of interest on voice communication devices
US10950275B2 (en) * 2016-11-18 2021-03-16 Facebook, Inc. Methods and systems for tracking media effects in a media effect index
US10303928B2 (en) 2016-11-29 2019-05-28 Facebook, Inc. Face detection for video calls
US10554908B2 (en) 2016-12-05 2020-02-04 Facebook, Inc. Media effect application
US10148910B2 (en) * 2016-12-30 2018-12-04 Facebook, Inc. Group video session
US11128675B2 (en) * 2017-03-20 2021-09-21 At&T Intellectual Property I, L.P. Automatic ad-hoc multimedia conference generator
US10679182B2 (en) * 2017-05-17 2020-06-09 International Business Machines Corporation System for meeting facilitation
WO2019032994A1 (en) * 2017-08-10 2019-02-14 Facet Labs, Llc ORAL, FACIAL AND GESTURE COMMUNICATION DEVICES AND COMPUTER INTERACTION ARCHITECTURE WITH DIGITAL MULTIMEDIA CONTENT
US20190268385A1 (en) * 2018-02-23 2019-08-29 Microsoft Technology Licensing, Llc Automatic method and system for identifying consensus and resources
US10558827B2 (en) 2018-02-23 2020-02-11 Microsoft Technology Licensing, Llc Automatic method and system for identifying consensus and resources
US10810457B2 (en) * 2018-05-09 2020-10-20 Fuji Xerox Co., Ltd. System for searching documents and people based on detecting documents and people around a table
CN110633406B (zh) * 2018-06-06 2023-08-01 北京百度网讯科技有限公司 事件专题的生成方法、装置、存储介质和终端设备
US20200162698A1 (en) * 2018-11-20 2020-05-21 International Business Machines Corporation Smart contact lens based collaborative video conferencing
US11150965B2 (en) * 2019-06-20 2021-10-19 International Business Machines Corporation Facilitation of real time conversations based on topic determination
US11829723B2 (en) 2019-10-17 2023-11-28 Microsoft Technology Licensing, Llc System for predicting document reuse
EP4200840A1 (en) * 2020-08-18 2023-06-28 Cognius AI Pte Ltd System and a method to create conversational artificial intelligence
WO2022164547A1 (en) * 2021-01-26 2022-08-04 Microsoft Technology Licensing, Llc Collaborative content recommendation platform
US11513664B2 (en) * 2021-01-26 2022-11-29 Microsoft Technology Licensing, Llc Collaborative content recommendation platform
CN114218438B (zh) * 2021-12-23 2023-03-21 北京百度网讯科技有限公司 视频数据处理方法、装置、电子设备和计算机存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6434520B1 (en) * 1999-04-16 2002-08-13 International Business Machines Corporation System and method for indexing and querying audio archives
US20120197750A1 (en) * 2010-11-18 2012-08-02 Wal-Mart Stores, Inc. Methods, systems and devices for recommending products and services
US8423555B2 (en) * 2010-07-09 2013-04-16 Comcast Cable Communications, Llc Automatic segmentation of video

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7382933B2 (en) 2005-08-24 2008-06-03 International Business Machines Corporation System and method for semantic video segmentation based on joint audiovisual and text analysis
US7801910B2 (en) 2005-11-09 2010-09-21 Ramp Holdings, Inc. Method and apparatus for timed tagging of media content
US8392409B1 (en) 2006-01-23 2013-03-05 Symantec Corporation Methods, systems, and user interface for E-mail analysis and review
US7640272B2 (en) 2006-12-07 2009-12-29 Microsoft Corporation Using automated content analysis for audio/video content consumption
US8756233B2 (en) 2010-04-16 2014-06-17 Video Semantics Semantic segmentation and tagging engine
US20110289088A1 (en) 2010-05-19 2011-11-24 Frank N. Magid Associates, Inc. System and method for ranking content interest
US9614807B2 (en) 2011-02-23 2017-04-04 Bottlenose, Inc. System and method for analyzing messages in a network or across networks
US8698872B2 (en) * 2011-03-02 2014-04-15 At&T Intellectual Property I, Lp System and method for notification of events of interest during a video conference
US8886743B2 (en) * 2011-08-30 2014-11-11 Open Text S.A. System and method of browsing offline and queried content
CN102646134A (zh) * 2012-03-29 2012-08-22 百度在线网络技术(北京)有限公司 一种用于确定消息记录中的消息会话的方法和设备
US9641898B2 (en) * 2013-12-24 2017-05-02 JBF Interlude 2009 LTD Methods and systems for in-video library
US9467744B2 (en) * 2013-12-30 2016-10-11 Verizon and Redbox Digital Entertainment Services, LLC Comment-based media classification
US20150193482A1 (en) * 2014-01-07 2015-07-09 30dB, Inc. Topic sentiment identification and analysis
US10621231B2 (en) 2015-08-24 2020-04-14 Google Llc Generation of a topic index with natural language processing

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6434520B1 (en) * 1999-04-16 2002-08-13 International Business Machines Corporation System and method for indexing and querying audio archives
US8423555B2 (en) * 2010-07-09 2013-04-16 Comcast Cable Communications, Llc Automatic segmentation of video
US20120197750A1 (en) * 2010-11-18 2012-08-02 Wal-Mart Stores, Inc. Methods, systems and devices for recommending products and services

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10621231B2 (en) 2015-08-24 2020-04-14 Google Llc Generation of a topic index with natural language processing
WO2023229056A1 (ko) * 2022-05-23 2023-11-30 주식회사 엔씨소프트 비디오 데이터를 이용하여 외부 전자 장치의 화면을 표시하기 위한 정보를 송신하기 위한 전자 장치

Also Published As

Publication number Publication date
WO2017035136A1 (en) 2017-03-02
CN107636651A (zh) 2018-01-26
CN107636651B (zh) 2021-11-16
EP3341857A1 (en) 2018-07-04
KR102047923B1 (ko) 2019-11-22
EP3341857B1 (en) 2021-05-26
US10621231B2 (en) 2020-04-14
US20170060917A1 (en) 2017-03-02

Similar Documents

Publication Publication Date Title
CN107636651B (zh) 使用自然语言处理生成主题索引
US11036920B1 (en) Embedding location information in a media collaboration using natural language processing
US10068617B2 (en) Adding content to a media timeline
CN112383566B (zh) 流媒体呈现系统
US9141695B2 (en) System and method for creating, managing, and publishing audio microposts
JP6364424B2 (ja) メディアアセットに関するコンテクスト上関係する情報を表示するための方法およびシステム
US20170083214A1 (en) Keyword Zoom
US20140272820A1 (en) Language learning environment
US20120233155A1 (en) Method and System For Context Sensitive Content and Information in Unified Communication and Collaboration (UCC) Sessions
JP2014209733A (ja) ビデオインターバルへの注釈
Yew et al. Knowing funny: genre perception and categorization in social video sharing
US20130060873A1 (en) Real time event reviewing system and method
US11609738B1 (en) Audio segment recommendation
Yang et al. Catchlive: Real-time summarization of live streams with stream content and interaction data
US20220094654A1 (en) Methods, systems, and media for identifying and presenting video objects linked to a source video
AT&T \376\377\000w\000w\000w\0002\0000\0001\0001\000d\000e\000m\000o\000_\000s\000o\000c\000i\000a\000l\000t\000v\000_\000f\000i\000n\000a\000l
Bailer et al. Multimedia Analytics Challenges and Opportunities for Creating Interactive Radio Content
Renger et al. VoiSTV: voice-enabled social TV
Outtagarts et al. A cloud-based collaborative and automatic video editor
Chorianopoulos et al. Social video retrieval: research methods in controlling, sharing, and editing of web video
Albert School of Electronic Engineering and Computer Science

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant