KR20220006491A

KR20220006491A - 댓글 자막을 생성하는 방법, 장치, 전자 기기, 저장 매체 및 컴퓨터 프로그램

Info

Publication number: KR20220006491A
Application number: KR1020210191423A
Authority: KR
Inventors: 쭝췬 웨이
Original assignee: 베이징 바이두 넷컴 사이언스 테크놀로지 컴퍼니 리미티드
Priority date: 2021-03-25
Filing date: 2021-12-29
Publication date: 2022-01-17
Also published as: US20220124421A1; CN113079417A; CN113079417B; EP3996373A3; EP3996373A2; JP2022043273A

Abstract

본 개시는 댓글 자막을 생성하는 방법, 장치, 전자 기기 및 저장 매체를 개시하였으며, 컴퓨터 기술 분야에 적용되며, 구체적으로 스마트 추천 분야에 적용된다. 댓글 자막을 생성하는 방법의 구체적인 구현 방안으로는, 동영상 데이터의 내용 정보 및 목표 대상의 속성 정보를 획득하며; 내용 정보의 제1 핵심 정보를 추출하고, 속성 정보의 제2 핵심 정보를 추출하며; 목표 대상에 대한 목표 핵심 정보를 결정하며, 제1 핵심 정보 중의 제2 핵심 정보에 매칭되는 정보를 목표 핵심 정보로 결정하는 것을 포함하며; 소정 미디어 라이브러리에서 목표 핵심 정보에 매칭되는 제1 멀티미디어 정보를 검색하며; 및 제1 멀티미디어 정보를 기반으로, 목표 핵심 정보에 대한 제1 댓글 자막을 생성하여, 동영상 데이터를 재생하는 동시에 제1 댓글 자막을 전시하도록 하며; 여기서, 제1 댓글 자막은 목표 대상에 대한 추천 정보의 링크를 포함하며, 추천 정보는 멀티미디어 정보를 포함한다.

Description

댓글 자막을 생성하는 방법, 장치, 전자 기기, 저장 매체 및 컴퓨터 프로그램{METHOD, APPARATUS, ELECTRONIC DEVICE, STORAGE MEDIUM AND COMPUTER PROGRAM FOR GENERATING COMMENT SUBTITLE}

본 개시는 컴퓨터 기술 분야에 관한 것이며, 구체적으로 스마트 추천 분야에 관한 것이며, 더 구체적으로 댓글 자막을 생성하는 방법, 장치, 전자 기기 및 저장 매체에 관한 것이다.

네트워크 기술의 발전에 따라, 동영상에 댓글을 발표하기 위한 댓글 자막이 대상 사이의 인터랙티브성을 강화하는 주요 방식의 하나로 되었다. 구체적으로, 대상이 댓글 내용을 발표한 후에, 상기 댓글 내용은 표시 화면에서 슬라이딩하여 지나가는 자막 형식으로 표시된다.

관련 분야에서, 댓글 자막은 간단한 인터랙션 행위를 제공하며, 대상의 기본 수요를 만족시킬 수 있다.

댓글 자막 기능을 확장하는 댓글 자막을 생성하는 방법, 장치, 기기 및 저장 매체를 제공한다.

본 개시의 일 측면에 따르면, 동영상 데이터의 내용 정보 및 목표 대상의 속성 정보를 획득하며; 상기 내용 정보의 제1 핵심 정보를 추출하고, 상기 속성 정보의 제2 핵심 정보를 추출하며; 상기 목표 대상에 대한 목표 핵심 정보를 결정하며; 소정 미디어 라이브러리에서 상기 목표 핵심 정보에 매칭되는 제1 멀티미디어 정보를 검색하며; 및 상기 제1 멀티미디어 정보를 기반으로, 상기 목표 핵심 정보에 대한 제1 댓글 자막을 생성하여, 상기 동영상 데이터를 재생하는 동시에 상기 제1 댓글 자막을 전시하도록 하는 것을 포함하며; 여기서, 상기 목표 대상에 대한 목표 핵심 정보를 결정하는 것은, 상기 제1 핵심 정보 중의 상기 제2 핵심 정보에 매칭되는 정보를 상기 목표 핵심 정보로 결정하는 것을 포함하며, 상기 제1 댓글 자막은 상기 목표 대상에 대한 추천 정보의 링크를 포함하며, 상기 추천 정보는 상기 멀티미디어 정보를 포함하는 댓글 자막을 생성하는 방법을 제공한다.

본 개시의 다른 측면에 따르면, 동영상 데이터의 내용 정보 및 목표 대상의 속성 정보를 추출하기 위한 정보 획득 모듈; 상기 내용 정보의 제1 핵심 정보를 추출하고, 상기 속성 정보의 제2 핵심 정보를 추출하기 위한 정보 추출 모듈; 상기 목표 대상에 대한 목표 핵심 정보를 결정하기 위한 핵심 정보 결정 모듈; 소정 미디어 라이브러리에서 목표 핵심 정보에 매칭되는 제1 멀티미디어 정보를 검색하기 위한 제1 정보 검색 모듈; 및 제1 멀티미디어 정보를 기반으로, 목표 핵심 정보에 대한 제1 댓글 자막을 생성하여, 동영상 데이터를 재생하는 동시에 제1 댓글 자막을 전시하도록 하기 위한 댓글 자막 생성 모듈을 포함하며, 여기서, 상기 목표 대상에 대한 목표 핵심 정보를 결정하는 것은, 상기 제1 핵심 정보 중의 상기 제2 핵심 정보에 매칭되는 정보를 상기 목표 핵심 정보로 하는 것을 포함하며, 상기 제1 댓글 자막은 상기 목표 대상에 대한 제1 추천 정보의 링크를 포함하며, 상기 제1 추천 정보는 상기 제1 멀티미디어 정보를 포함하는 댓글 자막을 생성하는 장치를 제공한다.

본 개시의 다른 측면에 따르면, 적어도 하나의 프로세서; 및 상기 적어도 하나의 프로세서에 통신 연결되는 메모리를 포함하는 전자 기기에 있어서, 상기 메모리에는 상기 적어도 하나의 프로세서에 의해 실행 가능한 명령어가 저장되어 있고, 상기 명령어는 상기 적어도 하나의 프로세서에 의해 실행되어 상기 적어도 하나의 프로세서로 하여금 본 개시에서 제공하는 댓글 자막을 생성하는 방법을 실행하게 하는 전자 기기를 제공한다.

본 개시의 다른 측면에 따르면, 컴퓨터 명령어가 저장되어 있는 비휘발성 컴퓨터 판독 가능 저장 매체에 있어서, 상기 컴퓨터 명령어는 상기 컴퓨터로 하여금 본 개시에서 제공하는 댓글 자막을 생성하는 방법을 실행하게 하기 위한 것인 비일시적 컴퓨터 판독가능 저장 매체를 제공한다.

본 개시의 다른 측면에 따르면, 프로세서에 의해 실행될 때 본 개시에서 제공하는 댓글 자막을 생성하는 방법을 구현하는 컴퓨터 프로그램을 포함하는 컴퓨터 프로그램 제품을 제공한다.

본 부분에서 설명한 내용은 본 개시의 실시예의 결정적이거나 중요한 특징을 나타내기 위한 것이 아니며, 본 개시의 범위를 제한하기 위한 것도 아님을 이해해야 한다. 본 개시의 기타 특징은 아래의 설명서를 통해 쉽게 이해하게 될 것이다.

첨부된 도면은 본 해결 수단을 더 잘 이해하기 위한 것이며, 본 개시에 대해 한정하지 않는다. 여기서,
도 1은 본 개시의 실시예에 따른 댓글 자막을 생성하는 방법 및 장치의 적용 환경 예시도이며;
도 2는 본 개시의 실시예에 따른 댓글 자막을 생성하는 방법의 흐름도이며;
도 3은 본 개시의 실시예에 따른 목표 핵심 정보를 결정하는 원리 예시도이며;
도 4는 본 개시의 실시예에 따른 댓글 자막을 생성하는 방법의 원리 예시도이며;
도 5는 본 개시의 다른 실시예에 따른 댓글 자막을 생성하는 방법의 원리 예시도이며;
도 6은 본 개시의 실시예에 따른 추천 정보가 인터랙션 동작에 대해 응답하는 예시도이며;
도 7은 본 개시의 실시예에 따른 구축된 소정 지식 그래프의 구조 예시도이며;
도 8은 본 개시의 실시예에 따른 댓글 자막을 생성하는 장치의 구조 블록도이며;
도 9는 본 개시의 실시예의 댓글 자막을 생성하는 방법을 구현하기 위한 전자 기기의 블록도이다.

아래에서는 본 개시의 예시적 실시예에 대해 첨부된 도면을 결부하여 설명하도록 하며, 여기서 이해를 돕기 위해 본 개시의 실시예의 다양한 세부 내용을 포함하며, 이들은 단지 예시적인 것으로 간주되어야 한다. 따라서, 당해 분야의 통상적인 기술자는 본 개시의 범위 및 사상을 벗어나는 것이 없이, 여기서 설명한 실시예에 대해 다양한 변형 및 수정을 할 수 있음을 이해해야 한다. 마찬가지로, 명확성 및 간결성을 위해, 아래의 설명에서는 공지된 기능 및 구조에 대한 설명을 생략한다.

본 개시는 정보 획득 단계, 정보 추출 단계, 핵심 정보 결정 단계, 정보 검색 단계 및 댓글 자막 생성 단계를 포함하는 댓글 자막을 생성하는 방법을 제공한다. 정보 획득 단계에서는 동영상 데이터의 내용 정보 및 목표 대상의 속성 정보를 획득한다. 정보 추출 단계에서는 내용 정보의 제1 핵심 정보를 추출하고, 속성 정보의 제2 핵심 정보를 추출한다. 핵심 정보 결정 단계에서는 목표 대상에 대한 목표 핵심 정보를 결정하며, 제1 핵심 정보 중의 제2 핵심 정보에 매칭되는 정보를 목표 핵심 정보로 결정하는 것을 포함한다. 정보 검색 단계에서는 소정 미디어 라이브러리에서 목표 핵심 정보에 매칭되는 제1 멀티미디어 정보를 검색한다. 댓글 자막 생성 단계에서는 제1 멀티미디어 정보를 기반으로, 목표 핵심 정보에 대한 제1 댓글 자막을 생성하여, 동영상 데이터를 재생하는 동시에 제1 댓글 자막을 전시하도록 한다. 여기서, 제1 댓글 자막은 목표 대상에 대한 추천 정보의 링크를 포함하며, 상기 추천 정보는 제1 멀티미디어 정보를 포함한다.

아래에서는 도 1을 결부하여 본 개시에서 제공하는 방법 및 장치의 적용 환경에 대해 설명하도록 한다.

도 1은 본 개시의 실시예에 따른 댓글 자막을 생성하는 방법 및 장치의 적용 환경 예시도이다.

도 1에서 도시한 바와 같이, 상기 적용 환경(100)은 서버(110), 데이터 베이스(120) 및 단말 기기(150)를 포함한다. 서버(110)는 네트워크를 통해 데이터 베이스(120)를 액세스할 수 있으며, 단말 기기(150)는 네트워크를 통해 서버(110)와 통신적으로 연결될 수 있으며, 네트워크는 유선 또는 무선 통신 링크를 포함할 수 있다.

본 개시의 실시예에 따르면, 데이터 베이스(120)에는 예를 들어 멀티미디어 정보가 저장될 수 있으며, 상기 데이터 베이스(120)에는 동영상 플랫폼, 텍스트 플랫폼, 포럼 플랫폼 등 멀티 플랫폼의 전체 정보 또는 단일 플랫폼의 전체 정보가 저장될 수 있다. 서버(110)는 예를 들어 데이터 베이스(120)에서 멀티미디어 정보를 읽으며, 상기 멀티미디어 정보를 추천 정보로 하여 단말 기기(150)에 발송할 수 있다.

사용자(160)는 예를 들어 단말 기기(150)를 사용하여 네트워크를 통해 서버(110)와 인터랙션함으로써, 정보 등을 수신하거나 발송할 수 있다. 단말 기기(150)는 디스플레이 스크린을 구비하며 동영상 재생을 할 수 있는 단말 기기일 수 있으며, 스마트폰, 태블릿, 랩톱 휴대형 컴퓨터 및 데스크탑 컴퓨터 등을 포함하지만, 이에 제한되지 않는다.

서버(110)는 예를 들어 사용자(160)의 인터랙션에 응답하여, 전시되는 동영상 데이터를 단말 기기(150)에 발송할 수 있다. 상기 서버는 다양한 서비스를 제공하는 서버일 수 있으며, 예를 들어 사용자가 단말 기기(150)를 이용하여 브라우징하는 웹사이트 또는 클라이언트측 애플리케이션에 대해 지지를 제공하는 백그라운드 관리 서버일 수 있다. 상기 서버는 클라우드 서버일 수도 있고, 분산형 시스템의 서버이거나, 블록 체인을 결부한 서버일 수도 있다.

일 실시예에서, 서버(110)는 단말 기기(150)에 동영상 데이터를 발송하기 전에, 예를 들어 동영상 데이터의 내용을 기반으로, 데이터 베이스(120)에서 상기 동영상 데이터의 내용과 관련된 멀티미디어 정보(130)를 읽어 사용자에게 추천하는 정보로 할 수 있다. 상기 멀티미디어 정보는 댓글 자막의 형식으로 동영상 데이터에 추가된다. 이와 같이, 서버(110)가 단말 기기(150)에 발송한 동영상 데이터는 댓글 자막을 가진 동영상 데이터(140)이다. 대응되게, 단말 기기(150)가 댓글 자막을 가진 동영상 데이터를 수신한 후, 동영상 데이터를 재생하는 동시에 상기 댓글 자막을 전시함으로써, 사용자에게 멀티미디어 정보를 추천하는 역할을 한다. 이해할 수 있는 것은, 서버(110)는 예를 들어 단말 기기(150)가 발송한 댓글 자막 획득 요청에 응답하여, 단말 기기(150)가 재생할 동영상 프레임에 따라 멀티미디어 정보를 읽고 댓글 자막을 생성하여, 댓글 자막을 단말 기기(150)에 발송할 수도 있다. 여기서, 단말 기기는 동영상 데이터를 재생할 때 재생될 동영상 프레임에 따라 댓글 자막 획득 요청을 실시간으로 발송할 수 있다. 또는, 서버(110)는 동영상 데이터와 댓글 자막을 별도로 저장하고, 동영상 데이터의 식별자로서 동영상 데이터에 대한 댓글 자막의 저장 인덱스로 할 수 있다.

일 실시예에서, 상기 댓글 자막은 상기 멀티미디어 정보에 대한 링크를 포함할 수 있으며, 이로써, 사용자(160)가 단말 기기(150)를 통해 재생된 동영상 데이터를 볼 때, 댓글 자막에 대한 클릭 동작을 통해, 단말 기기(150)의 전시 화면이 멀티미디어 정보(130)의 전시 화면으로 이동하도록 할 수 있다.

설명해야 할 점은, 본 개시에서 제공하는 댓글 자막을 생성하는 방법은 서버(110)에 의해 실행될 수 있다. 대응되게, 본 개시에서 제공하는 댓글 자막을 생성하는 장치는 서버(110)에 설치될 수 있다. 본 개시에서 제공하는 댓글 자막을 생성하는 방법은 서버(110)와 상이하고 서버(110)와 통신할 수 있는 서버 또는 서버 그룹에 의해 실행될 수도 있다. 대응되게, 본 개시에서 제공되는 댓글 자막을 생성하는 장치는 서버(110)와 상이하고 서버(110)와 통신할 수 있는 서버 또는 서버 그룹에 설치될 수도 있다.

이해해야 할 것은, 도 1 중의 단말 기기, 서버 및 데이터 베이스의 개수 및 유형은 단지 예시적인 것이다. 구현 수요에 따라, 임의의 개수 및 유형의 단말 기기, 서버 및 데이터 베이스를 구비할 수 있다.

도 2는 본 개시의 실시예에 따른 댓글 자막을 생성하는 방법의 흐름도이다.

도 2에서 도시한 바와 같이, 이 실시예의 댓글 자막을 생성하는 방법(200)은 동작S210~동작S290을 포함할 수 있다.

동작S210에서는, 동영상 데이터의 내용 정보 및 목표 대상의 속성 정보를 획득한다.

본 개시의 실시예에 따르면, 동영상 데이터의 내용 정보는 동영상 데이터 중의 각 동영상 프레임의 이미지 정보, 각 동영상 프레임 중의 자막, 각 동영상 프레임이 가진 음성 정보 등을 포함할 수 있다.

본 개시의 실시예에 따르면, 목표 대상의 속성 정보는 예를 들어 목표 대상의 정적 속성 및 동적 속성 등을 포함할 수 있다. 정적 속성은 목표 대상의 기본 정보, 예를 들어 목표 대상의 나이 등이다. 동적 속성은 목표 대상의 사회 행위에 의해 발생한 속성이며, 상기 동적 속성은 목표 대상의 선호 등을 반영할 수 있다.

동작S230에서는, 내용 정보의 제1 핵심 정보를 추출하고, 속성 정보의 제2 핵심 정보를 추출한다.

본 개시의 실시예에 따르면, 동영상 내용 이해（Video Content Understanding）방법을 사용하여 내용 정보에서 제1 핵심 정보를 추출할 수 있다. 상기 동영상 내용 이해 방법은 일련의 인공 지능 알고리즘을 통해, 동영상 데이터를 구조화적이고 기계 판독 가능한 의도와 단어 슬롯 정보로 해석할 수 있다.

본 개시의 실시예에 따르면, 내용 정보 중의 이미지, 자막 및 음성 등을 해석할 수 있으며, 상기 내용 정보에서 엔티티 특징, 속성 특징 및 엔티티 특징과 속성 특징 사이의 관계 특징 등을 추출할 수 있다. 예를 들어, 내용 정보는 전술한 이미지, 자막 및 음성 외에, 동영상 데이터의 표제, 표지 이미지 및 분류 정보 등을 포함하여, 이로써 더 많은 정보를 융합하여 특징 추출을 할 수도 있다. 예를 들어, 동영상 데이터의 업로드 시간 등에 따라 동영상 데이터의 실효성을 결정할 수도 있다. 예를 들어, 동영상 데이터의 선명도 및 동영상 데이터의 완전성 등에 따라 동영상 데이터의 내용 품질을 결정할 수도 있다. 이 추출된 특징 및 결정된 실효성, 내용 품질 등 정보들을 제1 핵심 정보로 할 수 있다.

예시적으로, 추출된 특징을 얻은 후, 예를 들어 엔티티 특징과 속성 특징을 서로 사이의 관계 특징에 따라 키값쌍 구조의 데이터를 구성할 수 있으며, 상기 키값쌍 구조의 데이터를 제1 핵심 정보로 한다. 예시적으로, 얻은 제1 핵심 정보는 예를 들어 "물품 카테고리-과일"을 포함할 수 있다.

예시적으로, 제1 핵심 정보를 추출하는 과정에서, 안면 인식 방법, 동물 인식 방법, 식물 인식 방법 등 임의의 물체 인식 방법을 사용하여, 동영상 데이터 중의 엔티티를 인식하여 얻으며, 상기 엔티티의 엔티티 단어를 제1 핵심 정보의 일부분으로 한다.

본 개시의 실시예에 따르면, 목표 대상의 속성 정보를 얻은 후, 상기 속성 정보를 키값쌍 구조의 데이터로 정리하여 제2 핵심 정보로 할 수 있다. 또는, 목표 대상의 속성 정보가 동적 정보를 포함하는 경우, 이 실시예는 동적 정보에 관한 멀티미디어 정보의 라벨을 통계하여, 개수가 보다 많은 라벨을 속성 정보의 제2 핵심 정보로 할 수 있다. 예시적으로, 얻은 제2 핵심 정보는 예를 들어 "아이돌-장삼(張三)"을 포함할 수 있다.

이해할 수 있는 것은, 상기의 제1 핵심 정보를 추출하고 제2 핵심 정보를 추출하는 방법은 단지 예시로서 본 개시의 이해를 돕기 위한 것이며, 본 개시는 관련 기술 중의 임의의 특징 추출 방법을 사용하여 제1 핵심 정보 및 제2 핵심 정보를 추출할 수 있으며, 본 개시는 이에 대해 한정하지 않는다.

동작S250에서, 목표 대상에 대한 목표 핵심 정보를 결정하며, 제1 핵심 정보 중의 제2 핵심 정보에 매칭되는 정보를 목표 핵심 정보로 결정하는 것을 포함한다.

본 개시의 실시예에 따르면, 제1 핵심 정보 중의 제2 핵심 정보와 동일한 정보를 목표 핵심 정보로 할 수 있다. 예를 들어, 제1 핵심 정보가 "가수-장삼(張三)"을 포함하고, 제2 핵심 정보가 "장삼(張三)"을 포함하면, 제1 핵심 정보인 "가수-장삼(張三)"을 목표 핵심 정보로 결정할 수 있다. 또는 제1 핵심 정보 중의 제2 핵심 정보가 지시하는 유형에 속한 엔티티 단어를 목표 핵심 정보로 할 수 있다. 예를 들어, 만약 제1 핵심 정보가 엔티티 단어인 "코기"를 포함하고, 제2 핵심 정보가 "개"를 포함할 경우, 상기 제1 핵심 정보 중의 "코기"를 목표 핵심 정보로 결정할 수 있다.

본 개시의 실시예에 따르면, 우선 각 제1 핵심 정보와 제2 핵심 정보 중의 각 핵심 정보 사이의 유사도를 결정할 수 있다. 어느 제2 핵심 정보와의 유사도가 제1 소정 값보다 큰 제1 핵심 정보를 목표 핵심 정보로 결정한다. 핵심 정보 상이의 유사도는 아래의 임의의 파라미터 형식, 즉 코사인 유사도, 피어슨 상관 계수, 자카드 유사 계수 등을 사용하여 구현할 수 있다. 제1 소정 값은 실제 수요에 따라 설정할 수 있으며, 예를 들어 0.7 등으로 설정할 수 있으며, 본 개시는 이에 대해 한정하지 않는다.

동작S270에서, 소정 미디어 라이브러리에서 목표 핵심 정보에 매칭되는 제1 멀티미디어 정보를 검색한다.

본 개시의 실시예에 따르면, 소정 미디어 라이브러리에는 동영상 정보, 오디오 정보, 텍스트 정보 등 다양한 유형의 멀티미디어 정보가 유지될 수 있으며, 상기 소정 미디어 라이브러리 중의 멀티미디어 정보는 동영상 플랫폼, 내용 인터랙션 플랫폼, 뉴스 소식 및 쇼핑 플랫폼 등으로부터 유래된다. 상기 소정 미디어 라이브러리 중의 멀티미디어 정보는 단일 모드의 정보（예를 들어 단순한 텍스트 정보, 단순한 이미지 정보 등）일 수 있으며, 멀티 모드의 정보（예를 들어 텍스트-이미지 조합의 정보 등）일 수 있다.

이 실시예는 제1 멀티미디어 정보를 검색할 때, 소정 미디어 라이브러리 중의 목표 핵심 정보를 라벨로 하는 멀티미디어 정보를 제1 멀티미디어 정보로 할 수 있다. 또는, 이 실시예는 목표 핵심 정보와 소정 미디어 라이브러리 중의 각 멀티미디어 정보의 설명 정보 사이의 유사도를 결정하며, 설명 정보와 목표 핵심 정보의 유사도가 제2 소정 값보다 큰 멀티미디어 정보를 제1 멀티미디어 정보로 할 수 있다. 제2 소정 값은 위에서 설명한 제1 소정 값과 동일하거나 상이할 수 있다. 예를 들어, 상기 제2 소정 값은 0.5 등일 수 있으며, 본 개시는 실제 수요에 따라 제2 소정 값을 선택할 수 있다.

동작S290에서, 제1 멀티미디어 정보를 기반으로, 목표 핵심 정보에 대한 제1 댓글 자막을 생성하여, 동영상 데이터를 재생하는 동시에 제1 댓글 자막을 전시하도록 한다.

본 개시의 실시예에 따르면, 제1 멀티미디어 정보를 얻은 후, 이 제1 멀티미디어 정보를 목표 대상에 대한 추천 정보로 하며, 상기 추천 정보를 기반으로 얻은 댓글 자막을 목표 핵심 정보에 대한 제1 댓글 자막으로 한다. 추천 정보의 표제, 추천 정보의 요약 또는 추천 정보에서 추출한 키워드 등을 제1 댓글 자막 내용으로 하며, 이 제1 댓글 자막 내용 및 추천 정보의 링크(예를 들어 전시 페이지 주소)를 제1 댓글 자막으로 구성할 수 있다. 따라서, 제1 댓글 자막은 목표 대상에 대한 추천 정보의 링크를 포함한다. 추천 정보가 제1 멀티미디어 정보만 포함하면, 상기 제1 댓글 자막은 제1 멀티미디어 정보의 전시 페이지 주소를 포함할 수 있으며, 추천 정보가 복수의 정보를 포함하면, 제1 댓글 자막이 포함하는 전시 페이지 주소는 복수의 정보가 배열되어 조성된 추천 페이지의 주소일 수 있다.

상기와 같이 종합하여 분석하면, 본 개시의 실시예는 동영상 데이터의 내용 정보 및 목표 대상의 속성 정보를 기반으로 목표 대상에 대한 목표 핵심 정보를 결정하며, 상기 목표 핵심 정보를 기반으로 멀티미디어 정보를 검색하며, 멀티미디어 정보의 링크를 포함하는 댓글 자막을 생성하며, 동영상 데이터를 재생할 때, 댓글 자막의 형식으로 목표 대상에게 정보를 추천할 수 있다. 이로써 추천 정보의 전시 형식을 풍부화시키고, 댓글 자막의 기능을 확장시키며, 정보의 클릭률을 일정 정도 향상시킬 수 있다.

도 3은 본 개시의 실시예에 따른 목표 핵심 정보를 결정하는 원리 예시도이다.

도 3에서 도시한 바와 같이, 이 실시예(300)에서, 목표 핵심 정보를 결정할 때, 제2 핵심 정보(320)와 제1 핵심 정보(310)를 비교함으로써, 제1 핵심 정보(310) 중의 제2 핵심 정보에 매칭되는 정보(311)를 결정하는 것 외에, 상기 매칭되는 정보(311)가 속한 분야와 관련된 목표 분야(331)로부터 매칭되는 정보(311)에 관련된 단어를 획득하며, 상기 단어를 매칭되는 정보(311)와 함께 목표 핵심 정보(350)로 구성한다.

예시적으로, 본 개시는 소정 어휘 베이스(340)가 유지되어 있으며, 상기 소정 어휘 베이스(340)는 복수의 소정 분야(330) 중의 단어를 포함한다. 이 실시예는 우선 매칭되는 정보(311)가 속한 분야를 결정한 다음, 복수의 소정 분야(330)에서 매칭되는 정보(311)가 속한 분야에 관련된 분야를 결정하여, 목표 분야(331)를 얻을 수 있다. 목표 분야(331)를 결정한 후, 소정 어휘 베이스(340)에서 상기 목표 분야(331)에 속하고, 매칭되는 정보와 관련된 단어(즉 목표 분야에 속한 단어(341))를 선택하며, 이 선택된 단어를 목표 핵심 정보(350)로 결정한다. 매칭되는 정보(311)가 속한 분야는 상기 매칭되는 정보(311)가 포함하는 단어가 속한 분야이며, 상기 속한 분야는 복수의 소정 분야(330) 중의 하나일 수 있다.

예시적으로, 소정 분야는 교통 분야, 에너지 분야, 식품 분야, 오락 분야 등을 포함할 수 있다. 목표 핵심 정보가 교통 분야에 속한 자동차를 포함하면, 결정된 목표 분야는 에너지 분야 등을 포함할 수 있으며, 소정 어휘 베이스에서 선택한 단어는 예를 들어 리튬 배터리 등을 포함할 수 있다.

예시적으로, 목표 분야를 결정할 때, 매칭되는 정보(311)에서 엔티티 단어를 선택하여, 엔티티 단어가 지시하는 엔티티와 관련된 분야를 목표 분야로 결정한다. 소정 어휘 베이스에서 단어를 선택할 때, 엔티티 단어만 선택할 수 있다.

상기 실시예가 목표 핵심 정보를 결정할 때, 또한 매칭되는 정보와 관련된 분야에서 목표 핵심 정보를 선택하므로, 결정된 목표 핵심 정보를 기반으로 검색된 멀티미디어 정보의 다양성을 향상시킴으로써, 추천 유효성을 향상시킬 수 있다.

도 4는 본 개시의 실시예에 따른 댓글 자막을 생성하는 방법의 원리 예시도이다.

도 4에서 도시한 바와 같이, 이 실시예(400)에서, 생성된 댓글 자막은 제1 댓글 자막(460) 및 제2 댓글 자막(490)을 포함할 수 있다. 제1 댓글 자막(460)은 상기 설명한 댓글 자막의 생성 흐름과 유사한 흐름을 사용하여 생성된다. 예를 들어, 동영상 데이터의 내용 정보(410) 및 목표 대상의 속성 정보(420)에 따라 목표 핵심 정보(430)를 결정하며, 상기 목표 핵심 정보(430)를 기반으로 소정 미디어 라이브러리(440)에서 제1 멀티미디어 정보(450)를 검색하며, 상기 제1 멀티미디어 정보(450)를 기반으로 제1 댓글 자막을 생성한다. 제2 댓글 자막은 아래의 흐름을 사용하여 생성될 수 있다. 즉, 소정 정보 베이스(470)에서 인기 정보(480)를 검색하며, 상기 인기 정보(480)를 기반으로, 인기 정보(480)에 대한 제2 댓글 자막(490)을 생성한다.

예시적으로, 인기 정보(480)의 표제, 요약 또는 키워드 등을 제2 댓글 자막 내용으로 하며, 상기 제2 댓글 자막 내용 및 인기 정보(480)의 링크(예를 들어 전시 페이지 주소)를 제2 댓글 자막으로 형성한다. 상기 인기 정보(480)는 전술한 제1 멀티미디어 정보와 함께 목표 대상에 대한 추천 정보를 구성한다.

예시적으로, 소정 정보 베이스(470)는 뉴스 플랫폼, 웨이보 플랫폼 등 멀티미디어 정보 플랫폼의 정보 베이스일 수 있다. 본 개시는 상기 멀티미디어 정보 플랫폼이 제공하는 API 인터페이스를 호출하여 인기 정보를 획득할 수 있다. 여기서, 인기 정보는 실효성 요구에 대해 요구가 보다 높은 정보이다.

상기와 같이 종합하여 분석하면, 본 개시의 실시예는 목표 대상의 속성 정보 및 동영상 데이터의 내용 정보를 기반으로 추천 정보를 검색하는 것 외에, 인기 정보도 추천 정보로 함으로써, 추천 정보의 다양성을 향상시키고, 추천 유효성을 향상시킬 수 있다.

본 개시의 실시예에 따르면, 결정된 목표 핵심 정보는 동영상 데이터 중의 목표 엔티티를 지시하는 목표 엔티티 단어를 포함하여, 목표 핵심 정보를 기반으로 제1 멀티미디어 정보의 리콜율을 향상시킬 수 있다.

본 개시의 실시예에 따르면, 제1 댓글 자막을 생성한 후, 제1 댓글 자막을 전시하는 시간대 정보를 설정하는 것을 통해 제1 댓글 자막과 목표 엔티티를 동시에 전시함을 보장함으로써, 제1 댓글 자막이 링크하는 추천 정보의 추천 효과를 향상시키며, 상기 추천 정보의 클릭률을 향상시킬 수 있다. 여기서, 목표 엔티티는 동영상 데이터 중의 제1 댓글 자막에 매칭되는 엔티티 단어가 지시하는 엔티티이다. 이 실시예는 제1 핵심 정보를 추출할 때, 엔티티 특징을 추출하는 것 외에, 목표 엔티티가 동영상 데이터 중에서 나타나는 시간대 정보를 목표 엔티티를 지시하는 엔티티 특징의 라벨로 할 수도 있다. 이로써, 목표 핵심 정보는 동영상 데이터 중의 목표 엔티티를 지시하는 목표 엔티티 단어를 포함하는 것 외에, 상기 목표 엔티티가 동영상 데이터에서 나타나는 시간대 정보를 포함할 수도 있다.

예시적으로, 상기 목표 엔티티가 동영상 데이터에서 나타나는 시간대 정보를 목표 엔티티 단어에 대한 제1 댓글 자막을 전시하는 시간대 정보로 할 수 있다. 여기서, 시간대 정보는 시작 시간 및 전시 시간 길이를 포함할 수 있다.

예시적으로, 생성된 제1 댓글 자막에서 목표 엔티티 단어에 대한 댓글 자막의 개수가 보다 많은 경우, 제1 댓글 자막 중의 목표 엔티티 단어에 대한 댓글 자막을 후보 댓글 자막으로 할 수도 있다. 목표 엔티티가 동영상 데이터에서 나타나는 시간 길이에 따라 전시 가능한 댓글 자막의 개수를 결정하며, 상기 후보 댓글 자막에서 전시 가능한 댓글 자막을 선택한다. 예를 들어, 댓글 자막 각각의 전시 시간 길이를 사전에 설정하며, 상기 전시 시간 길이와 목표 엔티티가 나타나는 시간 길이 사이의 크기 관계에 따라 전시 가능한 댓글 자막의 개수를 결정한다. 예를 들어, 목표 엔티티가 나타나는 시간 길이가 6s이며, 댓글 자막 각각의 전시 시간 길이는 2s이면, 전시 가능한 댓글 자막의 개수는 6/2=3개인 것으로 결정할 수 있다. 후보 댓글 자막에서 전시 가능한 댓글 자막을 선택할 때, 예를 들어 목표 엔티티와의 매칭률이 보다 높은 후보 댓글 자막을 선택하여 목표 엔티티와 동시에 전시하는 목표 댓글 자막으로 할 수 있다. 이로써, 목표 댓글 자막의 시간대 정보를 결정할 때, 상기 목표 엔티티가 동영상 데이터에서 나타나는 시간대 정보 중의 시작 시간을 목표 댓글 자막을 전시하는 시작 시간으로 할 수 있다. 목표 엔티티의 나타나는 시간 길이와 소정 시간 길이 중의 보다 작은 값을 목표 댓글 자막을 전시하는 시간 길이로 한다. 상기 소정 시간 길이를 설정함으로써, 사용자가 상기 목표 댓글 자막에 대해 관심이 없을 경우, 목표 댓글 자막이 장시간 전시됨으로 인해, 목표 대상에게 보다 나쁜 체험을 주는 것을 방지할 수 있다.

이해할 수 있는 것은, 목표 댓글 자막이 복수이면, 여기의 목표 댓글 자막을 전시하는 시작 시간은 복수의 목표 댓글 자막 중 맨 처음에 있는 목표 댓글 자막을 전시하는 시작 시간이다. 예를 들어, 소정 시간 길이가 전술한 2s이고, 목표 엔티티의 나타나는 시간 길이가 6s이며, 목표 댓글 자막이 3개이고, 목표 엔티티가 나타나는 시작 시간이 t이면, 3개 목표 댓글 자막 중 첫 번째 목표 댓글 자막을 전시하는 시작 시간이 t이고, 시간 길이가 2s이다. 3개 목표 댓글 자막 중 두 번째 목표 댓글 자막을 전시하는 시작 시간이 t+2s이고, 시간 길이가 2s이며, 3개 목표 댓글 자막 중 세 번째 목표 댓글 자막을 전시하는 시작 시간이 t+4s이고, 시간 길이가 2s이다.

본 개시의 실시예에 따르면, 댓글 자막을 생성하는 방법이 제1 댓글 자막을 생생할 뿐만 아니라, 전술한 제2 댓글 자막도 생성할 경우, 목표 대상의 선호도에 따라 제1 댓글 자막 및 제2 댓글 자막의 전시 비율을 결정하며, 상기 전시 비율에 따라 최종적으로 전시하는 목표 댓글 자막을 결정할 수 있다. 전술한 목표 대상의 속성 정보는 인기 정보에 대한 상기 목표 대상의 선호도를 포함할 수 있다. 상기 선호도는 목표 대상이 브라우징한 인기 정보의 개수가 브라우징한 모든 정보의 개수에서 점하는 비율에 의해 표시될 수 있다. 이 실시예는 상기 선호도를 제2 댓글 자막의 전시 개수가 총 목표 댓글 자막의 총 전시 개수에서 점하는 비례값으로 하여, 제1 댓글 자막 및 제2 댓글 자막에서 목표 댓글 자막을 추출할 수 있다.

본 개시의 실시예에 따르면, 댓글 자막을 생성하는 방법은 제1 댓글 자막을 생성할 뿐만 아니라, 전술한 제2 댓글 자막도 생성하며, 제1 댓글 자막과 상기 제1 댓글 자막이 대한 목표 엔티티 단어에 의해 지시되는 엔티티를 동시에 전시할 필요가 있을 경우, 목표 엔티티 단어에 대한 제1 댓글 자막을 전시하는 동시에, 전술한 선호도에 따라 일정 개수의 제2 댓글 자막을 전시함으로써, 댓글 자막 링크의 정보의 다양성 및 클릭률을 향상시킬 수 있다. 아래에서는 도 5를 결부하여, 상기 경우에 댓글 자막을 생성하는 방법에 대해 설명하도록 한다.

도 5는 본 개시의 다른 실시예에 따른 댓글 자막을 생성하는 방법의 원리 예시도이다.

도 5에서 도시한 바와 같이, 이 실시예(500)의 댓글 자막을 생성하는 방법은 제1 댓글 자막 및 제2 댓글 자막(520)을 생성한 후, 우선 제1 댓글 자막에서 목표 엔티티 단어에 대한 후보 댓글 자막(510)을 선택할 수 있다. 후보 댓글 자막(510)을 선택하여 얻은 후, 상기 후보 댓글 자막(510) 및 제2 댓글 자막(520)을 목표 댓글 자막(530)을 선택하는 댓글 자막 풀로 구성한다.

본 개시의 실시예에 따르면, 댓글 자막 풀에서 제2 댓글 자막(520) 및 후보 댓글 자막(510)의 개수가 보다 많을 경우, 목표 엔티티가 동영상 데이터에서 나타나는 시간대 내에서, 상기 댓글 자막 풀 중의 댓글 자막은 모두 전시될 수 없다. 이 실시예는 상기 댓글 자막 풀에서 전시 가능한 댓글 자막을 선택하여, 목표 댓글 자막(530)으로 한다. 목표 댓글 자막(530)을 선택할 때, 이 실시예는 우선 목표 엔티티의 시간대 정보(540)를 기반으로, 전시 가능한 댓글 자막의 개수(550)를 결정할 수 있다. 다음, 선호도(560)에 따라, 후보 댓글 자막의 전시 개수 및 제2 댓글 자막의 전시 개수의 비례값(570)을 결정한다. 비례값(570)을 결정한 후, 상기 비례값(570) 및 전시 가능한 댓글 자막의 개수(550)에 따라, 댓글 자막 풀에서 목표 댓글 자막(530)을 선택한다. 선택하여 얻은 목표 댓글 자막(530) 중의 제2 댓글 자막의 비례는 선호도(560)와 동일할 수 있다.

목표 댓글 자막(530)을 얻은 후, 목표 엔티티의 시간대 정보(540)에 따라 목표 댓글 자막을 전시하는 시간대 정보(580)를 결정할 수 있다. 상기 목표 댓글 자막을 전시하는 시간대 정보(580)를 목표 댓글 자막(530)의 라벨로 하면, 바로 동영상 데이터가 가진 댓글 자막 정보(590)를 얻을 수 있다. 상기 동영상 데이터가 가진 댓글 자막 정보(590)는 동영상 데이터와 함께 압축되어 데이터 패킷을 얻을 수 있으며, 단말 기기가 동영상 데이터의 획득을 요청할 때, 상기 데이터 패킷을 피드백 정보로 하여 단말 기기에 피드백한다.

예시적으로, 동영상 데이터가 가진 댓글 자막 정보(590)를 얻은 후, 예를 들어 상기 동영상 데이터가 가진 댓글 자막 정보(590)를 블록체인의 공유 장부에 저장할 수도 있으며, 목표 대상에게 정보를 추천할 필요가 있을 때, 블록체인의 공유 장부에서 상기 동영상 데이터가 가진 댓글 자막 정보(590)를 추출하여, 단말 기기에 제공하며, 단말 기기가 동영상 데이터를 전시하는 동시에 상기 댓글 자막 정보를 전시할 수 있도록 한다.

본 개시의 실시예에 따르면, 목표 댓글 자막을 얻은 후, 상기 목표 엔티티가 동영상 데이터에서 나타나는 시간대 정보 중의 시작 시간을 목표 댓글 자막을 전시하는 시작 시간으로 할 수 있다. 목표 엔티티의 나타나는 시간 길이와 소정 시간 길이 중 보다 작은 값을 목표 댓글 자막을 전시하는 시간 길이로 할 수 있다.

이해할 수 있는 것은, 이 실시예에서 선호도를 기반으로 댓글 자막을 선택하고 목표 댓글 자막의 시간대 정보를 결정하는 방법은 앞에서 설명한 방법과 유사하므로, 여기서는 중복 설명하지 않도록 한다.

도 6은 본 개시의 실시예에 따른 추천 정보가 인터랙션 동작에 대해 응답하는 예시도이다.

본 개시의 실시예에 따르면, 제1 댓글 자막을 생성할 때, 상기 제1 댓글 자막을 통해 목표 대상에게 제1 멀티미디어 정보를 추천할 수 있는 것 외에, 예를 들어 지식 그래프를 통해 목표 핵심 정보 중의 목표 엔티티 단어와 관련된 멀티미디어 정보를 발굴하며, 목표 대상에게 상기 관련된 멀티미디어 정보를 추천함으로써, 목표 대상에게 더 풍부한 정보를 나아가 추천할 수 있다.

예시적으로, 전술한 목표 핵심 정보는 동영상 데이터 중의 복수의 목표 엔티티를 각각 지시하는 복수의 목표 엔티티 단어를 포함하며, 복수의 목표 엔티티 단어 중의 목표 엔티티 단어 각각에 대한 제1 댓글 자막의 개수는 적어도 하나이다. 이 실시예의 댓글 자막을 생성하는 방법은 소정 지식 그래프를 기반으로, 목표 엔티티 단어 각각과 관련된 제2 멀티미디어 정보를 결정하는 동작을 더 포함한다. 상기 제2 멀티미디어 정보를 얻은 후, 상기 제2 멀티미디어 정보 및 목표 엔티티 단어 각각에 매칭되는 제1 멀티미디어 정보를 기반으로 추천 정보를 생성할 수 있다.

예시적으로, 제2 멀티미디어 정보의 표제 및 목표 엔티티 단어 각각에 매칭되는 제1 멀티미디어 정보의 표제를 배열하여 추천 페이지를 형성하며, 상기 추천 페이지를 추천 정보로 할 수 있다. 배열 순서는 멀티미디어 정보와 목표 엔티티 단어의 매칭정도에 따라 설정할 수 있다. 또는, 목표 엔티티 단어 각각에 매칭되는 제1 멀티미디어 정보를 제1 위에 배열하고, 제2 멀티미디어 정보를 제1 위 뒤에 랜덤으로 배열할 수 있다. 이로써, 제1 댓글 자막이 목표 대상에 대한 추천 정보의 링크를 포함하므로, 단말 기기가 제1 댓글 자막을 전시한 후, 바로 상기 제1 댓글 자막에 대한 클릭 동작에 응답하여, 추천 페이지로 이동한다.

예시적으로, 도 6에서 도시한 실시예(600)와 같이, 동영상 데이터에서 나타나는 엔티티가 가수"장삼"을 포함하면, 단말 기기는 동영상이 "장삼"의 화면(610)까지 재생할 때, 화면(610)에서 "장삼"에 대한 댓글 자막(611)인 "XX년 X월 X일 생, 가수#장삼"을 전시하면 된다. 상기 댓글 자막(611)에 대한 클릭 동작에 응답하여, 상기 단말 기기의 전시 페이지는 예를 들어 페이지(620)로 변환되며, 상기 페이지(620)에는, "장삼"에 매칭되는 제1 멀티미디어 정보인 "장삼"의 백과 정보(621) 외에, 백과 정보(621)와 관련된 "장삼"의 작품 정보(622)（예를 들어 사진, 음악 및 동영상 등을 포함할 수 있음）, 및 "장삼"과 관련된 "장삼의 회사"의 동적 정보(623)도 포함할 수 있다.

본 개시의 실시예에 따르면, 소정 지식 그래프를 기반으로 제2 멀티미디어 정보를 결정할 때, 예를 들어 우선 소정 지식 그래프 중의 목표 엔티티를 지시하는 노드를 위치 결정한 다음, 이 노드를 시작점으로 하여, 이 노드와 기타 노드의 연결 관계에 따라 확산하여, n차의 확산 후에 얻은 노드가 지시하는 멀티미디어 정보를 제2 멀티미디어 정보로 할 수 있다. 상기 소정 지식 그래프 중의 노드는 엔티티를 지시하는 노드 및 멀티미디어 정보를 지시하는 노드를 포함하며, 구체적으로, 상기 소정 지식 그래프는 아래에서 설명하는 방법을 사용하여 구축할 수 있으며, 여기서는 중복 설명하지 않도록 한다. 여기서, n의 값은 실제 수요에 따라 설정할 수 있으며, 예를 들어, n은 2보다 크거나 같은 자연수이며, 본 개시는 이에 대해 한정하지 않는다.

본 개시의 실시예에 따르면, 추천 정보를 생성할 때, 예를 들어 소정 정보 베이스에서 목표 엔티티의 이미지를 랜덤으로 획득하며, 상기 이미지에 대해 스마트 클리핑 및 스마트 컬러 채색을 진행하며, 전술한 제1 멀티미디어 정보 및 제2 멀티미디어 정보를 배열하여 형성한 전시 페이지의 헤드 맵 및 배경색을 생성함으로써, 추천 정보의 미관도를 향상시킬 수 있다.

본 개시의 실시예에 따르면, 전술한 방법을 통해 제1 댓글 자막 및/또는 제2 댓글 자막을 생성한 후, 이 실시예의 댓글 자막을 생성하는 방법은 댓글 자막 각각의 전시 방식을 설정할 수 있다. 예를 들어 댓글 자막의 전시 위치 및 전시 형식을 설정하여, 상기 생성된 댓글 자막을 전시할 때, 생성된 댓글 자막과 발표된 댓글 자막을 구분하도록 한다. 예를 들어, 발표된 댓글 자막이 동영상 데이터의 동영상 프레임 중의 상부 영역에 전시되면, 상기 생성된 댓글 자막은 동영상 데이터의 동영상 프레임 중의 하부 영역 또는 측부 영역에 전시될 수 있다. 또는, 상기 생성된 댓글 자막에 대해 보다 큰 전시 글자체 등을 설정할 수 있다. 일 실시예에서, 댓글 자막을 생성할 때, 댓글 자막에 식별자로서의 내용을 추가하며, 상기 식별자는 오각별, 삼각형, 이모티콘 등 그래픽 정보일 수 있다.

도 7은 본 개시의 실시예에 따른 구축된 소정 지식 그래프의 구조 예시도이다.

상기 실시예의 댓글 자막을 생성하는 방법은 소정 지식 그래프를 구축하는 동작을 더 포함할 수도 있다. 상기 소정 지식 그래프를 구축하는 동작은 우선 소정 어휘 베이스에서 목표 엔티티 단어와 관련된 엔티티 단어를 검색하며, 복수의 목표 엔티티 단어에 대한 관련 엔티티 단어를 얻는다. 관련 엔티티 단어를 얻은 후, 위에서 설명한 소정 미디어 라이브러리에서 관련 엔티티 단어에 매칭되는 제3 멀티미디어 정보를 검색한다. 목표 엔티티 단어에 매칭되는 제1 멀티미디어 정보 및 관련 엔티티 단어에 매칭되는 제3 멀티미디어 정보를 얻은 후, 관련 엔티티 단어, 복수의 목표 엔티티 단어, 제1 멀티미디어 정보 및 제3 멀티미디어 정보를 각각 지시하는 복수의 노드를 구축하며, 복수의 목표 엔티티 단어와 관련 엔티티 단어 사이의 관련 관계, 복수의 목표 엔티티 단어와 제1 멀티미디어 정보 사이의 매칭 관계 및 관련 엔티티 단어와 제3 멀티미디어 정보 사이의 매칭 관계를 기반으로, 복수의 노드 사이의 연결 변을 구축하여, 소정 지식 그래프를 얻을 수 있다.

예시적으로, 도 7에서 도시한 바와 같이, 상기 실시예에서 구축하여 얻은 지식 그래프(700)는 적어도 목표 엔티티 단어A1를 지시하는 노드(711), 목표 엔티티 단어A1과 관련된 엔티티 단어a1을 지시하는 노드(712), 목표 엔티티 단어A1에 매칭되는 제1 멀티미디어 정보를 지시하는 노드（지시 정보B1의 노드(721) 및 지시 정보B2의 노드(722)를 포함）, 및 엔티티 단어a1에 매칭되는 제3 멀티미디어 정보를 지시하는 노드（지시 정보b1의 노드(723), 지시 정보b2의 노드(724) 및 지시 정보b3의 노드(725)를 포함）를 포함할 수 있다. 소정 지식 그래프를 기반으로, 제2 멀티미디어 정보를 결정할 때, 우선 노드(711)를 위치 결정하여 얻을 수 있다. 다음 노드(711)를 시작점으로 하여, 노드(711)에 연결된 변에 따라, 외측으로 한 스텝 이동하여, 노드(721), 노드(722) 및 노드(712)를 얻으며, 제1차의 확산을 완성한다. 다음, 노드(721), 노드(722) 및 노드(712)를 시작점으로 하여, 외측으로 한 스텝 이동하여, 노드(723), 노드(724) 및 노드(725)를 얻으며, 제2차의 확산을 완성하며, 이와 같이 유추하여, n차 확산을 완성한다. 확산하여 얻은 모든 노드가 지시하는 정보 중의 멀티미디어 정보를 제2 멀티미디어 정보로 한다. 이 실시예에서, 제2 멀티미디어 정보는 적어도 정보b1, 정보b2 및 정보b3을 포함한다.

본 개시의 실시예에 따르면, 상기 소정 지식 그래프를 구축할 때, 예를 들어 소정 정보 베이스 중의 그림과 물자, 질문과 대답, 동영상, 뉴스, 백과, 음악, 게시물, 라이브러리, 생방송 및 인기 리스트 등 다양한 상이한 유형의 정보를, 전술한 제1 멀티미디어 정보 및 제3 멀티미디어 정보 사이의 관련성에 따라, 모두 상기 소정 지식 그래프에 융합하여, 지식 그래프를 기반으로 얻은 제2 멀티미디어 정보를 풍부화시킬 수 있다.

이해할 수 있는 것은, 도 7 중의 지식 그래프(700)는 기타 엔티티 단어, 및 상기 기타 엔티티 단어에 매칭되는 멀티미디어 정보, 및 멀티미디어 정보에 관련된 기타 멀티미디어 정보 등을 포함할 수도 있다. 예를 들어, 도 7 중의 지식 그래프(700)는 적어도 엔티티 단어A2를 지시하는 노드(713)를 포함할 수도 있으며, 정보b3은 상기 엔티티 단어A2와 매칭된다.

도 8은 본 개시의 실시예에 따른 댓글 자막을 생성하는 장치의 구조 블록도이다.

도 8에서 도시한 바와 같이, 상기 실시예의 댓글 자막을 생성하는 장치(800)는 정보 획득 모듈(810), 정보 추출 모듈(830), 핵심 정보 결정 모듈(850), 제1 정보 검색 모듈(870) 및 댓글 자막 생성 모듈(890)을 포함할 수 있다.

정보 획득 모듈(810)은 동영상 데이터의 내용 정보 및 목표 대상의 속성 정보를 추출하기 위한 것이다. 일 실시예에서, 정보 획득 모듈(810)은 전술한 동작S210을 실행하기 위한 것이며, 여기서는 중복 설명하지 않도록 한다.

정보 추출 모듈(830)은 내용 정보의 제1 핵심 정보를 추출하고, 속성 정보의 제2 핵심 정보를 추출하기 위한 것이다. 일 실시예에서, 정보 추출 모듈(830)은 전술한 동작S230을 실행하기 위한 것이며, 여기서는 중복 설명하지 않도록 한다.

핵심 정보 결정 모듈(850)은 목표 대상에 대한 목표 핵심 정보를 결정하기 위한 것이며, 제1 핵심 정보 중의 제2 핵심 정보에 매칭되는 정보를 목표 핵심 정보로 결정하는 것을 포함한다. 일 실시예에서, 핵심 정보 결정 모듈(850)은 전술한 동작S250을 실행하기 위한 것이며, 여기서는 중복 설명하지 않도록 한다.

제1 정보 검색 모듈(870)은 소정 미디어 라이브러리에서 목표 핵심 정보에 매칭되는 제1 멀티미디어 정보를 검색하기 위한 것이다. 일 실시예에서, 제1 정보 검색 모듈(870)은 전술한 동작S270을 실행하기 위한 것이며, 여기서는 중복 설명하지 않도록 한다.

댓글 자막 생성 모듈(890) 제1 멀티미디어 정보를 기반으로, 목표 핵심 정보에 대한 제1 댓글 자막을 생성하여, 동영상 데이터를 재생하는 동시에 제1 댓글 자막을 전시하도록 하기 위한 것이다. 일 실시예에서, 댓글 자막 생성 모듈(890)은 전술한 동작S290을 실행하기 위한 것이며, 여기서는 중복 설명하지 않도록 한다.

본 개시의 실시예에 따르면, 상기의 핵심 정보 결정 모듈은 소정 분야에서 매칭되는 정보와 관련된 분야를 목표 분야로 하는데도 사용된다. 다음 소정 어휘 베이스에서 목표 분야에 속하고 매칭되는 정보와 관련된 단어를 목표 핵심 정보로 결정한다.

본 개시의 실시예에 따르면, 상기의 댓글 자막을 생성하는 장치(800)는 소정 정보 베이스에서 인기 정보를 검색하기 위한 제2 정보 검색 모듈을 더 포함한다. 전술한 댓글 자막 생성 모듈은 인기 정보에 대한 제2 댓글 자막을 생성하여, 동영상 데이터를 재생하는 동시에 제2 댓글 자막을 전시하도록 하는데도 사용된다. 여기서, 제2 댓글 자막은 인기 정보의 링크를 포함한다.

본 개시의 실시예에 따르면, 목표 핵심 정보는 동영상 데이터 중의 목표 엔티티를 지시하는 목표 엔티티 단어 및 목표 엔티티가 동영상 데이터에서 나타나는 시간대 정보를 포함할 수 있다. 상기 댓글 자막을 생성하는 장치(800)는 후보 댓글 자막 결정 모듈, 개수 결정 모듈, 목표 댓글 자막 결정 모듈 및 시간 정보 결정 모듈을 더 포함한다. 후보 댓글 자막 결정 모듈은 제1 댓글 자막 중의 목표 엔티티 단어의 댓글 자막을 결정하여, 후보 댓글 자막으로 하기 위한 것이다. 개수 결정 모듈은 목표 엔티티가 동영상 데이터에서 나타나는 시간대 정보를 기반으로, 전시 가능한 댓글 자막의 개수를 결정하기 위한 것이다. 목표 댓글 자막 결정 모듈은 전시 가능한 댓글 자막의 개수 및 후보 댓글 자막을 기반으로, 목표 댓글 자막을 결정하기 위한 것이다. 시간 정보 결정 모듈은 목표 엔티티가 동영상 데이터에서 나타나는 시간대 정보를 기반으로, 목표 댓글 자막을 전시하는 시간대 정보를 결정하기 위한 것이다.

본 개시의 실시예에 따르면, 상기 속성 정보는 인기 정보에 대한 목표 대상의 선호도를 포함한다. 상기 후보 댓글 자막의 개수는 복수이며, 제2 댓글 자막의 개수는 복수이다. 상기 목표 댓글 자막 결정 모듈은 비례값 결정 서브 모듈 및 댓글 자막 결정 서브 모듈을 포함한다. 비례값 결정 서브 모듈은 선호도를 기반으로, 후보 댓글 자막의 전시 개수와 제2 댓글 자막의 전시 개수의 비례값을 결정한다. 댓글 자막 결정 서브 모듈은 비례값 및 전시 가능한 댓글 자막의 개수를 기반으로, 후보 댓글 자막 및 제2 댓글 자막 중의 목표 댓글 자막을 결정한다.

본 개시의 실시예에 따르면, 상기 목표 엔티티가 동영상 데이터에서 나타나는 시간대 정보는 목표 엔티티의 나타나는 시간 길이 및 목표 엔티티가 나타나는 시작 시간을 포함한다. 상기 시간 정보 결정 모듈은 시작 시간 결정 서브 모듈 및 시간 길이 결정 서브 모듈을 포함한다. 시작 시간 결정 서브 모듈은 목표 댓글 자막을 전시하는 시작 시간을 목표 엔티티가 나타나는 시작 시간으로 결정하기 위한 것이다. 시간 길이 결정 서브 모듈은 목표 댓글 자막을 전시하는 시간 길이가 목표 엔티티의 나타나는 시간 길이 및 소정 시간 길이 중의 보다 작은 값으로 결정한다.

본 개시의 실시예에 따르면, 상기 목표 핵심 정보는 동영상 데이터 중의 복수의 목표 엔티티를 각각 지시하는 복수의 목표 엔티티 단어를 포함하며, 복수의 목표 엔티티 단어 중의 각각에 대한 목표 엔티티 단어의 제1 댓글 자막의 개수는 적어도 하나이다. 상기 댓글 자막을 생성하는 장치(800)는 멀티미디어 정보 결정 모듈 및 추천 정보 생성 모듈을 더 포함한다. 멀티미디어 정보 결정 모듈은 목표 엔티티 단어 각각에 대해, 소정 지식 그래프를 기반으로, 목표 엔티티 단어 각각과 관련된 제2 멀티미디어 정보를 결정하기 위한 것이다. 추천 정보 생성 모듈은 제2 멀티미디어 정보 및 목표 엔티티 단어 각각에 매칭되는 제1 멀티미디어 정보를 기반으로, 추천 정보를 생성하기 위한 것이다.

본 개시의 실시예에 따르면, 상기 댓글 자막을 생성하는 장치(800)는 소정 지식 그래프를 구축하기 위한 그래프 구축 모듈을 더 포함한다. 상기 그래프 구축 모듈은 관련 단어 검색 서브 모듈, 정보 검색 서브 모듈, 노드 구축 서브 모듈 및 변 구축 서브 모듈을 포함한다. 관련 단어 검색 서브 모듈은 소정 어휘 베이스에서 목표 엔티티 단어 각각과 관련된 엔티티 단어를 검색하여, 복수의 목표 엔티티 단어의 관련 엔티티 단어를 얻기 위한 것이다. 정보 검색 서브 모듈은 소정 미디어 라이브러리에서 관련 엔티티 단어에 매칭되는 제3 멀티미디어 정보를 검색하기 위한 것이다. 노드 구축 서브 모듈은 관련 엔티티 단어, 복수의 목표 엔티티 단어, 제1 멀티미디어 정보 및 제3 멀티미디어 정보를 각각 지시하는 복수의 노드를 구축하기 위한 것이다. 변 구축 서브 모듈은 복수의 목표 엔티티 단어와 관련 엔티티 단어 사이의 관련 관계, 복수의 목표 엔티티 단어와 제1 멀티미디어 정보 사이의 매칭 관계 및 관련 엔티티 단어와 제3 멀티미디어 정보 사이의 매칭 관계를 기반으로, 복수의 노드 사이의 연결 변을 구축하여, 소정 지식 그래프를 얻기 위한 것이다.

설명해야 할 것은, 본 개시의 기술 방안에서, 관련된 사용자 개인 정보 획득, 저장 및 응용 등은 모두 관련 법률 및 법규의 규정에 부합되며, 공공질서 및 미풍양속을 위반하지 않는다.

본 개시의 실시예에 따르면, 본 개시는 전자 기기, 판독 가능 저장 매체 및 컴퓨터 프로그램 제품을 더 제공한다.

도 9는 본 개시의 실시예의 예시적 실시예를 구현하기 위한 전자 기기(900)의 예시적 블록도를 도시하였다. 전자 기기는 랩톱 컴퓨터, 데스크톱 컴퓨터, 워크 스테이션, 개인 휴대 정보 단말기, 서버, 블레이드 서버, 메인 프레임 컴퓨터 및 기타 적합한 컴퓨터와 같은 다양한 형태의 디지털 컴퓨터를 나타내기 위한 것이다. 전자 기기는 개인 휴대 정보 단말기, 셀룰러 폰, 스마트 폰, 웨어러블 기기 및 기타 유사한 컴퓨팅 장치와 같은 다양한 형태의 모바일 장치를 나타낼 수도 있다. 본문에 기재된 부재, 이들의 연결 및 관계, 및 이들의 기능은 단지 예시일 뿐이며, 본문에서 설명 및/또는 요구되는 본 개시의 구현을 제한하려는 것이 아니다.

도 9에서 도시한 바와 같이, 기기(900)는 컴퓨팅 유닛(901)을 포함하며, 이는 읽기 전용 기억 장치(ROM)(902)에 저장된 컴퓨터 프로그램 또는 저장 유닛(908)으로부터 랜덤 액세스 메모리(RAM)(903)에 로딩된 컴퓨터 프로그램에 의해, 다양한 적합한 동작 및 처리를 실행할 수 있다. RAM(903)에서, 기기(900)가 작동하는데 필요한 다양한 프로그램 및 데이터를 더 저장할 수 있다. 컴퓨팅 유닛(901), ROM(902) 및 RAM(903)은 버스(904)를 통해 서로 연결된다. 입력/출력(I/O) 인터페이스(905)도 버스(904)에 연결된다.

기기(900) 중의 복수의 부재는 I/O 인터페이스(905)에 연결되며, 키보드, 마우스 등과 같은 입력 유닛(906); 다양한 유형의 디스플레이, 스피커 등과 같은 출력 유닛(907); 자기 디스크, 광 디스크 등과 같은 저장 유닛(908); 및 네트워크 카드, 모뎀, 무선 통신 송수신기 등과 같은 통신 유닛(909)을 포함한다. 통신 유닛(909)은 기기(900)로 하여금 인터넷과 같은 컴퓨터 네트워크 및/또는 다양한 통신 네트워크를 통해 기타 기기와 정보/데이터를 교환하도록 허락한다.

컴퓨팅 유닛(901)은 다양한 처리 및 계산 능력을 가지는 범용 및/또는 전용 프로세싱 컴포넌트일 수 있다. 컴퓨팅 유닛(901)의 일부 예시는 중앙 처리 장치(CPU), 그래픽 처리 장치(GPU), 다양한 전용 인공 지능(AI) 컴퓨팅 칩, 머신 러닝 모델 알고리즘을 실행하는 다양한 컴퓨팅 유닛, 디지털 신호 처리 프로세서(DSP), 및 임의의 적합한 프로세서, 컨트롤러, 마이크로 컨트롤러 등을 포함하지만, 이에 제한되지 않는다. 컴퓨팅 유닛(901)은 상술한 각 방법 및 처리, 예를 들어 본 개시에 따른 댓글 자막을 생성하는 방법을 실행한다. 예를 들어, 일부 실시예에서, 댓글 자막을 생성하는 방법은 컴퓨터 소프트웨어 프로그램으로 구현될 수 있으며, 저장 유닛(908)과 같은 기계 판독 가능 매체에 유형적으로 저장될 수 있다. 일부 실시예에서, 컴퓨터 프로그램의 부분 또는 전부는 ROM(902) 및/또는 통신 유닛(909)에 경유해 기기(900) 상에 로딩되거나 장착될 수 있다. 컴퓨터 프로그램이 RAM(903)에 로딩되고 컴퓨팅 유닛(901)에 의해 실행될 경우, 상술한 댓글 자막을 생성하는 방법의 하나 또는 복수의 단계를 실행할 수 있다. 선택적으로, 기타 실시예에서, 컴퓨팅 유닛(901)은 기타 임의의 적합한 방식을 통해(예를 들어, 펌웨어에 의해) 댓글 자막을 생성하는 방법을 실행하도록 배치될 수 있다.

본문에서 이상 설명한 시스템 및 기술의 여러가지 실시 형태는 디지털 전자 회로 시스템, 집적 회로 시스템, 필드 프로그램 가능 게이트 어레이(FPGA), 전용 집적 회로(ASIC), 특정 용도 표준 제품(ASSP), 시스템 온 칩(SOC), 복합 프로그램 가능 논리 소자(CPLD), 컴퓨터 하드웨어, 펌웨어, 소프트웨어 및/또는 이들의 조합에서 구현할 수 있다. 이러한 여러가지 실시 형태는 하나 또는 복수의 컴퓨터 프로그램에서 실시되는 것을 포함할 수 있으며, 상기 하나 또는 복수의 컴퓨터 프로그램은 적어도 하나의 프로그램 가능 프로세서를 포함하는 프로그램 가능 시스템에서 실행 및/또는 해석될 수 있으며, 상기 프로그램 가능 프로세서는 전용 또는 범용 프로그램 가능 프로세서일 수 있으며, 저장 시스템, 적어도 하나의 입력 장치 및 적어도 하나의 출력 장치로부터 데이터 및 명령어를 수신할 수 있으며, 데이터 및 명령어를 상기 저장 시스템, 상기 적어도 하나의 입력 장치 및 상기 적어도 하나의 출력 장치에 전송할 수 있다.

본 개시의 방법을 실시하기 위한 프로그램 코드는 하나 또는 그 이상의 프로그래밍 언어의 임의의 조합을 사용하여 프로그래밍할 수 있다. 이 프로그램 코드들은 범용 컴퓨터, 전용 컴퓨터 또는 기타 프로그램 가능 데이터 처리 장치의 프로세서 또는 컨트롤러에 제공되어, 프로그램 코드가 프로세서 또는 컨트롤러에 의해 실행될 때 흐름도 및/또는 블록도에서 규정한 기능 및/또는 단계를 실시하도록 할 수 있다. 프로그램 코드는 전부 기계에서 실행, 부분적으로 기계에서 실행되고, 독립형 소프트웨어 패키지로서 부분적으로 기계에서 실행되고 부분적으로 원격 기계 상에서 실행 또는 전부 원격 기계 또는 서버에서 실행될 수 있다.

본 개시의 문맥에서, 기계 판독 가능 매체는 유형 매체일 수 있으며, 이는 명령어 실행 시스템, 장치 또는 기기가 사용하거나 명령어 실행 시스템, 장치 또는 기기와 결합하여 사용하기 위한 프로그램을 포함하거나 저장할 수 있다. 기계 판독 가능 매체는 기계 판독 가능 신호 매체 또는 기계 판독 가능 저장 매체 일 수 있다. 기계 판독 가능 매체는 전자, 자기, 광학, 전자기, 적외선 또는 반도체 시스템, 장치 또는 기기, 또는 이들의 임의의 적절한 조합을 포함할 수 있지만 이에 제한되지는 않는다. 기계 판독 가능 저장 매체의 보다 구체적인 예시로는 하나 또는 그 이상의 와이어를 기반으로 한 전기적 연결, 휴대용 컴퓨터 디스크, 하드 드라이브, 랜덤 액세스 메모리(RAM), 읽기 전용 메모리(ROM), 소거 가능 및 프로그램 가능 읽기용 기억 장치(EPROM 또는 플래시 메모리), 광섬유, 휴대용 컴팩트 디스크 읽기 전용 메모리(CD-ROM), 광학 저장 장치, 자기적 저장 장치 또는 이들의 임의의 적절한 조합을 포함한다.

사용자와의 대화를 제공하기 위하여, 컴퓨터 상에서 여기서 설명하는 시스템 및 기술을 실시할 수 있으며, 상기 컴퓨터는 사용자에게 정보를 표시하기 위한 디스플레이 장치(예를 들어 CRT(음극선관) 또는 LCD(액정 디스플레이) 모니터); 및 키보드와 지향 장치(예를 들어, 마우스 또는 트랙볼)를 구비하며, 사용자는 상기 키보드와 상기 지향 장치를 통해 컴퓨터에 입력을 제공할 수 있다. 기타 유형의 장치도 사용자와의 대화에 사용될 수 있으며, 예를 들어 사용자에게 제공된 피드백은 임의의 형식의 센싱 피드백(예를 들어, 시점적 피드백, 청각적 피드백 또는 촉각적 피드백)일 수 있으며, 임의의 형식(소리 입력, 음성 입력 또는 촉각 입력을 포함)으로 사용자로부터의 입력을 수신할 수 있다.

여기서 설명한 시스템 및 기술을 백그라운드 부재를 포함하는 컴퓨팅 시스템(예를 들어, 데이터 서버) 또는 미들웨어 부재를 포함하는 컴퓨팅 시스템(예를 들어, 애플리케이션 서버) 또는 프론트 엔드 부재를 포함하는 컴퓨팅 시스템(예를 들어, 그래픽 사용자 인터페이스 또는 네트워크 브라우저를 구비한 사용자 컴퓨터, 사용자는 상기 그래픽 사용자 인터페이스 또는 상기 네트워크 브라우저를 통해, 여기서 설명한 시스템 및 기술의 실시 형태와 대화할 수 있음), 또는 이러한 백그라운드 부재, 미들웨어 부재 또는 프론트 엔드 부재를 포함하는 임의의 조합의 컴퓨팅 시스템에서 실시할 수 있다. 임의의 형태 또는 매체의 디지털 데이터 통신(예를 들어, 통신 네트워크)을 통해 시스템의 부재를 서로 연결할 수 있다. 통신 네트워크의 예시로는 근거리 통신망(LAN), 광역 통신망(WAN) 및 인터넷을 포함한다.

컴퓨터 시스템은 클라이언트와 서버를 포함할 수 있다. 클라이언트와 서버는 일반적으로 서로 멀리 떨어져 있으며, 일반적으로 통신 네트워크를 통해 서로 인터랙션한다. 대응되는 컴퓨터에서 동작되고 서로 클라이언트-서버 관계를 가지는 컴퓨터 프로그램을 구비함으로써, 클라이언트와 서버의 관계를 발생한다.

이해해야 할 점은, 이상에서 설명한 여러 가지 형태의 과정을 사용하여, 순서를 다시 순서 배열, 증가 또는 삭제하는 단계들을 사용할 수 있다. 예를 들어, 본 개시에서 기재한 각 단계들은 병렬적으로 실행할 수도 있고 순차적으로 실행할 수도 있으며 상이한 순서로 실행할 수도 있는 바, 본 개시에서 개시한 기술적 해결 수단에서 기대하는 결과를 구현할 수만 있으면, 본문은 이에 대해 한정하지 않는다.

상기 구체적인 실시 형태는 본 개시의 보호 범위를 한정하지 않는다. 본 기술 분야에서 통상의 지식을 가진 자들은 설계 요구와 기타 요소에 근거하여 다양한 수정, 결합, 하위 결합 및 교체를 할 수 있다는 것을 이해해야 한다. 본 개시의 사상 및 원칙 내에서 진행한 임의의 수정, 균등한 교체 및 개선 등은 모두 본 개시의 보호 범위 내에 포함되어야 한다.

Claims

동영상 데이터의 내용 정보 및 목표 대상의 속성 정보를 획득하는 단계;
상기 내용 정보의 제1 핵심 정보를 추출하고, 상기 속성 정보의 제2 핵심 정보를 추출하는 단계;
상기 목표 대상에 대한 목표 핵심 정보를 결정하는 단계;
소정 미디어 라이브러리에서 상기 목표 핵심 정보에 매칭되는 제1 멀티미디어 정보를 검색하는 단계; 및
상기 제1 멀티미디어 정보를 기반으로, 상기 목표 핵심 정보에 대한 제1 댓글 자막을 생성하여, 상기 동영상 데이터를 재생하는 동시에 상기 제1 댓글 자막을 전시하도록 하는 단계를 포함하며,
여기서, 상기 목표 대상에 대한 목표 핵심 정보를 결정하는 단계는, 상기 제1 핵심 정보 중의 상기 제2 핵심 정보에 매칭되는 정보를 상기 목표 핵심 정보로 결정하는 단계를 포함하며,
상기 제1 댓글 자막은 상기 목표 대상에 대한 추천 정보의 링크를 포함하며, 상기 추천 정보는 상기 멀티미디어 정보를 포함하는
댓글 자막을 생성하는 방법.
제1항에 있어서,
상기 목표 대상에 대한 목표 핵심 정보를 결정하는 단계는,
소정 분야에서 상기 매칭되는 정보와 관련된 분야를 결정하여 목표 분야로 하는 단계; 및
소정 어휘 베이스 중의 상기 목표 분야에 속하고 상기 매칭되는 정보와 관련된 단어를 상기 목표 핵심 정보로 결정하는 단계를 더 포함하는
댓글 자막을 생성하는 방법.
제1항에 있어서,
소정 정보 베이스에서 인기 정보를 검색하는 단계; 및
상기 인기 정보에 대한 제2 댓글 자막을 생성하여, 상기 동영상 데이터를 재생하는 동시에 상기 제2 댓글 자막을 전시하도록 하는 단계를 더 포함하며,
여기서, 상기 제2 댓글 자막은 상기 인기 정보의 링크를 포함하는
댓글 자막을 생성하는 방법.
제1항 내지 제3항 중 어느 한 항에 있어서,
상기 목표 핵심 정보는 상기 동영상 데이터 중의 목표 엔티티를 지시하는 목표 엔티티 단어 및 상기 목표 엔티티 단어가 상기 동영상 데이터에서 나타나는 시간대 정보를 포함하며, 상기 방법은,
상기 제1 댓글 자막 중의 상기 목표 엔티티 단어에 대한 댓글 자막을 결정하여 후보 댓글 자막으로 하는 단계;
상기 목표 엔티티가 상기 동영상 데이터에서 나타나는 시간대 정보를 기반으로, 전시 가능한 댓글 자막의 개수를 결정하는 단계;
상기 전시 가능한 댓글 자막의 개수 및 상기 후보 댓글 자막을 기반으로, 목표 댓글 자막을 결정하는 단계; 및
상기 목표 엔티티가 상기 동영상 데이터에서 나타나는 시간대 정보를 기반으로, 상기 목표 댓글 자막을 전시하는 시간대 정보를 결정하는 단계를 더 포함하는
댓글 자막을 생성하는 방법.
제4항에 있어서,
상기 속성 정보는 상기 인기 정보에 대한 상기 목표 대상의 선호도를 포함하며, 상기 후보 댓글 자막의 개수는 복수이며, 상기 제2 댓글 자막의 개수는 복수이며;
목표 댓글 자막을 결정하는 단계는,
상기 선호도를 기반으로, 상기 후보 댓글 자막의 전시 개수와 상기 제2 댓글 자막의 전시 개수의 비례값을 결정하는 단계; 및
상기 비례값 및 상기 전시 가능한 댓글 자막의 개수를 기반으로, 상기 후보 댓글 자막과 상기 제2 댓글 자막 중의 목표 댓글 자막을 결정하는 단계를 포함하는
댓글 자막을 생성하는 방법.
제4항에 있어서,
상기 목표 엔티티가 상기 동영상 데이터에서 나타나는 시간대 정보는 상기 목표 엔티티의 나타나는 시간 길이 및 상기 목표 엔티티가 나타나는 시작 시간을 포함하며;
상기 목표 댓글 자막을 전시하는 시간대 정보를 결정하는 단계는,
상기 목표 댓글 자막을 전시하는 시작 시간을 상기 목표 엔티티가 나타나는 시작 시간으로 결정하는 단계; 및
상기 목표 댓글 자막을 전시하는 시간 길이를 상기 목표 엔티티가 나타나는 시간 길이와 소정 시간 길이 중 보다 작은 값으로 결정하는 단계를 포함하는
댓글 자막을 생성하는 방법.
제1항 내지 제3항 중 어느 한 항에 있어서,
상기 목표 핵심 정보는 상기 동영상 데이터 중의 복수의 목표 엔티티를 각각 지시하는 복수의 목표 엔티티 단어를 포함하며, 복수의 목표 엔티티 단어 중의 목표 엔티티 단어 각각에 대한 제1 댓글 자막의 개수는 적어도 하나이며; 상기 방법은 상기 목표 엔티티 단어 각각에 대해,
소정 지식 그래프를 기반으로, 상기 목표 엔티티 단어 각각과 관련된 제2 멀티미디어 정보를 결정하는 단계; 및
상기 제2 멀티미디어 정보 및 상기 목표 엔티티 단어에 매칭되는 제1 멀티미디어 정보를 기반으로, 상기 추천 정보를 생성하는 단계를 더 포함하는
댓글 자막을 생성하는 방법.
제7항에 있어서,
상기 소정 지식 그래프를 구축하는 단계를 더 포함하며,
상기 소정 지식 그래프를 구축하는 단계는,
소정 어휘 베이스에서 상기 목표 엔티티 단어 각각과 관련된 엔티티 단어를 검색하여, 상기 복수의 목표 엔티티 단어에 대한 관련 엔티티 단어를 얻는 단계;
상기 소정 미디어 라이브러리에서 상기 관련 엔티티 단어에 매칭되는 제3 멀티미디어 정보를 검색하는 단계;
상기 관련 엔티티 단어, 상기 복수의 목표 엔티티 단어, 상기 제1 멀티미디어 정보 및 상기 제3 멀티미디어 정보를 각각 지시하는 복수의 노드를 구축하는 단계; 및
상기 복수의 목표 엔티티 단어와 상기 관련 엔티티 단어 사이의 관련 관계, 상기 복수의 목표 엔티티 단어와 상기 제1 멀티미디어 정보 사이의 매칭 관계 및 상기 관련 엔티티 단어와 상기 제3 멀티미디어 정보 사이의 매칭 관계를 기반으로, 상기 복수의 노드 사이의 연결 변을 구축하여, 상기 소정 지식 그래프를 얻는 단계를 포함하는
댓글 자막을 생성하는 방법.
동영상 데이터의 내용 정보 및 목표 대상의 속성 정보를 추출하기 위한 정보 획득 모듈;
상기 내용 정보의 제1 핵심 정보를 추출하고, 상기 속성 정보의 제2 핵심 정보를 추출하기 위한 정보 추출 모듈;
상기 목표 대상에 대한 목표 핵심 정보를 결정하기 위한 핵심 정보 결정 모듈;
소정 미디어 라이브러리에서 목표 핵심 정보에 매칭되는 제1 멀티미디어 정보를 검색하기 위한 제1 정보 검색 모듈; 및
제1 멀티미디어 정보를 기반으로, 목표 핵심 정보에 대한 제1 댓글 자막을 생성하여, 동영상 데이터를 재생하는 동시에 제1 댓글 자막을 전시하도록 하기 위한 댓글 자막 생성 모듈을 포함하며,
여기서, 상기 목표 대상에 대한 목표 핵심 정보를 결정하는 것은, 상기 제1 핵심 정보 중의 상기 제2 핵심 정보에 매칭되는 정보를 상기 목표 핵심 정보로 하는 것을 포함하며,
상기 제1 댓글 자막은 상기 목표 대상에 대한 제1 추천 정보의 링크를 포함하며, 상기 제1 추천 정보는 상기 제1 멀티미디어 정보를 포함하는
댓글 자막을 생성하는 장치.
제9항에 있어서,
상기 핵심 정보 결정 모듈은, 또한
소정 분야에서 상기 매칭되는 정보와 관련된 분야를 결정하여 목표 분야로 하는 것; 및
소정 어휘 베이스 중의 상기 목표 분야에 속하고 상기 매칭되는 정보와 관련된 단어를 상기 목표 핵심 정보로 결정하기 위한 것인
댓글 자막을 생성하는 장치.
제9항에 있어서,
소정 정보 베이스에서 인기 정보를 검색하기 위한 제2 정보 검색 모듈을 더 포함하며,
여기서, 상기 댓글 자막은 또한, 인기 정보에 대한 제2 댓글 자막을 생성하여, 상기 동영상 데이터를 재생하는 동시에 상기 제2 댓글 자막을 전시하도록 하기 위한 것이며,
여기서, 제2 댓글 자막은 상기 인기 정보의 링크를 포함하는
댓글 자막을 생성하는 장치.
제9항 내지 제11항 중 어느 한 항에 있어서,
상기 목표 핵심 정보는 상기 동영상 데이터 중의 목표 엔티티를 지시하는 목표 엔티티 단어 및 상기 목표 엔티티가 상기 동영상 데이터에서 나타나는 시간대 정보를 포함하며, 상기 장치는,
상기 제1 댓글 자막 중의 상기 목표 엔티티 단어에 대한 댓글 자막을 결정하여, 후보 댓글 자막으로 하기 위한 후보 댓글 자막 결정 모듈;
상기 목표 엔티티가 상기 동영상 데이터에서 나타나는 시간대 정보를 기반으로, 전시 가능한 댓글 자막의 개수를 결정하기 위한 개수 결정 모듈;
상기 전시 가능한 댓글 자막의 개수 및 상기 후보 댓글 자막을 기반으로, 목표 댓글 자막을 결정하기 위한 목표 댓글 자막 결정 모듈; 및
상기 목표 엔티티가 상기 동영상 데이터에서 나타나는 시간대 정보를 기반으로, 상기 목표 댓글 자막을 전시하는 시간대 정보를 결정하기 위한 시간 정보 결정 모듈을 더 포함하는
댓글 자막을 생성하는 장치.
제12항에 있어서,
상기 속성 정보는 상기 인기 정보에 대한 상기 목표 대상의 선호도를 포함하며, 상기 후보 댓글 자막의 개수는 복수이며, 상기 제2 댓글 자막의 개수는 복수이며;
상기 목표 댓글 자막 결정 모듈은 또한,
상기 선호도를 기반으로, 상기 후보 댓글 자막의 전시 개수와 상기 제2 댓글 자막의 전시 개수의 비례값을 결정하기 위한 비례값 결정 서브 모듈; 및
상기 비례값 및 상기 전시 가능한 댓글 자막의 개수를 기반으로, 상기 후보 댓글 자막 및 상기 제2 댓글 자막 중의 목표 댓글 자막을 결정하기 위한 댓글 자막 결정 서브 모듈을 포함하는
댓글 자막을 생성하는 장치.
제12항에 있어서,
상기 목표 엔티티가 상기 동영상 데이터에서 나타나는 시간대 정보는 상기 목표 엔티티의 나타나는 시간 길이 및 상기 목표 엔티티가 나타나는 시작 시간을 포함하며;
상기 시간 정보 결정 모듈은,
상기 목표 댓글 자막을 전시하는 시작 시간을 상기 목표 엔티티가 나타나는 시작 시간으로 결정하기 위한 시작 시간 결정 서브 모듈; 및
상기 목표 댓글 자막을 전시하는 시간 길이를 상기 목표 엔티티의 나타나는 시간 길이 및 소정 시간 길이 중의 보다 작은 값으로 결정하기 위한 시간 길이 결정 서브 모듈을 포함하는
댓글 자막을 생성하는 장치.
제9항 내지 제11항 중 어느 한 항에 있어서,
상기 목표 핵심 정보는 동영상 데이터 중의 복수의 목표 엔티티를 각각 지시하는 복수의 목표 엔티티 단어를 포함하며, 복수의 목표 엔티티 단어 중의 각각에 대한 목표 엔티티 단어의 제1 댓글 자막의 개수는 적어도 하나이며;
상기 장치는
목표 엔티티 단어 각각에 대해, 소정 지식 그래프를 기반으로, 상기 목표 엔티티 단어 각각과 관련된 제2 멀티미디어 정보를 결정하기 위한 멀티미디어 정보 결정 모듈; 및
상기 제2 멀티미디어 정보 및 상기 목표 엔티티 단어 각각에 매칭되는 제1 멀티미디어 정보를 기반으로, 상기 추천 정보를 생성하기 위한 추천 정보 생성 모듈을 더 포함하는
댓글 자막을 생성하는 장치.
제15항에 있어서,
상기 소정 지식 그래프를 구축하기 위한 그래프 구축 모듈을 더 포함하며,
상기 그래프 구축 모듈은
소정 어휘 베이스에서 상기 목표 엔티티 단어 각각과 관련된 엔티티 단어를 검색하여, 상기 복수의 목표 엔티티 단어의 관련 엔티티 단어를 얻기 위한 관련 단어 검색 서브 모듈;
상기 소정 미디어 라이브러리에서 상기 관련 엔티티 단어에 매칭되는 제3 멀티미디어 정보를 검색하기 위한 정보 검색 서브 모듈;
상기 관련 엔티티 단어, 상기 복수의 목표 엔티티 단어, 상기 제1 멀티미디어 정보 및 상기 제3 멀티미디어 정보를 각각 지시하는 복수의 노드를 구축하기 위한 노드 구축 서브 모듈; 및
상기 복수의 목표 엔티티 단어와 상기 관련 엔티티 단어 사이의 관련 관계, 상기 복수의 목표 엔티티 단어와 상기 제1 멀티미디어 정보 사이의 매칭 관계 및 상기 관련 엔티티 단어와 상기 제3 멀티미디어 정보 사이의 매칭 관계를 기반으로, 상기 복수의 노드 사이의 연결 변을 구축하여, 소정 지식 그래프를 얻기 위한 변 구축 서브 모듈을 포함하는
댓글 자막을 생성하는 장치.
적어도 하나의 프로세서; 및
상기 적어도 하나의 프로세서에 통신 연결되는 메모리를 포함하는 전자 기기에 있어서,
상기 메모리에는 상기 적어도 하나의 프로세서에 의해 실행 가능한 명령어가 저장되어 있고, 상기 명령어는 상기 적어도 하나의 프로세서에 의해 실행되어 상기 적어도 하나의 프로세서로 하여금 제1항 내지 제3항 중 어느 한 항에 따른 방법을 실행하게 하는 전자 기기.
컴퓨터 명령어가 저장되어 있는 비휘발성 컴퓨터 판독 가능 저장 매체에 있어서, 상기 컴퓨터 명령어는 상기 컴퓨터로 하여금 제1항 내지 제3항 중 어느 한 항에 따른 방법을 실행하게 하기 위한 것인 비일시적 컴퓨터 판독가능 저장 매체.
프로세서에 의해 실행될 때 제1항 내지 제3항 중 어느 한 항에 따른 방법을 구현하는, 저장 매체에 저장된 컴퓨터 프로그램.