JP7201729B2 - ビデオ再生ノードの位置決め方法、装置、デバイス、記憶媒体およびコンピュータプログラム - Google Patents

ビデオ再生ノードの位置決め方法、装置、デバイス、記憶媒体およびコンピュータプログラム Download PDF

Info

Publication number
JP7201729B2
JP7201729B2 JP2021055712A JP2021055712A JP7201729B2 JP 7201729 B2 JP7201729 B2 JP 7201729B2 JP 2021055712 A JP2021055712 A JP 2021055712A JP 2021055712 A JP2021055712 A JP 2021055712A JP 7201729 B2 JP7201729 B2 JP 7201729B2
Authority
JP
Japan
Prior art keywords
video
videos
text segments
time information
group
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2021055712A
Other languages
English (en)
Other versions
JP2021103896A (ja
Inventor
衛国 李
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Publication of JP2021103896A publication Critical patent/JP2021103896A/ja
Application granted granted Critical
Publication of JP7201729B2 publication Critical patent/JP7201729B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/102Programmed access in sequence to addressed parts of tracks of operating record carriers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/845Structuring of content, e.g. decomposing content into time segments
    • H04N21/8456Structuring of content, e.g. decomposing content into time segments by decomposing the content in the time domain, e.g. in time segments
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • G06V20/41Higher-level, semantic clustering, classification or understanding of video scenes, e.g. detection, labelling or Markovian modelling of sport events or news items
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/1815Semantic context, e.g. disambiguation of the recognition hypotheses based on word meaning
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • G10L25/57Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for processing of video signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/439Processing of audio elementary streams
    • H04N21/4394Processing of audio elementary streams involving operations for analysing the audio stream, e.g. detecting features or characteristics in audio streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream, rendering scenes according to MPEG-4 scene graphs
    • H04N21/44008Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream, rendering scenes according to MPEG-4 scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics in the video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/472End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content
    • H04N21/47217End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content for controlling playback functions for recorded or on-demand content, e.g. using progress bars, mode or play-point indicators or bookmarks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/488Data services, e.g. news ticker
    • H04N21/4884Data services, e.g. news ticker for displaying subtitles

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Acoustics & Sound (AREA)
  • Databases & Information Systems (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Television Signal Processing For Recording (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Studio Circuits (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)

Description

本発明は、コンピュータ技術分野に関し、具体的にはビッグデータおよびビデオ処理技術に関する。より具体的には、本発明は、ビデオ再生ノードの位置決め方法、装置、デバイス、記憶媒体およびコンピュータプログラムを提供する。
インターネット技術の継続的な発展に伴い、様々なビデオ再生プラットフォームが広く発展している。ビデオは、情報をより直感的で、豊富で、明瞭に表現できるという特徴を有することから、情報伝達キャリアとして広く普及して適用されている。ユーザは、ビデオを視聴するとき、例えば、コンテンツが豊富で、繰り返し視聴する必要があるビデオを視聴するとき、ビデオが特定のコンテンツの再生ノードにジャンプして再生を開始できることを望むことが多い。
本発明は、ビデオ再生ノードの位置決め方法、装置、デバイス、記憶媒体およびコンピュータプログラムを提供する。
第1の様態によれば、ビデオ再生ノードの位置決め方法を提供し、当該方法は、複数のビデオから目標ビデオを選別することと、目標ビデオと、当該目標ビデオの複数の字幕テキストセグメントと、当該複数の字幕テキストセグメントのそれぞれの開始時間情報とをクライアントに送信し、クライアントによって複数の字幕テキストセグメントを提示し、複数の字幕テキストセグメントのうちのいずれか1つの字幕テキストセグメントに対するトリガ操作に応答して、当該いずれか1つの字幕テキストセグメントの開始時間情報に基づいて当該目標ビデオの開始再生ノードを特定することとを含む。
第2の様態によれば、ビデオ再生ノードの位置決め方法を提供し、当該方法は、複数のビデオから選別された目標ビデオと、前記目標ビデオの複数の字幕テキストセグメントと、前記複数の字幕テキストセグメントのそれぞれの開始時間情報とを取得することと、前記複数の字幕テキストセグメントを提示することと、前記複数の字幕テキストセグメントのうちのいずれか1つの字幕テキストセグメントに対するトリガ操作に応答して、前記いずれか1つの字幕テキストセグメントの開始時間情報に基づいて前記目標ビデオの開始再生ノードを特定することとを含む。
第3の様態によれば、ビデオ再生ノードの位置決め装置を提供し、当該装置は、選別モジュールと再生ノード管理モジュールとを含む。選別モジュールは、複数のビデオから目標ビデオを選別するためのものである。再生ノード管理モジュールは、目標ビデオと、当該目標ビデオの複数の字幕テキストセグメントと、当該複数の字幕テキストセグメントのそれぞれの開始時間情報とをクライアントに送信し、クライアントによって当該複数の字幕テキストセグメントを提示し、当該複数の字幕テキストセグメントのうちのいずれか1つの字幕テキストセグメントに対するトリガ操作に応答して、当該いずれか1つの字幕テキストセグメントの開始時間情報に基づいて当該目標ビデオの開始再生ノードを特定するためのものである。
第4の様態によれば、ビデオ再生ノードの位置決め装置を提供し、当該装置は、取得モジュールと、提示モジュールと、再生ノード位置決めモジュールとを含む。取得モジュールは、複数のビデオから選別された目標ビデオと、当該目標ビデオの複数の字幕テキストセグメントと、当該複数の字幕テキストセグメントのそれぞれの開始時間情報とを取得するためのものである。提示モジュールは、前記複数の字幕テキストセグメントを提示するためのものである。再生ノード位置決めモジュールは、前記複数の字幕テキストセグメントのうちのいずれか1つの字幕テキストセグメントに対するトリガ操作に応答して、前記いずれか1つの字幕テキストセグメントの開始時間情報に基づいて前記目標ビデオの開始再生ノードを特定するためのものである。
第5の様態によれば、電子デバイスを提供し、少なくとも1つのプロセッサと、前記少なくとも1つのプロセッサに通信接続されるメモリとを含む。ただし、メモリには、少なくとも1つのプロセッサによって実行可能な命令が記憶されており、少なくとも1つのプロセッサが本発明によるビデオ再生ノードの位置決め方法を実行可能であるように、当該命令は、少なくとも1つのプロセッサによって実行される。
第6の様態によれば、コンピュータ命令が記憶されている非一時的なコンピュータ読み取り可能な記憶媒体を提供し、当該コンピュータ命令は、コンピュータに、本発明によるビデオ再生ノードの位置決め方法を実行させるためのものである。
第7の様態によれば、実行される際に、本発明によるビデオ再生ノードの位置決め方法を実現するコンピュータ実行可能な命令を含むコンピュータプログラムを提供する。
本発明の技術手段によれば、大量のビデオから選別された再生ノード位置決め価値を有する目標ビデオは、目標ビデオに対して再生を行なう必要がある場合、ユーザに目標ビデオの複数の字幕テキストセグメントを提示する。ユーザが指定した字幕テキストセグメントの開始時間情報に基づいて、当該目標ビデオの開始再生ノードを特定することができる。以上のプロセスでは、目標ビデオのみに対する再生ノード位置決め処理は、大量の算出リソースを節約し、サーバとクライアントとの間の相互作用効率を向上することができ、複数の字幕テキストセグメントの共同提示により、視聴したいコンテンツノードをユーザが短時間で特定でき、かつ、ユーザが指定した字幕テキストセグメントの開始時間情報に基づいて、現在のビデオの開始再生ノードを正確に特定することができる。
このセクションに記載される内容は、本開示の実施例の主要または重要な特徴を特定することを意図するものではなく、また、本開示の範囲を限定することを意図するものでもないことを理解されたい。本開示の他の特徴は、以下の明細書によって容易に理解されることになる。
図面は、本発明をより良く理解するためのものであり、本発明を限定するものではない。
本発明の一実施例によるビデオ再生ノードの位置決め方法および装置を適用する例示的なシステムアーキテクチャである。 本発明の一実施例によるビデオ再生ノードの位置決め方法のフローチャートである。 本発明の別の実施例によるビデオ再生ノードの位置決め方法のフローチャートである。 本発明の一実施例によるビデオ選別プロセスのフローチャートである。 本発明の別の実施例によるビデオ選別プロセスのフローチャートである。 本発明の一実施例によるビデオ再生ノードの位置決めプロセスの概略図である。 本発明の一実施例によるビデオ再生インタフェースの概略図である。 本発明の一実施例によるビデオ再生ノードの位置決め装置のブロック図である。 本発明の別の実施例によるビデオ再生ノードの位置決め装置のブロック図である。 本発明の一実施例によるビデオ再生ノードの位置決め方法の電子デバイスのブロック図である。
以下、図面を組み合わせて本発明の例示的な実施例を説明し、理解を容易にするために、本発明の実施例の様々な詳細を含み、単に例示的なものとみなされるべきである。したがって、当業者は、本発明の範囲および精神から逸脱することなく、ここに記載される実施例に対して様々な変更および修正を行うことができることを理解すべきである。同様に、明瞭および明確化のために、以下の説明では、周知の機能および構成についての説明は省略する。
インターネット技術の継続的な発展に伴い、様々なビデオ再生プラットフォームが広く発展している。ビデオは、情報をより直感的で、豊富で、明瞭に表現できるという特徴を有することから、情報伝達キャリアとして広く普及し、適用されている。ユーザは、ビデオを視聴するとき、例えば、コンテンツが豊富で、繰り返し視聴する必要があるビデオ(例えば、知識類ビデオ、一般向けの科学類ビデオ)を視聴し、ビデオ内のいくつかの特定のプロットを確認する必要があるとき、ビデオが特定のコンテンツの再生ノードにジャンプして再生を開始できることを望むことが多い。
この場合、例えば、倍速、早送り等の機能によりビデオをはやく再生して、ユーザが視聴ニーズを満たす再生ノードを見つけることを可能にしたり、または、ユーザがプログレスバーをドラッグしながら、ビデオの現在のフレームのピクチャをプレビューすることをサポートすることにより、ユーザが視聴ニーズを満たす再生ノードを見つけることを可能にする。以上の方法は何れも、ユーザが視聴したいコンテンツを探すのに長い時間が必要であり、再生ノードの位置決めも十分に正確ではない。
図1は、本発明の一実施例によるビデオ再生ノードの位置決め方法および装置を適用できる例示的なシステムアーキテクチャ100である。なお、図1は、本発明の実施例を適用できるシステムアーキテクチャの例示に過ぎず、当業者が本発明の技術内容を容易に理解するためであるが、本発明の実施例が他のデバイス、システム、環境またはシナリオに使用され得ないことを意味するものではない。
図1に示すように、当該実施例によるシステムアーキテクチャ100は、複数の端末デバイス110と、ネットワーク120と、サーバ130とを含んでもよい。端末デバイス110は、ビデオ再生をサポートできる様々な電子デバイスであってもよく、例えば、スマートフォン、タブレット、ラップトップ、デスクトップコンピュータ等であってもよいが、ここでは限定されない。サーバ130は、一定の算出能力を有する様々な電子デバイスであってもよく、ここでは限定されない。以下、端末デバイス110とサーバ130との間がネットワーク120を介して相互作用するプロセスを例に挙げて説明する。例示的には、端末デバイス110は、ビデオ再生類アプリケーションのクライアントがインストールされてもよく、端末デバイス110は、このクライアントによりサーバ130からビデオデータを要求し、ビデオデータに基づいてデコードして再生を行う。
本発明の実施例によれば、ビデオ再生ノードの位置決め方法を提供する。以下、図面によりこの方法を例示的に説明する。以下の方法における各操作の番号が、説明の便宜上、その操作を表すためにのみ使用されており、当該各操作の実行順序を示すものと見なされるべきではないことに注意されたい。特に明記しない限り、当該方法は、完全に示される順序に従って実行する必要がない。
図2Aは、本発明の一実施例によるビデオ再生ノードの位置決め方法のフローチャートである。例示的には、図2Aに示すビデオ再生ノードの位置決め方法は、サーバによって実行されてもよい。
図2Aに示すように、当該ビデオ再生ノードの位置決め方法200は、操作S210~操作S220を含んでもよい。
操作S210では、複数のビデオから目標ビデオを選別する。
例示的には、目標ビデオは、コンテンツ価値が高く、含まれる情報が豊富であるビデオであってもよく、例えば、xx知識点の説明ビデオ、xx一般向けの科学ビデオ等であってもよい。ユーザがこのようなビデオを視聴するとき、通常、特定のコンテンツを繰り返し視聴する必要があり、このようなビデオに対してビデオ再生ノード位置決めのニーズがある。本開示の実施例によれば、ビデオの1つまたは複数の次元の情報に基づいてビデオ価値を評価することで、評価結果に応じてビデオの選別を行なうことができる。ビデオ再生プラットフォームのサーバ側に、通常、大量のビデオリソースを有し、本操作S210は、大量のビデオから再生ノード位置決め価値を有する目標ビデオを選別することができ、引き続きのビデオ処理プロセスに対して算出リソースを節約する。
操作S220では、目標ビデオと、当該目標ビデオの複数の字幕テキストセグメントと、当該複数の字幕テキストセグメントのそれぞれの開始時間情報とをクライアントに送信し、クライアントによって複数の字幕テキストセグメントを提示し、複数の字幕テキストセグメントのうちのいずれか1つの字幕テキストセグメントに対するトリガ操作に応答して、当該いずれか1つの字幕テキストセグメントの開始時間情報に基づいて当該目標ビデオの開始再生ノードを特定する。
例示的には、いずれか1つの目標ビデオAについて、m個の字幕テキストセグメントと、m個の字幕テキストセグメントに1対1に対応するm個の開始時間情報とを有する。mは1より大きい整数である。各字幕テキストセグメントの開始時間情報は、対応するビデオにおける当該字幕テキストセグメントの開始時間を表すことができる。本開示の実施例によれば、例えば、目標ビデオAに含まれる音声を識別することにより、上記m個の字幕テキストセグメントを取得することができる。
例示的には、サーバは、クライアントの目標ビデオAに対する要求メッセージに応答して、目標ビデオAのビデオデータ、m個の字幕テキストセグメントおよびm個の開始時間情報を所定のフォーマットでエンコードした後、所定の通信規則に従って、エンコードして得られたデータパケットをクライアントに送信することができる。クライアントは、データパケットをデコードした後、目標ビデオAのビデオデータ、m個の字幕テキストセグメントおよび対応するm個の開始時間情報を取得することができる。非目標ビデオについて、サーバは、クライアントの要求メッセージに応答して、帯域幅を節約するために、ビデオデータのみをクライアントに送信してもよい。
上記実施例では、サーバの観点から本開示の実施例によるビデオ再生ノードの位置決め方法を説明し、以下、クライアントの観点から本開示の実施例によるビデオ再生ノードの位置決め方法を例示的に説明する。
図2Bは、本発明の別の実施例によるビデオ再生ノードの位置決め方法のフローチャートである。例示的には、図2Bに示すビデオ再生ノードの位置決め方法は、クライアントが位置する端末デバイスによって実行されてもよい。
図2Bに示すように、当該ビデオ再生ノードの位置決め方法200’は、操作S210’~操作S230’を含んでもよい。
操作S210’では、目標ビデオと、当該目標ビデオの複数の字幕テキストセグメントと、当該複数の字幕テキストセグメントのそれぞれの開始時間情報とを取得する。
例示的には、当該目標ビデオは、複数のビデオからサーバによって選別され得る。選別プロセスは既に上記で説明したので、重複する部分は再び説明しない。
操作S220’では、複数の字幕テキストセグメントを提示する。
例示的には、クライアントは、上記目標ビデオAのビデオデータと、m個の字幕テキストセグメントと、m個の開始時間情報とを受信した後、当該m個の字幕テキストセグメントをユーザに提示することができる。通常の場合、異なる字幕テキストセグメントが目標ビデオ内の異なる時点のコンテンツに対応し得るため、クライアントによって提示されるm個の字幕テキストセグメントは、実質的に、目標ビデオAに関するコンテンツ要約をユーザに提供し、これにより、ユーザは、目標ビデオAのコンテンツの分布状況を素早く知るか、または思い出すことができる。ユーザが、そのうちの1つの字幕テキストセグメントに対応するビデオコンテンツを見たいとき、この字幕テキストセグメントに対してトリガ操作を行うことができる。
操作S230’では、複数の字幕テキストセグメントのうちのいずれか1つの字幕テキストセグメントに対するトリガ操作に応答して、当該いずれか1つの字幕テキストセグメントの開始時間情報に基づいて目標ビデオの開始再生ノードを特定する。
例示的には、クライアントは、ある字幕テキストセグメントに対するトリガ操作に応答して、当該字幕テキストセグメントの開始時間情報に基づいて、ビデオAの現在の開始再生ノードを優先にすることを特定し、これにより、当該開始再生ノードにジャンプして目標ビデオAを再生することができる。
当業者は、本開示の実施例によるビデオ再生ノードの位置決め方法によれば、大量のビデオから選別された再生ノード位置決め価値を有する目標ビデオが、目標ビデオを再生する必要がある場合、ユーザに目標ビデオの複数の字幕テキストセグメントを提示することを理解することができる。ユーザが指定した字幕テキストセグメントの開始時間情報に基づいて、当該目標ビデオの開始再生ノードを特定することができる。以上のプロセスでは、目標ビデオのみに対する再生ノード位置決め処理は、大量の算出リソースを節約し、サーバとクライアントとの間の相互作用効率を向上することができ、複数の字幕テキストセグメントの共同提示により、視聴したいコンテンツノードをユーザが短時間で特定でき、かつ、ユーザが指定した字幕テキストセグメントの開始時間情報に基づいて、現在のビデオの開始再生ノードを正確に特定することができる。
図3は、本発明の一実施例によるビデオ選別プロセスのフローチャートであり、上記複数のビデオから目標ビデオを選別する実施形態を例示的に説明するためのものである。
図3に示すように、当該ビデオ選別プロセスは、操作S311~操作S312を含んでもよい。
操作S311では、複数のビデオの各ビデオについて、当該ビデオのユーザ相互作用データに基づいて、当該ビデオの価値スコアを算出する。
本開示の実施例によれば、ビッグデータ分析によってビデオの価値スコアを算出する。例示的には、いずれか1つのビデオBのユーザ相互作用データは、例えば、当該ビデオBを視聴するユーザの総数に対する、当該ビデオBを視聴する回数が所定の閾値を超えるユーザ数の割合x1、当該ビデオBに対するコメント数x2、当該ビデオBに対するお気に入り数x3および当該ビデオBに対するいいねの数x4等のうちの少なくとも1つを含んでもよい。ここで、例えば、所定の閾値は、1であり、割合x1は、ビデオBを視聴するユーザ全体のうち、視聴ビデオBを重複して視聴するユーザの数の比例を表し、当該割合x1が高いほど、当該ビデオBに対するユーザの重複視聴の需要度が高いことを表明する。コメント数x2、お気に入り数x3およびいいねの数x4は、それぞれ、ビデオBに対するユーザの好み度合いおよび関心度合いを表すことができる。他の実施例では、ユーザのビデオに対する重複視聴の需要度、好み度合い、関心度合いなどの特性を表すことができる他のユーザ相互作用データも、ビッグデータ分析によって選択されてもよく、ここでは限定されない。
例えば、以上の割合x1、コメント数x2、お気に入り数x3およびいいねの数x4をユーザ相互作用データとして選択する場合、式(1)によってビデオBの価値スコアSを算出することができる。
S=α×x_1+β×x_2+γ×x_3+δ×x_4
式(1)
ここで、α、β、γおよびδは、予め設定された第1の重み、第2の重み、第3の重みおよび第4の重みである。上記プロセスでは、予め設定された第1の重み、第2の重み、第3の重みおよび第4の重みを用いて、割合x1、コメント数x2、お気に入り数x3およびいいねの数x4を重み付き加算することにより、ビデオBの価値スコアを算出する。同様に、サーバ側の各ビデオの価値スコアを算出することができる。この価値スコアは、ユーザのビデオに対するリアルな相互作用データに基づいて得られるため、ビデオの価値の高低をより客観的に反映することができる。なお、ビデオに対する各ユーザ相互作用データの重みの設定によって、価値スコアに対する各ユーザ相互作用データの寄与を調整し、価値スコアの正確性を向上する。他の例では、様々な融合アルゴリズムを用いてユーザ相互作用データを統合することで、各ビデオの価値スコアを取得してもよい。
操作S312では、複数のビデオから価値スコアが第1の閾値より高いビデオを第1のグループのビデオとして選別する。
図3に示す選別プロセスを第1の段階の選別と呼ぶことができる。当該第1の段階の選別では、低価値のビデオを大幅に選別できる。選別された第1のグループのビデオは、1つまたは複数のビデオを含んでもよい。
いくつかの実施形態では、本操作S312で選別された第1のグループのビデオを、直接に目標ビデオとすることができ、このとき、第1のグループのビデオに対して字幕テキストセグメントの生成プロセスを行うことができる。別のいくつかの実施形態では、本操作S312で選別された第1のグループのビデオは、より精細で正確な選別結果を得るために、さらに、引き続き第2の段階の選別を行なってもよい。
図4は、本発明の別の実施例によるビデオ選別プロセスのフローチャートであり、上記複数のビデオから目標ビデオを選別する実施形態を例示的に説明するためのものである。
図4に示すように、当該ビデオ選別プロセスは、前記実施例の第1の選別段階を経た後、操作S413~操作S414をさらに含んでもよい。
操作S413では、第1のグループのビデオの各ビデオについて、予め訓練された分類器を用いて当該ビデオを分類することで、当該ビデオが属するカテゴリを特定する。
ここで、第1のグループのビデオの例示的な選別プロセスは、上記で説明したので、ここでは再び説明しない。例示的には、機械学習アルゴリズムに基づいて複数の既知のカテゴリに関する分類器を予め構築することができる。大量のビデオサンプルを取得し、各ビデオサンプルにカテゴリタグを付し、カテゴリタグ付きビデオサンプルを用いて分類器を訓練することで、ビデオに対して優れた分類能力を有する分類器を得る。複数の既知のカテゴリの分類標準および分類粒度は、必要に応じて設定されてもよく、例えば、知識類、一般向けの科学類、映画類、音楽類、グルメ類、ゲーム類などを含んでもよいが、ここでは限定されない。ビッグデータ統計結果によれば、例えば、知識類、一般向けの科学類などのカテゴリのビデオは、ユーザにとって、より高い重複視聴価値を有するため、これらカテゴリを所定のカテゴリとして設定してもよい。
操作S414では、第1のグループのビデオから所定のカテゴリに属するビデオを第2のグループのビデオとして選別する。
第1の段階の選別結果を基礎とし、第2の段階の選別では、ビデオコンテンツの分類の観点から、再生ノード位置決め価値がより高い第2のグループのビデオをさらに選別する。第2のグループのビデオは、1つまたは複数のビデオを含む。分類器は、大量の既知のカテゴリビデオサンプルに基づいて訓練して得られるものであり、分類結果はより正確である。ユーザは、異なるカテゴリのビデオに対する視聴習慣が大きく異なり、カテゴリに基づいて選別される第2のグループのビデオは、より合理的で正確である。
いくつかの実施形態では、本操作S414で選別された第2のグループのビデオは、直接に目標ビデオとされることができる。別のいくつかの実施形態では、本操作S414で選別された第2のグループのビデオは、より精細で正確な選別結果を得るために、さらに、引き続き第3の段階の選別を行なってもよい。
第3の段階の選別では、上記で得られた第2のグループのビデオを基礎とし、先ず、各ビデオの字幕テキストセグメントおよび字幕テキストセグメントの相関情報を生成してもよい。さらに、字幕テキストセグメントの相関情報に基づいて第2のグループのビデオから最終の目標ビデオを選別する。
例示的には、第2のグループのビデオの各ビデオについて、当該ビデオのオーディオデータを抽出する。それから、抽出されたオーディオデータを音声識別(Automatic Speech Recognition, ASR)して識別結果を取得する。識別結果は、当該ビデオの複数の字幕テキストセグメント、当該複数の字幕テキストセグメントのそれぞれの開始時間情報および終了時間情報を含んでもよい。例えば、1つのビデオから時間tのオーディオデータを抽出する。当該オーディオデータを音声識別するプロセスでは、オーディオのポーズが所定時間を超える(例えば、ポーズが3秒を超える)ことをセグメント分割標準とすることで、複数のテキストセグメントを複数の字幕テキストセグメントとして識別してもよい。なお、上記時間tにおける各テキストセグメントの開始時間情報および終了時間情報も記録される。
本開示の一実施例では、第2のグループのビデオの各ビデオについて、当該ビデオの複数の字幕テキストセグメントのそれぞれの開始時間情報および終了時間情報に基づいて、当該ビデオの総時間に対する当該ビデオの複数の字幕テキストセグメントの総時間の割合yを特定することができる。そして、て、第2のグループのビデオから割合yが第2の閾値よりも高いビデオを第3の段階の選別後の目標ビデオとして選別する。サーバは、目標ビデオの字幕テキストセグメントおよび相関時間情報を保留するために、目標ビデオの上記識別結果を記憶する。
通常の場合、ビデオの字幕テキストセグメントの時間割合が大きいほど、当該ビデオの情報量が豊富であり、ユーザが繰り返し視聴する必要があり、より高いビデオ再生ノードの位置決め価値を有することが理解できる。したがって、本実施例の第3の段階の選別では、ビデオにおける字幕テキストセグメントの時間割合から、当該時間割合が比較的長いビデオを第2のグループのビデオから選別することによって、情報含有量が豊富である目標ビデオをさらに選別する。
本開示の別の実施例では、第2のグループのビデオの各ビデオについて、当該ビデオの複数の字幕テキストセグメントに対して語彙分析(Semantic Analysis)を行って、当該ビデオの複数の字幕テキストセグメントに対する論理スコアを取得することができる。当該論理スコアは、複数の字幕テキストセグメントに含まれる語彙論理の度合いの高低を表すものであり、語彙論理の度合いが高いほど、含まれる語彙が完全で意義がある。次に、第2のグループのビデオから論理スコアが第3の閾値よりも高いビデオを第3の段階の選別を経た後の目標ビデオとして選別する。
通常の場合、ビデオの字幕テキストセグメントに含まれる語彙がより完全に明確であればあるほど、当該ビデオに含まれる情報に価値があることを表明し、ユーザが繰り返し視聴する必要があり、より高いビデオ再生ノードの位置決め価値を有することが理解できる。したがって、本実施例の第3の段階の選別では、ビデオの字幕テキストセグメントに含まれる語彙論理から初めて、第2のグループのビデオから完全で意義のある意味を含むビデオを最終の目標ビデオとして選別する。
図5は、本発明の一実施例によるビデオ再生ノードの位置決めプロセスの概略図であり、クライアント510とサーバ530との間の相互作用プロセスを例示的に説明するためのものである。
図5に示すように、サーバ530は、M個のビデオ501に対して第1の段階の選別S5101、第2の段階の選別S5102および第3の段階の選別S5103を順に行い、N個の目標ビデオ502を取得する。MおよびNは何れも正整数であり、MはNよりも大きい。第1の段階の選別、第2の段階の選別および第3の段階の選別は、上記でそれぞれ例示的に説明されたので、ここでは再び説明しない。サーバ530は、各目標ビデオの所定のデータ集合503を記憶し、各目標ビデオの所定のデータ集合503は、当該目標ビデオのビデオデータと、当該目標ビデオの複数の字幕テキストセグメントと、当該複数の字幕テキストセグメントのそれぞれの開始時間情報(例えば、開始タイムスタンプ情報)および終了時間情報(例えば、終了タイムスタンプ情報)とを含んでもよい。
クライアント510は、あるビデオ(例えば、ビデオC)に対するユーザの選択操作を受信し、ビデオCに対する要求メッセージ504をサーバ530に送信することができる。サーバ530は、ビデオCが上記N個の目標ビデオ502に属するか否かを判断することができる。他の例示では、この判断プロセスは、クライアントで実行されてもよい。ビデオCが目標ビデオに属しない場合、直接にビデオCのビデオデータをクライアント510に送信する。ビデオCが目標ビデオに属する場合、サーバ530は、ビデオCの所定のデータ集合503をクライアント510に送信する。クライアント510は、ビデオCのN個の字幕テキストセグメント5031をユーザに提示し、nが1より大きい整数である。
クライアント510は、n個の字幕テキストセグメントのうちのi番目の字幕テキストセグメントに対するユーザのトリガ操作に応答して、i番目の字幕テキストセグメントの開始時間情報に基づいてビデオCの開始再生ノードを特定する。iは、1以上n以下の整数である。例示的には、i番目の字幕テキストセグメントの開始時間情報に基づいて、ビデオCにおける前記いずれか1つの字幕テキストセグメントの開始時刻(例えば、8分20秒)を特定する。この開始時刻を今回のビデオCの開始再生ノードとし、ビデオCのビデオデータに基づいてビデオCをロードして再生するとき、直接に当該開始再生ノードから再生ビデオCを開始する。
本開示の実施例によれば、さらに、i番目の字幕テキストセグメントの終了時間情報に基づいて、ビデオCにおけるi番目の字幕テキストセグメントの終了時刻(例えば、15分32秒)を特定してもよい。この開始時刻を今回のビデオCの終了再生ノードとし、ビデオCのビデオデータに基づいてビデオCをロードして再生するプロセスでは、ビデオCが終了再生ノードまで再生されるとき、再生ビデオCを停止する。上記の例では、字幕テキストセグメントに対するユーザのトリガ操作に応じて、ビデオCを8分20秒から15分32秒まで再生することができ、この部分のビデオコンテンツは、ユーザが現在興味を有し、視聴する必要があるコンテンツである。このプロセスは、ユーザ操作を大幅に簡略化することを前提として、ユーザが現在興味を有するコンテンツを容易に検索または思い出し、ユーザが興味を有する再生ノードに正確に位置決めすることができ、ユーザのニーズを満たす。
図6は、本発明の一実施例によるビデオ再生インタフェースの概略図であり、クライアントのビデオ再生プロセスを例示的に説明するためのものである。
図6に示すように、ビデオ再生インタフェース600は、ビデオ再生領域601と、字幕提示領域602と、検索領域603とを含んでもよい。例えば、1つの目標ビデオは、以下の複数の字幕テキストセグメント、例えば、「第1の問題……」、「第2の問題の第1の解法……」、「第2の問題の第2の解法」および「第3の問題……」などを含む。クライアントは、当該複数の字幕テキストセグメントを字幕提示領域602に提示することができる。提示が不完全な場合、ユーザは、スライド、ドラッグなどの操作により当該複数の字幕テキストセグメントを閲覧することができる。ユーザがビデオ内のあるコンテンツを視聴したいとき、対応する字幕テキストセグメントに対して、例えば、クリックのトリガ操作を行うことができる。クライアントは、ある字幕テキストセグメント(例えば、「第2の問題の第1の解法……」)に対するユーザのトリガ操作に応答して、ビデオにおける当該字幕テキストセグメントの開始時間をビデオの開始再生ノードとして、直接に当該開始再生ノードにジャンプして再生ビデオを開始する。
さらに、図6に示すように、本開示の実施例によるビデオ再生方法は、字幕テキストセグメントに対する検索機能もサポートすることができる。例示的には、検索領域603は、例えば、検索ボックス、検索ボタンなどの検索コントロールを含む。ビデオの字幕テキストセグメントが多すぎる場合、ユーザは、検索領域603に検索ワードを入力し、トリガ操作(例えば、ボタンをクリックトリガする、など)を実行することができる。ユーザのトリガ操作に応答して、検索ワードを取得する。現在のビデオの複数の字幕テキストセグメントから検索ワードに対するマッチング字幕テキストセグメントを特定する。例えば、上記の例では、検索ワードが「第3の」である場合、マッチングプロセスにより得られるマッチング字幕テキストセグメントは、「第3の問題……」である。当該マッチング字幕テキストセグメントの提示位置には、当該マッチング字幕テキストセグメントを目立つようにマークするために所定の標識が提示されることで、ユーザにリマインダして当該マッチング字幕テキストセグメントを注意させる。ビデオの再生ノードの位置決めおよびジャンプを可能にするために、ユーザは、当該マッチング字幕テキストセグメントを直接にトリガすることができる。
図7は、本発明の一実施例によるビデオ再生ノードの位置決め装置のブロック図である。
図7に示すように、ビデオ再生ノードの位置決め装置700は、サーバに適用されてもよく、ビデオ再生ノードの位置決め装置700は、選別モジュール710と、再生ノード管理モジュール720とを含んでもよい。
選別モジュール710は、複数のビデオから目標ビデオを選別するためのものである。
再生ノード管理モジュール720は、目標ビデオと、当該目標ビデオの複数の字幕テキストセグメントと、当該複数の字幕テキストセグメントのそれぞれの開始時間情報とをクライアントに送信し、クライアントによって当該複数の字幕テキストセグメントを提示し、当該複数の字幕テキストセグメントのうちのいずれか1つの字幕テキストセグメントに対するトリガ操作に応答して、当該いずれか1つの字幕テキストセグメントの開始時間情報に基づいて当該目標ビデオの開始再生ノードを特定するためのものである。
本発明の実施例によれば、選別モジュール710は、スコアサブモジュールと、第1の選別サブモジュールとを含んでもよい。スコアサブモジュールは、複数のビデオの各ビデオについて、ビデオのユーザ相互作用データに基づいて、ビデオの価値スコアを算出するためのものである。第1の選別サブモジュールは、複数のビデオから価値スコアが第1の閾値よりも高いビデオを第1のグループのビデオとして選別するためのものである。前記第2のグループのビデオに基づいて目標ビデオを取得する。
本発明の実施例によれば、選別モジュール710は、分類サブモジュールと、第2の選別サブモジュールとをさらに含んでもよい。分類サブモジュールは、ビデオが属するカテゴリを特定するために、前記第1のグループのビデオの各ビデオについて、予め訓練された分類器を用いてビデオを分類するためのものである。第2の選別サブモジュールは、前記第1のグループのビデオから所定のカテゴリに属するビデオを第2のグループのビデオとして選別するためのものである。第2のグループのビデオに基づいて目標ビデオを取得する。
例示的には、選別モジュール710は、第1の分析サブモジュールと、第3の選別サブモジュールとをさらに含んでもよい。第1の分析サブモジュールは、前記第2のグループのビデオの各ビデオについて、前記ビデオのオーディオデータを抽出し、前記オーディオデータを音声識別して、識別結果を取得するためのものである。前記識別結果は、前記ビデオの複数の字幕テキストセグメントと、前記ビデオの複数の字幕テキストセグメントのそれぞれの開始時間情報および終了時間情報とを含む。前記ビデオの複数の字幕テキストセグメントのそれぞれの開始時間情報および終了時間情報に基づいて、前記ビデオの総時間に対する前記ビデオの複数の字幕テキストセグメントの総時間の第1の割合を特定する。第3の選別サブモジュールは、前記第2のグループのビデオから前記第1の割合が第2の閾値よりも高いビデオを前記目標ビデオとして選別するためのものである。
例示的には、選別モジュール710は、第2の分析サブモジュールと、第4の選別サブモジュールとをさらに含んでもよい。第2の分析サブモジュールは、第2のグループのビデオの各ビデオについて、ビデオが所定のカテゴリに属する場合、ビデオのオーディオデータを抽出し、オーディオデータを音声識別して、識別結果を取得するためのものである。識別結果は、ビデオの複数の字幕テキストセグメントと、前記ビデオの複数の字幕テキストセグメントのそれぞれの開始時間情報および終了時間情報とを含む。ビデオの複数の字幕テキストセグメントに対して語彙分析を行なって、ビデオの複数の字幕テキストセグメントに対する論理スコアを取得する。第4の選別サブモジュールは、前記第2のグループのビデオから前記論理スコアが第3の閾値よりも高いビデオを前記目標ビデオとして選別する。
本発明の実施例によれば、再生ノード管理モジュール720は、さらに、目標ビデオの複数の字幕テキストセグメントのそれぞれの終了時間情報を前記クライアントに送信し、クライアントによって前記複数の字幕テキストセグメントのうちのいずれか1つの字幕テキストセグメントに対するトリガ操作に応答して、当該いずれか1つの字幕テキストセグメントの終了時間情報に基づいて、目標ビデオの終了再生ノードを特定するためのものである。
例示的には、ユーザ相互作用データは、ビデオを視聴するユーザの総数に対する、ビデオを視聴する回数が第4の閾値を超えるユーザ数の第2の割合と、ビデオに対するコメント数と、ビデオに対するお気に入り数と、ビデオに対するいいねの数のうちの少なくとも1つを含む。
例えば、スコアサブモジュールは、予め設定された第1の重み、第2の重み、第3の重みおよび第4の重みを用いて、前記第2の割合、前記コメント数、前記お気に入り数および前記いいねの数を重み付き加算することにより、前記価値スコアを算出するためのものである。
図8は、本発明の別の実施例によるビデオ再生ノードの位置決め装置のブロック図である。
図8に示すように、ビデオ再生ノードの位置決め装置800は、クライアントに適用されてもよく、ビデオ再生ノードの位置決め装置800は、取得モジュール810と、提示モジュール820と、再生ノード位置決めモジュール830とを含んでもよい。
取得モジュール810は、複数のビデオから選別された目標ビデオと、当該目標ビデオの複数の字幕テキストセグメントと、当該複数の字幕テキストセグメントのそれぞれの開始時間情報とを取得するためのものである。
提示モジュール820は、複数の字幕テキストセグメントを提示するためのものである。
再生ノード位置決めモジュール830は、前記複数の字幕テキストセグメントのうちのいずれか1つの字幕テキストセグメントに対するトリガ操作に応答して、当該いずれか1つの字幕テキストセグメントの開始時間情報に基づいて前記目標ビデオの開始再生ノードを特定するためのものである。
本発明の実施例によれば、再生ノード位置決めモジュール830は、当該いずれか1つの字幕テキストセグメントの開始時間情報に基づいて、目標ビデオにおける当該いずれか1つの字幕テキストセグメントの開始時刻を特定するための第1の特定サブモジュールと、当該開始時刻を目標ビデオの開始再生ノードとして当該開始再生ノードから前記目標ビデオの再生を開始するための第1の位置決めサブモジュールとを含む。
本発明の実施例によれば、当該装置800は、検索処理モジュールをさらに含み、当該検索処理モジュールは、検索コントロールを提示し、前記検索コントロールに対するトリガ操作に応答して検索ワードを取得し、前記複数の字幕テキストセグメントから前記検索ワードに対するマッチング字幕テキストセグメントを特定し、前記マッチング字幕テキストセグメントの提示位置に所定の標識を提示するためのものである。
本発明の実施例によれば、取得モジュール810は、さらに、複数の字幕テキストセグメントのそれぞれの終了時間情報を取得するためのものである。再生ノード位置決めモジュール830は、第2の特定サブモジュールと、第2の位置決めサブモジュールとをさらに含む。第2の特定サブモジュールは、いずれか1つの字幕テキストセグメントの終了時間情報に基づいて、前記目標ビデオにおける当該いずれか1つの字幕テキストセグメントの終了時刻を特定するためのものである。第2の位置決めサブモジュールは、当該終了時刻を前記目標ビデオの終了再生ノードとして、目標ビデオが前記終了再生ノードまで再生されるとき、再生目標ビデオを停止するためのものである。
なお、装置部分の実施例における各モジュール/ユニット/サブユニット等の実施形態、解決される技術問題、実現される機能、および達成される技術効果は、それぞれ方法部分の実施例における各対応するステップの実施形態、解決される技術問題、実現される機能、および達成されると同じまたは類似であり、ここでは再び説明しない。
本発明の実施例によるモジュール、サブモジュール、ユニット、サブユニットのうちの任意の複数、またはそれらのうちの任意の複数の少なくとも一部の機能は、1つのモジュールで実現されてもよい。本発明の実施例によるモジュール、サブモジュール、ユニット、サブユニットのうちの任意の1つまたは複数は、複数のモジュールに分けて実現されてもよい。本発明の実施例によるモジュール、サブモジュール、ユニット、サブユニットのうちの任意1つまたは複数は、少なくとも部分的に、例えば、フィールドプログラマブルゲートアレイ(FPGA)、プログラマブル論理アレイ(PLA)、システムオンチップ、基板上のシステム、パッケージ上のシステム、専用集積回路(ASIC)などのハードウェア回路として実現されてもよく、または、回路を集積またはパッケージする任意の他の合理的な形態のハードウェアまたはファームウェアで実現されてもよく、または、ソフトウェア、ハードウェアおよびファームウェアの3つの実現形態のうちのいずれか1つで、または、これらのうちの任意の一部の適切な組み合わせで実現されてもよい。または、本発明の実施例によるモジュール、サブモジュール、ユニット、サブユニットのうちの1つまたは複数は、少なくとも部分的に、コンピュータプログラムモジュールとして実現されてもよく、当該コンピュータプログラムモジュールが実行されるとき、対応する機能を実現しても良い。
本発明の実施例によれば、本発明は、電子デバイスと、読み取り可能な記憶媒体とをさらに提供する。
図9は、本発明の実施例によるビデオ再生ノードの位置決め方法の電子デバイスのブロック図である。当該電子デバイスは、上記ビデオ再生ノードの位置決め方法を実行するサーバであってもよいし、上記ビデオ再生ノードの位置決め方法を実行するクライアントが位置するデバイスであってもよい。電子デバイスは、ラップトップコンピュータ、デスクトップコンピュータ、ワークステーション、パーソナルデジタルアシスタント、サーバ、ブレードサーバ、大型コンピュータ、および他の適切なコンピュータなど、様々な形態のデジタルコンピュータを表すことを意図とする。電子デバイスは、パーソナルデジタルアシスタント、携帯電話、スマートフォン、ウェアラブルデバイスおよび他の類似の算出装置など、様々な形態の移動装置をさらに表す。本明細書に示されるコンポーネント、それらの接続と関係、およびそれらの機能は、単なる例であり、本明細書に記載および/または要求される本発明の実現を限定することを意図していない。
図9に示すように、当該電子デバイス900は、1つのまたは複数のプロセッサ901、メモリ902、および各コンポーネントを接続するためのインターフェース(高速インターフェースおよび低速インターフェースを含む)を含む。各コンポーネントは、異なるバスで互いに接続され、共通のマザーボードに実装されてもよいし、必要に応じて他の形態で実装されてもよい。プロセッサは、電子デバイス内で実行される命令を処理してもよく、当該命令は、メモリに記憶されて外部入力/出力装置(例えば、インターフェースに結合された表示デバイス)に表示されるGUIのグラフィック情報の命令を含む。他の実施形態では、必要であれば、複数のプロセッサおよび/または複数本のバスを複数のメモリおよび複数のメモリと共に使用してもよい。同様に、複数の電子デバイスを接続し、各デバイスが必要な操作の一部(例えば、サーバアレイ、ブレードサーバのセット、またはマルチプロセッサシステムとして)を提供するようにしてもよい。図9では、1つのプロセッサ901を例とする。
メモリ902は、本発明による非一時的なコンピュータ読み取り可能な記憶媒体である。前記メモリには、少なくとも1つのプロセッサによって実行可能な命令が記憶されており、前記少なくとも1つのプロセッサに、本発明によるビデオ再生ノードの位置決め方法を実行させる。本発明の非一時的なコンピュータ読み取り可能な記憶媒体は、コンピュータに、本発明によるビデオ再生ノードの位置決め方法を実行させるためのコンピュータ命令を記憶する。
メモリ902は、非一時的なコンピュータ読み取り可能な記憶媒体であり、本発明の実施例におけるビデオ再生ノードの位置決め方法に対応するプログラム命令/モジュールのような、非一時的なソフトウェアプログラム、非一時的なコンピュータ実行可能なプログラムおよびモジュールを記憶することができる。プロセッサ901は、メモリ902に記憶された非一時的なソフトウェアプログラム、命令およびモジュールを実行することにより、サーバの様々な機能アプリケーションおよびデータ処理を実行し、すなわち、上記方法実施例におけるビデオ再生ノードの位置決め方法を実現する。
メモリ902は、記憶プログラム領域および記憶データ領域を含んでもよく、記憶プログラム領域は、オペレーティングシステム、少なくとも1つの機能に必要なアプリケーションプログラムを記憶することができる。記憶データ領域は、電子デバイスの使用によって作成されるデータなどを記憶することができる。また、メモリ902は、高速ランダムアクセスメモリを含んでもよく、例えば、少なくとも1つの磁気ディスク記憶装置、フラッシュ記憶装置、または他の非一時的な固体記憶装置などの非一時メモリをさらに含んでもよい。一部の実施例では、メモリ902は、選択的に、プロセッサ901に対して遠隔に設けられたメモリを含んでもよく、これら遠隔メモリは、ネットワークを介して電子デバイスに接続され得る。上記ネットワークの実例は、インターネット、企業内部イントラネット、ローカルエリアネットワーク、移動通信ネットワーク、およびそれらの組み合わせを含むが、これらに限定されない。
ビデオ再生ノードの位置決め方法の電子デバイスは、入力装置903と、出力装置904とをさらに含んでもよい。プロセッサ901、メモリ902、入力装置903および出力装置904は、バスまたは他の形態で接続されていてもよいが、図9では、バス905で接続されることを例とする。
入力装置903は、入力されるデジタルまたは文字情報を受信し、ビデオ再生ノードの位置決め方法の電子デバイスのユーザ設定および機能制御に関するキー信号入力を生成することができ、例えば、タッチスクリーン、キーパッド、マウス、トラックパッド、タッチパッド、ポインティングスティック、1つのまたは複数のマウスボタン、トラックボール、ジョイスティックなどの入力装置である。出力装置904は、表示デバイス、補助照明装置(例えば、LED)および触覚フィードバック装置(例えば、振動モータ)などを含んでもよい。当該表示デバイスは、液晶ディスプレイ(LCD)、発光ダイオード(LED)ディスプレイおよびプラズマディスプレイを含んでもよいが、これらに限定されない。いくつかの実施形態では、表示デバイスは、タッチスクリーンであってもよい。
ここに記載されるシステムおよび技術の様々な実施形態は、デジタル電子回路システム、集積回路システム、専用ASIC(専用集積回路)、コンピュータハードウェア、ファームウェア、ソフトウェア、および/またはそれらの組合せで実現され得る。これら様々な実施形態は、専用または汎用プログラマブルプロセッサであり得る少なくとも1つのプログラマブルプロセッサを含むプログラマブルシステムで実行および/または解釈され得る1つのまたは複数のコンピュータプログラムで実施されること、および、記憶システム、少なくとも1つの入力装置、および少なくとも1つの出力装置からデータおよび命令を受信し、データおよび命令を当該記憶システム、当該少なくとも1つの入力装置、および当該少なくとも1つの出力装置に伝送することを含んでもよい。
これら算出プログラム(プログラム、ソフトウェア、ソフトウェアアプリケーション、またはコードとも呼ばれる)は、プログラマブルプロセッサの機械命令を含み、高レベルのプロセスおよび/またはオブジェクト向けのプログラミング言語、および/またはアセンブリ/機械言語を用いてこれら算出プログラムで実施できる。本明細書で使用される、「機械読み取り可能な媒体」および「コンピュータ読み取り可能な媒体」という用語は、機械命令および/またはデータをプログラマブルプロセッサに提供する任意のコンピュータプログラム製品、デバイス、および/または装置(例えば、磁気ディスク、光ディスク、メモリ、プログラマブルロジック装置(PLD))を指し、機械読み取り可能な信号としての機械命令を受信する機械読み取り可能な媒体を含む。「機械読み取り可能な信号」という用語は、機械命令および/またはデータをプログラマブルプロセッサに提供するための任意の信号を指す。
ユーザとの対話を提供するために、コンピュータで本明細書に記載されるシステムおよび技術を実行することができ、当該コンピュータは、ユーザに情報を表示するための表示装置(例えば、CRT(陰極線管)またはLCD(液晶ディスプレイ)モニタ)、およびキーボードおよびポインティング装置(例えば、マウスまたはトラックボール)を有し、ユーザは、当該キーボードおよび当該ポインティング装置によって入力をコンピュータに提供することができる。他の種類の装置も、ユーザとの対話を提供するために使用され得る。例えば、ユーザに提供されるフィードバックは、任意の形態のセンシングフィードバック(例えば、視覚フィードバック、聴覚フィードバック、または触覚フィードバック)であってもよく、かつ、ユーザからの入力は、任意の形態(声入力、音声入力、または、触覚入力を含む)で受信され得る。
本明細書で説明されるシステムおよび技術は、バックエンドコンポーネントを含むコンピューティングシステム(例えば、データサーバとして)、またはミドルウェアコンポーネントを含むコンピューティングシステム(例えば、アプリケーションサーバ)、またはフロントエンドコンポーネントを含むコンピューティングシステム(例えば、グラフィカルユーザインターフェースまたはネットワークブラウザを有するユーザコンピュータで実施される。ユーザは、当該グラフィカルユーザインターフェースまたは当該ネットワークブラウザによって本明細書で説明されるシステムおよび技術の実施形態と対話できる)、またはこのようなバックエンドコンポーネント、ミドルウェアコンポーネント、またはフロントエンドコンポーネントの任意の組合せを含むコンピューティングシステムで実施することができる。任意の形態または媒体のデジタルデータ通信(例えば、通信ネットワーク)によってシステムのコンポーネントを互いに接続することができる。通信ネットワークの示例は、ローカルエリアネットワーク(LAN)、ワイドエリアネットワーク(WAN)およびインターネットを含む。
コンピュータシステムは、クライアントおよびサーバを含んでもよい。クライアントおよびサーバは、一般に、互いから離れており、通常、通信ネットワークを介して対話する。それぞれのコンピュータで動作し、互いにクライアント-サーバ関係を有するコンピュータプログラムによって、クライアントとサーバの関係を生成する。
本発明の実施例の技術手段によれば、大量のビデオから選別された再生ノード位置決め価値を有する目標ビデオは、目標ビデオに対して再生を行なう必要がある場合、ユーザに目標ビデオの複数の字幕テキストセグメントを提示する。ユーザが指定した字幕テキストセグメントの開始時間情報に基づいて、当該目標ビデオの開始再生ノードを特定することができる。以上のプロセスでは、目標ビデオのみに対する再生ノード位置決め処理は、大量の算出リソースを節約し、サーバとクライアントとの間の相互作用効率を向上することができ、複数の字幕テキストセグメントの共同提示により、視聴したいコンテンツノードをユーザが短時間で特定でき、かつ、ユーザが指定した字幕テキストセグメントの開始時間情報に基づいて、現在のビデオの開始再生ノードを正確に特定することができる。本開示の実施例によるビデオ再生ノードの位置決め方法、装置、デバイスおよび記憶媒体は、例えば、クラウドコンピューティング、ビッグデータ、ビデオ処理などの様々な技術に関する。
上記に示された様々な形態のフローを用いて、ステップを新たにソート、追加、または削除することができることを理解されたい。例えば、本願に記載の各ステップは、並列的に実行されてもよいし、順番に実行されてもよいし、異なる順番で実行されてもよいが、本発明に開示される技術手段から期待される結果が得られる限り、ここでは限定されない。
上記具体的な実施形態は、本発明の保護範囲を限定するものではない。当業者は、設計要求および他の要因に応じて様々な補正、組合せ、サブ組合せおよび置換を行なうことができることを理解する必要がある。本発明の思想および原則内で行われる任意の修正、均等物および改良物などは、何れも本発明の保護範囲内に含まれるべきである。

Claims (9)

  1. 複数のビデオの各ビデオについて、前記ビデオのユーザ相互作用データに基づいて、前記ビデオの価値スコアを算出することと、
    前記複数のビデオから前記価値スコアが第1の閾値よりも高いビデオを第1のグループのビデオとして選別することと、
    前記第1のグループのビデオの各ビデオについて、予め訓練された分類器を用いて前記ビデオを分類することで、前記ビデオが属するカテゴリを特定することと、
    前記第1のグループのビデオから所定のカテゴリに属するビデオを第2のグループのビデオとして選別することと、
    前記第2のグループのビデオに基づいて目標ビデオを取得すること、
    前記目標ビデオと、前記目標ビデオの複数の字幕テキストセグメントと、前記複数の字幕テキストセグメントのそれぞれの開始時間情報とをクライアントに送信し、前記クライアントによって前記複数の字幕テキストセグメントを提示し、前記複数の字幕テキストセグメントのうちのいずれか1つの字幕テキストセグメントに対するトリガ操作に応答して、前記いずれか1つの字幕テキストセグメントの開始時間情報に基づいて前記目標ビデオの開始再生ノードを特定することとを含
    前記第2のグループのビデオに基づいて前記目標ビデオを取得することは、
    前記第2のグループのビデオの各ビデオについて、
    前記ビデオのオーディオデータを抽出することと、
    前記オーディオデータを音声識別して、前記ビデオの複数の字幕テキストセグメントと、前記ビデオの複数の字幕テキストセグメントのそれぞれの開始時間情報および終了時間情報とを含む識別結果を取得することと、
    前記ビデオの複数の字幕テキストセグメントのそれぞれの開始時間情報および終了時間情報に基づいて、前記ビデオの総時間に対する前記ビデオの複数の字幕テキストセグメントの総時間の第1の割合を特定することと、
    前記第2のグループのビデオから前記第1の割合が第2の閾値よりも高いビデオを前記目標ビデオとして選別することとを含む、ことを特徴とするビデオ再生ノードの位置決め方法。
  2. 前記第2のグループのビデオに基づいて前記目標ビデオを取得することは、
    前記第2のグループのビデオの各ビデオについて、
    前記ビデオが所定のカテゴリに属する場合、前記ビデオのオーディオデータを抽出することと、
    前記オーディオデータを音声識別して、前記ビデオの複数の字幕テキストセグメントと、前記ビデオの複数の字幕テキストセグメントのそれぞれの開始時間情報および終了時間情報とを含む識別結果を取得することと、
    前記ビデオの複数の字幕テキストセグメントに対して語彙分析を行なって、前記ビデオの複数の字幕テキストセグメントに対する論理スコアを取得することと、
    前記第2のグループのビデオから前記論理スコアが第3の閾値よりも高いビデオを前記目標ビデオとして選別することとを含む、ことを特徴とする請求項に記載の方法。
  3. 前記目標ビデオの複数の字幕テキストセグメントのそれぞれの終了時間情報を前記クライアントに送信し、前記クライアントによって前記複数の字幕テキストセグメントのうちのいずれか1つの字幕テキストセグメントに対するトリガ操作に応答して、前記いずれか1つの字幕テキストセグメントの終了時間情報に基づいて前記目標ビデオの終了再生ノードを特定することをさらに含む、ことを特徴とする請求項またはに記載の方法。
  4. 前記ユーザ相互作用データは、
    前記ビデオを視聴するユーザの総数に対する前記ビデオを視聴する回数が第4の閾値を超えるユーザ数の第2の割合と、
    前記ビデオに対するコメント数と、
    前記ビデオに対するお気に入り数と、
    前記ビデオに対するいいねの数とのうちの少なくとも1つを含む、ことを特徴とする請求項に記載の方法。
  5. 前記ユーザ相互作用データに基づいて前記ビデオの価値スコアを算出することは、
    予め設定された第1の重み、第2の重み、第3の重みおよび第4の重みを用いて、前記第2の割合、前記コメント数、前記お気に入り数および前記いいねの数を重み付き加算することで、前記価値スコアを算出することを含む、ことを特徴とする請求項に記載の方法。
  6. 複数のビデオの各ビデオについて、前記ビデオのユーザ相互作用データに基づいて、前記ビデオの価値スコアを算出し、前記複数のビデオから前記価値スコアが第1の閾値よりも高いビデオを第1のグループのビデオとして選別し、前記第1のグループのビデオの各ビデオについて、予め訓練された分類器を用いて前記ビデオを分類することで、前記ビデオが属するカテゴリを特定し、前記第1のグループのビデオから所定のカテゴリに属するビデオを第2のグループのビデオとして選別し、前記第2のグループのビデオに基づいて目標ビデオを取得するための選別モジュールと、
    前記目標ビデオと、前記目標ビデオの複数の字幕テキストセグメントと、前記複数の字幕テキストセグメントのそれぞれの開始時間情報とをクライアントに送信し、前記クライアントによって前記複数の字幕テキストセグメントを提示し、前記複数の字幕テキストセグメントのうちのいずれか1つの字幕テキストセグメントに対するトリガ操作に応答して、前記いずれか1つの字幕テキストセグメントの開始時間情報に基づいて前記目標ビデオの開始再生ノードを特定するための再生ノード管理モジュールとを含
    前記選別モジュールにおいて、前記第2のグループのビデオに基づいて前記目標ビデオを取得することは、
    前記第2のグループのビデオの各ビデオについて、
    前記ビデオのオーディオデータを抽出することと、
    前記オーディオデータを音声識別して、前記ビデオの複数の字幕テキストセグメントと、前記ビデオの複数の字幕テキストセグメントのそれぞれの開始時間情報および終了時間情報とを含む識別結果を取得することと、
    前記ビデオの複数の字幕テキストセグメントのそれぞれの開始時間情報および終了時間情報に基づいて、前記ビデオの総時間に対する前記ビデオの複数の字幕テキストセグメントの総時間の第1の割合を特定することと、
    前記第2のグループのビデオから前記第1の割合が第2の閾値よりも高いビデオを前記目標ビデオとして選別することとを含む、ことを特徴とするビデオ再生ノードの位置決め装置。
  7. 少なくとも1つのプロセッサと、
    前記少なくとも1つのプロセッサに通信接続されるメモリとを含み、
    前記メモリには、前記少なくとも1つのプロセッサによって実行可能な命令が記憶されており、前記少なくとも1つのプロセッサが請求項1~のいずれか一項に記載の方法を実行可能であるように、前記命令は、前記少なくとも1つのプロセッサによって実行される、ことを特徴とする電子デバイス。
  8. コンピュータ命令が記憶されている非一時的なコンピュータ読み取り可能な記憶媒体であって、
    前記コンピュータ命令は、コンピュータに請求項1~のいずれか一項に記載の方法を実行させるためのものである、ことを特徴とする非一時的なコンピュータ読み取り可能な記憶媒体。
  9. 実行される際に、請求項1~のいずれか一項に記載の方法を実現するコンピュータ実行可能な命令を含むコンピュータプログラム。
JP2021055712A 2020-08-28 2021-03-29 ビデオ再生ノードの位置決め方法、装置、デバイス、記憶媒体およびコンピュータプログラム Active JP7201729B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN202010891723.0 2020-08-28
CN202010891723.0A CN111988663B (zh) 2020-08-28 2020-08-28 视频播放节点的定位方法、装置、设备以及存储介质

Publications (2)

Publication Number Publication Date
JP2021103896A JP2021103896A (ja) 2021-07-15
JP7201729B2 true JP7201729B2 (ja) 2023-01-10

Family

ID=73439729

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021055712A Active JP7201729B2 (ja) 2020-08-28 2021-03-29 ビデオ再生ノードの位置決め方法、装置、デバイス、記憶媒体およびコンピュータプログラム

Country Status (5)

Country Link
US (1) US11581021B2 (ja)
EP (1) EP3855753B1 (ja)
JP (1) JP7201729B2 (ja)
KR (1) KR102436734B1 (ja)
CN (1) CN111988663B (ja)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112437353B (zh) * 2020-12-15 2023-05-02 维沃移动通信有限公司 视频处理方法、视频处理装置、电子设备和可读存储介质
CN112738554B (zh) * 2020-12-22 2022-12-13 北京百度网讯科技有限公司 视频的处理方法、装置和电子设备
CN112866776B (zh) * 2020-12-29 2022-09-20 北京金堤科技有限公司 视频生成方法和装置
CN112860939B (zh) * 2021-02-19 2023-09-26 北京百度网讯科技有限公司 音视频数据处理方法、装置、设备和存储介质
CN115119044B (zh) * 2021-03-18 2024-01-05 阿里巴巴新加坡控股有限公司 视频处理方法、设备、系统及计算机存储介质
CN113378001B (zh) * 2021-06-28 2024-02-27 北京百度网讯科技有限公司 视频播放进度的调整方法及装置、电子设备和介质
CN113569085A (zh) * 2021-06-30 2021-10-29 北京达佳互联信息技术有限公司 音视频数据展示方法、装置、设备、存储介质及程序产品
CN113873323B (zh) * 2021-07-28 2023-08-29 百度在线网络技术(北京)有限公司 视频播放方法、装置、电子设备和介质
CN114339300B (zh) * 2021-12-28 2024-04-19 Oppo广东移动通信有限公司 字幕处理方法、装置、电子设备及计算机可读介质及产品
CN114501159B (zh) * 2022-01-24 2023-12-22 传神联合(北京)信息技术有限公司 一种字幕编辑方法、装置、电子设备及存储介质
CN114495916B (zh) * 2022-04-15 2022-07-12 腾讯科技(深圳)有限公司 背景音乐的插入时间点确定方法、装置、设备和存储介质
CN115022732B (zh) * 2022-05-25 2023-11-03 阿里巴巴(中国)有限公司 视频生成方法、装置、设备及介质
CN115086783B (zh) * 2022-06-28 2023-10-27 北京奇艺世纪科技有限公司 一种视频生成方法、装置及电子设备
CN115278307B (zh) * 2022-07-27 2023-08-04 天翼云科技有限公司 一种视频播放方法、装置、设备和介质
CN117714766A (zh) * 2022-09-09 2024-03-15 抖音视界有限公司 视频内容预览交互方法、装置、电子设备及存储介质
CN117033673B (zh) * 2023-05-16 2024-04-05 广州比地数据科技有限公司 一种基于人工智能的多媒体内容抽取系统

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003199028A (ja) 2001-12-27 2003-07-11 Matsushita Electric Ind Co Ltd 電子アルバム装置
JP2005242998A (ja) 2004-01-23 2005-09-08 Microsoft Corp ピボットポイントデータによるデータベースの選択的な多重レベル展開
JP2006245907A (ja) 2005-03-02 2006-09-14 Sharp Corp 放送記録再生装置
JP2009055459A (ja) 2007-08-28 2009-03-12 Index:Kk ビデオコンテンツ再生端末およびビデオコンテンツ再生プログラム
JP2010124155A (ja) 2008-11-18 2010-06-03 Samsung Yokohama Research Institute Co Ltd 情報処理装置、情報処理方法、プログラム、および情報処理システム
JP2014044268A (ja) 2012-08-24 2014-03-13 Sony Corp 情報処理装置、情報処理方法、及びプログラム
JP2017054257A (ja) 2015-09-08 2017-03-16 ヤフー株式会社 決定装置、決定方法、及び決定プログラム

Family Cites Families (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI271704B (en) * 2004-01-12 2007-01-21 Sunplus Technology Co Ltd A control method and device capable of playing digital multimedia content according to corresponding time of a caption
US8090694B2 (en) * 2006-11-02 2012-01-03 At&T Intellectual Property I, L.P. Index of locally recorded content
CN101650958B (zh) * 2009-07-23 2012-05-30 中国科学院声学研究所 对电影类视频进行场景片段抽取方法及其建立索引的方法
WO2011143818A1 (en) * 2010-05-19 2011-11-24 Mediatek Singapore Pte. Ltd. Method for providing a video playback device with a subtitle-based repeat/playback function, and associated video playback device and associated processing circuit
US20130177891A1 (en) * 2011-07-02 2013-07-11 Joachim Hammerschmidt Audio-visual learning system
CN102833638B (zh) * 2012-07-26 2015-03-18 北京数视宇通技术有限公司 基于字幕信息的视频自动切分及标注方法及系统
CN103838751A (zh) * 2012-11-23 2014-06-04 鸿富锦精密工业(深圳)有限公司 视频内容搜索系统及方法
CN103997663A (zh) * 2013-02-19 2014-08-20 广州星海传媒有限公司 一种视频资源管理方法、系统及视频点播装置
US9646227B2 (en) 2014-07-29 2017-05-09 Microsoft Technology Licensing, Llc Computerized machine learning of interesting video sections
CN104967910B (zh) * 2014-10-29 2018-11-23 广州酷狗计算机科技有限公司 多媒体播放进度控制方法及装置
CN105609121B (zh) * 2014-11-20 2019-03-12 广州酷狗计算机科技有限公司 多媒体播放进度控制方法及装置
CN104954878B (zh) * 2015-06-30 2018-10-30 北京奇艺世纪科技有限公司 一种对用户回顾的视频字幕的显示方法及装置
CN105163178B (zh) * 2015-08-28 2018-08-07 北京奇艺世纪科技有限公司 一种视频播放位置定位方法和装置
CN105338419B (zh) * 2015-10-29 2018-07-31 网易传媒科技(北京)有限公司 一种字幕集锦的生成方法和设备
US10341405B2 (en) 2015-12-29 2019-07-02 Facebook, Inc. Social networking interactions with portions of digital videos
CN108337533B (zh) * 2017-01-17 2021-07-09 腾讯科技(深圳)有限公司 视频压缩方法和装置
CN107027060A (zh) * 2017-04-18 2017-08-08 腾讯科技(深圳)有限公司 视频片段的确定方法和装置
CN107438204B (zh) * 2017-07-26 2019-12-17 维沃移动通信有限公司 一种媒体文件循环播放的方法及移动终端
US11109111B2 (en) * 2017-12-20 2021-08-31 Flickray, Inc. Event-driven streaming media interactivity
CN108401189A (zh) * 2018-03-16 2018-08-14 百度在线网络技术(北京)有限公司 一种搜索视频的方法、装置及服务器
CN109246472A (zh) * 2018-08-01 2019-01-18 平安科技(深圳)有限公司 视频播放方法、装置、终端设备及存储介质
CN109743617B (zh) * 2018-12-03 2020-11-24 清华大学 一种视频播放的跳转导航方法和设备
CN111277898A (zh) * 2018-12-05 2020-06-12 中国移动通信集团广西有限公司 一种内容推送方法及装置
CN111314775B (zh) * 2018-12-12 2021-09-07 华为终端有限公司 一种视频拆分方法及电子设备
CN109359636B (zh) * 2018-12-14 2023-04-28 腾讯科技(深圳)有限公司 视频分类方法、装置及服务器
US11204959B1 (en) * 2019-02-06 2021-12-21 Snap Inc. Automated ranking of video clips
US10963702B1 (en) * 2019-09-10 2021-03-30 Huawei Technologies Co., Ltd. Method and system for video segmentation
US11574145B2 (en) * 2020-06-30 2023-02-07 Google Llc Cross-modal weak supervision for media classification

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003199028A (ja) 2001-12-27 2003-07-11 Matsushita Electric Ind Co Ltd 電子アルバム装置
JP2005242998A (ja) 2004-01-23 2005-09-08 Microsoft Corp ピボットポイントデータによるデータベースの選択的な多重レベル展開
JP2006245907A (ja) 2005-03-02 2006-09-14 Sharp Corp 放送記録再生装置
JP2009055459A (ja) 2007-08-28 2009-03-12 Index:Kk ビデオコンテンツ再生端末およびビデオコンテンツ再生プログラム
JP2010124155A (ja) 2008-11-18 2010-06-03 Samsung Yokohama Research Institute Co Ltd 情報処理装置、情報処理方法、プログラム、および情報処理システム
JP2014044268A (ja) 2012-08-24 2014-03-13 Sony Corp 情報処理装置、情報処理方法、及びプログラム
JP2017054257A (ja) 2015-09-08 2017-03-16 ヤフー株式会社 決定装置、決定方法、及び決定プログラム

Also Published As

Publication number Publication date
CN111988663B (zh) 2022-09-06
KR20210042852A (ko) 2021-04-20
JP2021103896A (ja) 2021-07-15
EP3855753B1 (en) 2023-03-15
US20210233571A1 (en) 2021-07-29
US11581021B2 (en) 2023-02-14
CN111988663A (zh) 2020-11-24
KR102436734B1 (ko) 2022-08-26
EP3855753A2 (en) 2021-07-28
EP3855753A3 (en) 2021-08-11

Similar Documents

Publication Publication Date Title
JP7201729B2 (ja) ビデオ再生ノードの位置決め方法、装置、デバイス、記憶媒体およびコンピュータプログラム
US11830241B2 (en) Auto-curation and personalization of sports highlights
CN107995536B (zh) 一种提取视频预览的方法、装置、设备和计算机存储介质
US9438850B2 (en) Determining importance of scenes based upon closed captioning data
KR101944469B1 (ko) 컴퓨터 실행 방법, 시스템 및 컴퓨터 판독 가능 매체
US20190130185A1 (en) Visualization of Tagging Relevance to Video
US20160055164A1 (en) News alert system and method
US20170235828A1 (en) Text Digest Generation For Searching Multiple Video Streams
WO2018108047A1 (zh) 信息展示图片的生成方法及装置
JP2011215963A (ja) 電子機器、画像処理方法及びプログラム
CN113779381B (zh) 资源推荐方法、装置、电子设备和存储介质
KR20220103112A (ko) 비디오 생성 방법 및 장치, 전자 장치, 및 컴퓨터 판독가능 매체
WO2023279843A1 (zh) 内容搜索方法、装置、设备和存储介质
CN111279709A (zh) 提供视频推荐
WO2023016349A1 (zh) 一种文本输入方法、装置、电子设备和存储介质
CN113079417A (zh) 生成弹幕的方法、装置、设备和存储介质
CN112287168A (zh) 用于生成视频的方法和装置
CN111309200B (zh) 一种扩展阅读内容的确定方法、装置、设备及存储介质
TW201907323A (zh) 視訊結果項的展示、提供方法、客戶端及伺服器
CN116049490A (zh) 素材搜索方法、装置和电子设备
TWI709905B (zh) 資料分析方法及資料分析系統
CN114245171A (zh) 视频编辑方法、装置、电子设备、介质
CN116992073B (zh) 视频片段排序方法、装置、设备及存储介质
US11941885B2 (en) Generating a highlight video from an input video
TWI780333B (zh) 動態處理並播放多媒體內容的方法及多媒體播放裝置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210329

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20220309

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220426

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220714

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20221129

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20221222

R150 Certificate of patent or registration of utility model

Ref document number: 7201729

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150