JP7246487B2 - ビデオにおけるホットスポットセグメントを抽出する方法、装置、電子機器、記憶媒体およびコンピュータプログラム - Google Patents

ビデオにおけるホットスポットセグメントを抽出する方法、装置、電子機器、記憶媒体およびコンピュータプログラム Download PDF

Info

Publication number
JP7246487B2
JP7246487B2 JP2021536295A JP2021536295A JP7246487B2 JP 7246487 B2 JP7246487 B2 JP 7246487B2 JP 2021536295 A JP2021536295 A JP 2021536295A JP 2021536295 A JP2021536295 A JP 2021536295A JP 7246487 B2 JP7246487 B2 JP 7246487B2
Authority
JP
Japan
Prior art keywords
pending video
video
image
image frame
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2021536295A
Other languages
English (en)
Other versions
JP2022524260A (ja
Inventor
倩 張
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Publication of JP2022524260A publication Critical patent/JP2022524260A/ja
Application granted granted Critical
Publication of JP7246487B2 publication Critical patent/JP7246487B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
    • H04N21/23418Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
    • H04N21/23424Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving splicing one content stream with another content stream, e.g. for inserting or substituting an advertisement
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
    • H04N21/2343Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
    • H04N21/234381Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements by altering the temporal resolution, e.g. decreasing the frame rate by frame skipping
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
    • H04N21/2343Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
    • H04N21/23439Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements for generating different versions
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/44016Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving splicing one content stream with another content stream, e.g. for substituting a video clip
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/442Monitoring of processes or resources, e.g. detecting the failure of a recording device, monitoring the downstream bandwidth, the number of times a movie has been viewed, the storage space available from the internal hard disk
    • H04N21/44213Monitoring of end-user related data
    • H04N21/44222Analytics of user selections, e.g. selection of programs or purchase activity
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/45Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
    • H04N21/454Content or additional data filtering, e.g. blocking advertisements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/475End-user interface for inputting end-user data, e.g. personal identification number [PIN], preference data
    • H04N21/4756End-user interface for inputting end-user data, e.g. personal identification number [PIN], preference data for rating content, e.g. scoring a recommended movie
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/845Structuring of content, e.g. decomposing content into time segments
    • H04N21/8456Structuring of content, e.g. decomposing content into time segments by decomposing the content in the time domain, e.g. in time segments
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/85Assembly of content; Generation of multimedia applications
    • H04N21/858Linking data to content, e.g. by linking an URL to a video object, by creating a hotspot
    • H04N21/8583Linking data to content, e.g. by linking an URL to a video object, by creating a hotspot by creating hot-spots
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • G06V20/46Extracting features or characteristics from the video content, e.g. video fingerprints, representative shots or key frames

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Databases & Information Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Social Psychology (AREA)
  • Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Human Computer Interaction (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Television Signal Processing For Recording (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)

Description

本願は、出願日が2020年02月01日であり、出願番号が2020101086838であり、発明名称が「ビデオにおけるホットスポットセグメントを抽出する方法および装置」である中国特許出願の優先権を主張する。
本出願は、インターネット技術の分野に関し、特に、マルチメディア処理技術分野におけるビデオにおけるホットスポットセグメントを抽出する方法、装置、電子機器、およびコンピュータ読み取り可能な記憶媒体に関する。
インターネット技術の発展に伴い、ネットワークにおけるビデオの形態は多様化し、ビデオにおけるハイライトや重要な内容に対する取得がユーザの重要な需要となるようになってきている。
従来技術では、ユーザは、ビデオを素早く視聴するために倍速再生やスキップ再生などの操作を行うことが一般的であった。ここで、倍速再生のオーディオ体験は不十分であり、スキップ再生の速度が把握しにくく、早送りしすぎて見逃したり、早送りしすぎて繰り返し内容を見てしまったりするなどの不具合が発生しやすくなる。したがって、ユーザーがビデオのホットスポット部分を便利で正確に視聴することができる方法が強く望まれている。
本願が技術課題を解決するために採用する技術案は、ビデオにおけるホットスポットセグメントを抽出する方法であって、処理待ちのビデオを取得することと、前記処理待ちのビデオにおける内容が重複する画像フレームをフィルタリングして、前記処理待ちのビデオのコンパクトセグメントを取得することと、前記処理待ちのビデオに対応するユーザ視聴情報に基づいて、前記コンパクトセグメントにおける各フレーム画像を採点することと、採点結果が予め設定された条件を満たす画像フレームをスティッチングし、スティッチング結果を前記処理待ちのビデオのホットスポットセグメントとすることと、を含む。本願は、ユーザがビデオのハイライト内容をより正確で便利に視聴することを可能にし、ホットスポットセグメントのサイズを効果的に低減し、それにより、ユーザのメモリリソース及び帯域幅の浪費を低減することができる。
本願の好ましい実施例によれば、前記処理待ちのビデオにおける内容が重複する画像フレームをフィルタリングすることは、前記処理待ちのビデオのビデオ画像シーケンスを取得することと、前記ビデオ画像シーケンスにおける各フレーム画像間の内容重複度を計算することと、前記内容重複度が第1の閾値を超えるか否かを判定し、超える場合、前記各フレーム画像のうちの1つのフレーム画像を保留して他の画像をフィルタリングし、そうでなければ、前記各フレーム画像を保留することと、を含む。このステップは、画像フレームフィルタリングの正確性を向上させることができる。
本願の好ましい実施例によれば、前記処理待ちのビデオに対応するユーザ視聴情報は、ユーザによる前記処理待ちのビデオにおける各画像フレームに対するマーク回数、およびユーザによる前記処理待ちのビデオにおける各画像フレームに対する有効視聴回数の少なくとも1つを含む。このステップは、ユーザの見る情報の種類を豊富にし、それによって画像フレームの採点結果の正確性を向上させることができる。
本願の好ましい実施例によれば、前記処理待ちのビデオに対応するユーザ視聴情報に基づいて、前記コンパクトセグメントにおける各フレーム画像を採点することは、対応的な画像フレームがマークされた第1の重み、および対応的な画像フレームが効果的に視聴される第2の重みを取得することと、画像フレームのマーク回数及び第1の重みに基づいて第1の採点を取得し、画像フレームの有効視聴回数及び第2の重みに基づいて第2の採点を取得することと、第1の採点と第2の採点との加算結果を画像フレームの採点結果とすることと、を含む。このステップは、多次元情報により画像フレームの採点を行い、採点結果の正確性を向上させることができる。
本願の好ましい実施例によれば、ユーザによる前記処理待ちのビデオにおける各画像フレームに対するマーク回数を取得することは、前記処理待ちのビデオの再生過程にマークボタンを提供することと、前記処理待ちのビデオにおける各画像フレームを再生するときの前記マークボタンのトリガ回数を統計し、前記ユーザによる前記処理待ちのビデオにおける各画像フレームに対するマーク回数とすることと、を含む。
本願の好ましい実施例によれば、ユーザによる前記処理待ちのビデオにおける各画像フレームに対する有効視聴回数を取得することは、再生過程において前記処理待ちのビデオの各画像フレームの再生速度を決定することと、前記処理待ちのビデオにおける各画像フレームが正常な速度で再生された回数を統計し、前記ユーザによる前記処理待ちのビデオにおける各画像フレームに対する有効視聴回数とすることとを含む。
本願の好ましい実施例によれば、前記方法は、ユーザが選択的に視聴するように、前記処理待ちのビデオをそれに対応するホットスポットセグメントと共にユーザに展示すること、をさらに含む。このステップは、ビデオ表示の柔軟性を向上させ、ユーザへ多くの視聴選択を提供することができる。
本願が技術課題を解決するために採用する技術案は、ビデオにおけるホットスポットセグメントを抽出する装置を提供しており、処理待ちのビデオを取得する取得ユニットと、前記処理待ちのビデオにおける内容が重複する画像フレームをフィルタリングして、前記処理待ちのビデオのコンパクトセグメントを取得する簡素化ユニットと、前記処理待ちのビデオに対応するユーザ視聴情報に基づいて、前記コンパクトセグメントにおける各フレーム画像を採点する採点ユニットと、採点結果が予め設定された条件を満たす画像フレームをスティッチングし、スティッチング結果を前記処理待ちのビデオのホットスポットセグメントとする処理ユニットと、を含む。
本願の好ましい実施例によれば、前記簡素化ユニットが前記処理待ちのビデオにおける内容が重複する画像フレームをフィルタリングする場合、具体的には、前記処理待ちのビデオのビデオ画像シーケンスを取得し、前記ビデオ画像シーケンスにおける各フレーム画像間の内容重複度を計算し、前記内容重複度が第1の閾値を超えるか否かを判定し、超える場合、前記各フレーム画像のうちの1つのフレーム画像を保留して他の画像をフィルタリングし、そうでなければ、前記各フレーム画像を保留することを、実行する。
本願の好ましい実施例によれば、前記採点ユニットにおいて前記処理待ちのビデオに対応するユーザ視聴情報は、ユーザによる前記処理待ちのビデオにおける各画像フレームに対するマーク回数、およびユーザによる前記処理待ちのビデオにおける各画像フレームに対する有効視聴回数の少なくとも1つを含む。
本願の好ましい実施例によれば、前記採点ユニットが前記処理待ちのビデオに対応するユーザ視聴情報に基づいて、前記コンパクトセグメントにおける各フレーム画像を採点する場合、具体的に、対応的な画像フレームがマークされた第1の重み、および対応的な画像フレームが効果的に視聴される第2の重みを取得し、画像フレームのマーク回数及び第1の重みに基づいて第1の採点を取得し、画像フレームの有効視聴回数及び第2の重みに基づいて第2の採点を取得し、第1の採点と第2の採点との加算結果を画像フレームの採点結果とすることを、実行する。
本願の好ましい実施例によれば、前記採点ユニットがユーザによる前記処理待ちのビデオにおける各画像フレームに対するマーク回数を取得する場合、具体的に、前記処理待ちのビデオの再生過程にマークボタンを提供し、前記処理待ちのビデオにおける各画像フレームを再生するときの前記マークボタンのトリガ回数を統計し、前記ユーザによる前記処理待ちのビデオにおける各画像フレームに対するマーク回数とすることを、実行する。
本願の好ましい実施例によれば、前記採点ユニットがユーザによる前記処理待ちのビデオにおける各画像フレームに対する有効視聴回数を取得する場合、具体的に、再生過程において前記処理待ちのビデオの各画像フレームの再生速度を決定し、前記処理待ちのビデオにおける各画像フレームが正常な速度で再生された回数を統計し、前記ユーザによる前記処理待ちのビデオにおける各画像フレームに対する有効視聴回数とすることを、実行する。
本願の好ましい実施例によれば、前記処理ユニットは、ユーザが選択的に視聴するように、前記処理待ちのビデオをそれに対応するホットスポットセグメントと共にユーザに展示することを、さらに実行する。
上記の出願の一実施例は、ホットスポットセグメントの抽出正確性を向上させ、ユーザーがビデオのハイライトをより便利に見ることができるようにし、ホットスポットセグメントのサイズを効果的に低減し、ユーザーのメモリリソース及び帯域幅の浪費を低減することができるという利点又は効果を有する。2回の最適化過程によってビデオにおけるホットスポットセグメントを抽出する技術手段を採用することにより、従来技術におけるユーザが倍速再生またはスキップ再生によってビデオを視聴することによって生じるハイライト内容を正確に視聴することができないという技術問題を克服し、ホットスポットセグメントの抽出正確性を向上させ、ホットスポットセグメントのサイズを減少させ、ユーザメモリリソースおよび帯域幅の浪費を減少させる技術的効果を実現する。
本願が技術課題を解決するために採用する技術案は、少なくとも1つのプロセッサと、前記少なくとも1つのプロセッサに通信可能に接続されたメモリと、を含み、前記メモリは、前記少なくとも1つのプロセッサによって実行可能な命令を記憶し、前記命令は、前記少なくとも1つのプロセッサが前記方法を実行するように、前記少なくとも1つのプロセッサによって実行されることを特徴とする電子機器を提供した。
本願が技術課題を解決するために採用する技術案は、コンピュータ命令は、前記コンピュータに前記方法を実行させることを特徴とするコンピュータ命令を記憶した非一時的なコンピュータ読み取り可能な記憶媒体を提供した。
本願が技術課題を解決するために採用する技術案は、コンピュータに、前記方法を実現させるコンピュータ命令を含むコンピュータプログラムを提供した。
以下、具体的な実施例を組み合わせて、上記選択的な方式が具備する他の効果を説明する。
図面は、本技術案をよりよく理解するためのものであり、本願を限定するものではない。
図1は、本願の第1の実施例によるビデオにおけるホットスポットセグメントを抽出する方法のフローチャートである。 図2は、本願の第2の実施例によるビデオにおけるホットスポットセグメントを抽出する装置構成図である。 図3は、本願の実施例のビデオにおけるホットスポットセグメントを抽出する方法を実現するための電子機器のブロック図である。
添付の図面を組み合わせて本願の例示的な実施例を説明し、よく理解するように、本願の実施例の様々な詳細を含むが、それらは単に例示的なものとみなされるべきである。したがって、当業者は、本願の範囲および精神から逸脱することなく、本明細書に記載された実施例に対して様々な変更および修正を行うことができることを認識するであろう。同様に、明確化および簡潔化のために、以下の説明では、周知の機能及び構成についての記載が省略される。
図1は、本願の一実施例によるビデオにおけるホットスポットセグメントを抽出する方法のフローチャートであり、図1に示すように、前記方法は、
S101では、処理待ちのビデオを取得する。
このステップでは、処理待ちのビデオを取得する。その中、このステップで取得される処理待ちのビデオは、普通のビデオ、例えば、ドラマ、バラエティ、映画などのビデオであってもよいし、短いビデオであってもよい。
なお、このステップでは、処理待ちのビデオを取得した後、当該処理待ちのビデオのビデオ画像シーケンス、即ち、処理待ちのビデオにおけるフレームごとの画像のシーケンスを取得してもよく、ビデオ画像シーケンスの取得は従来技術に属し、ここでは贅言しない。
S102では、前記処理待ちのビデオにおける内容が重複する画像フレームをフィルタリングして、前記処理待ちのビデオのコンパクトセグメントを取得する。
このステップでは、ステップS101で取得した処理待ちのビデオにおける内容が重複する画像フレームをフィルタリングした後、フィルタリングされていない画像フレームのスティッチング結果を処理待ちのビデオのコンパクトセグメントとする。すなわち、このステップは、ビデオにおける冗長して重複する画像フレームを除去することができ、これによりビデオのサイズを最適化し、ユーザメモリリソース及び帯域幅の浪費を低減する。
具体的には、このステップは、処理待ちのビデオにおける内容が重複する画像フレームをフィルタリングする際に、以下の方式を採用することができる。処理待ちのビデオにおけるビデオ画像シーケンスを取得し、ビデオ画像シーケンスにおける各フレーム画像間の内容重複度を算出し、例えば、ビデオが開始する画像フレームからビデオが終了する画像フレームまで、取得されたビデオ画像シーケンスにおける隣接する2つのフレーム画像又は隣接する複数のフレーム画像間の内容重複度を順次に計算し、内容重複度が第1の閾値を超えるか否かを判定し、超える場合、各フレーム画像のうちの1つのフレーム画像を保留してその他の画像をフィルタリングし、そうでなければ、各フレーム画像を保留する。
ここで、このステップでは、各フレーム画像間の内容重複度を計算する際に、予めトレーニングされたディープラーニングモデルによって計算することができ、すなわち、各フレーム画像をディープラーニングモデルの入力とし、ディープラーニングモデルの出力結果を各フレーム画像間の内容重複度とする。
また、このステップでは、画像フレームにおける画素情報により各フレーム画像間の内容重複度を計算することもでき、例えば、画像フレームにおける画素の階調平均値、画像フレームにおける画素のハッシュ値等により計算し、本願にここでは贅言しない。
なお、このステップでは、処理待ちのビデオにおける内容が重複する画像フレームをフィルタリングする際、処理待ちのビデオにおけるビデオ画像シーケンスを、予めトレーニングされた画像フィルタリングモデルに入力し、当該画像フィルタリングモデルは、ビデオ画像シーケンスにおける内容が重複する画像フレームをフィルタリングすることができ、画像フィルタリングモデルの出力結果に基づいて、処理待ちのビデオのコンパクトセグメントを取得することを、採用することもできると理解すべきである。
このステップでは、処理待ちのビデオにおける内容が重複する画像フレームをフィルタリングした後、残りの画像フレームがそれぞれ異なる内容を有し、これらの画像フレームを順次にスティッチングし、得られたスティッチング結果が、対応的な処理待ちのビデオのコンパクトセグメントである。
S103では、前記処理待ちのビデオに対応するユーザ視聴情報に基づいて、前記コンパクトセグメントにおける各フレーム画像を採点する。
このステップでは、まず、ステップS101の処理待ちのビデオに対応するユーザ視聴情報を取得し、そして、取得したユーザ視聴情報に基づいて、ステップS102で得られたコンパクトセグメント中の各画像フレームを採点して、コンパクトセグメントにおける各画像フレームの採点結果を決定する。
具体的には、このステップにおける処理待ちのビデオに対応するユーザ視聴情報は、現在処理待ちのビデオを視聴する全てのユーザの視聴行動を統計することによって得られ、ユーザによる処理待ちのビデオにおける各画像フレームに対するマーカ回数及びユーザによる処理待ちのビデオにおける各画像フレームに対する有効視聴回数のうちの少なくとも1つを含む。
ここで、ユーザによる処理待ちのビデオにおける画像フレームに対するマーカ回数は、ユーザが現在の処理待ちのビデオを視聴する際に、重要な又はハイライト内容を含む画像フレームをマークし、画像フレームがマークされた回数が多いほど、含まれる内容は重要な又はハイライト内容となる。
具体的に、このステップは、ユーザによる処理待ちのビデオにおける各画像フレームに対するマーク回数を取得する場合、以下の方式を採用することができる。処理待ちのビデオの再生中に、ユーザにより手動でトリガされ、またはユーザにより音声でトリガされるマークボタンを提供し、処理待ちのビデオにおける各画像フレームを再生する際におけるマークボタンのトリガ回数を統計して、ユーザによる処理待ちのビデオにおける各画像フレームに対するマーク回数とする。
ユーザによる処理待ちのビデオにおける各画像フレームに対する有効視聴回数は、ユーザが現在処理待ちのビデオを視聴する際に、早送り、倍速再生、スキップなどの行為を行わずに正常な速度で再生することを示し、画像フレームが有効に視聴された回数が多いほど、含まれる内容は重要なまたはハイライト内容となる。
具体的に、このステップは、ユーザによる処理待ちのビデオにおける各画像フレームに対する有効視聴回数を取得する場合、以下の方式を採用することができる。処理待ちのビデオの再生過程における各画像フレームの再生速度を確定し、処理待ちのビデオにおける各画像フレームが正常な速度で再生した回数を統計し、ユーザによる前記処理待ちのビデオにおける各画像フレームに対する有効視聴回数とする。
このステップで取得されるユーザ視聴情報は、処理待ちのビデオにおける各画像フレームの重要度やハイライト程度を反映したものであるため、このステップでは、ユーザ視聴情報によって、コンパクトセグメント中の各画像フレームを採点し、得られる採点結果が異なる画像フレームの重要度やハイライト程度を示すことができる。
具体的に、このステップは、処理待ちのビデオに対応するユーザ視聴情報に基づいて、コンパクトセグメントの各フレーム画像を採点する際に、以下の方式を採用することができる。対応的な画像フレームがマークされる第1の重み、及び対応的な画像フレームが効果的に視聴される第2の重みを取得し、第1の重み及び第2の重みが予め設定され、画像フレームのマーク回数及び第1の重みに基づいて第1の採点を取得し、画像フレームの有効視聴回数及び第2の重みに基づいて第2の採点を取得し、第1の採点及び第2の採点の加算結果を画像フレームの採点結果とする。
例えば、予め設定された第1の重みが1であり、予め設定された第2の重みが0.8であり、ある画像フレームのマーク回数が100回であり、有効視聴回数が200回である場合、当該画像フレームの採点結果は、(100×1) + (200×0.8) =260となる。
S104では、採点結果が予め設定された条件を満たす画像フレームを順次にスティッチングし、スティッチング結果を前記処理待ちのビデオのホットスポットセグメントとする。
このステップでは、ステップS103でコンパクトセグメントにおける各画像フレームの採点結果を取得した後、コンパクトセグメントの各フレーム画像から、採点結果が予め設定された条件を満たす画像フレームを選択し、そして、各画像フレームを順次スティッチングすることによって、最後のスティッチング結果を、処理待ちのビデオのホットスポットスライスとする。すなわち、ステップS102で処理待ちのビデオに対して1番目の最適化を行った後、このステップでは、1番目の最適化結果に対して2番目の最適化を行い、ホットスポットセグメントに冗長して重複する画像フレームが含まれないようにし、これにより、処理待ちのビデオのホットスポットセグメントをより正確に取得する。
ここでは、このステップは、予め設定された条件を満たす画像フレームを選択する時、採点結果が第2の閾値を超える画像フレームを選択してもよいし、採点結果に従って各画像フレームを大から小に配列した後、上位N個の画像フレームを選択してもよい(Nは1以上の正の整数である)。
なお、このステップは、処理待ちのビデオに対応するホットスポットセグメントを取得した後、処理待ちのビデオをそれに対応するホットスポットセグメントと共にユーザに展示することができ、それにより、ユーザは、実際な需要に応じて、相応的なバージョンをより柔軟に選択して視聴することができると理解すべきである。
したがって、本願は、2つの最適化プロセスによって、処理待ちのビデオのホットスポットセグメントを抽出し、これにより、ユーザがビデオにおけるハイライト内容をより正確で便利に視聴することができ、抽出されたホットスポットセグメントのサイズを効果的に低減することができ、ユーザメモリリソースおよび帯域幅の浪費を低減することができる。
図2は、本願の一実施例によるビデオにおけるホットスポットセグメントを抽出する装置構成図であり、図2に示すように、前記装置は、取得ユニット201、簡素化ユニット202、採点ユニット203及び処理ユニット204を含む。
取得ユニット201は、処理待ちのビデオを取得する。
取得ユニット201は、処理待ちのビデオを取得する。ここで、取得ユニット201が取得する処理待ちのビデオは、普通のビデオ、例えば、ドラマ、バラエティ、映画などのビデオであってもよいし、短いビデオであってもよい。
なお、取得ユニット201は、処理待ちのビデオを取得した後、当該処理待ちのビデオのビデオ画像シーケンス、即ち、処理待ちのビデオにおけるフレームごとの画像のシーケンスを取得してもよく、ビデオ画像シーケンスの取得は従来技術に属し、ここでは贅言しない。
簡素化ユニット202は、前記処理待ちのビデオにおける内容が重複する画像フレームをフィルタリングして、前記処理待ちのビデオのコンパクトセグメントを取得する。
簡素化ユニット202は、取得ユニット201によってで取得した処理待ちのビデオにおける内容が重複する画像フレームをフィルタリングした後、フィルタリングされていない画像フレームのスティッチング結果を処理待ちのビデオのコンパクトセグメントとする。すなわち、簡素化ユニット202は、ビデオにおける冗長して重複する画像フレームを除去することができ、これによりビデオのサイズを最適化し、ユーザメモリリソース及び帯域幅の浪費を低減する。
具体的には、簡素化ユニット202は、処理待ちのビデオにおける内容が重複する画像フレームをフィルタリングする際に、以下の方式を採用することができる。処理待ちのビデオにおけるビデオ画像シーケンスを取得し、ビデオ画像シーケンスにおける各フレーム画像間の内容重複度を算出し、例えば、ビデオが開始する画像フレームからビデオが終了する画像フレームまで、取得されたビデオ画像シーケンスにおける隣接する2つのフレーム画像間又は隣接する複数のフレーム画像間の内容重複度を順次に計算し、内容重複度が第1の閾値を超えるか否かを判定し、超える場合、各フレーム画像のうちの1つのフレーム画像を保留し、そうでなければ、各フレーム画像を保留する。
ここで、簡素化ユニット202は、各フレーム画像間の内容重複度を計算する際に、予めトレーニングされたディープラーニングモデルによって計算することができ、すなわち、各フレーム画像をディープラーニングモデルの入力とし、ディープラーニングモデルの出力結果を各フレーム画像間の内容重複度とする。
また、簡素化ユニット202は、画像フレームにおける画素情報により各フレーム画像間の内容重複度を計算することもでき、例えば、画像フレームにおける画素の階調平均値、画像フレームにおける画素のハッシュ値等により計算し、本願にここでは贅言しない。
なお、簡素化ユニット202は、処理待ちのビデオにおける内容が重複する画像フレームをフィルタリングする際、以下の方式を採用することもできる。処理待ちのビデオにおけるビデオ画像シーケンスを、予めトレーニングされた画像フィルタリングモデルに入力し、当該画像フィルタリングモデルは、ビデオ画像シーケンスにおける内容が重複する画像フレームをフィルタリングすることができ、画像フィルタリングモデルの出力結果に基づいて、処理待ちのビデオのコンパクトセグメントを取得する。
簡素化ユニット202は、処理待ちのビデオにおける内容が重複する画像フレームをフィルタリングした後、残りの画像フレームがそれぞれ異なる内容を有し、これらの画像フレームを順次にスティッチングし、得られたスティッチング結果が、処理待ちのビデオに対応するコンパクトセグメントである。
採点ユニット203は、前記処理待ちのビデオに対応するユーザ視聴情報に基づいて、前記コンパクトセグメントにおける各フレーム画像を採点する。
採点ユニット203は、まず、処理待ちのビデオに対応するユーザ視聴情報を取得し、そして、取得したユーザ視聴情報に基づいて、簡素化ユニット202によって得られたコンパクトセグメントの各画像フレームを採点して、コンパクトセグメントにおける各画像フレームの採点結果を決定する。
具体的には、採点ユニット203には、処理待ちのビデオに対応するユーザ視聴情報は、現在処理待ちのビデオを視聴する全てのユーザの視聴行動を統計することによって得られ、ユーザによる処理待ちのビデオにおける各画像フレームに対するマーカ回数及びユーザによる処理待ちのビデオにおける各画像フレームに対する有効視聴回数のうちの少なくとも1つを含む。
ここで、ユーザによる処理待ちのビデオにおける画像フレームに対するマーカ回数は、ユーザが現在の処理待ちのビデオを視聴する際に、認定された重要な又はハイライト内容を含む画像フレームをマークし、画像フレームがマークされた回数が多いほど、含まれる内容は重要な又はハイライト内容となる。
具体的に、採点ユニット203は、ユーザによる処理待ちのビデオにおける各画像フレームに対するマーク回数を取得する場合、以下の方式を採用することができる。処理待ちのビデオの再生中に、ユーザにより手動でトリガされ、またはユーザにより音声でトリガされるマークボタンを提供し、処理待ちのビデオにおける各画像フレームを再生する際におけるマークボタンのトリガ回数を統計して、ユーザによる処理待ちのビデオにおける各画像フレームに対するマーク回数とする。
ユーザによる処理待ちのビデオにおける各画像フレームに対する有効視聴回数は、ユーザが現在処理待ちのビデオを視聴する際に、早送り、倍速再生、スキップなどの行為を行わずに正常な速度で再生することを示し、画像フレームが有効に視聴された回数が多いほど、含まれる内容は重要なまたはハイライト内容となる。
具体的に、採点ユニット203は、ユーザによる処理待ちのビデオにおける各画像フレームに対する有効視聴回数を取得する場合、以下の方式を採用することができる。処理待ちのビデオの再生過程における各画像フレームの再生速度を確定し、処理待ちのビデオにおける各画像フレームが正常な速度で再生した回数を統計し、ユーザによる前記処理待ちのビデオにおける各画像フレームに対する有効視聴回数とする。
採点ユニット203によって取得されるユーザ視聴情報は、処理待ちのビデオにおける各画像フレームの重要度やハイライト程度を反映したものであるため、採点ユニット203は、ユーザ視聴情報によって、コンパクトセグメントの各画像フレームを採点し、得られる採点結果が異なる画像フレームの重要度やハイライト程度を示すことができる。
具体的に、採点ユニット203は、処理待ちのビデオに対応するユーザ視聴情報に基づいて、コンパクトセグメントの各フレーム画像を採点する際に、以下の方式を採用することができる。対応的な画像フレームがマークされる第1の重み、及び対応的な画像フレームが効果的に視聴される第2の重みを取得し、第1の重み及び第2の重みが予め設定され、画像フレームのマーク回数及び第1の重みに基づいて第1の採点を取得し、画像フレームの有効視聴回数及び第2の重みに基づいて第2の採点を取得し、第1の採点及び第2の採点の加算結果を画像フレームの採点結果とする。
処理ユニット204は、採点結果が予め設定された条件を満たす画像フレームを順次にスティッチングし、スティッチング結果を前記処理待ちのビデオのホットスポットセグメントとする。
処理ユニット204は、採点ユニット203によってコンパクトセグメントにおける各画像フレームの採点結果を取得した後、コンパクトセグメントの各フレーム画像から、採点結果が予め設定された条件を満たす画像フレームを選択し、そして、各画像フレームを順次スティッチングすることによって、最後のスティッチング結果を、処理待ちのビデオのホットスポットスライスとする。
すなわち、簡素化ユニット202によって処理待ちのビデオに対して1番目の最適化を行った後、処理ユニット204は、1番目の最適化結果に対して2番目の最適化を行い、ホットスポットセグメントに冗長して重複する画像フレームが含まれないようにし、これにより、処理待ちのビデオのホットスポットセグメントをより正確に取得する。
ここでは、処理ユニット204は、予め設定された条件を満たす画像フレームを選択する時、採点結果が第2の閾値を超える画像フレームを選択してもよいし、採点結果に従って各画像フレームを大から小に配列した後、処理ユニット204は、上位N個の画像フレームを選択してもよい(Nは1以上の正の整数である)。
なお、処理ユニット204は、処理待ちのビデオに対応するホットスポットセグメントを取得した後、処理待ちのビデオをそれに対応するホットスポットセグメントと共にユーザに展示することができ、それにより、ユーザは、実際な需要に応じて、相応的なバージョンをより柔軟に選択して視聴することができる。
本願の実施例によれば、本願は、電子機器及び読み取り可能な記憶媒体をさらに提供している。
図3に示すように、本願の実施例によるビデオにおけるホットスポットセグメントを抽出する方法の電子機器のブロック図である。電子機器は、例えば、ラップトップコンピュータ、デスクトップコンピュータ、ワークステーション、パーソナルデジタルアシスタント、サーバ、ブレードサーバ、メインフレームコンピュータ、及び他の適切なコンピュータなどの様々な形態のデジタルコンピュータである。電子機器は、例えば、パーソナルデジタルプロセッシング、携帯電話、スマートフォン、ウェアラブルデバイス、及び他の類似なコンピューティングデバイス等、様々な形態のモバイルデバイスであってもよい。本明細書に示される部品、それらの接続及び関係、並びにそれらの機能は、単なる例示であり、本明細書に記載及び/又は請求される本願の実施を限定しない。
図3に示すように、当該電子機器は、1つまたは複数のプロセッサ301と、メモリ302と、高速インターフェースと低速インターフェースとを含む、各部品を接続するためのインターフェースとを備える。各部品は、異なるバスで互いに接続され、共通のマザーボード上に実装されてもよいし、必要に応じて他の形態で実装されてもよい。プロセッサは、電子機器で実行される命令を処理してもよく、外部入出力装置(例えば、インターフェースに結合された表示機器)にGUIのグラフィック情報を表示するようにメモリ中またはメモリ上に記憶された命令を含む。他の実施形態では、必要に応じて、複数のプロセッサおよび/または複数のバスを、複数のメモリおよび複数のメモリと共に使用し得る。同様に、複数の電子機器を接続し、各機器が必要な操作の一部(例えば、サーバアレイ、ブレードサーバの集合、マルチプロセッサシステムなど)を提供するようにしてもよい。図3では、1つのプロセッサ301を例に挙げている。
メモリ302は、本願に提供される非一時的コンピュータ読み取り可能な記憶媒体である。前記メモリは、少なくとも1つのプロセッサに、本願に提供されるビデオにおけるホットスポットセグメントを抽出する方法を実行させるように、少なくとも1つのプロセッサによって実行可能な命令を記憶する。本願の非一時的コンピュータ読み取り可能な記憶媒体は、コンピュータに本願に提供されるビデオにおけるホットスポットセグメントを抽出する方法を実行させるためのコンピュータ命令を記憶する。
メモリ302は、非一時的コンピュータ読み取り可能な記憶媒体として、例えば、本願の実施例におけるホットスポットセグメントを抽出する方法に対応するプログラム命令/モジュール(例えば、図2に示す取得ユニット201、簡素化ユニット202、採点ユニット203および処理ユニット204)のような、非一時的ソフトウェアプログラム、非一時的コンピュータ実行可能なプログラム及びモジュールを記憶する。プロセッサ301は、メモリ302に記憶された非一時的ソフトウェアプログラム、命令およびモジュールを実行することによって、サーバの様々な機能アプリケーションおよびデータ処理を実行し、すなわち、上記方法の実施例におけるホットスポットセグメントを抽出する方法を実現する。
メモリ302は、記憶プログラム領域および記憶データ領域を含み、記憶プログラム領域は、オペレーティングシステム、少なくとも1つの機能に必要なアプリケーションを記憶し、記憶データ領域は、電子機器の使用により作成されたデータ等を記憶する。また、メモリ302は、高速ランダムアクセスメモリを含んでもよく、例えば少なくとも1つのディスク記憶デバイス、フラッシュメモリデバイス、または他の非一時的固体記憶デバイスなどの非一時的メモリを含んでもよい。いくつかの実施例では、メモリ302は、プロセッサ301から遠隔に配置されたメモリを選択することができ、それらの遠隔メモリは、ネットワークを介して、ホットスポットセグメントを抽出する方法の電子機器に接続され得る。上記ネットワークの例示は、インターネット、イントラネット、ローカルエリアネットワーク、移動体通信ネットワーク、及びそれらの組み合わせが挙げられるが、これらに限定されない。
ビデオ中のホットスポットセグメントを抽出する方法の電子機器は、入力装置303と、出力装置304とをさらに含んでもよい。プロセッサ301、メモリ302、入力装置303、及び出力装置304は、バス又は他の方式で接続されてもよく、図3では、バスで接続することを例に挙げている。
入力装置303は、入力された数字または文字情報を受信し、ビデオ中のホットスポットセグメントを抽出する方法の電子機器のユーザ設定および機能制御に関するキー信号入力を発生させることができ、例えば、タッチスクリーン、キーパッド、マウス、トラックパッド、タッチパッド、ポインティングバー、一つまたは複数のマウスボタン、トラックボール、ジョイスティックなどの入力装置である。出力装置304は、表示装置、補助照明装置(例えば、LED)、触覚フィードバック装置(例えば、振動モータ)などを含んでもよい。当該表示装置は、液晶ディスプレイ(LCD)、発光ダイオード(LED)ディスプレイ及びプラズマディスプレイを含むが、これらに限らない。いくつかの実施形態では、表示装置はタッチスクリーンであってもよい。
本明細書に記載のシステムおよび技術の様々な実施形態は、デジタル電子回路システム、集積回路システム、特定用途向けASIC(特定用途向け集積回路)、コンピュータハードウェア、ファームウェア、ソフトウェア、および/またはそれらの組合せで実現され得る。これらの様々な実施形態は、1つまたは複数のコンピュータプログラム内で実施されることを含み、当該1つまたは複数のコンピュータプログラムは、少なくとも1つのプログラマブルプロセッサを含むプログラマブルシステム上で実行および/または解釈され、当該プログラマブルプロセッサは、専用または汎用のプログラマブルプロセッサであり、記憶システム、少なくとも1つの入力装置、および少なくとも1つの出力装置からデータおよび命令を受信し、データおよび命令を当該記憶システム、少なくとも1つの入力装置、および少なくとも1つの出力装置に送信する。
これらの計算プログラム(プログラム、ソフトウェア、ソフトウェアアプリケーション、またはコードとしても言われる)は、プログラマブルプロセッサの機械命令を含み、高級プロセス、および/またはオブジェクト指向プログラミング言語、および/またはアセンブリ/機械言語でこれらの計算プログラムを実施することができる。本明細書で使用される場合、「機械読み取り可能な媒体」および「コンピュータ読み取り可能な媒体」という用語は、機械命令および/またはデータをプログラマブルプロセッサのいずれかのコンピュータプログラム製品、デバイス、および/または装置(例えば、磁気ディスク、光ディスク、メモリ、プログラマブルロジックデバイス(PLD))に提供することであり、機械読み取り可能な信号としての機械命令を受信する機械読み取り可能な媒体を含む。「機械読み取り可能な信号」という用語は、機械命令および/またはデータをプログラマブルプロセッサに提供するための任意の信号である。
ユーザとのインタラクティブを提供するために、コンピュータで本明細書に記載されるシステムおよび技術を実施することができ、当該コンピュータは、ユーザに情報を表示するための表示装置(たとえば、CRT(陰極線管)またはLCD(液晶ディスプレイ)モニタ)と、ユーザがコンピュータに入力を提供し得るキーボードおよびポインティングデバイス(たとえば、マウスまたはトラックボール)とを有する。他の種類の装置は、ユーザとのインタラクティブを提供するために使用され得る。例えば、ユーザに提供されるフィードバックは、任意の形態の感覚フィードバック(例えば、視覚フィードバック、聴覚フィードバック、又は触覚フィードバック)であってもよく、任意の形態(例えば、音声入力、音声入力または触覚入力)でユーザからの入力を受信することができる。
本明細書で説明されるシステムおよび技術を、バックエンド部品を含むコンピューティングシステム(例えば、データサーバとして)、またはミドルウェア部品を含むコンピューティングシステム(例えば、アプリケーションサーバ)、またはフロントエンド部品を含むコンピューティングシステム(例えば、ユーザが本明細書で説明されるシステムおよび技術の実施形態とインタラクティブすることができるグラフィカルユーザインターフェースまたはウェブブラウザを有するユーザコンピュータ)、またはそのようなバックエンド部品、ミドルウェア部品、もしくはフロントエンド部品の任意の組合せを含むコンピューティングシステムにおいて実施され得る。任意の形態または媒体のデジタルデータ通信(例えば、通信ネットワーク)を介してシステムの部品を互いに接続することができる。通信ネットワークの例示は、ローカルエリアネットワーク(LAN)、ワイドエリアネットワーク(WAN)、およびインターネットを含む。
コンピュータシステムは、クライアントおよびサーバを含み得る。クライアントおよびサーバは、一般に、互いから離れており、通常、通信ネットワークを介してインタラクティブしている。相応的なコンピュータで運行し、互いにクライアント-サーバ関係を有するコンピュータプログラムによって、クライアントとサーバの関係を生成する。
本願の実施例の技術案によれば、2回の最適化の過程によって処理待ちのビデオのホットスポットセグメントを抽出することにより、ホットスポットセグメントの抽出正確性を向上し、ユーザがビデオにおけるハイライト内容をより便利に視聴し、抽出されたホットスポットセグメントのサイズを減少させ、ユーザメモリリソースおよび帯域幅の浪費を減少させることができる。
上記に示された様々な形態のフローを用いて、ステップを並べ替え、追加、または削除することができることを理解されたい。例えば、本願に記載された各ステップは、並列的に実行されてもよく、順番に実行されてもよく、異なる順番で実行されてもよく、本願において開示された技術案の所望の結果を達成することができる限り、ここで制限されない。
上記の具体的な実施形態は、本願の保護範囲を限定するものではない。当業者であれば、設計の要求及び他の要因に応じて、各種の補正、組合、サブ組合および切り替えを行うことができることは明らかであろう。本願の思想及び原則における任意の補正、均等物及び改善は、本願の保護範囲に含まれるべきである。

Claims (13)

  1. 処理待ちのビデオを取得することと、
    前記処理待ちのビデオにおける内容が重複する画像フレームをフィルタリングして、前記処理待ちのビデオのコンパクトセグメントを取得することと、
    前記処理待ちのビデオに対応するユーザ視聴情報に基づいて、前記コンパクトセグメントにおける各フレーム画像を採点することと、
    採点結果が予め設定された条件を満たす画像フレームを順次にスティッチングし、スティッチング結果を前記処理待ちのビデオのホットスポットセグメントとすることと、を含み、
    前記処理待ちのビデオに対応するユーザ視聴情報は、
    ユーザによる前記処理待ちのビデオにおける各画像フレームに対するマーク回数、およびユーザによる前記処理待ちのビデオにおける各画像フレームに対する有効視聴回数の少なくとも1つを含み、
    前記処理待ちのビデオに対応するユーザ視聴情報に基づいて、前記コンパクトセグメントにおける各フレーム画像を採点することは、
    対応的な画像フレームがマークされた第1の重み、および対応的な画像フレームが効果的に視聴される第2の重みを取得することと、
    画像フレームのマーク回数及び第1の重みに基づいて第1の採点を取得し、画像フレームの有効視聴回数及び第2の重みに基づいて第2の採点を取得することと、
    第1の採点と第2の採点との加算結果を画像フレームの採点結果とすることと、を含む
    ことを特徴とするビデオにおけるホットスポットセグメントを抽出する方法。
  2. 前記処理待ちのビデオにおける内容が重複する画像フレームをフィルタリングすることは、
    前記処理待ちのビデオのビデオ画像シーケンスを取得することと、
    前記ビデオ画像シーケンスにおける各フレーム画像間の内容重複度を計算することと、
    前記内容重複度が第1の閾値を超えるか否かを判定し、超える場合、前記各フレーム画像のうちの1つのフレーム画像を保留して他の画像をフィルタリングし、そうでなければ、前記各フレーム画像を保留することと、を含む
    ことを特徴とする請求項1に記載の方法。
  3. ユーザによる前記処理待ちのビデオにおける各画像フレームに対するマーク回数を取得することは、
    前記処理待ちのビデオの再生過程にマークボタンを提供することと、
    前記処理待ちのビデオにおける各画像フレームを再生するときの前記マークボタンのトリガ回数を統計し、前記ユーザによる前記処理待ちのビデオにおける各画像フレームに対するマーク回数とすることと、を含む
    ことを特徴とする請求項に記載の方法。
  4. ユーザによる前記処理待ちのビデオにおける各画像フレームに対する有効視聴回数を取得することは、
    再生過程において前記処理待ちのビデオの各画像フレームの再生速度を決定することと、
    前記処理待ちのビデオにおける各画像フレームが正常な速度で再生された回数を統計し、前記ユーザによる前記処理待ちのビデオにおける各画像フレームに対する有効視聴回数とすることとを含む
    ことを特徴とする請求項に記載の方法。
  5. ユーザが選択的に視聴するように、前記処理待ちのビデオをそれに対応するホットスポットセグメントと共にユーザに展示すること、をさらに含む
    ことを特徴とする請求項1に記載の方法。
  6. 処理待ちのビデオを取得する取得ユニットと、
    前記処理待ちのビデオにおける内容が重複する画像フレームをフィルタリングして、前記処理待ちのビデオのコンパクトセグメントを取得する簡素化ユニットと、
    前記処理待ちのビデオに対応するユーザ視聴情報に基づいて、前記コンパクトセグメントにおける各フレーム画像を採点する採点ユニットと、
    採点結果が予め設定された条件を満たす画像フレームをスティッチングし、スティッチング結果を前記処理待ちのビデオのホットスポットセグメントとする処理ユニットと、を含み、
    前記採点ユニットにおいて前記処理待ちのビデオに対応するユーザ視聴情報は、
    ユーザによる前記処理待ちのビデオにおける各画像フレームに対するマーク回数、およびユーザによる前記処理待ちのビデオにおける各画像フレームに対する有効視聴回数の少なくとも1つを含み、
    前記採点ユニットが前記処理待ちのビデオに対応するユーザ視聴情報に基づいて、前記コンパクトセグメントにおける各フレーム画像を採点する場合、具体的に、
    対応的な画像フレームがマークされた第1の重み、および対応的な画像フレームが効果的に視聴される第2の重みを取得し、
    画像フレームのマーク回数及び第1の重みに基づいて第1の採点を取得し、画像フレームの有効視聴回数及び第2の重みに基づいて第2の採点を取得し
    第1の採点と第2の採点との加算結果を画像フレームの採点結果とすること、を実行する
    ことを特徴とするビデオにおけるホットスポットセグメントを抽出する装置。
  7. 前記簡素化ユニットが前記処理待ちのビデオにおける内容が重複する画像フレームをフィルタリングする場合、具体的に、
    前記処理待ちのビデオのビデオ画像シーケンスを取得し、
    前記ビデオ画像シーケンスにおける各フレーム画像間の内容重複度を計算し、
    前記内容重複度が第1の閾値を超えるか否かを判定し、超える場合、前記各フレーム画像のうちの1つのフレーム画像を保留して他の画像をフィルタリングし、そうでなければ、前記各フレーム画像を保留すること、を実行する
    ことを特徴とする請求項に記載の装置。
  8. 前記採点ユニットがユーザによる前記処理待ちのビデオにおける各画像フレームに対するマーク回数を取得する場合、具体的に、
    前記処理待ちのビデオの再生過程にマークボタンを提供し、
    前記処理待ちのビデオにおける各画像フレームを再生するときの前記マークボタンのトリガ回数を統計し、前記ユーザによる前記処理待ちのビデオにおける各画像フレームに対するマーク回数とすること、を実行する
    ことを特徴とする請求項に記載の装置。
  9. 前記採点ユニットがユーザによる前記処理待ちのビデオにおける各画像フレームに対する有効視聴回数を取得する場合、具体的に、
    再生過程において前記処理待ちのビデオの各画像フレームの再生速度を決定し、
    前記処理待ちのビデオにおける各画像フレームが正常な速度で再生された回数を統計し、前記ユーザによる前記処理待ちのビデオにおける各画像フレームに対する有効視聴回数とすること、を実行する
    ことを特徴とする請求項に記載の装置。
  10. 前記処理ユニットは、ユーザが選択的に視聴するように、前記処理待ちのビデオをそれに対応するホットスポットセグメントと共にユーザに展示することを、さらに実行する
    ことを特徴とする請求項に記載の装置。
  11. 少なくとも1つのプロセッサと、
    前記少なくとも1つのプロセッサに通信可能に接続されたメモリと、を含み、
    前記メモリは、前記少なくとも1つのプロセッサによって実行可能な命令を記憶し、前記命令は、前記少なくとも1つのプロセッサが請求項1~のいずれか一項に記載の方法を実行するように、前記少なくとも1つのプロセッサによって実行される
    ことを特徴とする電子機器。
  12. コンピュータ命令は、コンピュータに請求項1~のいずれか一項に記載の方法を実行させる
    ことを特徴とする前記コンピュータ命令を記憶した非一時的なコンピュータ読み取り可能な記憶媒体。
  13. コンピュータに、請求項1~のいずれか一項に記載の方法を実現させるコンピュータ命令を含むコンピュータプログラム。
JP2021536295A 2020-02-21 2020-12-01 ビデオにおけるホットスポットセグメントを抽出する方法、装置、電子機器、記憶媒体およびコンピュータプログラム Active JP7246487B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN202010108683.8 2020-02-21
CN202010108683.8A CN111277861B (zh) 2020-02-21 2020-02-21 提取视频中热点片段的方法以及装置
PCT/CN2020/133034 WO2021164369A1 (zh) 2020-02-21 2020-12-01 提取视频中热点片段的方法以及装置

Publications (2)

Publication Number Publication Date
JP2022524260A JP2022524260A (ja) 2022-05-02
JP7246487B2 true JP7246487B2 (ja) 2023-03-27

Family

ID=70999515

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021536295A Active JP7246487B2 (ja) 2020-02-21 2020-12-01 ビデオにおけるホットスポットセグメントを抽出する方法、装置、電子機器、記憶媒体およびコンピュータプログラム

Country Status (5)

Country Link
US (1) US20220312055A1 (ja)
EP (1) EP3890294B1 (ja)
JP (1) JP7246487B2 (ja)
CN (1) CN111277861B (ja)
WO (1) WO2021164369A1 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111277861B (zh) * 2020-02-21 2023-02-24 北京百度网讯科技有限公司 提取视频中热点片段的方法以及装置
CN111698475B (zh) * 2020-06-16 2022-02-25 宁波愉阅网络科技有限公司 一种基于学生实验考试的管理系统及方法
CN111935503A (zh) * 2020-06-28 2020-11-13 百度在线网络技术(北京)有限公司 短视频生成方法、装置、电子设备和存储介质
CN111918122A (zh) * 2020-07-28 2020-11-10 北京大米科技有限公司 视频处理方法、装置、电子设备和可读存储介质
CN112911385B (zh) * 2021-01-12 2021-12-07 平安科技(深圳)有限公司 待识别图片的提取方法、装置、设备以及存储介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004282212A (ja) 2003-03-13 2004-10-07 Matsushita Electric Ind Co Ltd 映像嗜好推測方法および映像配信システム
JP2010109464A (ja) 2008-10-28 2010-05-13 Hitachi Ltd 情報記録再生装置および情報記録再生方法
CN105045900A (zh) 2015-08-05 2015-11-11 石河子大学 数据提取的方法及装置
CN107105318A (zh) 2017-03-21 2017-08-29 华为技术有限公司 一种视频热点片段提取方法、用户设备和服务器
US20170318317A1 (en) 2014-10-31 2017-11-02 Guangzhou Ucweb Computer Technology Co., Ltd. Method, device, and server for producing video frame set
US20180061459A1 (en) 2016-08-30 2018-03-01 Yahoo Holdings, Inc. Computerized system and method for automatically generating high-quality digital content thumbnails from digital video
JP2019169891A (ja) 2018-03-23 2019-10-03 パナソニックIpマネジメント株式会社 表示制御装置、映像表示装置、及び、表示制御方法

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11238071A (ja) * 1998-02-20 1999-08-31 Toshiba Corp ダイジェスト作成装置及びダイジェスト作成方法
KR101146926B1 (ko) * 2006-12-20 2012-05-22 엘지전자 주식회사 이동 단말기에서 비디오의 대표 영상 제공 방법
CN105491456A (zh) * 2014-10-11 2016-04-13 中兴通讯股份有限公司 视频内容的推荐、评价方法及装置
US9578279B1 (en) * 2015-12-18 2017-02-21 Amazon Technologies, Inc. Preview streaming of video data
CN105847993A (zh) * 2016-04-19 2016-08-10 乐视控股(北京)有限公司 一种分享视频片段的方法及装置
CN105939494A (zh) * 2016-05-25 2016-09-14 乐视控股(北京)有限公司 音视频片段提供方法及装置
CN106303675B (zh) * 2016-08-24 2019-11-15 北京奇艺世纪科技有限公司 一种视频片段提取方法和装置
CN109151558A (zh) * 2018-07-27 2019-01-04 努比亚技术有限公司 一种视频处理方法、终端及计算机可读存储介质
CN109104642A (zh) * 2018-09-26 2018-12-28 北京搜狗科技发展有限公司 一种视频生成方法及装置
US10943125B1 (en) * 2018-12-13 2021-03-09 Facebook, Inc. Predicting highlights for media content
CN110267119B (zh) * 2019-06-28 2023-06-30 北京奇艺世纪科技有限公司 视频精彩度的评价方法及相关设备
CN111277861B (zh) * 2020-02-21 2023-02-24 北京百度网讯科技有限公司 提取视频中热点片段的方法以及装置

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004282212A (ja) 2003-03-13 2004-10-07 Matsushita Electric Ind Co Ltd 映像嗜好推測方法および映像配信システム
JP2010109464A (ja) 2008-10-28 2010-05-13 Hitachi Ltd 情報記録再生装置および情報記録再生方法
US20170318317A1 (en) 2014-10-31 2017-11-02 Guangzhou Ucweb Computer Technology Co., Ltd. Method, device, and server for producing video frame set
CN105045900A (zh) 2015-08-05 2015-11-11 石河子大学 数据提取的方法及装置
US20180061459A1 (en) 2016-08-30 2018-03-01 Yahoo Holdings, Inc. Computerized system and method for automatically generating high-quality digital content thumbnails from digital video
CN107105318A (zh) 2017-03-21 2017-08-29 华为技术有限公司 一种视频热点片段提取方法、用户设备和服务器
JP2019169891A (ja) 2018-03-23 2019-10-03 パナソニックIpマネジメント株式会社 表示制御装置、映像表示装置、及び、表示制御方法

Also Published As

Publication number Publication date
CN111277861A (zh) 2020-06-12
US20220312055A1 (en) 2022-09-29
JP2022524260A (ja) 2022-05-02
EP3890294B1 (en) 2023-10-04
WO2021164369A1 (zh) 2021-08-26
CN111277861B (zh) 2023-02-24
EP3890294A1 (en) 2021-10-06
EP3890294A4 (en) 2021-12-29

Similar Documents

Publication Publication Date Title
JP7246487B2 (ja) ビデオにおけるホットスポットセグメントを抽出する方法、装置、電子機器、記憶媒体およびコンピュータプログラム
US11250066B2 (en) Method for processing information, electronic device and storage medium
US11025881B2 (en) Method, computer storage media, and client for switching scenes of panoramic video
CN111754407B (zh) 图像展示的布局方法、装置、设备以及存储介质
CN106648283B (zh) 一种弹幕信息处理方法及服务器
CN112148160B (zh) 浮窗显示方法、装置、电子设备和计算机可读存储介质
KR102487794B1 (ko) 비디오 중의 핫스팟 세그먼트를 추출하는 방법, 장치, 전자 기기, 저장 매체, 및 컴퓨터 프로그램 제품
CN106982388B (zh) 一种图片的显示方法和装置
US10924572B2 (en) Information push method and apparatus, information sending method and apparatus, system, and storage medium
WO2015078257A1 (zh) 一种显示搜索信息的设备和方法
US10575043B2 (en) Navigating a plurality of video content items
CN111770384A (zh) 视频切换方法、装置、电子设备和存储介质
CN111246305A (zh) 视频预览方法、装置、设备及存储介质
CN109756785B (zh) 视频切换播放方法、装置及存储介质
CN112383825B (zh) 视频推荐方法、装置、电子设备和介质
CN109388737A (zh) 一种内容项的曝光数据的发送方法、装置及存储介质
CN113891136A (zh) 一种视频播放方法、装置、电子设备和存储介质
US11462013B2 (en) Method and apparatus for recognizing target object, electronic device and storage medium
CN110798736B (zh) 视频播放方法、装置、设备和介质
JP7236544B2 (ja) ビデオ再生方法、装置、電子機器、記録媒体及びプログラム
CN111491183B (zh) 一种视频处理方法、装置、设备及存储介质
WO2024212965A1 (zh) 滑动图像预览的方法、装置及终端设备
CN110968786B (zh) 一种视觉信息推荐方法、装置、设备及存储介质
US12014019B2 (en) Display method, apparatus and computer readable storage medium
CN111935549B (zh) 播放序列的更新方法、装置

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210621

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210621

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20220714

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220816

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20221115

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230221

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230314

R150 Certificate of patent or registration of utility model

Ref document number: 7246487

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150