TWI685254B - 確定音視訊中插播時段的方法和裝置 - Google Patents

確定音視訊中插播時段的方法和裝置 Download PDF

Info

Publication number
TWI685254B
TWI685254B TW107107572A TW107107572A TWI685254B TW I685254 B TWI685254 B TW I685254B TW 107107572 A TW107107572 A TW 107107572A TW 107107572 A TW107107572 A TW 107107572A TW I685254 B TWI685254 B TW I685254B
Authority
TW
Taiwan
Prior art keywords
video
point
characteristic
audio
period
Prior art date
Application number
TW107107572A
Other languages
English (en)
Other versions
TW201840198A (zh
Inventor
柳林東
Original Assignee
香港商阿里巴巴集團服務有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 香港商阿里巴巴集團服務有限公司 filed Critical 香港商阿里巴巴集團服務有限公司
Publication of TW201840198A publication Critical patent/TW201840198A/zh
Application granted granted Critical
Publication of TWI685254B publication Critical patent/TWI685254B/zh

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • G06V20/49Segmenting video sequences, i.e. computational techniques such as parsing or cutting the sequence, low-level clustering or determining units such as shots or scenes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04HBROADCAST COMMUNICATION
    • H04H60/00Arrangements for broadcast applications with a direct linking to broadcast information or broadcast space-time; Broadcast-related systems
    • H04H60/35Arrangements for identifying or recognising characteristics with a direct linkage to broadcast information or to broadcast space-time, e.g. for identifying broadcast stations or for identifying users
    • H04H60/37Arrangements for identifying or recognising characteristics with a direct linkage to broadcast information or to broadcast space-time, e.g. for identifying broadcast stations or for identifying users for identifying segments of broadcast information, e.g. scenes or extracting programme ID
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/44008Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics in the video stream
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • G06V20/41Higher-level, semantic clustering, classification or understanding of video scenes, e.g. detection, labelling or Markovian modelling of sport events or news items
    • G06V20/42Higher-level, semantic clustering, classification or understanding of video scenes, e.g. detection, labelling or Markovian modelling of sport events or news items of sport video content
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/439Processing of audio elementary streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/439Processing of audio elementary streams
    • H04N21/4394Processing of audio elementary streams involving operations for analysing the audio stream, e.g. detecting features or characteristics in audio streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/472End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/472End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content
    • H04N21/47205End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content for manipulating displayed content, e.g. interacting with MPEG-4 objects, editing locally
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/472End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content
    • H04N21/47217End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content for controlling playback functions for recorded or on-demand content, e.g. using progress bars, mode or play-point indicators or bookmarks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/81Monomedia components thereof
    • H04N21/8126Monomedia components thereof involving additional data, e.g. news, sports, stocks, weather forecasts
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/845Structuring of content, e.g. decomposing content into time segments
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/845Structuring of content, e.g. decomposing content into time segments
    • H04N21/8456Structuring of content, e.g. decomposing content into time segments by decomposing the content in the time domain, e.g. in time segments
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04HBROADCAST COMMUNICATION
    • H04H60/00Arrangements for broadcast applications with a direct linking to broadcast information or broadcast space-time; Broadcast-related systems
    • H04H60/56Arrangements characterised by components specially adapted for monitoring, identification or recognition covered by groups H04H60/29-H04H60/54
    • H04H60/58Arrangements characterised by components specially adapted for monitoring, identification or recognition covered by groups H04H60/29-H04H60/54 of audio
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04HBROADCAST COMMUNICATION
    • H04H60/00Arrangements for broadcast applications with a direct linking to broadcast information or broadcast space-time; Broadcast-related systems
    • H04H60/56Arrangements characterised by components specially adapted for monitoring, identification or recognition covered by groups H04H60/29-H04H60/54
    • H04H60/59Arrangements characterised by components specially adapted for monitoring, identification or recognition covered by groups H04H60/29-H04H60/54 of video
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/45Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
    • H04N21/454Content or additional data filtering, e.g. blocking advertisements

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Databases & Information Systems (AREA)
  • Human Computer Interaction (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Television Signal Processing For Recording (AREA)
  • Studio Circuits (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)
  • Management Or Editing Of Information On Record Carriers (AREA)
  • Indexing, Searching, Synchronizing, And The Amount Of Synchronization Travel Of Record Carriers (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本申請提供一種確定音視訊中插播時段的方法,包括:將音視訊中特徵媒體資料出現及/或消失的時間點作為候選分段點;以滿足預定起點條件的候選分段點為起點,以滿足預定終點條件的候選分段點為終點,將起點和終點之間的時段作為插播時段。本申請的技術方案無需人工查找即可自動識別出音視訊中的插播時段,用於回放視訊製作時能夠極大的減少製作人員的人工工作,縮短回放視訊的製作時間,提高製作效率。

Description

確定音視訊中插播時段的方法和裝置
本發明係有關一種資料處理技術領域,尤其是一種確定音視訊插播時段的方法和裝置。
電視節目的回放是許多視訊網站提供的視訊內容的重要組成部分。錄製的電視節目視訊通常由節目時段和插播時段組成,其中,節目時段為播放節目內容的時間段;插播時段為播放非節目的時間段,例如在一部電影或一集電視劇中的廣告時段;再如在體育比賽直播節目中用來填充場間休息的廣告時段或直播間評論時段等。   在觀看回放視訊時,極少有使用者在播放插播時段時耐心等待,而往往會通過拖動進度條跳過插播時段,由於很難一次拖動即準確的跳過插播時段,使用者通常需要來回調整進度條,影響了使用者的體驗。因此,在製作回放視訊時通常會去掉節目視訊中的插播時段。   現有技術中,由視訊製作人員人工查找出視訊中的插播時段,再將插播時段從節目視訊中剪切掉。這種方式工作繁瑣、耗時長而效率低,難以滿足回放視訊及時上線的要求。
有鑑於此,本申請提供一種確定音視訊中插播時段的方法,包括:   將音視訊中特徵媒體資料出現及/或消失的時間點作為候選分段點;   以滿足預定起點條件的候選分段點為起點,以滿足預定終點條件的候選分段點為終點,將起點和終點之間的時段作為插播時段。   本申請還提供了一種確定音視訊中插播時段的裝置,包括:   候選分段點單元,用於將音視訊中特徵媒體資料出現及/或消失的時間點作為候選分段點;   起點及終點單元,用於以滿足預定起點條件的候選分段點為起點,以滿足預定終點條件的候選分段點為終點,將起點和終點之間的時段作為插播時段。   由以上技術方案可見,本申請的實施例中,通過某個時間點的音視訊中是否呈現特徵媒體資料來作為區分節目時段和插播時段的依據,在特徵媒體資料出現及/或消失的時間點中將滿足預定起點條件的作為插播時段的起點,將滿足預定終點條件的作為插播時段的終點,無需人工查找即可自動識別出音視訊中的插播時段,用於回放視訊製作時能夠極大的減少製作人員的人工工作,縮短回放視訊的製作時間,提高製作效率。
在包括插播時段的音視訊中,尤其是由電視節目錄製的視訊中,通常節目時段或者插播時段的音視訊內容中會帶有明顯的可識別特徵。例如,在電影或電視劇中間的廣告插播時段,會一直顯示插播時段的倒計時、或者一直顯示“稍後繼續播出……”等;再如,在體育比賽的節目時段通常會一直顯示記分牌。這些可識別特徵的出現及/或消失可以用來作為劃分節目時段和插播時段的依據。   因此,本申請的實施例提出一種新的確定音視訊中插播時段的方法,將上述可識別特徵的特徵媒體資料出現及/或消失的時間點作為節目時段與插播時段之間的候選分段點,將滿足預定起點條件的候選分段點作為插播時段的起點,將滿足預定終點條件的候選分段點作為插播時段的終點,來自動識別出音視訊中的插播時段,避免了製作人員人工查找插播時段的繁瑣工作,降低了製作人員的工作量,同時加快了視訊製作的速度和效率,以解決現有技術中存在的問題。   本申請的實施例可以運行在任何具有計算和儲存能力的設備上,如手機、平板電腦、PC(Personal Computer,個人電腦)、筆記型電腦、伺服器等設備;還可以由運行在兩個或兩個以上設備的邏輯節點來實現本申請實施例中的各項功能。   本申請的實施例中,確定音視訊中插播時段的方法的流程如圖1所示。   步驟110,將音視訊中特徵媒體資料出現及/或消失的時間點作為候選分段點。   本申請的實施例中,可以根據實際應用場景的需要來劃分音視訊中的節目時段和插播時段,不做限定。例如,體育比賽節目中的暫停時段可以作為節目時段,也可以作為插播時段。   在確定將哪些時段作為節目時段、哪些時段作為插播時段後,可以把在節目時段與插播時段切換時會出現、或者會消失的畫面特徵及/或聲音特徵的作為特徵媒體資料。在音訊或視訊中查找出特徵媒體資料出現、及/或消失的時間點,將這些時間點作為候選分段點。   對視訊而言,特徵媒體資料可以是視訊畫面中的特徵圖像,也可以是視訊聲音中的特徵聲音。對音訊而言,特徵媒體資料通常是音訊中特徵聲音。需要說明的是,特徵圖像可以是全部或部分的視訊畫面;特徵聲音可以是音訊的全部或部分波段,如具有預定音量、音調及/或音色的聲音。本申請的實施例不做限定。   通過對視訊畫面、視訊聲音或音訊聲音進行分析,可以發現當前視訊畫面、視訊聲音或音訊聲音中是否帶有特徵媒體資料,從而找出特徵媒體資料出現及/或消失的時間點。   在特徵圖像是部分視訊畫面,並且總是出現在畫面中預定區域的應用場景中,可以分析視訊畫面中該預定區域的色彩比例、圖形形狀、或者同時分析色彩比例和圖形形狀,查找出特徵圖像在在預定區域出現及/或消失的時間點;以體育比賽視訊中的記分牌為例,假設某幀畫面中不顯示記分牌,而下一幀畫面中顯示有記分牌,則這兩幀畫面之間的時間點就是候選分段點。   對某個或某類的音視訊而言,特徵媒體資料可以是一個到多個。例如,對體育比賽視訊,可以將記分牌作為特徵媒體資料,也可以將記分牌和比賽暫停時的長鳴聲都作為特徵媒體資料;再如,對電影或電視節目視訊,可以將顯示的“稍後繼續播出”、或者將顯示的廣告時段倒計時作為特徵媒體資料,也可以將顯示的“稍後繼續播出”和廣告時段倒計時都作為特徵媒體資料。   根據實際應用場景中對特徵媒體資料的呈現方式,可以將某個特徵媒體資料出現的時間點作為候選分段點,也可以將某個特徵媒體資料消失的時間點作為候選分段點,還可以將某個特徵媒體資料出現和消失的時間點都作為候選分段點。例如,對廣告插播時段顯示的倒計時,如果某個視訊中從廣告插播時段開始到結束都顯示倒計時,則可以將所顯示倒計時的出現和消失的時間點都作為候選分段點;如果某個視訊中只在廣告插播時段快要結束前才顯示倒計時,則可以只將所顯示倒計時消失的時間點作為候選分段點,而不將所顯示倒計時出現的時間點作為候選分段點。   步驟120,以滿足預定起點條件的候選分段點為起點,以滿足預定終點條件的候選分段點為終點,將起點和終點之間的時段作為插播時段。   對候選分段點,根據所選擇的特徵媒體資料在音視訊中的呈現方式,將代表插播時段開始的特徵媒體資料的變化作為預定起點條件,將代表插播時段結束的特徵媒體資料的變化作為預定終點條件,來在候選分段點中確定一個到多個插播時段的起始時間點和結束時間點,從而確定音視訊中的每個插播時段。   對視訊而言,特徵媒體資料可以是視訊畫面中的一個到多個特徵圖像。當某個特徵圖像可以用來確定插播時段的起點時,預定起點條件可以是該特徵圖像出現或消失;當某個特徵圖像可以用來確定插播時段的終點時,預定終點條件可以是該特徵圖像的出現或消失;當某個特徵圖像既可以用來確定插播時段的起點也可以用來確定插播時段的終點時,預定起點條件可以是該特徵圖像出現或消失,對應的預定終點條件可以是該特徵圖像的消失或出現。   例如,廣告時段顯示的“稍後繼續播出……”通常可以用來確定插播時段的開始,對應的預定起點條件為:稍後繼續播出”字樣的出現;廣告時段顯示的倒計時用來確定插播時段的結束時,對應的預定終點條件可以是:倒計時的消失。   類似的,對視訊和音訊而言,特徵媒體資料可以是一個到多個特徵聲音。當某個特徵聲音可以用來確定插播時段的起點時,預定起點條件可以是該特徵聲音出現或消失;當某個特徵聲音可以用來確定插播時段的終點時,預定終點條件可以是該特徵聲音的出現或消失;當某個特徵聲音既可以用來確定插播時段的起點也可以用來確定插播時段的終點時,預定起點條件可以是該特徵聲音出現或消失,對應的預定終點條件可以是該特徵聲音的消失或出現。   當採用兩個或兩個以上的特徵媒體資料時,可以根據實際應用場景中這些特徵媒體資料的呈現方式來採用較為複雜的預定起點條件及/或預定終點條件。例如,在一種製作體育比賽回放視訊的應用場景中,將比賽的暫停時間段、廣告時段和直播間時段作為插播時段,可以採用記分牌和暫停長鳴聲兩種特徵媒體資料,由於這種場景中廣告時段和直播間時段不會顯示記分牌,而暫停時段會顯示記分牌,並且經常在暫停時段開始後進入廣告時段或直播間時段,在廣告時段或直播間時段結束後既可能還處於暫停時段也可能暫停時段已結束,則預定起點條件可以是:出現暫停的長鳴聲並且在之前的第一預定等待時間段內沒有發生記分牌消失、或者記分牌消失;預定終點條件可以是:記分牌出現並且在之後的第二預定等待時間段內沒有出現暫停的長鳴聲、或者出現暫停的長鳴聲並且距離上次出現暫停長鳴聲的時間點不超過第三預定等待時間段。   滿足預定起點條件的候選分段點為插播時段的起點,滿足預定終點條件的點為插播時段的終點,起點和終點之間的時段即為插播時段。需要說明的是,音視訊中的插播時段可以是一個到多個,本申請實施例中的方法可以確定其中的每個插播時段。   在確定音視訊中的插播時段後,可以在播放音視訊時,將進度條中插播時段對應的區域顯示為與非插播時段(即節目時段)不同的顏色,這樣使用者可以方便的通過拖動進度條來跳到下一個節目時段;也可以在播放音視訊時,取消播放所有的插播時段,只播放節目時段;還可以刪除音視訊中的插播時段,在播放時採用刪除後只剩節目時段的版本。   可見,本申請的實施例中,將可以用來區分節目時段和插播時段的可識別特徵作為特徵媒體資料,在特徵媒體資料出現及/或消失的時間點中將滿足預定起點條件的作為插播時段的起點,將滿足預定終點條件的作為插播時段的終點,無需人工查找即可自動識別出音視訊中的插播時段,避免了製作人員人工繁瑣工作,提升了視訊製作的速度和效率。   在本申請的一個應用示例中,製作人員錄製電視直播的美職籃比賽視訊後,希望將其製作為回放視訊。除比賽時段外,電視直播節目中還包括廣告時段和直播間時段。在製作視訊時,以比賽時段為該視訊中的節目時段,以廣告時段和直播間時段為插播時段。在該視訊的比賽時段,始終在畫面的右下角顯示記分牌,如圖2所示;而在廣告時段和直播間時段,則不會顯示記分牌。因此,製作人員將畫面右下角包括記分牌的顯示區域作為預定區域,將所顯示的記分牌作為特徵圖像。   運行本申請實施例的設備提取視訊中的每幀畫面,對該幀畫面的預定區域進行色彩比例的分析和圖形形狀的分析,可以識別出該幀畫面中是否顯示有記分牌。當記分牌顯示在前一幀畫面中而在後一幀畫面中沒有顯示、或者記分牌在前一幀畫面中沒有顯示而在下一幀畫面中顯示時,將兩幀畫面之間的時間點作為候選分段點;以記分牌消失(預定起點條件)的候選分段點作為插播時段的起點,以出現記分牌(預定終點條件)的候選分段點作為插播時段的終點,來劃分出視訊中的各個插播時段。   運行本申請實施例的設備可以刪除視訊中的插播時段,將刪除後的視訊作為回放視訊,播放給使用者;也可以將錄製的視訊作為回放視訊,在播放該視訊時,在播放的進度條上將插播時段顯示為與節目時段不同的顏色,例如可以如圖3所示,供使用者準確的跳過插播時段。   與上述流程實現對應,本申請的實施例還提供了一種確定音視訊中插播時段的裝置。該裝置可以通過軟體實現,也可以通過硬體或者軟硬體結合的方式實現。以軟體實現為例,作為邏輯意義上的裝置,是通過所在設備的CPU(Central Process Unit,中央處理器)將對應的電腦程式指令讀取到記憶體中運行形成的。從硬體層面而言,除了圖4所示的CPU、記憶體以及非易失性儲存器之外,確定音視訊中插播時段的裝置所在的設備通常還包括用於進行無線信號收發的晶片等其他硬體,及/或用於實現網路通信功能的板卡等其他硬體。   圖5所示為本申請實施例提供的一種確定音視訊中插播時段的裝置,包括候選分段點單元和起點及終點單元,其中:候選分段點單元用於將音視訊中特徵媒體資料出現及/或消失的時間點作為候選分段點;起點及終點單元用於以滿足預定起點條件的候選分段點為起點,以滿足預定終點條件的候選分段點為終點,將起點和終點之間的時段作為插播時段。   可選的,所述特徵媒體資料包括:視訊畫面中的特徵圖像;所述預定起點條件包括:視訊畫面中所述特徵圖像出現或消失。   可選的,所述特徵媒體資料包括:視訊畫面中的特徵圖像;所述預定終點條件包括:視訊畫面中所述特徵圖像消失或出現。   可選的,所述特徵圖像位於視訊畫面中的預定區域;所述候選分段點單元具體用於:分析視訊畫面中所述預定區域的色彩比例及/或圖形形狀,查找出特徵圖像在所述預定區域出現及/或消失的時間點,作為候選分段點。   可選的,所述特徵圖像包括:體育比賽視訊中的記分牌。   可選的,所述特徵媒體資料包括:視訊或音訊中的特徵聲音;所述預定起點條件包括:視訊或音訊中所述特徵聲音出現或消失的時間點。   可選的,所述特徵媒體資料包括:視訊或音訊中的特徵聲音;所述預定終點條件包括:視訊或音訊中所述特徵聲音消失或出現的時間點。   可選的,所述特徵聲音包括:具有預定音量、音調及/或音色的聲音。   可選的,所述裝置還包括:音視訊播放及更改單元,用於在播放所述音視訊時,將進度條中插播時段對應的區域顯示為與非插播時段不同的顏色;或,用於在播放所述音視訊時,取消播放所述插播時段;或,用於刪除所述音視訊中的插播時段。   以上所述僅為本申請的較佳實施例而已,並不用以限制本申請,凡在本申請的精神和原則之內,所做的任何修改、等同替換、改進等,均應包含在本申請保護的範圍之內。   在一個典型的配置中,計算設備包括一個或多個處理器(CPU)、輸入/輸出介面、網路介面和記憶體。   記憶體可能包括電腦可讀媒介中的非永久性儲存器,隨機存取儲存器(RAM)及/或非易失性記憶體等形式,如唯讀儲存器(ROM)或快閃記憶體(flash RAM)。記憶體是電腦可讀媒介的示例。   電腦可讀媒介包括永久性和非永久性、可行動和非可行動媒體可以由任何方法或技術來實現資訊儲存。資訊可以是電腦可讀指令、資料結構、程式的模組或其他資料。電腦的儲存媒介的例子包括,但不限於相變記憶體(PRAM)、靜態隨機存取儲存器(SRAM)、動態隨機存取儲存器(DRAM)、其他類型的隨機存取儲存器(RAM)、唯讀儲存器(ROM)、電可抹除可程式化唯讀儲存器(EEPROM)、快閃記憶體或其他記憶體技術、唯讀光碟唯讀儲存器(CD-ROM)、數位多功能光碟(DVD)或其他光學儲存、卡式磁帶,磁帶磁磁碟儲存或其他磁性儲存設備或任何其他非傳輸媒介,可用於儲存可以被計算設備存取的資訊。按照本文中的界定,電腦可讀媒介不包括暫存電腦可讀媒體(transitory media),如調變的資料信號和載波。   還需要說明的是,術語“包括”、“包含”或者其任何其他變體意在涵蓋非排他性的包含,從而使得包括一系列要素的過程、方法、商品或者設備不僅包括那些要素,而且還包括沒有明確列出的其他要素,或者是還包括為這種過程、方法、商品或者設備所固有的要素。在沒有更多限制的情況下,由語句“包括一個……”限定的要素,並不排除在包括所述要素的過程、方法、商品或者設備中還存在另外的相同要素。   本領域技術人員應明白,本申請的實施例可提供為方法、系統或電腦程式產品。因此,本申請可採用完全硬體實施例、完全軟體實施例或結合軟體和硬體方面的實施例的形式。而且,本申請可採用在一個或多個其中包含有電腦可用程式代碼的電腦可用儲存媒介(包括但不限於磁碟儲存器、CD-ROM、光學儲存器等)上實施的電腦程式產品的形式。
110‧‧‧步驟120‧‧‧步驟
圖1是本申請實施例中一種確定音視訊中插播時段的方法的流程圖;   圖2是本申請應用示例中一種顯示有特徵圖像的視訊畫面的示例圖;   圖3是本申請應用示例中一種將插播時段顯示為不同顏色的播放進度條的示例圖;   圖4是運行本申請實施例的設備的一種硬體結構圖;   圖5是本申請實施例中一種確定音視訊中插播時段的裝置的邏輯結構圖。

Claims (16)

  1. 一種確定音視訊中插播時段的方法,其特徵在於,包括:將音視訊中特徵媒體資料出現及/或消失的時間點作為候選分段點;以滿足預定起點條件的候選分段點為起點,以滿足預定終點條件的候選分段點為終點,將起點和終點之間的時段作為插播時段;在播放所述音視訊時,將進度條中插播時段對應的區域顯示為與非插播時段不同的顏色。
  2. 根據請求項1所述的方法,其中,所述特徵媒體資料包括:視訊畫面中的特徵圖像;所述預定起點條件包括:視訊畫面中所述特徵圖像出現或消失。
  3. 根據請求項1所述的方法,其中,所述特徵媒體資料包括:視訊畫面中的特徵圖像;所述預定終點條件包括:視訊畫面中所述特徵圖像消失或出現。
  4. 根據請求項2或3所述的方法,其中,所述特徵圖像位於視訊畫面中的預定區域;所述將音視訊中特徵媒體資料出現及/或消失的時間點作為候選分段點,包括:分析視訊畫面中所述預定區域 的色彩比例及/或圖形形狀,查找出特徵圖像在所述預定區域出現及/或消失的時間點,作為候選分段點。
  5. 根據請求項1所述的方法,其中,所述特徵圖像包括:體育比賽視訊中的記分牌。
  6. 根據請求項1所述的方法,其中,所述特徵媒體資料包括:視訊或音訊中的特徵聲音;所述預定起點條件包括:視訊或音訊中所述特徵聲音出現或消失的時間點。
  7. 根據請求項1所述的方法,其中,所述特徵媒體資料包括:視訊或音訊中的特徵聲音;所述預定終點條件包括:視訊或音訊中所述特徵聲音消失或出現的時間點。
  8. 根據請求項6或7所述的方法,其中,所述特徵聲音包括:具有預定音量、音調及/或音色的聲音。
  9. 一種確定音視訊中插播時段的裝置,其特徵在於,包括:候選分段點單元,用於將音視訊中特徵媒體資料出現及/或消失的時間點作為候選分段點;起點及終點單元,用於以滿足預定起點條件的候選分段點為起點,以滿足預定終點條件的候選分段點為終點,將起點和終點之間的時段作為插播時段; 音視訊播放及更改單元,用於在播放所述音視訊時,將進度條中插播時段對應的區域顯示為與非插播時段不同的顏色。
  10. 根據請求項9所述的裝置,其中,所述特徵媒體資料包括:視訊畫面中的特徵圖像;所述預定起點條件包括:視訊畫面中所述特徵圖像出現或消失。
  11. 根據請求項9所述的裝置,其中,所述特徵媒體資料包括:視訊畫面中的特徵圖像;所述預定終點條件包括:視訊畫面中所述特徵圖像消失或出現。
  12. 根據請求項10或11所述的裝置,其中,所述特徵圖像位於視訊畫面中的預定區域;所述候選分段點單元具體用於:分析視訊畫面中所述預定區域的色彩比例及/或圖形形狀,查找出特徵圖像在所述預定區域出現及/或消失的時間點,作為候選分段點。
  13. 根據請求項9所述的裝置,其中,所述特徵圖像包括:體育比賽視訊中的記分牌。
  14. 根據請求項9所述的裝置,其中,所述特徵媒體資料包括:視訊或音訊中的特徵聲音;所述預定起點條件包 括:視訊或音訊中所述特徵聲音出現或消失的時間點。
  15. 根據請求項9所述的裝置,其中,所述特徵媒體資料包括:視訊或音訊中的特徵聲音;所述預定終點條件包括:視訊或音訊中所述特徵聲音消失或出現的時間點。
  16. 根據請求項14或15所述的裝置,其中,所述特徵聲音包括:具有預定音量、音調及/或音色的聲音。
TW107107572A 2017-04-28 2018-03-07 確定音視訊中插播時段的方法和裝置 TWI685254B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
??201710297149.4 2017-04-28
CN201710297149.4A CN108810615A (zh) 2017-04-28 2017-04-28 确定音视频中插播时段的方法和装置
CN201710297149.4 2017-04-28

Publications (2)

Publication Number Publication Date
TW201840198A TW201840198A (zh) 2018-11-01
TWI685254B true TWI685254B (zh) 2020-02-11

Family

ID=63918026

Family Applications (1)

Application Number Title Priority Date Filing Date
TW107107572A TWI685254B (zh) 2017-04-28 2018-03-07 確定音視訊中插播時段的方法和裝置

Country Status (9)

Country Link
US (1) US10936878B2 (zh)
EP (1) EP3547698A4 (zh)
JP (1) JP6871388B2 (zh)
KR (1) KR102220088B1 (zh)
CN (1) CN108810615A (zh)
MY (1) MY194397A (zh)
PH (1) PH12019501539A1 (zh)
TW (1) TWI685254B (zh)
WO (1) WO2018196811A1 (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110198456B (zh) * 2019-04-26 2023-02-07 腾讯科技(深圳)有限公司 基于直播的视频推送方法、装置和计算机可读存储介质
CN111601162B (zh) * 2020-06-08 2022-08-02 北京世纪好未来教育科技有限公司 视频切分方法、装置和计算机存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104202668A (zh) * 2014-09-09 2014-12-10 安一恒通(北京)科技有限公司 视频广告的过滤方法和装置
CN105763884A (zh) * 2014-12-18 2016-07-13 广州市动景计算机科技有限公司 视频处理方法、装置及设备

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7336890B2 (en) * 2003-02-19 2008-02-26 Microsoft Corporation Automatic detection and segmentation of music videos in an audio/video stream
CN1595970A (zh) 2004-06-22 2005-03-16 威盛电子股份有限公司 根据开始/结束片段特定画面检测广告片段的方法及系统
US20060013554A1 (en) * 2004-07-01 2006-01-19 Thomas Poslinski Commercial storage and retrieval
FR2894692B1 (fr) * 2005-12-08 2008-06-13 Thomson Licensing Sas Procede d'identification d'un document enregistre par affichage et selection d'images clefs, et recepteur associe.
KR101323331B1 (ko) * 2006-11-06 2013-10-29 삼성전자주식회사 불연속 동영상 데이터의 재생 방법 및 장치
EP2840801B1 (en) * 2010-02-26 2017-09-20 Comcast Cable Communications, LLC Video stream segmentation and classification to skip advertisements.
US10116902B2 (en) 2010-02-26 2018-10-30 Comcast Cable Communications, Llc Program segmentation of linear transmission
JP2011211481A (ja) 2010-03-30 2011-10-20 Hitachi Consumer Electronics Co Ltd 動画再生装置
US20140019902A1 (en) * 2012-07-12 2014-01-16 International Business Machines Corporation Progress bars for media content
CN103024555B (zh) * 2012-12-31 2015-08-26 青岛海信电器股份有限公司 基于云计算的电视广告侦测处理系统及方法
KR101456926B1 (ko) 2013-06-14 2014-10-31 (주)엔써즈 핑거프린트에 기반한 광고 검출 시스템 및 방법
US11051075B2 (en) 2014-10-03 2021-06-29 Dish Network L.L.C. Systems and methods for providing bookmarking data
CN105791914A (zh) * 2016-03-07 2016-07-20 合智能科技(深圳)有限公司 播放控制方法和装置
CN105847936A (zh) * 2016-03-31 2016-08-10 乐视控股(北京)有限公司 显示控制方法、装置和终端

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104202668A (zh) * 2014-09-09 2014-12-10 安一恒通(北京)科技有限公司 视频广告的过滤方法和装置
CN105763884A (zh) * 2014-12-18 2016-07-13 广州市动景计算机科技有限公司 视频处理方法、装置及设备

Also Published As

Publication number Publication date
EP3547698A4 (en) 2020-03-25
KR102220088B1 (ko) 2021-03-02
CN108810615A (zh) 2018-11-13
JP6871388B2 (ja) 2021-05-12
MY194397A (en) 2022-11-30
WO2018196811A1 (zh) 2018-11-01
JP2020509624A (ja) 2020-03-26
PH12019501539A1 (en) 2020-02-24
TW201840198A (zh) 2018-11-01
KR20190100218A (ko) 2019-08-28
EP3547698A1 (en) 2019-10-02
US20200057890A1 (en) 2020-02-20
US10936878B2 (en) 2021-03-02

Similar Documents

Publication Publication Date Title
US8799757B2 (en) Synchronization aspects of interactive multimedia presentation management
US8020084B2 (en) Synchronization aspects of interactive multimedia presentation management
JP2019110544A (ja) メディアにおける広告および他の挿入物の位置およびタイミングを判定するスキーム
US20070006080A1 (en) Synchronization aspects of interactive multimedia presentation management
CN103797812A (zh) 带评论运动图像生成装置及带评论运动图像生成方法
KR20110030433A (ko) 다수의 입력 비디오 스트림들로부터 결합된 비디오 스트림 생성 기술
CN104618663B (zh) 视频处理方法、终端和系统
WO2023104102A1 (zh) 一种直播评论展示方法、装置、设备、程序产品及介质
US8837912B2 (en) Information processing apparatus, information processing method and program
TWI685254B (zh) 確定音視訊中插播時段的方法和裝置
WO2024027688A1 (zh) 一种视频处理方法、装置、设备及存储介质
JP5338911B2 (ja) 動画像処理装置、サムネイル画像生成プログラムおよびサムネイル画像生成方法
WO2023051068A1 (zh) 一种视频展示方法、装置、计算机设备及存储介质
KR20240127482A (ko) 비디오 처리 방법 및 장치, 및 비휘발 컴퓨터 판독가능 저장 매체
WO2020258907A1 (zh) 虚拟物品的生成方法、装置及设备
CN105578224A (zh) 一种多媒体数据的获取方法、装置、智能电视及机顶盒
JP2007514329A5 (zh)
US8437611B2 (en) Reproduction control apparatus, reproduction control method, and program
WO2016184109A1 (zh) 一种保存录音、显示和播放图片形式录音的方法、终端
US11317166B2 (en) Advertising content presented in connection with trick play operation
KR20210055301A (ko) 리뷰 제작 시스템
US20220272407A1 (en) Device analysis for supplemental content exposure
US20070006062A1 (en) Synchronization aspects of interactive multimedia presentation management
KR101301958B1 (ko) 터치앤드래그 입력에 따른 동영상 재생 방법 및 그 방법이 기록된 기록매체
JP2014082734A (ja) 動画シーンのクリップ構成システム、方法および記録メディア