TWI528782B - 具有三層視訊場景之子母視訊之視訊流 - Google Patents

具有三層視訊場景之子母視訊之視訊流 Download PDF

Info

Publication number
TWI528782B
TWI528782B TW102129347A TW102129347A TWI528782B TW I528782 B TWI528782 B TW I528782B TW 102129347 A TW102129347 A TW 102129347A TW 102129347 A TW102129347 A TW 102129347A TW I528782 B TWI528782 B TW I528782B
Authority
TW
Taiwan
Prior art keywords
video
camera
video stream
layer
coupled
Prior art date
Application number
TW102129347A
Other languages
English (en)
Other versions
TW201429226A (zh
Inventor
古安諾 喬治 曹
單記章
潘輝
陳家旺
Original Assignee
豪威科技股份有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 豪威科技股份有限公司 filed Critical 豪威科技股份有限公司
Publication of TW201429226A publication Critical patent/TW201429226A/zh
Application granted granted Critical
Publication of TWI528782B publication Critical patent/TWI528782B/zh

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/81Monomedia components thereof
    • H04N21/816Monomedia components thereof involving special video data, e.g 3D video
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/20Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video object coding
    • H04N19/23Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video object coding with coding of regions that are present throughout a whole video segment, e.g. sprites, background or mosaic
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/20Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video object coding
    • H04N19/29Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video object coding involving scalability at the object level, e.g. video object layer [VOL]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/597Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding specially adapted for multi-view video sequence encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/41Structure of client; Structure of client peripherals
    • H04N21/414Specialised client platforms, e.g. receiver in car or embedded in a mobile appliance
    • H04N21/41407Specialised client platforms, e.g. receiver in car or embedded in a mobile appliance embedded in a portable device, e.g. video client on a mobile phone, PDA, laptop
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/41Structure of client; Structure of client peripherals
    • H04N21/422Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS]
    • H04N21/4223Cameras
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/44008Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics in the video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/4402Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display
    • H04N21/440227Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display by decomposing into layers, e.g. base layer and one or more enhancement layers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/02Constructional features of telephone sets
    • H04M1/0202Portable telephone sets, e.g. cordless phones, mobile phones or bar type handsets
    • H04M1/026Details of the structure or mounting of specific components
    • H04M1/0264Details of the structure or mounting of specific components for a camera module assembly

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • General Engineering & Computer Science (AREA)
  • Studio Devices (AREA)
  • Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)

Description

具有三層視訊場景之子母視訊之視訊流
本發明大體而言係關於一種行動計算裝置,且更具體而言係關於一種可產生具有一個三層視訊場景之一子母視訊(ViV)之視訊流之行動電話或智慧型電話。
線上共用視訊已變為常見做法。通常,將一視訊流自一所儲存視訊檔案上傳至一伺服器。複數個接收器可在不同時間自該伺服器下載經上傳之視訊。可由一單個視訊攝影機產生所儲存視訊檔案。上傳及下載並非即時的。
諸如行動電話、智慧型電話、平板電腦等行動計算裝置已變得無所不在。確實,據信當今世界上行動電話之數目正在接近(若不超過)全世界之人口數。現在,對自一行動電話廣播一即時視訊流之能力之需求正在增長。
100‧‧‧立體攝影機
102‧‧‧左攝影機
104‧‧‧右攝影機
106‧‧‧左攝影機視訊流
108‧‧‧右攝影機視訊流
110‧‧‧基線
111‧‧‧物件
112‧‧‧物件
113‧‧‧物件
114‧‧‧物件
202‧‧‧攝影機
204‧‧‧前攝影機視訊流
206‧‧‧前攝影機視訊流
211‧‧‧拍攝對象
212‧‧‧物件
213‧‧‧物件
400‧‧‧視訊處理器
402‧‧‧面部偵測單元
404‧‧‧面部邊緣偵測單元
406‧‧‧拍攝對象識別單元
408‧‧‧背景修整單元
502‧‧‧後視訊層
504‧‧‧中間視訊層
506‧‧‧前視訊層
508‧‧‧子母視訊(ViV)之視訊場景
602‧‧‧後視訊層
604‧‧‧中間視訊層
606‧‧‧前視訊層
608‧‧‧子母視訊(ViV)之視訊場景
800‧‧‧網路
802‧‧‧行動計算裝置
804‧‧‧伺服器
806‧‧‧上傳
808‧‧‧廣播
810‧‧‧接收器
812‧‧‧接收器
814‧‧‧接收器
816‧‧‧接收器
902‧‧‧前側
904‧‧‧後側
906‧‧‧前攝影機
908‧‧‧立體後攝影機
910‧‧‧左後攝影機
912‧‧‧右後攝影機
1000‧‧‧行動計算裝置/裝置
1002‧‧‧左攝影機
1004‧‧‧右攝影機
1006‧‧‧上傳
1008‧‧‧接收
W'‧‧‧寬度
參考以下各圖闡述本發明之非限制性及非詳盡實施例,其中在所有各視圖中相似參考編號指代相似部件,除非另有規定。
圖1根據本發明之教示展示具有產生一左場景之一左攝影機及產生一右場景之一右攝影機之一實例性立體攝影機。
圖2根據本發明之教示展示產生一場景之一實例性單個攝影機。
圖3根據本發明之教示展示修整背景且僅僅留下一拍攝對象之圖2之一實例性場景。
圖4根據本發明之教示展示經耦合以在一視訊場景中識別一拍攝對象之一視訊處理器之一實例性功能方塊圖。
圖5根據本發明之教示展示一後視訊層與一前視訊層之間的一覆疊中間視訊層從而產生具有三個視訊場景層之一ViV視訊流之一實例。
圖6根據本發明之教示展示一後視訊層與一前視訊層之間的一覆疊中間視訊層從而產生具有三個視訊場景層之一ViV視訊流之另一實例。
圖7根據本發明之教示展示概述產生具有三個視訊場景層之一ViV視訊流之程序之一實例性方塊圖。
圖8根據本發明之教示展示透過網際網路連接至一伺服器之一實例性行動計算裝置。
圖9根據本發明之教示展示具有面向行動計算裝置使用者之一單個前攝影機之一行動計算裝置前側及具有面向行動計算裝置使用者所面向之視圖之一立體後攝影機之一行動計算裝置後側之一實例。
圖10根據本發明之教示展示上傳由一立體攝影機產生之一立體視訊流從而替換由一行動計算裝置之立體後攝影機產生之左及右攝影機視訊流之一實例性裝置。
在圖式之所有數個視圖中,對應參考字元指示對應組件。熟習此項技術者將瞭解,各圖中之元件係為簡單明晰起見而圖解說明的,而未必按照比例繪製。舉例而言,為有助於改良對本發明之各種實施例之理解,各圖中某些元件之尺寸可能相對於其他元件放大。此外,通常未繪示在一商業可行之實施例中有用或必需之常見但眾所周知之元件以便促進對本發明之此等各種實施例之一較不受阻礙之視圖。
在以下說明中,闡述眾多特定細節以便提供對本發明之一透徹理解。然而,熟習此項技術者將明瞭,實踐本發明不需要採用特定細節。在其他例項中,未詳細地闡述眾所周知之材料或方法以便避免使本發明模糊。
在本說明書通篇中對「一項實施例」、「一實施例」、「一項實例」或「一實例」之提及意指結合該實施例或實例所闡述之一特定特徵、結構或特性包含於本發明之至少一項實施例中。因此,在本說明書通篇中各個地方片語「在一項實施例中」、「在一實施例中」、「一項實例」或「一實例」之出現未必全部指代同一實施例或實例。此外,該等特定特徵、結構或特性可以任何適合組合及/或子組合而組合於一或多項實施例或實例中。特定特徵、結構或特性可包含於一積體電路、一電子電路、一組合邏輯電路或提供所要功能性之其他適合組件中。另外,應瞭解,隨本文提供之各圖係出於向熟習此項技術者闡釋之目的且該等圖式未必按比例繪製。
由於越來越多數目之行動電話包含多個視訊攝影機,因此合併來自同一行動電話之多個視訊攝影機之多個視訊流從而形成一單個子母視訊(ViV)之視訊流可係有用的。如將論述,根據本發明之教示之實例係針對具有形成一立體攝影機之一單個前攝影機及一對後攝影機之一行動計算裝置,例如一行動電話、智慧型電話、平板電腦等。根據本發明之教示之實例組合由該行動計算裝置之單個前攝影機產生之視訊流與由該行動計算裝置之後攝影機中之一者產生之一視訊流。由於前攝影機面向行動計算裝置之使用者,因此前攝影機視訊流包含係該行動計算裝置之使用者之一拍攝對象。在一項實例中,可藉由修整背景來提取拍攝對象以使得前攝影機視訊流僅僅包含該拍攝對象之面部及身體而背景被自場景移除。在一項實例中,恰當地縮放僅僅包含 拍攝對象之前攝影機視訊流以形成一中間視訊層場景。
在一項實例中,行動計算裝置之後攝影機面向該行動計算裝置之使用者亦面向之視圖。基於三角量測,可將由一後攝影機產生之後攝影機視訊流之一場景中之物件劃分成一遠區及一近區。遠區中之物件包含於一後視訊層場景中,且近區中之物件包含於一前視訊層場景中。
在該實例中,將來自前攝影機之中間視訊層場景覆疊於後視訊層場景之頂部上,且將前視訊層場景覆疊於中間視訊層場景之頂部上,從而形成具有三個視訊層之一ViV視訊流。在恰當遮擋之情況下,所得ViV視訊流展示拍攝對象整合到該拍攝對象實際上觀看之背景場景中。事實上,拍攝對象並不在該背景中。在一項實例中,可將所形成之ViV視訊流上傳至一伺服器且然後由該伺服器透過網際網路即時地廣播。因此,在一項實例中,可自一行動計算裝置即時地廣播一正在進行之事件之一實況視圖,其中該行動計算裝置之使用者被併入至該實況視圖中。事實上,主持人並不在實況視圖中。由於主持人實際上觀看該實況視圖,因此主持人可精確地對該實況視圖進行評論。
為了圖解說明,圖1根據本發明之教示展示一行動計算裝置之一實例性立體攝影機100,其具有一左攝影機102及一右攝影機104。出於闡釋目的且如圖1中所繪示之實例中所圖解說明,在本發明中假定左攝影機102之鏡頭與右攝影機104之鏡頭分別位於與左攝影機102及右攝影機104實質上相同之位置處。因此,如圖1中所繪示之實例中所展示,左攝影機102與右攝影機104之間存在一基線110距離。在一項實例中,一視訊處理器400包含於該行動計算裝置中且耦合至左攝影機102及右攝影機104。左攝影機102產生一左攝影機視訊流106,在一項實例中,左攝影機視訊流106經耦合而由視訊處理器400接收並處 理。右攝影機104產生一右攝影機視訊流108,在一項實例中,右攝影機視訊流108經耦合而由視訊處理器400接收並處理。由於左攝影機102及右攝影機104兩者皆包含於立體攝影機100中,因此左攝影機視訊流106中之場景及右攝影機視訊流108中之場景兩者包含具有一視差之相同物件111、112、113及114。可使用此項技術中眾所周知之標準方法(諸如三角量測)來量測該視差並判定物件111至114到立體攝影機100之基線110之距離。
圖2根據本發明之教示展示一行動計算裝置之一實例性單個攝影機202,其耦合至一視訊處理器400。在一項實例中,圖2中所繪示之行動計算裝置及視訊處理器400係圖解說明立體攝影機100之圖1中所繪示之相同行動計算裝置及視訊處理器400。在另一實例中,圖2中所繪示之行動計算裝置及視訊處理器400處於不同於圖1中所繪示之實例之一行動計算裝置中。返回參考圖2中所繪示之實例,攝影機202係行動計算裝置之一前攝影機且產生包含一拍攝對象211以及背景物件212及213之一前攝影機視訊流204。根據本發明之教示,可自前攝影機視訊流204之場景修整背景物件212及213,以使得僅僅拍攝對象211留在一前攝影機視訊流206中,如圖3中所展示。
在一項實例中,可使用此項技術中眾所周知之方法來自前攝影機視訊流204修整背景物件212及213。舉例而言,在一項實例中,可利用一綠色螢幕或一藍色螢幕技術。亦稱為色度鍵合成或色度鍵控之綠色螢幕或藍色螢幕技術係基於色調或色度範圍而將兩個影像合成或層化在一起之一特殊技術。在諸多領域中已大量使用該技術自一相片或視訊之拍攝對象移除一背景,例如新聞廣播。使頂層中之色彩範圍為透明的,從而展露後面之另一場景。此可藉助均勻且明顯之任何色彩之背景來完成,但較常使用綠色及藍色背景,此乃因其在色調上最明顯地不同於大多數人類皮膚色彩。視訊中拍攝對象之任何部分可能 皆不重複背景中所使用之一色彩。以此方式,拍攝對象站立於一綠色或藍色螢幕之前方。在一背景修整程序中修整綠色或藍色螢幕之背景。
為了圖解說明,在電視上之天氣預報新聞廣播中,在其中於一實況電視新聞廣播期間拍攝對象(例如,氣象學家)顯現為站立於一大的天氣圖前方之情形中,通常使用綠色螢幕或藍色螢幕色度鍵合成技術。然而,事實上,拍攝對象實際站立於一大的藍色或綠色背景螢幕之前方。當使用一藍色螢幕時,在影像之在拍攝對象後面之其中色彩係藍色之背景中之部分上添加不同背景(例如,天氣圖)。若拍攝對象穿著藍色衣服,則亦將用背景場景替換他的或她的衣服。一類似系統用於綠色螢幕。使用綠色螢幕或藍色螢幕色度鍵合成技術創建視訊之各種電腦程序係可用的。
在一項實例中,不要求使用該行動計算裝置之拍攝對象站立於一綠色或藍色螢幕之前方。在一項實例中,一行動計算裝置之視訊處理器400利用進階處理自一前攝影機視訊流204修整背景場景以形成僅僅包含一拍攝對象211之前攝影機視訊流206。舉例而言,圖4根據本發明之教示繪示圖解說明一行動計算裝置之一視訊處理器400之一項實例中所包含之處理方塊之一功能方塊圖。程序方塊中之某些或全部在程序400中出現之次序不應視為限制性。而是,受益於本發明之熟習此項技術者將理解,可以未圖解說明之多種次序或甚至並行地執行該等程序方塊中之某些。
如所繪示之實例中所展示,根據本發明之教示,視訊處理器400經耦合以在一視訊場景中識別一拍攝對象。在該實例中,一前攝影機視訊流204經耦合而由視訊處理器400之一面部偵測單元402自一行動計算裝置之前攝影機接收。面部偵測單元402包含判定任意數位影像中之人類面部之位置及大小之處理技術。在一項實例中,面部偵測單 元402偵測面部特徵且忽略別的任何事物,諸如建築物(例如,圖2之213)、樹木(例如,圖2之212)及身體。面部偵測通常用於一數位攝影機之自動聚焦中。在偵測到拍攝對象之面部之後,在一面部邊緣偵測單元404中判定面部之邊緣。因此,識別面部之位置及邊緣。在由面部邊緣偵測單元404進行之面部邊緣偵測之後,亦可識別拍攝對象之身體並將其定位為自面部之延伸。在一拍攝對象識別單元406中識別包含面部及身體之拍攝對象。在由拍攝對象識別單元406進行之拍攝對象識別之後,可在一背景修整單元408中自場景204修整包含物件212及213而排除拍攝對象之面部及身體之背景物件以產生僅僅包含拍攝對象211之面部及身體而不具有背景之場景206。在一項實例中,根據本發明之教示,場景206將係一中層。在各種實例中,應瞭解,根據本發明之教示,視訊處理器400中所包含之處理方塊可在一行動計算裝置中所包含之硬體、電腦軟體、韌體及/或其組合中實施。
在一項實例中,來自場景106及108之僅一個場景用於形成兩個其他視訊層,其係後視訊層及前視訊層。根據本發明之教示,後視訊層、中間視訊層及前視訊層共同形成一個三層子母視訊(ViV)之視訊流。在一項實例中,場景106用於形成三層ViV視訊流之後視訊層及前視訊層。首先識別場景106中之物件111至114。在另一實例中,應瞭解,亦可使用場景108。可使用此項技術中之標準方法來進行物件識別。舉例而言,可辨識一物件之邊界或邊緣且因此可使用其紋理及/或色彩來識別該邊界或邊緣。另外,假定同一物件之各部分具有至立體攝影機100之基線110之實質上相同之距離。
繼續該實例,在識別場景106中之物件111至114之後,或換言之,在辨識物件111至114之所有邊界或邊緣之後,可使用左場景106與右場景108之視差基於(舉例而言)三角量測而判定物件111至114中之每一者至立體攝影機100之基線110之距離。出於闡釋目的,在所繪示 之實例中假定物件111、112、113及114至立體攝影機100之基線110之所判定距離分別係D1、D2、D3及D4。另外,在所繪示之實例中,假定D1<D2<D3<D4。
基於其距離D1、D2、D3及D4,可將場景106中之物件111至114劃分成遠區及近區。此外,遠區中之物件包含於一後視訊層中,且近區中之物件包含於一前視訊層中。圖3之場景206用作一中間視訊層。可選擇中間視訊層至立體攝影機100之基線110之距離,且使用該距離來劃分遠區及近區。比中間視訊層至立體攝影機100之基線110之距離遠之物件包含於遠區中,且比中間視訊層至立體攝影機100之基線110之距離近之物件包含於近區中。
舉例而言,根據本發明之教示,將中間視訊層之一距離DS(S代表拍攝對象)選擇為D1<DS<D2,如圖5中所展示。一後視訊層502包含物件112、113及114。一中間視訊層504係包含拍攝對象211之圖3之一經恰當縮放之場景206。一前視訊層506包含物件111。將中間視訊層504覆疊於後視訊層502上且進一步將前視訊層506覆疊於中間視訊層504上產生具有三個視訊層之一ViV視訊場景508。換言之,根據本發明之教示,中間視訊層504覆疊於前視訊層506與後視訊層502之間。在所得ViV視訊場景508中,拍攝對象211遮擋後視訊層502中之物件112及113,且前視訊層506中之物件111遮擋拍攝對象211。應注意,前視訊層508中之物件已適當遮擋後視訊層502中之物件,此乃因前視訊層508及後視訊層502中之物件最初皆係自場景106裁切的。
如所繪示之實例中所圖解說明,恰當縮放中間視訊層504中之拍攝對象211之大小。舉例而言,假定一人類面部之寬度W係大致18cm。應瞭解,可假定W為其他值。參考攝影機102之放大率及距離DS,可縮放場景206以使得若拍攝對象211站立在距立體攝影機100之基線110一距離DS處,則在中間視訊層504中拍攝對象211之面部之寬 度W'將等於W或大約18cm。因此,根據本發明之教示,拍攝對象適當地處於ViV視訊場景508中之中間視訊層504中以使得在ViV視訊場景508中拍攝對象之面部之寬度W被縮放為等於一預定值,例如18cm。應瞭解,18cm之一預定值係出於闡釋目的而隨本文提供的且根據本發明之教示亦可利用其他預定值。
圖6根據本發明之教示圖解說明其中將中間視訊層之距離DS選擇為D2<DS<D3之另一實例。如所圖解說明,後視訊層602包含物件113及114。一中間視訊層604係如先前所闡述經恰當縮放之包含拍攝對象211的圖3之場景206。一前視訊層606包含物件111及112。將中間視訊層604覆疊於後視訊層602上且進一步將前視訊層606覆疊於中間視訊層604上產生具有三個視訊層之一ViV視訊場景608。在所得ViV視訊場景608中,拍攝對象211遮擋後視訊層602中之物件113,且前視訊層606中之物件111及112遮擋拍攝對象211。
以此方式,根據本發明之教示,可產生具有三個視訊層之一ViV視訊流。在進行恰當遮擋之情況下拍攝對象顯現為作為背景之部分而站立,但事實上拍攝對象並不站立於背景中。在ViV視訊流中,亦根據拍攝對象虛擬站立之處的選定距離來恰當縮放拍攝對象。雖然一立體攝影機100用於判定場景中各種物件之距離,但所產生之ViV視訊流並非係一立體顯示。而是,根據本發明之教示,所得三視訊層ViV視訊流係一單個視訊流。
圖7根據本發明之教示展示由一視訊處理器執行之一實例性程序(例如藉助上文所論述之視訊處理器400中所包含之進階處理)之一方塊圖700,該視訊處理器經耦合以自前攝影機及立體攝影機接收視訊流以產生具有視訊場景之三個視訊層之一ViV視訊流。程序方塊中之某些或全部在方塊圖700中出現之次序不應視為限制性。而是,受益於本發明之熟習此項技術者將理解,可以未圖解說明之多種次序或甚 至並行地執行該等程序方塊中之某些。
如程序方塊702中所展示,基於一立體攝影機之一左場景或右場景中之物件之邊界或邊緣而識別該等物件,可使用包含紋理及/或色彩以及其他之各種因素來判定該等邊界或邊緣。在程序方塊704中,使用左場景與右場景之視差基於三角量測而判定每一物件之距離。在程序方塊706中,選擇一中間視訊層之距離。在程序方塊708中,將一場景中之物件劃分成遠區及近區。比中間視訊層之距離遠之物件包含於遠區中,且比中間視訊層之距離近之物件包含於近區中。在程序方塊710中,形成包含遠區中之物件之一後視訊層,且形成包含近區中之物件之一前視訊層。
在程序方塊712中,使用色度鍵合成方法及/或一視訊處理器來識別一單個攝影機場景(例如前攝影機)中之一拍攝對象以偵測該拍攝對象之面部及身體。在程序方塊714中,修整該單個攝影機場景中之背景,從而僅僅留下經識別拍攝對象之面部及身體。在程序方塊716中,根據程序706來選擇中間視訊層之距離。在程序方塊718中,縮放拍攝對象。出於闡釋目的,在一項實例中,拍攝對象經縮放以使得在場景中根據程序方塊706選擇之中間視訊層距離處拍攝對象之面部之寬度將係大致18cm。當然,應瞭解,可利用拍攝對象之面部之寬度之任何預定值來將拍攝對象適當縮放到背景場景中。在程序方塊720中,形成包含經恰當縮放之拍攝對象之一中間視訊層。在程序方塊722中,根據本發明之教示,覆疊後視訊層、中間視訊層及前視訊層,從而形成具有三個視訊層之一ViV視訊流。根據本發明之教示,在進行恰當遮擋之情況下,將中間視訊層覆疊於後視訊層之頂部上且將前視訊層覆疊於中間視訊層之頂部上產生一拍攝對象站立於一背景中之外觀。在各種實例中,應瞭解,根據本發明之教示,方塊圖700中所闡述之處理方塊可在行動計算裝置中所包含之硬體、電腦軟體、 韌體及/或其組合中實施。
圖8根據本發明之教示展示透過網際網路連接至一網路800中之一伺服器804之一行動計算裝置802之一實例。在一項實例中,舉例而言,行動計算裝置802可係一行動電話、一智慧型電話、一平板電腦等。如所繪示之實例中所展示,網路800包含行動計算裝置802、伺服器804以及複數個接收器810、812、814及816。該網際網路包含有線網路與無線網路之一組合。在一項實例中,行動計算裝置802使用一無線網路來與伺服器804連接。該無線網路可包含一Wi-Fi網路、一行動寬頻網路、一電話網路或任何適當網路。行動計算裝置802中所包含之視訊處理器將一視訊流視訊1上傳806至伺服器804。在一項實例中,視訊流視訊1係由行動計算裝置802擷取之一即時視訊流。在一項實例中,視訊流視訊1可係先前儲存於行動計算裝置802中之一經記錄視訊流。
如先前所提及,在一項實例中,行動計算裝置802可係一智慧型電話。出於本發明之目的,可將一智慧型電話視為建立在一行動作業系統(OS)基礎上之具有比一功能型電話更進階之計算功能及連接性之一行動電話。除視訊攝影機、觸控螢幕及網頁瀏覽器以外,一智慧型電話亦可包含一個人數位助理(PDA)、可攜式媒體播放器及全球定位系統(GPS)導航單元之功能。由現代智慧型電話使用之行動作業系統(OS)之實例包含但不限於:Android、iOS、Symbian、BlackBerry OS、Bada、Windows Phone、webOS及嵌入式Linux以及其他。
在伺服器804使與行動計算裝置802之連接安全之後,行動計算裝置802將視訊流視訊1上傳806至伺服器804。所接收之視訊流視訊1繼而由伺服器804透過包含有線網路與無線網路之一組合之網際網路廣播808。在所圖解說明之實例中,伺服器804將視訊流視訊1廣播至個別接收器,例如接收器810、812、814及816。所廣播視訊流視訊1 之接收器可包含另一行動計算裝置810,例如一行動電話、一智慧型電話、一平板電腦等。以此方式,行動計算裝置810之使用者可收看視訊流視訊1。類似地,其他接收器812、814及816可收看所廣播視訊流視訊1。在一項實例中,上傳及廣播可係即時的。在另一實例中,上傳及廣播可並非係即時的。
可使用此項技術中眾所周知之標準方法來使行動計算裝置802與伺服器804之間的連接安全且由伺服器804將視訊流廣播至接收器810至816。在所繪示之實例中,視訊流視訊1包含視訊信號及音訊信號兩者。視訊流視訊1亦可包含嵌入於視訊流中之文字、圖形及其他資料。
圖9根據本發明之教示展示一實例性行動計算裝置802之具有一單個前攝影機906之一前側902,前側902面向行動計算裝置802之使用者。在一項實例中,前攝影機906經耦合以將一前攝影機視訊流提供至視訊處理器400。圖9亦根據本發明之教示展示行動計算裝置802之具有一立體後攝影機908之一後側904,後側904面向行動計算裝置802之使用者所面向之視圖。立體後攝影機908進一步包含一左後攝影機910及一右後攝影機912。在一項實例中,立體後攝影機906經耦合以將一左後攝影機視訊流及一右後攝影機視訊流提供至視訊處理器400。前攝影機906產生包含參考圖2之視訊場景204之一前攝影機視訊流,其可係展示行動計算裝置802之使用者之視圖。左後攝影機910產生包含參考圖1之視訊場景106之一左後視訊流。右後攝影機912產生包含參考圖1之視訊場景108之一右後視訊流。場景106及108可係行動計算裝置802之使用者所面向之左視圖及右視圖。
簡單地返回參考圖7、圖4、圖2及圖1,視訊處理器400經耦合以產生具有包含來自視訊場景204及視訊場景106或視訊場景108之物件及一拍攝對象之三個視訊層之一輸出ViV視訊流。在一項實例中,一 行動計算裝置之視訊處理器400執行圖7中所闡述之程序以產生具有三個視訊層之輸出ViV視訊流。在圖8中所繪示之實例中,將所產生之輸出ViV視訊流展示為上傳806至伺服器804之視訊1。
以此方式,行動計算裝置802之一使用者可產生包含他或她所面向之視圖之一ViV視訊流,其中他或她在中間視訊層中之影像被縮放為在距行動計算裝置802之一中間視訊層距離處且具有恰當遮擋(即,他的或她的影像適當地遮擋後物件)。因此,被判定為距行動計算裝置802小於中間視訊層距離之一距離之覆疊於前視訊層中之相對近的物件適當地遮擋他或她在所形成ViV視訊流視訊1中之影像。另外,被判定為距行動計算裝置802大於中間視訊層距離之一距離之覆疊於後視訊層中之相對遠的物件由他或她在所形成ViV視訊流視訊1中之影像適當地遮擋。此外,將所產生之ViV視訊流視訊1上傳806至一伺服器,且該伺服器將視訊流視訊1廣播至接收器810至816。在一項實例中,視訊1之上傳及廣播可係即時的。在另一實例中,視訊1之上傳及廣播可並非係即時的。
圖10根據本發明之教示展示其中背景立體場景106及108不來自行動計算裝置802之一實例。為了圖解說明,一行動計算裝置1000或具有包含產生包含圖1之一左視訊場景106之一左視訊流之一左攝影機1002及產生包含圖1之一右視訊場景108之一右視訊流之一右攝影機1004之一立體攝影機之另一裝置將包含左視訊流及右視訊流之一立體視訊流視訊2上傳1006至一網路800中之伺服器804。網路800包含行動計算裝置802、裝置1000、伺服器804以及複數個接收器810、812、814及816,如所展示。應注意,一立體視訊流可需要用於上傳之一雙倍頻寬。行動計算裝置802自伺服器804接收1008立體視訊流視訊2。根據本發明之教示,將包含由行動計算裝置802之前攝影機906產生之圖2之視訊流204的一視訊流連同視訊流視訊2一起處理,從而形成如 先前所闡述具有三個視訊層之一ViV視訊流視訊1。將所形成之ViV視訊流視訊1上傳806至伺服器804。伺服器804繼而將視訊1廣播至接收器810至816。在一項實例中,上傳及廣播可係即時的。在另一實例中,上傳及廣播可並非係即時的。
亦應瞭解,即時上傳及即時廣播可包含由網際網路訊務導致之延遲。在一項實例中,根據本發明之教示,出於本發明之目的,可將多達數秒之一延遲視為即時的。在另一實例中,應瞭解,根據本發明之教示,出於本發明之目的,仍可將一更長延遲視為即時的。
如先前所提及,可利用電腦軟體及硬體來實施上文所闡釋之程序。所闡述之技術可構成在一有形或非暫時機器(例如,電腦)可讀儲存媒體內體現之機器可執行指令,該等機器可執行指令在由一機器(例如視訊處理器400)執行時將致使該機器執行所闡述之操作。另外,可在硬體(諸如一特殊應用積體電路(「ASIC」)或其他)內體現該等程序。
一有形非暫時機器可讀儲存媒體包含以可由一機器(例如,一電腦、網路裝置、行動計算裝置、製造工具、具有一個或一個以上處理器之一集合之任何裝置等)存取之一形式提供(即,儲存)資訊之任何機構。舉例而言,一機器可讀儲存媒體包含可記錄/不可記錄媒體(例如,唯讀記憶體(ROM)、隨機存取記憶體(RAM)、磁碟儲存媒體、光學儲存媒體、快閃記憶體裝置等)。
包含發明摘要中所闡述內容之本發明之所圖解說明實例之以上說明並非意欲係窮盡性或限制於所揭示之精確形式。儘管出於說明性目的而在本文中闡述本發明之特定實施例及實例,但可做出各種等效修改,此並不背離本發明之較廣泛精神及範疇。
可根據以上詳細說明對本發明之實例做出此等修改。以下申請專利範圍中所使用之術語不應理解為將本發明限制於說明書及申請專 利範圍中所揭示之特定實施例。相反,範疇將完全由以下申請專利範圍來判定,該申請專利範圍將根據所確立之請求項解釋原則來加以理解。因此,應將本說明書及各圖視為說明性而非限制性。
800‧‧‧網路
802‧‧‧行動計算裝置
804‧‧‧伺服器
806‧‧‧上傳
808‧‧‧廣播
810‧‧‧接收器
812‧‧‧接收器
814‧‧‧接收器
816‧‧‧接收器
906‧‧‧前攝影機
1000‧‧‧行動計算裝置/裝置
1002‧‧‧左攝影機
1004‧‧‧右攝影機
1006‧‧‧上傳
1008‧‧‧接收

Claims (37)

  1. 一種行動計算裝置,其包括:一第一攝影機,其在該行動計算裝置之一第一側上,其中該第一攝影機經耦合以產生一第一攝影機視訊流;一第二攝影機,其在該行動計算裝置之一第二側上,其中該第二攝影機經耦合以產生一第二攝影機視訊流;一第三攝影機,其在該行動計算裝置之該第二側上,其中該第三攝影機經耦合以產生一第三攝影機視訊流,其中該第二攝影機及該第三攝影機包含於該行動計算裝置之一立體攝影機中;及一視訊處理器,其經耦合以產生包含自該第一攝影機視訊流產生之一第一視訊層之一輸出視訊流,其中該視訊處理器進一步經耦合以回應於該第二攝影機視訊流及該第三攝影機視訊流而產生具有自該第二攝影機視訊流產生之一第二視訊層及一第三視訊層之該輸出視訊流,其中該視訊處理器經耦合以在該輸出視訊流中將該第一視訊層覆疊於該第二視訊層與該第三視訊層之間。
  2. 如請求項1之行動計算裝置,其中該視訊處理器耦合至該立體攝影機以回應於該第二攝影機視訊流及該第三攝影機視訊流而自該第二攝影機視訊流產生該輸出視訊流之該第二視訊層及該第三視訊層,以使得該輸出視訊流之該第三視訊層中之一第三物件比該輸出視訊流之該第二視訊層中之一第二物件更遠離該立體攝影機。
  3. 如請求項2之行動計算裝置,其中覆疊於該輸出視訊流之該第二視訊層與該第三視訊層之間的該輸出視訊流之該第一視訊層中 之一第一物件經耦合而由該視訊處理器縮放為比該第二視訊層中之該第二物件更遠離該立體攝影機,且其中該第一視訊層中之該第一物件經耦合而由該視訊處理器縮放為比該輸出視訊流之該第三視訊層中之該第三物件更靠近該立體攝影機。
  4. 如請求項3之行動計算裝置,其中該輸出視訊流之該第二視訊層中之該第二物件遮擋該輸出視訊流之該第一視訊層中之該第一物件,且其中該輸出視訊流之該第一視訊層中之該第一物件遮擋該輸出視訊流之該第三視訊層中之該第三物件。
  5. 如請求項2之行動計算裝置,其中該視訊處理器進一步經耦合以在該第二攝影機視訊流及該第三攝影機視訊流中識別該第二物件且基於該第二物件在該第二攝影機視訊流與該第三攝影機視訊流之間的一視差而判定該第二物件距該立體攝影機之一距離,其中該視訊處理器進一步經耦合以在該第二攝影機視訊流及該第三攝影機視訊流中識別該第三物件且基於該第三物件在該第二攝影機視訊流與該第三攝影機視訊流之間的一視差而判定該第三物件距該立體攝影機之一距離,其中該第二物件距該立體攝影機之該距離小於該第三物件距該立體攝影機之該距離。
  6. 如請求項1之行動計算裝置,其中該視訊處理器進一步經耦合以將在該第二攝影機視訊流及該第三攝影機視訊流中識別之比一中間視訊層距離更靠近該立體攝影機之任何物件放置於該第二視訊層中,其中該視訊處理器進一步經耦合以將在該第二攝影機視訊流及該第三攝影機視訊流中識別之比該中間視訊層距離更遠離該立體攝影機之任何物件放置於該第三視訊層中,且其中該視訊處理器進一步經耦合以將該第一攝影機視訊流中之在該中間視訊層距離處之一第一物件放置於該第一視訊層中。
  7. 如請求項1之行動計算裝置,其中該視訊處理器進一步經耦合以自該第一攝影機視訊流修整一背景以在該輸出視訊流中僅僅將一拍攝對象覆疊於該第二視訊層與該第三視訊層之間的該第一視訊層中,其中該拍攝對象係該行動計算裝置之一使用者。
  8. 如請求項7之行動計算裝置,其中該視訊處理器進一步經耦合以縮放該輸出視訊流之該第一視訊層中之該拍攝對象,以使得該拍攝對象之一面部之一寬度被縮放為等於該輸出視訊流中之一預定值。
  9. 如請求項7之行動計算裝置,其中該視訊處理器經耦合以利用色度鍵合成自該第一攝影機視訊流修整該背景。
  10. 如請求項7之行動計算裝置,其中該視訊處理器進一步包括:一面部偵測單元,其耦合至該第一視訊攝影機以接收該第一攝影機視訊流,其中該面部偵測單元經耦合以判定該第一攝影機視訊流中之該拍攝對象之一面部之一位置;一面部邊緣偵測單元,其耦合至該面部偵測單元,其中該面部邊緣偵測單元經耦合以偵測該第一攝影機視訊流中之該拍攝對象之該面部之一邊緣;一拍攝對象識別單元,其耦合至該面部邊緣偵測單元,其中該拍攝對象識別單元經耦合以識別該第一攝影機視訊流中之該拍攝對象之一身體;及一背景修整單元,其耦合至該拍攝對象識別單元,其中該背景修整單元經耦合以自該第一攝影機視訊流修整該背景以在該輸出視訊流之該第一視訊層中僅僅留下該拍攝對象之該面部及該身體。
  11. 如請求項1之行動計算裝置,其中包含該第一視訊層、該第二視訊層及該第三視訊層之該輸出視訊流經耦合以上傳至一伺服 器。
  12. 如請求項11之行動計算裝置,其中該輸出視訊流經耦合而由該伺服器廣播至複數個接收器。
  13. 如請求項11之行動計算裝置,其中該輸出視訊流經耦合以透過包含一Wi-Fi網路、一行動寬頻網路及一電話網路中之至少一者之一網際網路無線網路上傳至該伺服器。
  14. 如請求項12之行動計算裝置,其中該行動計算裝置經耦合以將該輸出視訊流即時地上傳至該伺服器,且其中該伺服器經耦合以使用一有線網際網路及一無線網際網路中之至少一者將該輸出視訊流即時地廣播至該複數個接收器。
  15. 如請求項14之行動計算裝置,其中該輸出視訊流自該行動計算裝置至該伺服器之該即時上傳及其中該輸出視訊流自該伺服器至該複數個接收器之該即時廣播包含由網際網路訊務導致之延遲。
  16. 如請求項1之行動計算裝置,其中該行動計算裝置係一行動電話、一智慧型電話或一平板電腦中之一者。
  17. 一種用於通訊之網路系統,其包括:一伺服器;一第一行動計算裝置,其連接至該伺服器,該第一行動計算裝置包含在該第一行動計算裝置之一第一側上之經耦合以產生一第一攝影機視訊流之一第一攝影機;一立體攝影機,其連接至該伺服器,該立體攝影機包含經耦合以產生一第二攝影機視訊流之一第二攝影機,且該立體攝影機進一步包含經耦合以產生一第三攝影機視訊流之一第三攝影機;一視訊處理器,其包含於該第一行動計算裝置中,其中該視 訊處理器經耦合以接收該第一攝影機視訊流以產生一輸出視訊流之一第一視訊層,且其中該視訊處理器經耦合以接收該第二攝影機視訊流及該第三攝影機視訊流以自該第二攝影機視訊流產生該輸出視訊流之一第二視訊層及一第三視訊層,其中該視訊處理器經耦合以在該輸出視訊流中將該第一視訊層覆疊於該第二視訊層與該第三視訊層之間,且其中該視訊處理器經耦合以將該輸出視訊流上傳至該伺服器;及複數個接收器,其耦合至該伺服器以接收該輸出視訊流。
  18. 如請求項17之網路系統,其中該立體攝影機包含於該第一行動計算裝置中該第一行動計算裝置之一第二側上。
  19. 如請求項17之網路系統,其中該立體攝影機包含於一第二行動計算裝置中,其中該第二計算裝置經耦合以將該第二攝影機視訊流及該第三攝影機視訊流上傳至該伺服器,且其中該第一行動計算裝置之該視訊處理器經耦合以自該伺服器接收該第二攝影機視訊流及該第三攝影機視訊流。
  20. 如請求項19之網路系統,其中該第二行動計算裝置係一行動電話、一智慧型電話或一平板電腦中之一者。
  21. 如請求項17之網路系統,其中該視訊處理器經耦合以回應於該第二攝影機視訊流及該第三攝影機視訊流而自該第二攝影機視訊流產生該輸出視訊流之該第二視訊層及該第三視訊層,以使得該輸出視訊流之該第三視訊層中之一第三物件比該輸出視訊流之該第二視訊層中之一第二物件更遠離該立體攝影機。
  22. 如請求項21之網路系統,其中該視訊處理器經耦合以將該輸出視訊流之該第一視訊層中之一第一物件覆疊於該輸出視訊流之該第二視訊層與該第三視訊層之間,其中該視訊處理器經耦合以將該第一視訊層中之該第一物件縮放為比該第二視訊層中之 該第二物件更遠離該立體攝影機,且其中該第一視訊層中之該第一物件經耦合而由該視訊處理器縮放為比該輸出視訊流之該第三視訊層中之該第三物件更靠近該立體攝影機。
  23. 如請求項22之網路系統,其中該輸出視訊流之該第二視訊層中之該第二物件遮擋該輸出視訊流之該第一視訊層中之該第一物件,且其中該輸出視訊流之該第一視訊層中之該第一物件遮擋該輸出視訊流之該第三視訊層中之該第三物件。
  24. 如請求項21之網路系統,其中該視訊處理器進一步經耦合以在該第二攝影機視訊流及該第三攝影機視訊流中識別該第二物件且基於該第二物件在該第二攝影機視訊流與該第三攝影機視訊流之間的一視差而判定該第二物件距該立體攝影機之一距離,其中該視訊處理器進一步經耦合以在該第二攝影機視訊流及該第三攝影機視訊流中識別該第三物件且基於該第三物件在該第二攝影機視訊流與該第三攝影機視訊流之間的一視差而判定該第三物件距該立體攝影機之一距離,其中該第二物件距該立體攝影機之該距離小於該第三物件距該立體攝影機之該距離。
  25. 如請求項22之網路系統,其中該視訊處理器進一步經耦合以將在該第二攝影機視訊流及該第三攝影機視訊流中識別之比距該立體攝影機之一中間視訊層距離更靠近該立體攝影機之任何物件覆疊於該第二視訊層中,其中該視訊處理器進一步經耦合以將在該第二攝影機視訊流及該第三攝影機視訊流中識別之比該中間視訊層距離更遠離該立體攝影機之任何物件覆疊於該第三視訊層中,且其中該視訊處理器進一步經耦合以在該輸出視訊流之該第一視訊層中將該第一物件覆疊為在距該立體攝影機之該中間視訊層距離處。
  26. 如請求項17之網路系統,其中該視訊處理器進一步經耦合以自 該第一攝影機視訊流修整一背景以在該輸出視訊流中僅僅將一拍攝對象覆疊於該第二視訊層與該第三視訊層之間的該第一視訊層中,其中該拍攝對象係該第一行動計算裝置之一使用者。
  27. 如請求項26之網路系統,其中該視訊處理器進一步經耦合以縮放該輸出視訊流之該第一視訊層中之該拍攝對象,以使得該拍攝對象之一面部之一寬度被縮放為等於該輸出視訊流中之一預定值。
  28. 如請求項26之網路系統,其中該視訊處理器經耦合以利用色度鍵合成自該第一攝影機視訊流修整該背景。
  29. 如請求項26之網路系統,其中該視訊處理器進一步包括:一面部偵測單元,其耦合至該第一視訊攝影機以接收該第一攝影機視訊流,其中該面部偵測單元經耦合以判定該第一攝影機視訊流中之該拍攝對象之一面部之一位置;一面部邊緣偵測單元,其耦合至該面部偵測單元,其中該面部邊緣偵測單元經耦合以偵測該第一攝影機視訊流中之該拍攝對象之該面部之一邊緣;一拍攝對象識別單元,其耦合至該面部邊緣偵測單元,其中該拍攝對象識別單元經耦合以識別該第一攝影機視訊流中之該拍攝對象之一身體;及一背景修整單元,其耦合至該拍攝對象識別單元,其中該背景修整單元經耦合以自該第一攝影機視訊流修整該背景以在該輸出視訊流之該第一視訊層中僅僅留下該拍攝對象之該面部及該身體。
  30. 如請求項17之網路系統,其中該第一行動計算裝置係一行動電話、一智慧型電話或一平板電腦中之一者。
  31. 一種用於將三個視訊層覆疊於一輸出視訊流中之方法,其包 括:在自一立體攝影機接收之第二攝影機視訊流及第三攝影機視訊流中識別物件;判定該立體攝影機與在該第二攝影機視訊流及該第三攝影機視訊流中識別之該等物件中之每一者之間的各別距離;將在該第二攝影機視訊流及該第三攝影機視訊流中識別之小於距該立體攝影機之一中間視訊層距離之任何物件放置於一第二視訊層中;將在該第二攝影機視訊流及該第三攝影機視訊流中識別之大於距該立體攝影機之該中間視訊層距離之任何物件放置於一第三視訊層中;在自一第一攝影機接收之一第一攝影機視訊流中識別一拍攝對象;自該第一攝影機視訊流修整一背景以在該第一攝影機視訊流中僅僅留下該經識別拍攝對象;僅僅將該經識別拍攝對象放置於一第一視訊層中;及在該輸出視訊流中將該第一視訊層覆疊於該第二視訊層與該第三視訊層之間。
  32. 如請求項31之方法,其進一步包括:在該第一攝影機視訊流中偵測該經識別拍攝對象之一面部;在該第一攝影機視訊流中識別該經識別拍攝對象之一身體,其中自該第一攝影機視訊流修整該背景以在該第一視訊層中僅僅留下該經識別拍攝對象之該面部及該身體。
  33. 如請求項32之方法,其進一步包括在該第一視訊層中將該經識別拍攝對象縮放為在距該立體攝影機之該中間視訊層距離處,以使得該經識別拍攝對象之該面部之一寬度被縮放為等於該輸 出視訊流中之一預定值。
  34. 如請求項31之方法,其中在該第一攝影機視訊流上識別該拍攝對象包括在該第一攝影機視訊流中利用色度鍵合成。
  35. 如請求項31之方法,其中在該輸出視訊流中將該第一視訊層覆疊於該第二視訊層與該第三視訊層之間包括:用該第二視訊層中之在該第二攝影機視訊流及該第三攝影機視訊流中識別之小於距該立體攝影機之該中間視訊層距離之該等任何物件遮擋該第一視訊層中之該經識別拍攝對象;及用該第一視訊層中之該經識別拍攝對象遮擋該第三視訊層中之在該第二攝影機視訊流及該第三攝影機視訊流中識別之大於距該立體攝影機之該中間視訊層距離之該等任何物件。
  36. 如請求項31之方法,其中該第一攝影機在一第一行動計算裝置上。
  37. 如請求項31之方法,其中該立體攝影機在一第二行動計算裝置上。
TW102129347A 2013-01-04 2013-08-15 具有三層視訊場景之子母視訊之視訊流 TWI528782B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US13/734,514 US9131284B2 (en) 2013-01-04 2013-01-04 Video-in-video video stream having a three layer video scene

Publications (2)

Publication Number Publication Date
TW201429226A TW201429226A (zh) 2014-07-16
TWI528782B true TWI528782B (zh) 2016-04-01

Family

ID=51041962

Family Applications (1)

Application Number Title Priority Date Filing Date
TW102129347A TWI528782B (zh) 2013-01-04 2013-08-15 具有三層視訊場景之子母視訊之視訊流

Country Status (3)

Country Link
US (1) US9131284B2 (zh)
CN (1) CN103916604B (zh)
TW (1) TWI528782B (zh)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10021431B2 (en) 2013-01-04 2018-07-10 Omnivision Technologies, Inc. Mobile computing device having video-in-video real-time broadcasting capability
KR102023179B1 (ko) * 2013-02-21 2019-09-20 삼성전자주식회사 듀얼 카메라를 포함하는 전자장치에서 듀얼 리코딩 촬영을 위한 방법 및 장치
KR102047704B1 (ko) * 2013-08-16 2019-12-02 엘지전자 주식회사 이동 단말기 및 이의 제어 방법
US10582346B2 (en) 2014-06-19 2020-03-03 Omnivision Technologies, Inc. Communication screen editing and previewing
US9154736B1 (en) 2014-07-16 2015-10-06 Omnivision Technologies, Inc. Video conferencing with a mobile platform
US9838528B2 (en) * 2014-07-21 2017-12-05 Verizon Patent And Licensing Inc. Voice and video calling over long term evolution-based user interface
TWI564841B (zh) * 2014-10-20 2017-01-01 陳金仁 即時影像合成裝置、方法與電腦程式產品
WO2017154411A1 (ja) * 2016-03-07 2017-09-14 パナソニックIpマネジメント株式会社 撮像装置、電子機器及び撮像システム
CN106803959B (zh) * 2017-02-28 2019-12-27 腾讯科技(深圳)有限公司 视频图像编码、解码方法、编码、解码装置及可读存储介质
FR3066671B1 (fr) 2017-05-18 2020-07-24 Darmon Yves Procede d'incrustation d'images ou de video au sein d'une autre sequence video

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8290034B2 (en) 1998-12-21 2012-10-16 Zin Stai Pte. In, Llc Video transmission and display including bit-wise sub-sampling video compression
US7865498B2 (en) 2002-09-23 2011-01-04 Worldwide Broadcast Network, Inc. Broadcast network platform system
US20100053436A1 (en) 2008-08-29 2010-03-04 Kabushiki Kaisha Toshiba Video Display Apparatus and Video Display Method
CN101489149B (zh) * 2008-12-25 2010-06-23 清华大学 双目立体视频采集系统
US8869239B2 (en) 2009-04-15 2014-10-21 Wyse Technology L.L.C. Method and system for rendering composite view of an application
CN101840146A (zh) * 2010-04-20 2010-09-22 夏佳梁 自动矫正视差的立体图像拍摄方法及装置
US9628755B2 (en) * 2010-10-14 2017-04-18 Microsoft Technology Licensing, Llc Automatically tracking user movement in a video chat application
US8860785B2 (en) 2010-12-17 2014-10-14 Microsoft Corporation Stereo 3D video support in computing devices
US8488011B2 (en) * 2011-02-08 2013-07-16 Longsand Limited System to augment a visual data stream based on a combination of geographical and visual information
US20120230539A1 (en) * 2011-03-08 2012-09-13 Bank Of America Corporation Providing location identification of associated individuals based on identifying the individuals in conjunction with a live video stream
CN202143152U (zh) 2011-07-15 2012-02-08 豪威科技(上海)有限公司 将人物与人物所视现场合成的拍摄装置
US10021431B2 (en) 2013-01-04 2018-07-10 Omnivision Technologies, Inc. Mobile computing device having video-in-video real-time broadcasting capability

Also Published As

Publication number Publication date
TW201429226A (zh) 2014-07-16
CN103916604B (zh) 2017-05-24
CN103916604A (zh) 2014-07-09
US9131284B2 (en) 2015-09-08
US20140192198A1 (en) 2014-07-10

Similar Documents

Publication Publication Date Title
TWI528782B (zh) 具有三層視訊場景之子母視訊之視訊流
TWI517716B (zh) 具有子母視訊即時廣播功能之行動計算裝置
US12056886B2 (en) Systems and methods for depth estimation using generative models
US10116922B2 (en) Method and system for automatic 3-D image creation
US9898856B2 (en) Systems and methods for depth-assisted perspective distortion correction
CN103475886B (zh) 立体深度影像建立系统及其方法
US20150156475A1 (en) Method and Device for Implementing Stereo Imaging
JP2016535353A (ja) オブジェクト検出及び分割の方法,装置,コンピュータプログラム製品
KR101804199B1 (ko) 입체 파노라마 영상을 생성하는 장치 및 방법
JP5963256B2 (ja) 画像生成装置
EP3245616A1 (en) Event triggered by the depth of an object in the field of view of an imaging device
WO2016192467A1 (zh) 一种播放视频的方法及装置
TWI502271B (zh) 控制方法及電子裝置
FR3052565B1 (fr) Dispositif individuel d&#39;immersion visuelle pour personne en mouvement
JP2011160221A (ja) 画像処理装置、画像処理方法、及びプログラム
JP5981460B2 (ja) 立体シーンにおける焦点面の位置を管理するためのデバイスおよび方法
JP7336871B2 (ja) 全天周映像処理装置及びプログラム
US20170053413A1 (en) Method, apparatus, and computer program product for personalized stereoscopic content capture with single camera end user devices
CN117278809A (zh) 一种多路视频流合成vr场景的方法、装置和电子设备
CN105791796B (zh) 图像处理方法和图像处理装置
CN117729320A (zh) 图像显示方法、设备及存储介质
CN105791796A (zh) 图像处理方法和图像处理装置
CN110710202A (zh) 一种图像处理方法及装置