TWI571105B - 用於基於感興趣區域的影像編碼之技術 - Google Patents

用於基於感興趣區域的影像編碼之技術 Download PDF

Info

Publication number
TWI571105B
TWI571105B TW103107487A TW103107487A TWI571105B TW I571105 B TWI571105 B TW I571105B TW 103107487 A TW103107487 A TW 103107487A TW 103107487 A TW103107487 A TW 103107487A TW I571105 B TWI571105 B TW I571105B
Authority
TW
Taiwan
Prior art keywords
image
data
interest
region
boundary
Prior art date
Application number
TW103107487A
Other languages
English (en)
Other versions
TW201442488A (zh
Inventor
董介
陳偉安
Original Assignee
英特爾公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 英特爾公司 filed Critical 英特爾公司
Publication of TW201442488A publication Critical patent/TW201442488A/zh
Application granted granted Critical
Publication of TWI571105B publication Critical patent/TWI571105B/zh

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/167Position within a video image, e.g. region of interest [ROI]
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01BMEASURING LENGTH, THICKNESS OR SIMILAR LINEAR DIMENSIONS; MEASURING ANGLES; MEASURING AREAS; MEASURING IRREGULARITIES OF SURFACES OR CONTOURS
    • G01B11/00Measuring arrangements characterised by the use of optical techniques
    • G01B11/14Measuring arrangements characterised by the use of optical techniques for measuring distance or clearance between spaced objects or spaced apertures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/168Feature extraction; Face representation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/12Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/61Control of cameras or camera modules based on recognised objects
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/63Control of cameras or camera modules by using electronic viewfinders
    • H04N23/633Control of cameras or camera modules by using electronic viewfinders for displaying additional information relating to control or operation of the camera
    • H04N23/635Region indicators; Field of view indicators
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/66Remote control of cameras or camera parts, e.g. by remote control devices
    • H04N23/661Transmitting camera control signals through networks, e.g. control via the Internet
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/67Focus control based on electronic image sensor signals

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Discrete Mathematics (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Theoretical Computer Science (AREA)
  • Studio Devices (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

用於基於感興趣區域的影像編碼之技術 發明領域
本文所述之實施例大體而言係關於在壓縮影像中使用已擷取影像之視野內的感興趣區域。
發明背景
數位擷取、儲存且觀察靜止視訊影像及運動視訊影像兩者所具之日益增加的色彩深度及解析度已賦能於數位攝影術甚至以突出銳度及色彩再現之期望值的專業人員水平來匹配基於膠捲之攝影術之品質。然而,色彩深度及解析度兩者之增加亦導致每一影像之增加的資料大小。此狀況導致對於儲存裝置之增加的儲存容量要求及對於包括此類影像之資料之交換之增加的資料傳送速率要求。
作為對此等增加的要求之應答,影像壓縮技術之領域日益強調編碼個別影像或運動視訊之影像之集合以減小該等影像之資料大小。一些影像壓縮技術使用無損編碼演算法,其中影像資料之共同觀注特性用來以不丟棄用於影像之任何像素之任何資料之方式來減小資料大小。儘管無損編碼演算法賦能於影像資料在隨後未壓縮時被如實地 再現,但是該等無損編碼演算法通常達成隻不過使影像之資料大小減小約一半。
其他影像壓縮技術使用有損編碼演算法,其中考慮到人類視覺之方面以丟棄影像資料中對於藉由人類眼睛及/或視覺皮質進行的該影像之感知的貢獻相較於該資料之其他部分較少的部分。實質上,存在被視為在遺漏時相較於其他資料不太可能被留意到的資料之選擇性移除。此類有損編碼演算法通常能夠達成相當大的壓縮程度,有時將影像之資料大小減小至其原始資料大小之約1/10。
然而,當解析度及色彩深度兩者繼續增加時,壓縮程度之增加已被視為合意的。就此等及其他考慮而言,需要本文所述之實施例。
依據本發明之一實施例,係特地提出一種設備,其包含:一影像感測器,其用以擷取一影像作為所擷取資料;以及邏輯元件,其用以:判定該影像內之一感興趣區域之第一邊界;使用一第一參數來壓縮表示該感興趣區域內之該影像之一第一部分的該所擷取資料之一第一部分;且使用一第二參數來壓縮表示該感興趣區域外部之該影像之一第二部分的該所擷取資料之一第二部分,該第一參數及該第二參數經選擇以使該所擷取資料之該第二部分比該所擷取資料之該第一部分壓縮一更大的程度。
100‧‧‧運算裝置/部分
110、910‧‧‧光學元件
112、912‧‧‧距離感測器
115、915‧‧‧影像感測器
132‧‧‧ROI資料
135‧‧‧所擷取資料
142‧‧‧聚焦部件
143‧‧‧對象識別部件
145‧‧‧擷取部件
148‧‧‧使用者介面部件
200‧‧‧擷取裝置/運算裝置
220、720‧‧‧控制器
240、240a、240b‧‧‧控制常式
250、250a、250b、750‧‧‧處理器元件
260、260a、260b、760、960‧‧‧儲存器
280、780、980‧‧‧顯示器
300‧‧‧運算裝置/部分
335‧‧‧壓縮資料
345‧‧‧壓縮部件
349‧‧‧通訊部件
390、790、990‧‧‧介面
500‧‧‧伺服器/運算裝置
700‧‧‧觀察裝置/運算裝置
740‧‧‧控制常式
812‧‧‧感興趣區域
813、883‧‧‧邊界
815‧‧‧視野
832a、832b‧‧‧像素資料
835a、835b、835c、835d‧‧‧遍
885‧‧‧二維區塊/巨集區塊
920‧‧‧鍵盤
925‧‧‧印表機
950‧‧‧處理器元件
955‧‧‧聯結器
961‧‧‧依電性儲存器
962‧‧‧非依電性儲存器
963‧‧‧可移媒體儲存器
965a~965c‧‧‧儲存器控制器
969‧‧‧可移機器可讀儲存媒體/機器可讀儲存媒體
985‧‧‧顯示介面
995a~995c‧‧‧介面控制器
999‧‧‧網路
1000‧‧‧影像處置系統
2100、2200、2300‧‧‧邏輯流程
2110~2140、2210~2250、2310~2350‧‧‧操作
3000‧‧‧處理架構
圖1例示出運算裝置之間的交互作用之第一實施例之不同部分。
圖2A及圖2B例示出在圖1之實施例之可能的實行方案中之影像擷取的態樣。
圖3A及圖3B例示出在圖1之實施例之可能的實行方案中之影像編碼的態樣。
圖4例示出圖1之實施例之一部分。
圖5例示出圖1之實施例之變體的態樣。
圖6例示出第一邏輯流程之實施例。
圖7例示出第二邏輯流程之實施例。
圖8例示出第三邏輯流程之實施例。
圖9例示出處理架構之實施例。
較佳實施例之詳細說明
各種實施例大體而言係針對將在影像之擷取期間判定之感興趣區域(ROI)使用來增強影像之壓縮以用於儲存及/或傳輸。指示在擷取影像時或擷取影像前後已知的影像之感興趣區域之邊界的資料儲存在擷取裝置內。感興趣區域之此等邊界之指示隨後在壓縮表示所擷取影像之資料期間用來使影像在感興趣區域內之部分之壓縮相較於影像在感興趣區域外部之另一部分不同地執行。
更具體而言,在感興趣區域外部之所擷取影像之一部分係使用選擇來在隨後解壓縮及觀察時損害該部分中之影像之品質的情況下達成較高壓縮程度的一或多個參數 來壓縮。相反,在感興趣區域內之所擷取影像之部分係使用選擇來在損害壓縮程度的情況下達成該部分中之影像之較高品質以用於後續解壓縮及觀察的一或多個參數來壓縮。使用所擷取影像在感興趣區域內之部分與所擷取影像在感興趣區域外部的一部分之壓縮的此差異賦能於表示在感興趣區域外部之部分之資料之更強制性壓縮,以達成較小的總資料大小,同時仍允許感興趣區域維持較高的影像品質。
影像之感興趣區域之邊界係在擷取影像時或在擷取影像前後判定。該等邊界可藉由擷取裝置作為實行自動形式之聚焦之部分自動地判定,或者可操作擷取裝置之控制器來指定該等邊界。亦應注意,在所擷取影像中可存在一個以上感興趣區域,各自具有其自己的邊界。此外,應注意,感興趣區域之此使用不限於單個或「靜止」影像之擷取,因為可對於在運動視訊之擷取中擷取之訊框指定一或多個感興趣區域。
設想,至少在一些實施例中,影像之擷取及表示該影像之資料之壓縮編碼兩者皆由擷取裝置執行。然而,其他實施例係可能的,其中擷取裝置分成兩個部分或裝置,擷取影像之第一部分或裝置及使用壓縮編碼演算法之第二部分或裝置,該壓縮編碼演算法使用指示感興趣區域之邊界之資料來壓縮表示所擷取影像之資料,上述資料中兩者皆自第一裝置接收。
在一般參考本文使用之符號及術語的情況下,可 用在電腦或電腦之網路上執行之程式程序來呈現以下詳細描述之部分。熟習此項技術者使用此等程序描述及表示來將其工作之實質最有效地傳達至其他熟習此項技術者。程序在此且通常係被構思成達到所要的結果之操作之自相一致序列。此等操作為需要物理量之物理調處之操作。通常但不一定,此等量採取能夠被儲存、轉送、組合、比較且以其他方式調處之電氣信號、磁信號或光信號之形式。已經證明主要出於共同使用之原因有時將此等信號稱為位元、值、元素、符號、字符、項、數等為便利的。然而,應注意,此等及類似詞中之全部將與適當物理量相關聯,且僅為應用於該等量之便利標記。
此外,此等調處通常在諸如相加或比較之項中被引用,該等項通常與由人類操作者執行之心理操作相關聯。然而,人類操作者之此能力在形成一或多個實施例之部分之本文所述之操作中的任一操作中為不必要的,或在大多數狀況下為不合意的。實情為,此等操作為機器操作。對於執行各種實施例之操作之有用之機器包括如由根據本文教示撰寫之儲存在內之電腦程式選擇性地啟動或組配之一般用途數位電腦,且/或包括出於所需目的特別構造之設備。各種實施例亦涉及用於執行此等操作之設備或系統。此等設備可出於所需目的特別地構造或可併入一般用途電腦。各種此等機器之所需結構將自給出的描述顯而易見。
現參考圖式,其中相似元件符號始終用來代表相似元件。在以下描述中,出於解釋之目的,闡述許多特定 細節以便提供該描述之徹底理解。然而,可為明顯的是,可在無此等特定細節的情況下實踐新穎實施例。在其他情況下,以方塊圖形式展示出熟知的結構及裝置以便促進其描述。意欲涵蓋申請專利範圍之範疇內之所有修改、等效物及替代方案。
圖1繪示影像處置系統1000之運算裝置之間的交互作用之方塊圖,該影像處置系統包含用以擷取且壓縮影像之擷取裝置200、用以解壓縮且觀察影像之觀察裝置700及用以在壓縮時至少暫時儲存表示影像之資料的伺服器500。此等運算裝置200、500及700中每一者皆可為各種類型之運算裝置中任一者,包括但不限於桌上型電腦系統、資料輸入終端、膝上型電腦、上網本電腦、超級本電腦、平板電腦、手持式個人資料助理、智慧型手機、數位相機、行動裝置、併入衣服中之身體配戴式運算裝置、整合至車輛中之運算裝置、伺服器、伺服器之聚集、伺服器場等。
如所繪示,此等運算裝置200、500及700經由網路999交換連同指示一或多個感興趣區域之資料一起傳遞表示經壓縮或未經壓縮之所擷取影像之資料之信號。然而,此等運算裝置中之一或多個可交換完全與影像或感興趣區域無關之其他資料。在各種實施例中,網路999可為可能限於在單個建築或其他相對有限的區域內延伸之單個網路、可能延伸相當大的距離之連接網路之組合,且/或可包括網際網路。因此,網路999可基於藉以交換信號之各種通訊技術(或通訊技術之組合)中任一者,包括但不限於使用電 氣及/或光學傳導的電纜纜線之有線技術,及使用紅外線、射頻或其他形式之無線傳輸之無線技術。亦應注意,此資料或者可經由可移儲存器(例如,基於快閃記憶體技術之固態儲存器、光學碟片媒體等)在不同時間至每一運算裝置的直接耦接至少在運算裝置200與運算裝置700之間交換。
在各種實施例中,擷取裝置200併入處理器元件250、儲存器260、控制器220、顯示器280、光學元件110、距離感測器112、影像感測器115及用以將擷取裝置200耦接至網路999之介面390中之一或多個。儲存器260儲存控制常式240、ROI資料132、所擷取資料135及壓縮資料335中之一或多個。影像感測器115可基於用於擷取場景之影像之各種技術中任一者,包括但不限於電荷耦合裝置(CCD)半導體技術。光學元件110由一或多個透鏡、鏡、稜鏡、快門、濾波器等組成。光學元件110介於影像感測器115與場景之間,使得向影像感測器提供將要經由光學元件110擷取之場景之視圖。因此,自場景發射之光經由光學元件110傳播至影像感測器115。光學元件110之特性及影像感測器115之特性一起合作以界定擷取裝置200之視野。
在一些實施例中,光學元件110可提供可控制地改變光學元件110傳播至影像感測器115之場景之光的聚焦之能力,該改變焦點可相應地改變視野。在此類實施例中,光學元件110可併入一或多個透鏡及/或反射面,該一或多個透鏡及/或反射表面為可移動的且/或其形狀為可改變的。又,在此類實施例中,擷取裝置200可併入距離感測器 112以結合光學元件110用來賦能於聚焦之自動控制。若存在,則距離感測器112可基於用於至少判定視野中之至少一對象距擷取裝置200之距離的各種技術中任一者。在一些實施例中,可使用超聲輸出及接收之組合,其中至少此距離可藉由朝向該對象投射超聲聲波且判定該等聲波在由該對象反射之後返回所需之時間之量來判定。在其他實施例中,可代替超聲聲波以類似方式使用紅外光之射束。熟習此項技術者將想到用以判定對象距擷取裝置200之距離的其他技術。
在執行控制常式240之指令序列中,使處理器元件250等待觸發信號,該觸發信號將命令傳遞至擷取裝置200以操作至少光學元件110來自動調整焦點且/或操作至少影像感測器115來擷取影像。觸發信號可自控制器220接收,且表示藉由擷取裝置200之操作者進行的控制器220之直接操作,或觸發信號可自另一運算裝置(未展示)接收,可能經由網路999。在圖2A及圖2B中繪示此自動聚焦及影像之擷取之態樣。
轉向圖2A,在支援自動聚焦之一些實施例中,處理器元件250操作距離感測器112以經由光學元件110判定擷取裝置200與影像感測器115之視野815中之對象之間的距離。處理器元件250然後操作光學元件110來調整焦點以用於此所判定距離。在一些可能的實行方案中,距離感測器112可經操作以判定自擷取裝置200至視野815中最接近於擷取裝置200之對象之距離。在此類實行方案中,距離 感測器112可具有用來判定視野815中之該最接近對象之位置及大小之一些能力,且處理器元件250可判定感興趣區域812之邊界813,該等邊界包圍如由距離感測器112偵測之視野815內之該最接近對象之至少一部分之位置。在其他可能的實行方案中,距離感測器112可經操作以判定擷取裝置200與視野815之中心中之對象之間的距離,而不考慮擷取裝置200與視野中之任何其他對象之間的距離。此類實行方案可反映至少使用擷取裝置200擷取之大多數影像將以操作擷取裝置200之任何人感興趣之對象為中心之假定。在此類實行方案中,感興趣區域812之位置可藉由預設定義為在視野815之中心處。然而,距離感測器112可具有用來判定視野815之中心中的對象之大小及/或形狀的一些能力,藉此賦能於處理器元件250判定該對象填充視野815之程度,且最終賦能於處理器元件250判定視野815之中心中的感興趣區域812之邊界813。
因此,在此類實行方案中,距離感測器112可用作除賦能於至對象之距離之判定以用於自動聚焦之外用以判定感興趣區域812之邊界813的輔助設備。處理器元件250將視野815內之感興趣區域812之邊界813之指示儲存為ROI資料132,以用於在壓縮中之後續使用。在調整焦點且不考慮如何精確地調整焦點的情況下,控制常式240之執行使處理器元件250操作影像感測器115來擷取在視野815中之事物之影像。應注意,此所擷取影像可為單個或「靜止」影像,或其可為多個影像之一或所擷取運動視訊之多個訊框 中之一「訊框」。在如此操作影像感測器115中,處理器元件250自影像感測器115接收傳遞如由影像感測器115偵測之所擷取影像之信號,且處理器元件250將所擷取影像儲存為所擷取資料135。
然而且轉向圖2B,在替代實行方案中,距離感測器112可在判定視野815內之感興趣區域812之邊界813中不起作用。在一些可能實施例中,可使處理器元件250使用一或多個演算法來分析視野815中之對象,以試圖基於一或多個特定類型之對象可能為正操作擷取裝置200之任何人感興趣的之假定來識別該等類型之對象。因此,例如,可使處理器元件250使用臉偵測演算法來搜尋視野815中之臉。在識別視野815中之臉之後,可使處理器元件250界定感興趣區域812之邊界813以包圍該識別之臉。然後可使處理器元件250操作距離感測器112(若其存在)來判定擷取裝置200與被識別為臉之對象之間的距離,以用於在操作光學元件110中用來調整焦點。再次,使處理器元件250將感興趣區域812之邊界813之指示儲存為ROI資料132,且將視野815之最終所擷取影像儲存為所擷取資料135。
在另一替選方案中,處理器元件250可接收指示藉由擷取裝置200之操作者進行的控制器220之手動操作之信號,以手動指示感興趣區域812之邊界813。此手動提供之指示可代替該等邊界之自動判定,可為該等邊界之此自動判定之精化且/或可用以指定額外感興趣區域(未展示)之邊界。
轉向圖1以及ROI資料132及所擷取資料135之以下儲存,處理器元件250使用各種壓縮編碼演算法中任一者來壓縮所擷取資料135以產生壓縮資料335。在所擷取影像為單個影像或「靜止」影像的情況下,處理器元件250可使用與用於靜止影像壓縮之工業接受標準相關聯之壓縮編碼演算法,該工業接受標準諸如但不限於由ISO/IEC(國際標準化組織及國際電子技術委員會)公佈之JPEG(聯合照相專家群)。在所擷取影像為組成運動視訊之一部分(例如,動態視訊之訊框)之多個影像之一的情況下,處理器元件250可使用與用於運動視訊壓縮之工業接受標準相關聯之壓縮編碼演算法,該工業接受標準諸如但不限於由ISO/IEC(國際標準化組織及國際電子技術委員會)公佈之MPEG(動畫專家群)之各種化身之H.263或H.264,或由SMPTE(動畫與電視工程師協會)公佈之VC-1。
在如此壓縮所擷取資料135中,處理器元件250使用由所擷取資料135表示之影像之視野815內之感興趣區域812之邊界813的指示來變化壓縮。在如此進行時,使處理器元件250將表示在感興趣區域812內之所擷取影像之部分的所擷取資料135之部分相較於表示未在感興趣區域812內之視野815之所擷取影像之一部分的所擷取資料135之一部分壓縮較小的程度。更確切地,在感興趣區域812內之所擷取影像之部分的壓縮之一或多個參數不同於在感興趣區域812外部之所擷取影像之一部分的壓縮之一或多個對應參數。此參數差異可包括色彩深度差異、色彩編碼差異、 品質設定差異、有效地選擇無損壓縮或有損壓縮之參數差異、壓縮比參數差異等中之一或多個。
因此,在感興趣區域812內之所擷取影像之像素在自所擷取資料135之壓縮產生的壓縮資料335中係以相較於在感興趣區域812外部之所擷取影像之一部分之像素的每一像素較高的平均位元來表示。換言之,相較於在感興趣區域812內之像素之平均丟失,每一像素平均丟失了與在感興趣區域812外部之所擷取影像之一部分的像素相關聯之更多資訊。因此,在稍後時間當作為觀察所擷取影像之部分解壓壓縮資料335時,在感興趣區域812內之所擷取影像之部分能夠以較高影像品質顯示(例如,更詳細地顯示且/或以更多色彩深度來顯示等)。
應注意,與工業標準相關聯之壓縮編碼演算法之選擇可導致壓縮資料335之特性之各種要求之強加。具體而言,此工業標準可能包括關於組織以壓縮形式表示影像之資料之部分之方式的說明(例如,指定資料始於滿足工業標準之各種要求之特定標頭等)、組織與影像之每一像素相關聯之資料的次序、對可利用的色彩深度及/或色彩編碼之選擇之限制等。例如且如圖3A中繪示,一些壓縮編碼演算法需要影像在稱為「巨集區塊」之像素之二維區塊885中之處置,該等巨集區塊之大小通常為8x8、8x16或16x16個像素(16x16更常見)。此外,該等壓縮編碼演算法中之一些進一步需要以藉由巨集區塊組織像素資料之方式來組織所得壓縮資料。更進一步,該等壓縮編碼演算法中之一些需要每 一巨集區塊內之所有像素與共用色彩深度、共用色彩編碼及/或其他共用壓縮相關之參數相關聯,使得不可能使用不同於該相同巨集區塊之其他像素的參數來壓縮巨集區塊之像素中的一些。
因此,在感興趣區域812之邊界813不與巨集區塊885中之鄰接巨集區塊之邊界883對準的情況下,感興趣區域812之邊界813可藉由處理器元件250改變,以與邊界883對準。結果為感興趣區域812之邊界813之變化以使該等邊界與邊界883對準。在一些實行方案中,處理器元件250使感興趣區域812之邊界813中之任何未對準邊界朝向巨集區塊885中之鄰接巨集區塊之邊界883中之最接近邊界移位,而不考慮如此做是否增加或減少感興趣區域812之二維面積。在其他實行方案中,處理器元件250使感興趣區域812之邊界813中之任何未對準邊界向外移位至在感興趣區域812之原始邊界813外部的巨集區塊885中之鄰接巨集區塊之最接近邊界883,使得感興趣區域812之二維面積只能增加。可進行此操作以確保最初界定感興趣區域812之邊界813所圍繞之感興趣對象隨後並未由於感興趣區域之二維面積縮小而自感興趣區域812移除(全部或部分)。
如另一替選方案,且假定壓縮編碼演算法之選擇在將邊界813界定為其中使用此類巨集區塊之邊界時為已知的,可最初將感興趣區域812之邊界813界定成與該等巨集區塊中之鄰接巨集區塊之邊界883之一對準,以避免在稍後時間必須移位邊界813。不考慮如何使邊界813與巨集區 塊885中之鄰接巨集區塊之邊界883之一對準,該等邊界如此對準之事實賦能於在壓縮所擷取影像中使用之不同的壓縮參數能夠在每一巨集區塊基礎上於壓縮資料335中被指定,該每一巨集區塊基礎遵循由於已進行之壓縮編碼演算法之選擇而對於壓縮資料335指定之要求。
轉向圖3B,亦應注意,與工業標準相關聯之壓縮編碼演算法之選擇可進一步包括用於將像素資料組織於所擷取影像之多個「遍(pass)」中之選項的說明。此有時被稱為「漸進」編碼,其中像素資料經組織以始於覆蓋影像之全部的第一相對低的解析度「遍」,繼之以後續遍中之每一額外遍逐步更詳細地增添第一遍的一或多個後續遍。漸進遍之此選項意味著允許影像在該影像仍然正由觀察裝置接收時開始在該觀察裝置處更快速地被觀察。換言之,正當表示影像之資料中的更多正被接收時,第一遍之影像之相對低的解析度表示能夠被視覺上呈現,以用於在其接收之後立即觀察,且當接收每一後續遍時,逐步增強影像之視覺呈現。在資料之資料大小相對大的情況下且/或在該資料至觀察裝置之轉輸速率相對緩慢的情況下,此舉可視為合意的,以避免在可觀察影像之前使觀察裝置之操作者等待表示影像之該資料至觀察裝置之轉輸完全完成。
可藉由控制常式240使處理器元件250藉由首先產生在視野815內之整個所擷取影像之像素資料的一或多個初始遍(例如,如圖3B中繪示之遍835a及遍835b),繼之以僅由與感興趣區域812內之像素相關聯之像素資料(例 如,分別如圖3B中繪示之遍835c及遍835d之像素資料832a及像素資料832b)組成的一或多個額外遍,來利用將壓縮資料335內之像素資料組織於多個遍中之選項。因此,組成額外遍835c及遍835d中每一者之像素資料之資料大小實質上小於組成初始遍835a及遍835b中每一者之像素資料之資料大小。用於在額外遍835c及遍835d中每一者中之感興趣區域812外部的像素之「空」或「透明」像素資料值之指示符可用來以最低程度地增添該等遍中每一者之資料大小的方式有效地「填充」該等遍中之該等像素。
轉向圖1,及以使用ROI資料132中之感興趣區域812之邊界813之指示的方式產生壓縮資料335之所擷取資料135之以下壓縮,處理器元件250可將壓縮資料335提供至用於儲存器之伺服器500及觀察裝置700中之一者或兩者,以賦能於所擷取影像之觀察。處理器元件250可操作介面390以經由網路999將壓縮資料335傳輸至伺服器500及觀察裝置700中之一者或兩者。另一選擇為或另外,處理器元件250可將壓縮資料335儲存在可移儲存媒體(未展示)上,該可移儲存器媒體隨後經攜帶至伺服器500或觀察裝置700中之一者或兩者,其中該伺服器或該觀察裝置中之一者或兩者自該可移儲存器媒體檢索壓縮資料335。
在各種實施例中,觀察裝置700併入處理器元件750、儲存器760、控制器720、顯示器780及將觀察裝置700耦接至網路999之介面790中之一或多個。儲存器760儲存控制常式740且直接或經由伺服器500複製自擷取裝置200接 收之壓縮資料335。在執行控制常式740之指令序列中,使處理器元件750接收且解壓壓縮資料335之複製。然後使處理器元件750將所擷取影像視覺上呈現在顯示器780上。處理器元件750可進一步接收藉由觀察裝置700之操作者進行的控制器720之操作之指示,以將命令傳遞至觀察裝置700以改變視覺上呈現所擷取影像之方式(例如,用以四處搖攝、放大及/或縮小所擷取影像等之命令)。
在各種實施例中,處理器元件250及750中每一者可包括多種可商購獲得之處理器中任一者,包括但不限於AMD® Athlon®、Duron®或Opteron®處理器;ARM®應用、嵌入式或保全處理器;IBM®及/或Motorola® DragonBall®或PowerPC®處理器;IBM及/或Sony® Cell處理器;或Intel® Celeron®、Core(2)Duo®、Core(2)Quad®、Core i3®、Core i5®、Core i7®、Atom®、Itanium®、Pentium®、Xeon®或XScale®處理器。進一步地,此等處理器元件中之一或多個可包括多核心處理器(多個核心共存於相同晶粒或分離的晶粒上),及/或藉以以一些方式連結多個實體分離的處理器之一些其他變形之多處理器架構。
在各種實施例中,儲存器260及760中每一者可基於多種資訊儲存技術中任一者,可能包括需要電功率之不間斷提供之依電性技術,且可能包括需要可為可移除或可為不可移除之機器可讀儲存媒體之使用之技術。因此,此等儲存器中每一者可包括多種類型(或類型之組合)之儲存裝置中任一者,包括但不限於唯讀記憶體(ROM)、隨機存 取記憶體(RAM)、動態RAM(DRAM)、雙倍資料速率DRAM(DDR-DRAM)、同步DRAM(SDRAM)、靜態RAM(SRAM)、可規劃ROM(PROM)、可抹除可規劃ROM(EPROM)、電氣可抹除可規劃ROM(EEPROM)、快閃記憶體、聚合物記憶體(例如,鐵電聚合物記憶體)、雙向記憶體、相變或鐵電記憶體、矽-氧化矽-氮化矽-氧化矽-矽(SONOS)記憶體、磁卡或光卡、一或多個單獨鐵磁碟片驅動器,組織成一或多個陣列之複數個儲存裝置(例如,組織成獨立的碟片陣列之冗餘陣列或RAID陣列之多個鐵磁碟片驅動器)。應注意,雖然此等儲存器中每一者係繪示為單個區塊,但是此等儲存器中之一或多個可包括可基於不同儲存技術之多個儲存裝置。因此,例如,此等繪示之儲存器中每一者中之一或多個可表示程式及/或資料可藉以在一些形式之機器可讀儲存媒體上儲存且傳遞之光驅動器或快閃記憶卡閱讀器、用以相對長期地局部儲存程式及/或資料之鐵磁碟片驅動器,及賦能於相對快速存取程式及/或資料之一或多個依電性固態記憶體裝置(例如,SRAM或DRAM)之組合。亦應注意,此等儲存器中每一者可由多個儲存部件組成,該等多個儲存部件基於相同儲存技術,但是可能由於用途之專門化(例如,一些DRAM裝置用作主儲存器,而其他DRAM裝置用作圖形控制器之相異訊框緩沖器)而被分離地維持。
在各種實施例中,介面390及790中每一者使用賦能於運算裝置200及700中每一者如已描述經由網路999耦 接的多種發信號技術中任一者。此等介面中每一者包括提供必要功能性中之至少一些之電路系統以賦能於此耦接。然而,此等介面中每一者亦可至少部分使用由處理器元件250及750中之對應的處理器元件執行之指令序列來實行(例如,以實行協定堆疊或其他特徵)。在網路999之一或多個部分使用電氣及/或光學傳導的電纜纜線的情況下,介面390及790中之對應的介面可使用符合各種工業標準中任一者之發信號及/或協定,該等工業標準包括但不限於RS-232C、RS-422、USB、乙太網路(IEEE-802.3)或IEEE-1394。另一選擇為或另外,在網路999之一或多個部分需要無線信號傳輸之使用的情況下,介面190及390中之對應的介面可使用符合各種工業標準中任一者之發信號及/或協定,該等工業標準包括但不限於IEEE 802.11a、802.11b、802.11g、802.16、802.20(通常被稱為「行動寬頻無線接取」);Bluetooth;ZigBee;或蜂巢式無線電話服務,諸如GSM與通用封包無線服務(GSM/GPRS)、CDMA/1xRTT、全域進化增強資料速率(EDGE)、純進化資料/進化資料最佳化(EV-DO)、資料及語音進化(EV-DV)、高速下行封包接取(HSDPA)、高速上行封包接取(HSUPA)、4G LTE等。應注意,雖然介面190及390中每一者係繪示為單個區塊,但是此等介面中之一或多個可包括可基於不同發信號技術之多個介面。此可為尤其在此等介面中之一或多個將運算裝置100及300中之對應的運算裝置耦接至各自使用不同的通訊技術之多於一個網路的情況下之狀況。
圖4例示出更詳細地繪示圖1之方塊圖中之一部分的方塊圖。更具體而言,繪示運算裝置200之操作環境的態樣,其中控制常式240之執行使處理器元件250執行前述功能。如熟習此項技術者將認識到,控制常式240包括組成該控制常式之部件經選擇為在任何類型之處理器或選擇來實行處理器元件250中每一者之處理器上為操作性的。
在各種實施例中,控制常式240可包括作業系統、裝置驅動器及/或應用層常式(例如,提供於碟片媒體上之所謂的「軟體套」、自遠端伺服器獲得之「小型應用程式」等)之組合。在包括作業系統的情況下,作業系統可為各種可利用的作業系統中任一者,包括但不限於WindowsTM、OS XTM、Linux®或Android OSTM。在包括一或多個裝置驅動器的情況下,該等裝置驅動器可為運算裝置200之各種其他部件(硬體部件或硬體部件)中任一者提供支援。
控制常式240包括通訊部件349,該通訊部件可由處理器元件250執行,以操作介面390來如已描述經由網路999傳輸且接收信號。如熟習此項技術者將認識到,此通訊部件經選擇為使用選擇來實行此介面之任何類型之介面技術可操作的。
控制常式240可包括對象識別部件143,該對象識別部件可由處理器元件250執行,以在擷取視野815中之事物之影像之前分析存在於視野815中之對象,以試圖識別其中之至少一個類型之對象。如先前所論述,一種類型之對象之一可能的實例為臉,然而應再次注意,代替臉或除臉 之外可分析視野815以試圖識別其他類型之對象。因此,對象識別部件143可分析視野815以試圖識別其中之臉之位置,以及視野815內之該識別之臉之大小。對象識別部件143然後可使用該識別之臉之位置之大小來判定感興趣區域812之邊界813,從而將該等邊界之指示儲存為ROI資料132。
控制常式240可包括聚焦部件142,該聚焦部件可由處理器元件250執行,以操作至少光學元件110來調整隨後藉以經由影像感測器115之操作擷取影像之聚焦。在距離感測器112存在的情況下,聚焦部件操作距離感測器112以判定擷取裝置200與視野815中之對象之間的距離。如先前所論述,對象可簡單地為處於視野之中心中的任何對象,且距離感測器112可另外經操作以判定視野內之該對象之大小。在此類實行方案中,聚焦部件142另外判定感興趣區域812之邊界813,從而將該等邊界之指示儲存為ROI資料132。另一選擇為,如先前所論述,對象可為藉由另一機構識別之對象,感興趣區域812之邊界813亦已藉由該另一機構判定,該另一機構諸如以上剛剛論述之對象識別部件143。在此類實行方案中,聚焦部件142接收感興趣區域812之邊界813作為輸入,且操作距離感測器112以判定自擷取裝置200至感興趣區域812內之對象之距離。不考慮如何精確地選擇判定距離之對象,聚焦部件142然後使用所判定距離來操作光學元件110以相應地調整焦點。
控制常式240可包括使用者介面部件148,該使用者介面部件可由處理器元件250執行,以監視控制器220且 操作顯示器280以賦能於擷取裝置200之操作者直接提供感興趣區域812之邊界813。使用者介面部件148可操作顯示器280以視覺上呈現早先可已藉由另一機構自動地判定之感興趣區域812之邊界813之定位,該另一機構諸如以上剛剛論述之對象識別部件143或聚焦部件142中任一者。使用者介面部件148接收指示藉由擷取裝置200之操作者進行的控制器220之操作之信號以指示感興趣區域812之邊界813(是否為邊界813之早先自動得出之位置之修正),且將該等邊界之指示儲存為ROI資料132。另外應注意,在聚焦並非自動調整之實施例中,除賦能於感興趣區域812之邊界813之直接提供之外或代替賦能於該直接提供,使用者介面部件148可賦能於擷取裝置200之操作者經由控制器220之操作直接調整焦點。
控制常式240包括擷取部件145,該擷取部件可由處理器元件250執行,以擷取至少在聚焦之調整之後在視野815中影像感測器115可見的事物之影像,且該控制常式將表示所擷取影像之資料儲存為所擷取資料135。如已論述,影像之擷取可響應於至少觸發自動聚焦之相同觸發信號。然而,在其他可能的實施例中,此自動聚焦可由一個信號觸發,而影像之實際擷取可由一額外後續信號觸發。
控制常式240包括壓縮部件345,該壓縮部件可由處理器元件250執行,以壓縮表示所擷取影像之所擷取資料135,且藉此產生具有小於所擷取資料135之資料大小的資料大小之壓縮資料335。在如此進行時,壓縮部件345使用 由感興趣區域812之邊界813之ROI資料132提供之指示,來使用相較於表示感興趣區域812外部之像素之所擷取資料135之部分的一或多個不同參數來壓縮表示感興趣區域812內之像素之所擷取資料135之部分。如先前已詳細論述,該等參數經選擇來使感興趣區域812外部的所擷取影像之一部分相較於感興趣區域812內之所擷取影像之部分壓縮更大的程度且導致每一像素之像素資料之更大丟失,使得感興趣區域812內之部分隨後能夠被觀察到其保留細節中之更多細節。更具體而言,且先前已,感興趣區域812內之部分相對於感興趣區域812外部之部分的此參數差異可包括色彩深度差異、色彩編碼差異、品質設定差異、有效地選擇無損壓縮或有損壓縮之參數差異、壓縮比參數差異等中之一或多個。
圖5例示出圖1之擷取裝置200之變化的方塊圖。為繪圖及論述之清晰起見,在圖5中已省略網路999、伺服器500及觀察裝置700之繪圖(其在圖1中繪示出)。圖5中繪示之此變化在在許多方面類似於圖1中繪示之事物,且因此相似元件符號始終用來代表相似元件。
然而,不同於圖1之擷取裝置200之變體,圖5之擷取裝置200之變體繪示擷取裝置200之部件在兩個相異部分100及300中之一個可能的分佈。在此分佈中,處理器元件250及儲存在圖1中繪示之事物之控制常式240的儲存器260分別分為分離的處理器元件250a及250b,以及儲存控制常式240a及240b之分離的儲存器260a及260b,且該等處理 器元件及該等儲存器分佈在部分100及300之中。在圖5之此變體中,處理器元件250a在執行控制常式240a中可操作光學元件110及/或距離感測器112來判定且/或調整自擷取裝置200至視野815中之對象之距離。又,在此變體中,處理器元件250b在執行控制常式240b中可壓縮所擷取資料135以產生壓縮資料335,從而使用感興趣區域812之邊界813之指示來變化壓縮表示所擷取影像之不同部分的所擷取資料135之不同部分之方式,如已論述。
圖6例示出邏輯流程2100之實施例。邏輯流程2100可表示由本文所述之一或多個實施例執行之操作中之一些或全部。更具體而言,邏輯流程2100可例示出由擷取裝置200之處理器元件250在至少執行控制常式240中執行之操作。
在2110處,擷取裝置(例如,擷取裝置200)接收觸發信號。如已論述,此觸發信號可為用以進行自動調整焦點為擷取影像作準備,或實際上擷取影像中任一者或兩者之觸發信號。
在2120處,擷取裝置判定提供至該擷取裝置之影像感測器的視野內之感興趣區域之邊界。如已論述,可作為距離感測器之操作之副產物來判定此等邊界,該距離感測器判定視野中最接近於擷取裝置或處於視野之中心中的對象之距離、大小及/或位置。另一選擇為,可作為執行用於識別視野中之特定類型之對象之各種可能的演算法中任一者之結果來判定此等邊界,該特定類型之對象包括但不 限於臉。在另一替選方案中,可在由擷取裝置接收之信號中向擷取裝置指示此等邊界,該等信號可能包括指示藉由擷取裝置之操作者進行來指定此等邊界的擷取裝置之控制器之操作之信號。如已另外論述,感興趣區域之邊界可經選擇成與組成影像之像素之鄰接巨集區塊之邊界對準,其中使用將像素組織成巨集區塊之壓縮編碼演算法。
在2130處,擷取裝置操作其影像感測器以擷取提供至影像感測器的視野內可見之事物之影像。如已論述,視野之態樣係由影像感測器及可介於影像感測器與視野中之場景之間的任何光學元件兩者之特性判定。如亦已論述,所擷取影像可為單個靜止影像或充當組成所擷取運動視訊之一部分之多個訊框中的一個訊框之影像。
在2140處,擷取裝置使用感興趣區域之邊界之指示壓縮表示所擷取影像(例如,所擷取資料135)之資料,使得表示感興趣區域內之影像之部分的該資料之部分相較於表示感興趣區域外部之影像之一部分的該資料之部分壓縮較小的程度。事實上,相較於與感興趣區域外部之影像之一部分相關聯的像素,與感興趣區域內之影像之部分之像素相關聯的每一像素之資料丟失得較少。以此方式,在感興趣區域中保留了比感興趣區域外部更大的每一像素詳細程度。
圖7例示出邏輯流程2200之一實施例。邏輯流程2200可表示由本文所述之一或多個實施例執行之操作中之一些或全部。更具體而言,邏輯流程2200可例示出由擷取 裝置200之處理器元件250在至少執行控制常式240中執行之操作。
在2210處,擷取裝置(例如,擷取裝置200)操作其距離感測器以判定至對象之距離及在該擷取裝置之影像感測器之視野內的對象之位置。如已論述,此可為由於為最接近於擷取裝置而選擇之對象,或另一選擇為,可為由於處於視野之中心中而選擇之對象。如亦已論述,距離感測器可基於多種技術中任一者,包括但不限於聲波、光束等。
在2220處,擷取裝置使用自擷取裝置至對象的所判定距離來操作其光學元件以調整焦點為擷取影像作準備。如已論述,光學元件可包括一或多個透鏡及/或反射面,該一或多個透鏡及/或反射面能夠由馬達及/或其他機構移動,且/或為自身形狀可改變的,以改變焦點。
在2230處,擷取裝置至少使用視野內之對象之位置來判定提供至其影像感測器的視野內之感興趣區域之邊界。然而,如亦已論述,在判定此等邊界中亦可使用對象之大小及/或形狀。
在2240處,擷取裝置操作其影像感測器以擷取提供至影像感測器的視野內之可見事物之影像。且,在2250處,擷取裝置使用感興趣區域之邊界之指示壓縮表示所擷取影像(例如,所擷取資料135)之資料,使得表示感興趣區域內之影像之部分的該資料之部分相較於表示感興趣區域外部之影像之一部分的該資料之部分壓縮較小的程度。
圖8例示出邏輯流程2300之一實施例。邏輯流程2300可表示由本文所述之一或多個實施例執行之操作中之一些或全部。更具體而言,邏輯流程2300可例示出由擷取裝置200之處理器元件250在至少執行控制常式240中執行之操作。
在2310處,擷取裝置(例如,擷取裝置200)使用各種可能的演算法中之一或多個來分析在其感測器之視野中可見之對象,以試圖識別一或多個特定類型之對象,包括但不限於臉。如先前論述,此類演算法之使用係基於一或多個特定類型之對象將為擷取裝置之操作者感興趣的主題之假定。
在2320處,擷取裝置操作其距離感測器以判定至所識別對象之距離,且使用自擷取裝置至該對象之所判定距離來操作其光學元件以調整焦點為擷取影像作準備。如已論述,距離感測器可基於用以偵測至物體之距離的各種技術中任一者,且光學元件可使用各種機構中任一者來移動或改變一或多個透鏡或反射面之形狀。
在2330處,擷取裝置至少使用視野內之所識別對象之位置來判定提供至其影像感測器的視野內之感興趣區域之邊界。然而,如亦已論述,在判定此等邊界中亦可使用該對象之大小及/或形狀。
在2340處,擷取裝置操作其影像感測器以擷取提供至影像感測器的視野內之可見事物之影像。且,在2350處,擷取裝置使用感興趣區域之邊界之指示壓縮表示所擷 取影像(例如,所擷取資料135)之資料,使得表示感興趣區域內之影像之部分的該資料之部分相較於表示感興趣區域外部之影像之一部分的該資料之部分壓縮較小的程度。
圖9例示出適合於實行如先前所述之各種實施例之示例性處理架構3000之實施例。更具體而言,處理架構3000(或其變體)可實行為運算裝置200及700中之一或多個之部分。應注意,處理架構3000之部件給予了最後兩個數字對應於早先繪示且描述為運算裝置200及700中每一者之部分的部件之元件符號之最後兩個數字的元件符號。進行此舉作為使可在各種實施例中使用此示例性處理架構之運算裝置200及700中之任何一個之此類部件相互關聯之輔助手段。
處理架構3000包括數位處理中通常使用之各種元件,包括但不限於一或多個處理器、多核心處理器、共處理器、記憶體單元、晶片組、控制器、周邊設備、介面、振盪器、定時裝置、視訊卡、音訊卡、多媒體輸入/輸出(I/O)部件、電源等。如本申請案中所使用,「系統」及「部件」等詞意欲代表執行數位處理所在之運算裝置之實體,該實體為硬體、硬體及軟體之組合、軟體或執行中之軟體,該實體之實例由此繪示之示例性處理架構提供。例如,部件可為但不限於為在處理器元件上執行之處理、處理器元件自身、可使用光學及/或磁性儲存媒體之儲存裝置(例如,硬碟片驅動器、陣列中之多個儲存器驅動器等)、軟體對象、可執行指令序列、執行之線程、程式、及/或整個運算裝置 (例如,整個電腦)。藉由說明之方式,在伺服器上執行之應用程式及可能兩者皆可為部件。一或多個部件可常駐於處理及/或執行之線程內,且部件可局限於一個運算裝置上且/或分散在兩個或兩個以上運算裝置之間。進一步地,部件可藉由各種類型之通訊媒體彼此以通訊方式耦接來協調操作。協調可涉及單向資訊交換或雙向資訊交換。例如,部件可以經由通訊媒體傳達之信號之形式傳達資訊。資訊可實行為分配給一或多個信號線之信號。每一訊息可為一信號或連續或大體上並行傳輸之複數個信號。
如所繪示,在實行處理架構3000中,運算裝置併入至少一處理器元件950、儲存器960、至其他裝置之介面990及聯結器955。取決於實行處理架構3000之運算裝置之各種態樣,包括該運算裝置之預定使用及/或使用條件,此運算裝置可進一步併入額外部件,諸如但不限於光學元件910、距離感測器912及/或影像感測器915。
聯結器955併入一或多個匯流排、點對點互連體、收發器、緩衝器、接點式交換器及/或其他導體及/或將至少該處理器元件950以通訊方式耦接至儲存器960之邏輯元件。聯結器955可進一步將處理器元件950耦接至介面990及顯示介面985中之一或多個(取決於此等及/或其他部件中之哪些亦存在)。在處理器元件950如此藉由聯結器955耦接的情況下,處理器元件950能夠執行用於實行處理架構3000之運算裝置200及700中之任何一個的以上詳細描述之任務中之各種任務。聯結器955可使用藉以光學地且/或電氣地 傳遞信號之各種技術或技術之組合中任一者來實行。進一步地,聯結器955中之至少部分可使用符合多種工業標準中任一者之定時及/或協定,該等工業標準包括但不限於加速圖形埠(AGP)、卡片匯流排、延伸工業標準架構(E-ISA)、微通道架構(MCA)、網路用戶匯流排(NuBus)、周邊組件互連(延伸)(PCI-X)、快速週邊組件互連(PCI-E)、個人電腦記憶卡國際協會(PCMCIA)匯流排、HyperTransportTM、快速路徑等。
如先前論述,處理器元件950(對應於處理器元件250、250a、250b及750中之一或多個)可包括多種可商購獲得之處理器中任一者,該等處理器使用多種技術中任一者且使用實體上以許多方式中任一者組合之一或多個核心予以實行。
如先前所論述,儲存器960(對應於儲存器260、260a、260b及760中之一或多個)可包括基於多種技術或技術之組合中任一者之一或多個相異儲存裝置。更具體而言,如所繪示,儲存器960可包括依電性儲存器961(例如,基於一或多個形式之RAM技術之固態儲存器)、非依電性儲存器962(例如,不需要電功率之恆定提供來保留其內容之固態、鐵磁或其他儲存器)及可移媒體儲存器963(例如,可藉以在運算裝置之間傳遞資訊之可移碟片或固態記憶卡儲存器)中之一或多個。將儲存器960繪示為可能包含多個相異類型之儲存器之此繪圖係承認多於一個類型之儲存裝置在運算裝置中之常見使用,其中一個類型提供賦能於藉由 處理器元件950進行的資料之更快速調處之相對快速的讀取及寫入能力(但可能使用不斷地需要電功率之「依電性」技術),而另一類型提供相對高的密度之非依電性儲存器(但可能提供相對緩慢的讀取及寫入能力)。
考慮到不同儲存裝置之通常不同的特性使用不同的技術,此類不同儲存裝置經由不同儲存器控制器耦接至運算裝置之其他部分亦為常見的,該等不同儲存器控制器經由不同介面耦接至其不同儲存裝置。藉由一實例之方式,在依電性儲存器961存在且係基於RAM技術的情況下,依電性儲存器961可經由儲存器控制器965a以通訊方式耦接至聯結器955,該儲存器控制器提供可能使用列尋址或行位址的通向依電性儲存器961之適當介面,且其中儲存器控制器965a可執行列再新及/或其他維護任務,以幫助保留儲存在依電性儲存器961內之資訊。藉由另一實例之方式,其中非依電性儲存器962存在且包括一或多個鐵磁碟片驅動器及/或固態碟片驅動器,非依電性儲存器962可經由儲存器控制器965b耦接至聯結器955,該儲存器控制器提供可能使用資訊之區塊及/或磁柱及扇區之尋址的通向非依電性儲存器962之適當介面。藉由另一實例之方式,其中可移媒體儲存器963存在且包括使用可移機器可讀儲存媒體969之一或多個片段之一或多個光學碟片驅動器及/或固態碟片驅動器,可移媒體儲存器963可經由儲存器控制器965c以通訊方式耦接至聯結器955,該儲存器控制器提供可能使用資訊之區段之尋址的通向可移媒體儲存器963之適當介面,且 其中儲存器控制器965c可以特定於延伸機器可讀儲存媒體969之壽命的方式協調讀取操作、抹除操作及寫入操作。
依電性儲存器961或非依電性儲存器962中之一個或另一個可包括以可儲存包含可由處理器元件950執行之指令序列之常式的機器可讀儲存媒體之形式之製品,取決於各自所基於之技術。藉由實例之方式,其中非依電性儲存器962包括基於鐵磁的碟片驅動器(例如,所謂的「硬驅動器」),每一此碟片驅動器通常使用一或多個旋轉磁盤,在該一或多個旋轉磁盤上磁性響應性粒子之塗層經沈積且以各種圖案磁性地定向來以類似於諸如軟式磁片之可移儲存媒體之方式儲存資訊,諸如指令序列。藉由另一實例之方式,非依電性儲存器962可由固態儲存裝置組組成來以類似於緊密快閃記憶卡之方式儲存資訊,諸如指令序列。再次,不同時間在運算裝置中使用不同類型之儲存裝置來儲存可執行常式及/或資料為常見的。因此,包含將藉由處理器元件950執行之指令序列的常式最初可儲存在機器可讀儲存媒體969上,且隨後可在將該常式複製到非依電性儲存器962以用於較長期儲存中使用可移媒體儲存器963而無需機器可讀儲存媒體969及/或依電性儲存器961之繼續存在,以在執行該常式時賦能於藉由處理器元件950進行的更快速存取。
如先前論述,介面990(對應於介面390及790中之一或多個)可使用各種發信號技術中任一者,該等發信號技術對應於可使用來將運算裝置以通訊方式耦接至一或多個 其他裝置的各種通訊技術中任一者。再次,各種形式之有線發信號或無線發信號中之一者或兩者可使用來賦能於處理器元件950與輸入/輸出裝置(例如,繪示之示例性鍵盤920或印表機925)及/或其他運算裝置交互,可能經由網路(例如,網路999)或網路之互連集合。承認多個類型之發信號及/或協定之通常極其不同的特性通常必須由任何一個運算裝置支援,而將介面990繪示為包含多個不同介面控制器995a、995b及995c。介面控制器995a可使用各種類型之有線數位串列介面或射頻無線介面中任一者來自諸如繪示之鍵盤920之使用者輸入裝置接收連續傳輸之訊息。介面控制器995b可使用各種基於電纜纜線發信號或無線發信號的定時及/或協定中任一者來經由繪示之網路999(可能包含一或多個鏈路之網路、較小網路或可能網際網路)存取其他運算裝置。介面995c可使用賦能於串行信號傳輸或並行信號傳輸之使用的各種電氣傳導的電纜纜線中任一者來將資料傳遞至繪示之印表機925。可經由介面990之一或多個介面控制器以通訊方式耦接的裝置之其他實例包括但不限於麥克風、遠端控制器、觸控筆、讀卡器、指紋閱讀器、虛擬實景互動手套、圖形輸入板、操縱桿、其他鍵盤、視網膜掃描器、觸控螢幕之觸摸輸入部件、軌跡球、各種感測器、雷射印表機、噴墨印表機、機械機器人、銑床等。
在運算裝置以通訊方式耦接至(或可能、實際上併入)顯示器(例如,繪示之示例性顯示器980)的情況下,實行處理架構3000之運算裝置亦可併入顯示介面985。雖然更 多一般化類型之介面可使用於以通訊方式耦接至顯示器中,但是在將各種形式之內容視覺上顯示於顯示器上中通常所需之稍微專門化的額外處理,以及所使用之基於電纜纜線之介面之稍微專門化的本性通常使得相異顯示介面之提供為合意的。可由顯示介面985使用於顯示器980之通訊耦接中的有線發信號技術及/或無線發信號技術可使用符合各種工業標準中任一者之發信號及/或協定,包括但不限於各種類比視訊介面、數位視訊介面(DVI)、顯示器埠等中任一者。
更一般而言,運算裝置200及700之各種元件可包括各種硬體元件、軟體元件或兩者之組合。硬體元件之實例可包括裝置、邏輯裝置、部件、處理器、微處理器、電路、處理器元件、電路元件(例如,電晶體、電阻器、電容器、感應器等)、積體電路、特定應用集體電路(ASIC)、可規劃邏輯裝置(PLD)、數位信號處理器(DSP)、場可規劃閘陣列(FPGA)、記憶體單元、邏輯閘、暫存器、半導體裝置、晶片、微晶片、晶片組等。軟體元件之實例可包括軟體部件、程式、應用、電腦程式、應用程式、系統程式、軟體開發程式、機器程式、作業系統軟體、中間軟體、韌體、軟體模組、常式、次常式、函數、方法、程序、軟體介面、應用程式介面(API)、指令集、運算碼、電腦碼、碼段、電腦碼段、字、值、符號或其任何組合。然而,判定實施例是否為使用硬體元件及/或軟體元件予以實行可根據如給定實行方案所要的任何數目之因素變化,該等因素諸如所 要的運算速率、功率級、耐熱性、處理週期預算、輸入資料速率、輸出資料速率、記憶體資源、資料匯流排速度及其他設計或效能約束。
一些實施例可使用表達「一個實施例」或「一實施例」連同其衍生表達一起來描述。此等詞意味結合實施例所述之特定特徵、結構或特性包括於至少一實施例中。用語「在一個實施例中」在說明書中之各地方之出現不一定全部參考相同實施例。此外,一些實施例可使用表達「耦接」及「連接」連同其衍生表達一起來描述。此等詞不一定意欲作為彼此之同義詞。例如,一些實施例可使用「連接」及/或「耦接」等詞來描述以指示兩個或兩個以上元件彼此直接實體接觸或電氣接觸。然而,「耦接」一詞亦可意味兩個或兩個以上元件並未彼此直接接觸,但仍彼此合作或相互作用。
吾人強調,揭露內容之摘要係提供來允許讀者快速查明技術揭露之本性。在理解摘要將不用以解釋或限制申請專利範圍之範疇或意義的情況下提交摘要。另外,在前述詳細描述中,可看出在單個實施例中將各種特徵集中在一起以用於使揭露內容合理化之目的。然而,揭示內容之此方法將並非解釋為反映所主張實施例需要比在每一請求項中明確敘述之特徵更多的特徵之意圖。實情為,如以下申請專利範圍所反映,發明性發明標的可在於少於單個揭露實施例之全部特徵中。因此,由此將以下申請專利範圍併入詳細描述中,其中每一請求項堅持其自己作為分開 的實施例。在隨附申請專利範圍中,「包括」及「在......中」等詞分別用作個別「包含」及「其中」等詞之通俗英文等效物。此外,「第一」、「第二」、「第三」等等詞僅用作標記,且並非意欲將數值要求強加於其對象。
以上已描述之內容包括揭露之架構之實例。當然,不可能描述部件及/或方法論之每一想像得到的組合,但是此項技術之一般技術者可認知到許多進一步組合及置換係可能的。因此,新穎架構意欲包括屬於隨附申請專利範圍之精神及範疇內之所有此類改變、修改及變化。詳細揭露內容現轉向提供關於進一步實施例之實例。以下提供之實例不欲為限制。
用以壓縮影像之設備之實例包括:影像感測器,其用以擷取影像作為所擷取資料;以及邏輯元件,其用以:判定影像內之感興趣區域之第一邊界;使用第一參數來壓縮表示感興趣區域內之影像之第一部分的所擷取資料之第一部分;且使用第二參數來壓縮表示感興趣區域外部之影像之第二部分的所擷取資料之第二部分,該第一參數及該第二參數經選擇以使所擷取資料之第二部分比所擷取資料之第一部分壓縮更大的程度。
設備之以上實例,其中邏輯元件用以分析影像感測器之視野以識別對象,且判定第一邊界以將對象包圍在感興趣區域內。
設備之以上實例中任一個,其中對象包括臉。
設備之以上實例中任一者,其中設備包括:距離 感測器,其用以判定至對象之距離;以及光學元件,其介於該影像感測器與該對象之間,且邏輯元件用以操作光學元件以響應於距離而調整焦點。
設備之以上實例中任一者,其中設備包括:距離感測器,其用以判定至影像感測器之視野之中心處的對象之距離;以及光學元件,其介於影像感測器與對象之間,邏輯元件用以操作光學元件以響應於距離而調整焦點,且判定第一邊界以將對象包圍在感興趣區域內。
設備之以上實例中任一者,其中設備包括控制器,且邏輯元件用以接收指示控制器之操作之信號以調整第一邊界。
設備之以上實例中任一者,其中設備包括顯示器,且邏輯元件用以將影像感測器之視野及第一邊界視覺上呈現在顯示器上。
設備之以上實例中任一者,其中第二參數在指定以下各項中之一者中不同於第一參數:相較於第一參數之較低色彩深度、相較於第一參數之不同色彩編碼、相較於第一參數之不同品質設定、有損壓縮之選擇而非第一參數之無損壓縮選擇,或相較於第一參數之較高壓縮比。
設備之以上實例中任一者,其中邏輯元件用以使第一邊界與鄰接巨集區塊之第二邊界對準,該等鄰接巨集區塊與在壓縮所擷取資料之第一部分及第二部分中之使用之壓縮編碼演算法相關聯。
設備之以上實例中任一者,其中設備包括介面, 其用以將邏輯元件耦接至網路以將自所擷取資料之第一部分及第二部分之壓縮產生之壓縮資料傳輸至運算裝置。
用以壓縮影像之另一設備之實例包括:介面,其用以經由網路接收表示所擷取影像之所擷取資料及指示感興趣區域之第一邊界之感興趣區域資料;以及邏輯元件,其用以:使用第一參數來壓縮表示感興趣區域內之所擷取影像之第一部分的所擷取資料之第一部分;且使用第二參數來壓縮表示感興趣區域外部之所擷取影像之第二部分的所擷取資料之第二部分,該第一參數及該第二參數經選擇以不同地將所擷取資料之第一部分相較於所擷取資料之第二部分壓縮成每一像素之資料丟失較小的程度。
另一設備之以上實例,其中設備包括控制器,且邏輯元件用以接收指示控制器之操作之信號以調整第一邊界。
另一設備之以上實例中任一者,其中設備包括顯示器,且邏輯元件用以將影像感測器之視野及第一邊界視覺上呈現在顯示器上。
另一設備之以上實例中任一者,其中第二參數在指定以下各項中之一者中不同於第一參數:相較於第一參數之較低色彩深度、相較於第一參數之不同色彩編碼、相較於第一參數之不同品質設定、有損壓縮之選擇而非第一參數之無損壓縮選擇,或相較於第一參數之較高壓縮比。
另一設備之以上實例中任一者,其中邏輯元件用以使第一邊界與鄰接巨集區塊之第二邊界對準,該等鄰接 巨集區塊與在壓縮所擷取資料之第一部分及第二部分中之使用之壓縮編碼演算法相關聯。
另一設備之以上實例中任一者,其中邏輯元件用以將自所擷取資料之第一部分及第二部分之壓縮產生之壓縮資料經由網路傳輸至運算裝置。
壓縮所擷取影像之電腦實行方法之實例包括:擷取所擷取影像作為表示所擷取影像之所擷取資料;判定所擷取影像內之感興趣區域之第一邊界;使用第一參數來壓縮表示感興趣區域內之所擷取影像之第一部分的所擷取資料之第一部分;以及使用對應於第一參數之第二參數來壓縮表示感興趣區域外部之影像之第二部分的所擷取資料之第二部分,該第一參數及該第二參數經選擇以不同地使所擷取資料之第二部分比所擷取資料之第一部分壓縮更大的程度。
電腦實行方法之以上實例,其中方法包括分析經操作以擷取影像之影像感測器之視野以識別對象,及判定第一邊界以將對象包圍在感興趣區域內。
電腦實行方法之以上實例中任一者,其中對象包括臉。
電腦實行方法之以上實例中任一者,其中方法包括判定至對象之距離,及操作介於影像感測器與對象之間的光學元件以響應於距離而調整焦點。
電腦實行方法之以上實例中任一者,其中方法包括判定至經操作以擷取影像之影像感測器之視野之中心處 的對象之距離,操作介於影像感測器與對象之間的光學元件以響應於距離而調整焦點,及判定第一邊界以將對象包圍在感興趣區域之內。
電腦實行方法之以上實例中任一者,其中方法包括將經操作以擷取影像之影像感測器之視野及第一邊界視覺上呈現在顯示器上,及接收指示控制器之操作之信號以調整第一邊界。
電腦實行方法之以上實例中任一者,其中第二參數在指定以下各項中之一者中不同於第一參數:相較於第一參數之較低色彩深度、相較於第一參數之不同色彩編碼、相較於第一參數之不同品質設定、有損壓縮之選擇而非第一參數之無損壓縮選擇,或相較於第一參數之較高壓縮比。
電腦實行方法之以上實例中任一者,其中方法包括使第一邊界與鄰接巨集區塊之第二邊界對準,該等鄰接巨集區塊與在壓縮所擷取資料之第一部分及第二部分中使用之壓縮編碼演算法相關聯。
電腦實行方法之以上實例中任一者,其中方法包括自所擷取資料之第一部分及第二部分之壓縮產生壓縮資料,其中將像素資料組織成包含表示所擷取影像之第一部分及第二部分兩者之像素資料的至少一初始遍及包含表示所擷取影像之第一部分且不表示所擷取影像之第二部分之像素資料的至少一額外遍。
電腦實行方法之以上實例中任一者,其中方法包 括將自所擷取資料之第一部分及第二部分之壓縮產生之壓縮資料經由網路傳輸至運算裝置。
設備之實例包括用於執行電腦實行方法之以上實例中任一者的構件。
至少一機器可讀儲存媒體之實例包括指令,該等指令在由運算裝置執行時,使運算裝置進行以下操作:接收表示所擷取影像之所擷取資料及指示感興趣區域之第一邊界之感興趣區域資料,使用第一參數來壓縮表示感興趣區域內之所擷取影像之第一部分的所擷取資料之第一部分,及使用對應於第一參數之第二參數來壓縮表示感興趣區域外部之所擷取影像之第二部分的所擷取資料之第二部分,該第一參數及該第二參數經選擇以使所擷取資料之第二部分比所擷取資料之第一部分壓縮更大的程度。
至少一機器可讀儲存媒體之以上實例,其中使運算裝置將經操作以擷取所擷取影像之影像感測器之視野及第一邊界視覺上呈現在顯示器上,且接受指示控制器之操作之信號以調整第一邊界。
至少一機器可讀儲存媒體之以上實例中任一者,其中使運算裝置使第一邊界與鄰接巨集區塊之第二邊界對準,該等鄰接巨集區塊與在壓縮所擷取資料之第一部分及第二部分中使用之壓縮編碼演算法相關聯。
至少一機器可讀儲存媒體之以上實例中任一者,其中使運算裝置將自所擷取資料之第一部分及第二部分之壓縮產生之壓縮資料經由網路傳輸至另一運算裝置。
用以壓縮影像之另一設備之實例包括用於進行以下操作之構件:接收表示所擷取影像之所擷取資料及指示感興趣區域之第一邊界之感興趣區域資料,使用第一參數來壓縮表示感興趣區域內之所擷取影像之第一部分的所擷取資料之第一部分,及使用對應於第一參數之第二參數來壓縮表示感興趣區域外部之所擷取影像之第二部分的所擷取資料之第二部分,該第一參數及該第二參數經選擇以使所擷取資料之第二部分比所擷取資料之第一部分壓縮更大的程度。
另一設備之以上實例,其中設備包括用以進行以下操作之構件:將經操作以擷取影像之影像感測器之視野及第一邊界視覺上呈現在顯示器上,及接收指示控制器之操作之信號以調整第一邊界。
另一設備之以上實例中任一者,其中設備包括用以進行以下操作之構件:使第一邊界與鄰接巨集區塊之第二邊界對準,該等鄰接巨集區塊與在壓縮所擷取資料之第一部分及第二部分中之使用之壓縮編碼演算法相關聯。
另一設備之以上實例中任一者,其中設備包括用於進行以下操作之構件:將自所擷取資料之第一部分及第二部分之壓縮產生之壓縮資料經由網路傳輸至另一運算裝置。
110‧‧‧光學元件
112‧‧‧距離感測器
115‧‧‧影像感測器
132‧‧‧ROI資料
135‧‧‧所擷取資料
200‧‧‧擷取裝置/運算裝置
220‧‧‧控制器
240‧‧‧控制常式
250‧‧‧處理器元件
260、560‧‧‧儲存器
280‧‧‧顯示器
335‧‧‧壓縮資料
390‧‧‧介面
500‧‧‧伺服器/運算裝置
700‧‧‧觀察裝置/運算裝置
720‧‧‧控制器
740‧‧‧控制常式
750‧‧‧處理器元件
760‧‧‧儲存器
780‧‧‧顯示器
790‧‧‧介面
999‧‧‧網路
1000‧‧‧影像處置系統

Claims (24)

  1. 一種用於影像處理之設備,其包含:一影像感測器,其用以擷取一影像作為所擷取資料;以及邏輯元件,其用以:判定該影像內之一感興趣區域之第一邊界;使用一第一參數來壓縮表示該感興趣區域內之該影像之一第一部分的該所擷取資料之一第一部分;及使用一第二參數來壓縮表示該感興趣區域外部之該影像之一第二部分的該所擷取資料之一第二部分,該第一及第二參數經選擇以使該所擷取資料之該第二部分比該所擷取資料之該第一部分壓縮一較大的程度,其中該第二參數在指定以下各項中之一者中不同於該第一參數:相較於該第一參數之一較低色彩深度、相較於該第一參數之一不同色彩編碼、相較於該第一參數之一不同品質設定、有損壓縮之一選擇而非該第一參數之一無損壓縮選擇,或相較於該第一參數之一較高壓縮比。
  2. 如請求項1之設備,該邏輯元件用以:分析該影像感測器之一視野以識別一對象;且判定該等第一邊界以將該對象包圍在該感興趣區 域內。
  3. 如請求項2之設備,其包含:一距離感測器,用以判定至該對象之一距離;以及光學元件,其介於該影像感測器與該對象之間,該邏輯元件操作該光學元件以響應於該距離而調整一焦點。
  4. 如請求項1之設備,其包含:一距離感測器,其用以判定至該影像感測器之一視野之一中心處的一對象之一距離;以及光學元件,其介於該影像感測器與該對象之間,該邏輯元件用以操作該光學元件以響應於該距離而調整一焦點,且用以判定該等第一邊界以將該對象包圍在該感興趣區域內。
  5. 如請求項1之設備,其包含控制器,該邏輯元件用以接收指示該等控制器之操作之信號以調整該等第一邊界。
  6. 如請求項5之設備,其包含一顯示器,該邏輯元件用以將該影像感測器之一視野及該等第一邊界視覺上呈現在該顯示器上。
  7. 如請求項1之設備,該邏輯元件用以使該等第一邊界與鄰接巨集區塊之第二邊界對準,該等鄰接巨集區塊與在壓縮該所擷取資料之該第一及第二部分中使用之一壓縮編碼演算法相關聯。
  8. 一種用於影像處理之設備,其包含:一介面,其用以經由一網路接收表示一所擷取影像 之一所擷取資料及指示一感興趣區域之第一邊界之一感興趣區域資料;以及邏輯元件,其用以:使用一第一參數來壓縮表示該感興趣區域內之該所擷取影像之一第一部分的該所擷取資料之一第一部分;及使用一第二參數來壓縮表示該感興趣區域外部之該所擷取影像之一第二部分的該所擷取資料之一第二部分,該第一及第二參數經選擇以不同地將該所擷取資料之該第一部分相較於該所擷取資料之該第二部分壓縮成每一像素之資料丟失較小的程度,其中該第二參數在指定以下各項中之一者中不同於該第一參數:相較於該第一參數之一較低色彩深度、相較於該第一參數之一不同色彩編碼、相較於該第一參數之一不同品質設定、有損壓縮之一選擇而非該第一參數之一無損壓縮選擇,或相較於該第一參數之一較高壓縮比。
  9. 如請求項8之設備,其包含控制器,該邏輯元件用以接收指示該等控制器之操作之信號以調整該等第一邊界。
  10. 如請求項9之設備,其包含一顯示器,該邏輯元件用以將該影像感測器之一視野及該等第一邊界視覺上呈現在該顯示器上。
  11. 如請求項8之設備,該邏輯元件用以使該等第一邊界與 鄰接巨集區塊之第二邊界對準,該等鄰接巨集區塊與在壓縮該所擷取資料之該第一及第二部分中使用之一壓縮編碼演算法相關聯。
  12. 如請求項8之設備,該邏輯元件用以經由該網路將自該所擷取資料之該第一及第二部分之該壓縮產生的一壓縮資料傳輸至一運算裝置。
  13. 一種電腦實行方法,其包含:擷取一影像作為表示一所擷取影像之所擷取資料;判定該所擷取影像內之一感興趣區域之第一邊界;使用一第一參數來壓縮表示該感興趣區域內之該所擷取影像之一第一部分的該所擷取資料之一第一部分;以及使用對應於該第一參數之一第二參數來壓縮表示該感興趣區域外部之該影像之一第二部分的該所擷取資料之一第二部分,該第一參數及該第二參數經選擇以不同地使該所擷取資料之該第二部分比該所擷取資料之該第一部分壓縮一較大的程度,其中該第二參數在指定以下各項中之一者中不同於該第一參數:相較於該第一參數之一較低色彩深度、相較於該第一參數之一不同色彩編碼、相較於該第一參數之一不同品質設定、有損壓縮之一選擇而非該第一參數之一無損壓縮選擇,或相較於該第一參數之一較高壓縮比。
  14. 如請求項13之電腦實行方法,其包含: 分析經操作以擷取該影像之一影像感測器之一視野以識別一對象;以及判定該等第一邊界以將該對象包圍在該感興趣區域內。
  15. 如請求項14之電腦實行方法,該對象包含一臉。
  16. 如請求項14之電腦實行方法,其包含:判定至該對象之一距離;以及操作介於該影像感測器與該對象之間的光學元件以響應於該距離而調整一焦點。
  17. 如請求項13之電腦實行方法,其包含:判定至經操作以擷取該影像之一影像感測器之一視野之一中心處的一對象之一距離;操作介於該影像感測器與該對象之間的光學元件以響應於該距離而調整一焦點;以及判定該等第一邊界以將該對象包圍在該感興趣區域內。
  18. 如請求項13之電腦實行方法,其包含:將經操作以擷取該影像之一影像感測器之一視野及該等第一邊界視覺上呈現在一顯示器上;以及接收指示控制器之操作之信號以調整該等第一邊界。
  19. 如請求項13之電腦實行方法,其包含使該等第一邊界與鄰接巨集區塊之第二邊界對準,該等鄰接巨集區塊與在壓縮該所擷取資料之該第一及第二部分中使用之一壓縮編碼演算法相關聯。
  20. 如請求項13之電腦實行方法,其包含自該所擷取資料之該第一及第二部分之該壓縮產生一壓縮資料,其中將像素資料組織成包含表示該所擷取影像之該第一及第二部分兩者之像素資料的至少一初始遍及包含表示該所擷取影像之該第一部分且不表示該所擷取影像之該第二部分之像素資料的至少一額外遍。
  21. 一種包含指令之至少一機器可讀儲存媒體,該等指令在由一運算裝置執行時致使該運算裝置:接收表示一所擷取影像之一所擷取資料及指示一感興趣區域之第一邊界之一感興趣區域資料;使用一第一參數來壓縮表示該感興趣區域內之該所擷取影像之一第一部分的該所擷取資料之一第一部分;以及使用對應於該第一參數之一第二參數來壓縮表示該感興趣區域外部之該所擷取影像之一第二部分的該所擷取資料之一第二部分,該第一及第二參數經選擇以使該所擷取資料之該第二部分比該所擷取資料之該第一部分壓縮一較大的程度,其中該第二參數在指定以下各項中之一者中不同於該第一參數:相較於該第一參數之一較低色彩深度、相較於該第一參數之一不同色彩編碼、相較於該第一參數之一不同品質設定、有損壓縮之一選擇而非該第一參數之一無損壓縮選擇,或相較於該第一參數之一較高壓縮比。
  22. 如請求項21之至少一種機器可讀儲存媒體,致使該運算裝置:將經操作以擷取該所擷取影像之一影像感測器之一視野及該等第一邊界視覺上呈現在一顯示器上;以及接收指示控制器之操作之信號以調整該等第一邊界。
  23. 如請求項21之至少一種機器可讀儲存媒體,致使該運算裝置使該等第一邊界與鄰接巨集區塊之第二邊界對準,該等鄰接巨集區塊與在壓縮該所擷取資料之該第一及第二部分中使用之一壓縮編碼演算法相關聯。
  24. 如請求項21之至少一種機器可讀儲存媒體,致使該運算裝置將自該所擷取資料之該第一及第二部分之該壓縮產生之一壓縮資料經由一網路傳輸至另一運算裝置。
TW103107487A 2013-03-08 2014-03-05 用於基於感興趣區域的影像編碼之技術 TWI571105B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/CN2013/072363 WO2014134828A1 (en) 2013-03-08 2013-03-08 Techniques for image encoding based on region of interest

Publications (2)

Publication Number Publication Date
TW201442488A TW201442488A (zh) 2014-11-01
TWI571105B true TWI571105B (zh) 2017-02-11

Family

ID=51490590

Family Applications (1)

Application Number Title Priority Date Filing Date
TW103107487A TWI571105B (zh) 2013-03-08 2014-03-05 用於基於感興趣區域的影像編碼之技術

Country Status (5)

Country Link
US (1) US20160007026A1 (zh)
EP (1) EP2965288A4 (zh)
CN (1) CN104969262A (zh)
TW (1) TWI571105B (zh)
WO (1) WO2014134828A1 (zh)

Families Citing this family (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9275349B2 (en) * 2013-07-19 2016-03-01 Ricoh Company Ltd. Healthcare system integration
DE102013224539A1 (de) * 2013-11-29 2015-06-03 Bayerische Motoren Werke Aktiengesellschaft Verfahren, Vorrichtung, Computerprogramm und Computerprogrammprodukt zur Bilddatenübertragung
CN104410863B (zh) 2014-12-11 2017-07-11 上海兆芯集成电路有限公司 图像处理器以及图像处理方法
JP7016522B2 (ja) * 2015-04-20 2022-02-07 コーネル ユニヴァーシティー 次元データ低減を有するマシンビジョン
JP6355595B2 (ja) * 2015-06-02 2018-07-11 キヤノン株式会社 撮像素子、撮像装置、撮像素子の制御方法、プログラムおよび記憶媒体
CN105827866A (zh) * 2016-05-18 2016-08-03 努比亚技术有限公司 一种移动终端及控制方法
US10452926B2 (en) * 2016-12-29 2019-10-22 Uber Technologies, Inc. Image capture device with customizable regions of interest
US10506255B2 (en) * 2017-04-01 2019-12-10 Intel Corporation MV/mode prediction, ROI-based transmit, metadata capture, and format detection for 360 video
US11315286B2 (en) * 2017-04-26 2022-04-26 Hewlett-Packard Development Company, L.P. Locating a region of interest on an object
US10755422B2 (en) * 2017-07-24 2020-08-25 Htc Corporation Tracking system and method thereof
US10511842B2 (en) 2017-10-06 2019-12-17 Qualcomm Incorporated System and method for foveated compression of image frames in a system on a chip
GB201717011D0 (en) 2017-10-17 2017-11-29 Nokia Technologies Oy An apparatus a method and a computer program for volumetric video
EP3531703A1 (en) * 2018-02-26 2019-08-28 Thomson Licensing Method and network equipment for encoding an immersive video spatially tiled with a set of tiles
US10694170B2 (en) * 2018-03-05 2020-06-23 Valve Corporation Controlling image display via real-time compression in peripheral image regions
US10776651B2 (en) * 2019-01-18 2020-09-15 Intelligrated Headquarters, Llc Material handling method, apparatus, and system for identification of a region-of-interest
WO2020150979A1 (zh) 2019-01-24 2020-07-30 华为技术有限公司 一种分享图像方法和移动设备
US10984534B2 (en) * 2019-03-28 2021-04-20 GM Global Technology Operations LLC Identification of attention region for enhancement of sensor-based detection in a vehicle
JP7211492B2 (ja) 2019-03-29 2023-01-24 日本電気株式会社 撮像システムおよび撮像方法
DE102019212516A1 (de) * 2019-08-21 2021-02-25 Robert Bosch Gmbh Verfahren und Vorrichtung zum Übertragen von Bilddaten für ein Fahrzeug
EP3958566A1 (en) 2020-08-17 2022-02-23 Axis AB Wearable camera and a method for encoding video captured by the wearable camera
US11966569B2 (en) * 2021-04-30 2024-04-23 Zebra Technologies Corporation Systems and methods for interacting with overlapping regions of interest in machine vision applications
US11991371B2 (en) * 2021-06-23 2024-05-21 Synaptics Incorporated Image processing system for region-of-interest-based video compression
WO2024077772A1 (en) * 2022-10-11 2024-04-18 Guangdong Oppo Mobile Telecommunications Corp., Ltd. Method and system for image data processing

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060045381A1 (en) * 2004-08-31 2006-03-02 Sanyo Electric Co., Ltd. Image processing apparatus, shooting apparatus and image display apparatus
CN1867125A (zh) * 2005-05-20 2006-11-22 英华达(上海)电子有限公司 手机中大图片mms使用roi图像压缩进行编辑处理的方法
TWI316812B (zh) * 2006-09-25 2009-11-01 Sunplus Technology Co Ltd
TWI318827B (en) * 2004-10-08 2009-12-21 Nvidia Corp Methods and systems for rate control in image compression
CN101882316A (zh) * 2010-06-07 2010-11-10 深圳市融创天下科技发展有限公司 一种图像区域划分/编码方法、装置及系统

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08331561A (ja) 1995-03-30 1996-12-13 Canon Inc 画像処理装置
US6973200B1 (en) * 1997-04-22 2005-12-06 Canon Kabushiki Kaisha Image processing apparatus, image processing method, and storage medium
EP1586190B1 (de) * 2003-01-23 2006-05-24 BenQ Mobile GmbH & Co. oHG Mobiltelefon mit schwenkbarer kamera
JP4599080B2 (ja) * 2004-04-02 2010-12-15 ソニー株式会社 画像符号化方法,撮像装置およびコンピュータプログラム
JP2006033507A (ja) * 2004-07-16 2006-02-02 Sony Corp 遠隔編集システム、主編集装置、遠隔編集装置、編集方法、編集プログラム、及び記憶媒体
US8243797B2 (en) * 2007-03-30 2012-08-14 Microsoft Corporation Regions of interest for quality adjustments
RU2010136929A (ru) * 2008-02-04 2012-03-20 Теле Атлас Норт Америка Инк. (Us) Способ для согласования карты с обнаруженными датчиком объектами

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060045381A1 (en) * 2004-08-31 2006-03-02 Sanyo Electric Co., Ltd. Image processing apparatus, shooting apparatus and image display apparatus
TWI318827B (en) * 2004-10-08 2009-12-21 Nvidia Corp Methods and systems for rate control in image compression
CN1867125A (zh) * 2005-05-20 2006-11-22 英华达(上海)电子有限公司 手机中大图片mms使用roi图像压缩进行编辑处理的方法
TWI316812B (zh) * 2006-09-25 2009-11-01 Sunplus Technology Co Ltd
CN101882316A (zh) * 2010-06-07 2010-11-10 深圳市融创天下科技发展有限公司 一种图像区域划分/编码方法、装置及系统

Also Published As

Publication number Publication date
CN104969262A (zh) 2015-10-07
EP2965288A1 (en) 2016-01-13
EP2965288A4 (en) 2016-07-27
US20160007026A1 (en) 2016-01-07
TW201442488A (zh) 2014-11-01
WO2014134828A1 (en) 2014-09-12

Similar Documents

Publication Publication Date Title
TWI571105B (zh) 用於基於感興趣區域的影像編碼之技術
TWI569629B (zh) 用於在壓縮視訊資料中包括感興趣區域指示之技術
CN107690649B (zh) 数字拍摄装置及其操作方法
JP5241500B2 (ja) カメラパラメータを利用した多視点動画符号化及び復号化装置並びに方法と、これを行うためのプログラムの記録された記録媒体
JP6154075B2 (ja) オブジェクト検出及び分割の方法,装置,コンピュータプログラム製品
KR20190052089A (ko) 명시야 데이터를 사용하여 장면을 표현하는 포인트 클라우드를 재구성하기 위한 방법 및 디바이스
EP2932707A1 (en) Multi-focal image capture and display
EP3316568B1 (en) Digital photographing device and operation method therefor
CN103841317A (zh) 数据处理装置以及数据处理方法
CN104737223A (zh) 具自适应选择压缩/解压缩算法以透过显示接口进行数据通信的数据处理装置以及相关数据处理方法
JP2011166264A (ja) 画像処理装置、撮像装置、および画像処理方法、並びにプログラム
JP2011091481A5 (zh)
JP2019208103A (ja) 画像記録装置、画像記録方法およびプログラム
KR20190041929A (ko) 화상 처리장치, 화상 처리방법 및 비일시적인 컴퓨터 판독가능한 기억매체
US20130258053A1 (en) Three-dimensional video encoding apparatus, three-dimensional video capturing apparatus, and three-dimensional video encoding method
CN102572469A (zh) 图像处理设备,图像处理方法和程序
KR20190023546A (ko) 영상 부호화 장치 및 영상 부호화 시스템
JP2013150071A (ja) 符号化装置、符号化方法、プログラム及び記憶媒体
US20130011047A1 (en) Method, System and Computer Program Product for Switching Between 2D and 3D Coding of a Video Sequence of Images
CN109931923B (zh) 一种导航引导图的生成方法和装置
US20210366182A1 (en) Three dimensional scene inpainting using stereo extraction
JP2006352335A (ja) 画像符号化装置
WO2018136129A1 (en) Image compression based on semantic relevance
JP7389565B2 (ja) 符号化装置、復号装置、及びプログラム
CN115965616B (zh) 一种虹膜图像处理方法、装置及电子设备

Legal Events

Date Code Title Description
MM4A Annulment or lapse of patent due to non-payment of fees