TW202415082A

TW202415082A - 用於確定指示在影像框的串流中捕獲的物件屬於物件類型的機率值之方法及影像處理裝置

Info

Publication number: TW202415082A
Application number: TW112131324A
Authority: TW
Inventors: 宋元恩; 路得維希哈斯布林
Original assignee: 瑞典商安訊士有限公司
Priority date: 2022-09-23
Filing date: 2023-08-21
Publication date: 2024-04-01

Abstract

本發明提供一種方法，其包含： - 在由多攝影機系統之一第一攝影機捕獲的影像框之一第一串流中捕獲的一場景之一第一區域中偵測（501）一第一物件或該第一物件之一第一部分； - 基於該第一物件或該第一物件之該部分的特性確定（502）一第一機率值，該第一機率值指示該所偵測第一物件或第一部分屬於物件類型的一第一機率； - 在由該攝影機系統之不同於該第一攝影機的一第二攝影機在影像框之一第二串流中捕獲的該場景之一第二區域中偵測（504）一第二物件或該第二物件之一第二部分，其中該第二區域至少部分地與該第一區域重疊； - 基於該第二物件或該第二物件之該第二部分的特性確定（505）一第二機率值，該第二機率值指示該所偵測第二物件或該第二部分屬於該物件類型的一第二機率；及 - 當該第二機率值低於一第二臨限值且該第一機率值高於一第一臨限值時，藉由增大該第二機率值來確定（507）一經更新第二機率值。

Description

用於確定指示在影像框的串流中捕獲的物件屬於物件類型的機率值之方法及影像處理裝置

本文中之具體實例係關於用於確定指示在影像框之串流中捕獲的物件屬於物件類型的機率值之方法及影像處理裝置。亦揭示一種對應電腦程式及一種電腦程式載體。

使用成像，尤其視訊成像對公眾進行監控常見於世界各地許多領域。可能需要監視之區域為例如銀行、商店及其他需要安全性之區域，諸如學校及政府機構。然而，在許多場所中，在無許可證/權限的情況下安裝攝影機係不合法的。其他可能需要監視之區域為視訊監控主要用以監視程序的處理、製造及物流應用。

然而，可存在不能夠自視訊監控識別人的要求。不能夠識別人之要求可與能夠確定視訊中正在發生何情形之要求形成對比。舉例而言，對匿名影像資料執行人員計數或佇列監視可備受關注。實務上，在符合此等兩個要求之間存在平衡點：不可識別的視訊及出於諸如人員計數之不同目的而提取大量資料。

已描述若干影像處理技術以避免識別人同時仍能夠識別活動。舉例而言，邊緣偵測/表示、邊緣增強、輪廓化物件及不同分類之「色彩模糊」，諸如色彩變化或擴大皆為此類操控實例。隱私遮蔽為在視訊監控中用以藉由用遮蔽區域自視野隱藏影像之部分來保護個人隱私的另一影像處理技術。

影像處理係指應用於影像之任何處理。處理可包括將各種效應、遮罩、濾波器或其類似者應用於影像。以此方式，影像可例如經銳化、轉換為灰階，或以某種方式變更。影像典型地已由視訊攝影機、靜態影像攝影機或其類似者捕獲。

如上文所提及，用以避免識別人之一種方式係藉由即時地遮蔽影像中移動的人及物件。在實況及所記錄視訊中遮蔽可藉由將實況攝影機視圖與設定背景場景進行比較及將動態遮蔽應用於變化區域——基本上為移動的人及物件。色彩遮蔽亦可稱為素色遮蔽或單色遮蔽（其中物件係由某一色彩之素色遮罩遮蔽），提供隱私保護同時使你能夠看見移動。馬賽克遮蔽亦稱為像素化、像素化隱私遮蔽或透明像素化遮蔽，以更低解析度展示移動的物件，且使得你藉由看到物件的色彩而更好地區分形式。

遮蔽實況及所記錄視訊適合於在監控由於隱私規則及法規而另外存在問題之區域中的遠端視訊監視或記錄。當視訊監控主要用以監視程序時，其對於處理、製造及物流應用係理想的。其他潛在應用係在零售、教育及政府機構中。

在遮蔽物件之前，可需要將物件偵測為待遮蔽物件，或換言之，分類為待遮蔽物件。US20180268240A1揭示一種方法，其包含：獲取場景之視訊，偵測場景中之物件，確定指示所偵測物件屬於待編輯物件類別之可能性的物件偵測機率值，及藉由混淆屬於待編輯物件類別之所偵測物件來編輯視訊。

在動態遮蔽用於監視系統中時發現之具挑戰性的問題為，相比於針對非遮擋人員之偵測而獲得的偵測得分，部分遮擋人員之偵測將產生低得多的偵測得分，諸如更低的物件偵測機率值。遮擋可歸因於場景中之其他物件。更低的偵測得分可造成部分遮擋人員在所捕獲視訊串流中未被遮蔽。舉例而言，若視訊串流中所捕獲之物件（例如，人）之一半被遮擋，則自物件偵測器獲得之偵測得分可為物件為人類的67%，而若所捕獲物件未被遮擋，則偵測得分可為95%。若視訊串流中用於遮蔽人類之臨限值偵測得分設定成例如80%，則部分遮擋人員將不被遮蔽，而非遮擋物件將被遮蔽。此為一問題，因為部分遮擋人員亦應被遮蔽以便避免識別。

因此，本文中之具體實例的目標可為預防上文所提及之問題中的一些，或至少減少上述問題之影響。具體而言，本文中之具體實例的目標可為如何偵測影像串流中由其他物件遮擋之所捕獲物件及如何根據已知物件類型對其進行分類。舉例而言，本文中之具體實例的目標可為偵測視訊影像串流中之人類，但人類在影像串流中並不完全可見。一旦物件被分類為人類，分類便可引起人類之遮蔽或引起人類之計數。

因此，本文中之具體實例的另一目標可為去識別或匿名化影像框之串流中的人，例如，藉由遮蔽人同時仍能夠確定影像框之串流中發生何情形。

另一目標可為改良確定機率值，該機率值指示在影像框之串流中捕獲的物件是否屬於物件類型，例如，待遮蔽、濾波或計算之物件類型。換言之，另一目標可為改良確定物件偵測機率值，該物件偵測機率值指示所偵測物件屬於特定物件類別之可能性。

根據一態樣，該目標係藉由在多攝影機系統中執行之用於確定指示在影像框之串流中捕獲的物件是否屬於物件類型的機率值的方法來達成。

該方法包含在場景之第一區域中偵測第一物件或第一物件之第一部分，該場景之第一區域係在由多攝影機系統之第一攝影機捕獲的影像框之第一串流中捕獲。

該方法進一步包含基於第一物件或第一物件之第一部分的特性確定指示所偵測第一物件或第一部分屬於物件類型之機率的第一機率值。

該方法進一步包含在場景之第二區域中偵測第二物件或第二物件之第二部分，該場景之第二區域係由攝影機系統之不同於第一攝影機的第二攝影機在影像框之第二串流中捕獲，其中第二區域至少部分與第一區域重疊。

該方法進一步包含基於第二物件或第二物件之第二部分的特性確定指示所偵測第二物件或第二部分屬於物件類型之機率的第二機率值。

該方法進一步包含當第二機率值低於第二臨限值且第一機率值高於第一臨限值時，藉由增大第二機率值來確定經更新第二機率值。

根據另一態樣，該目標係由經組態以執行以上方法之影像處理裝置達成。

根據其他態樣，該目標係由對應於上述態樣之電腦程式及電腦程式載體達成。

本文中之具體實例使用來自另一攝影機之指示所偵測第一物件或第一部分屬於物件類型的機率值。

由於第二機率值在第二機率值低於第二臨限值且第一機率值高於第一臨限值時增大，因此當第二物件被遮擋時可補償第二機率值。藉此有可能針對來自第一攝影機之具有高第一機率值的特定物件補償第二機率值。此意謂偵測到第二物件屬於某一物件類型的機率將增大，即使該些物件在第二攝影機中被部分遮擋亦如此，同時仍有較低數目個被錯誤地偵測為待偵測物件類型的第二物件，亦即，較低數目個誤報偵測。

因此，本文中具體實例之優點為增大偵測在某一攝影機中被部分遮擋的某一物件類型之物件的機率。因此，可改良某些類型或類別之物件的偵測。當機率值指示在影像框之串流中捕獲的物件屬於物件類型時，可確定物件之偵測。舉例而言，當第二機率值指示第二物件或第二部分屬於物件類型時，確定第二物件屬於待偵測之物件類型。舉例而言，較高第二機率值可指示第二物件或第二部分屬於物件類型，而較低第二機率值可指示第二物件或第二部分不屬於物件類型。較高及較低機率值可由一或多個臨限值識別。

另一優點係某些類型之物件的遮蔽得以改良。又一優點係某些類型之物件的計數得以改良。

本文中之具體實例可實施於一或多個影像處理裝置中。在本文中之一些具體實例中，一或多個影像處理裝置可包含或係諸如數位攝影機之一或多個影像捕獲裝置。圖 1描繪各種例示性 影像捕獲裝置 110。影像捕獲裝置110可例如為或包含以下中之任一者：攝錄影機；網路視訊記錄器；攝影機； 視訊攝影機 120，諸如監控攝影機或監視攝影機；數位攝影機； 無線通信裝置 130，諸如智慧型手機，包括影像感測器；或汽車 140，包括影像感測器。

圖 2a描繪例示性 視訊網路系統 250 ，本文中之具體實例可實施於該系統中。視訊網路系統250可包括諸如視訊攝影機120之影像捕獲裝置，該影像捕獲裝置可捕獲諸如數位視訊影像之 數位影像 201且對該數位影像執行影像處理。圖2a中之 視訊伺服器 260可例如經由網路或其類似者自視訊攝影機120獲得影像，此在圖2a中以雙向箭頭指示。

視訊伺服器260為專用於遞送視訊的基於電腦之裝置。視訊伺服器用於多個應用中，且通常具有解決特定應用之需要的額外功能及能力。舉例而言，用於安全性、監控及檢測應用中之視訊伺服器典型地經設計以自一或多個攝影機捕獲視訊且經由電腦網路遞送視訊。在視訊產生及廣播應用中，視訊伺服器可能夠記錄並播放所記錄視訊，並同時遞送許多視訊串流。現今，許多視訊伺服器功能可建置於視訊攝影機120中。

然而，在圖2a中，視訊伺服器260經由視訊網路系統250連接至影像捕獲裝置，此處由視訊攝影機120例示。視訊伺服器260可進一步連接至 視訊儲存器 270以供儲存視訊影像，及/或連接至 監視器 280以供顯示視訊影像。在一些具體實例中，視訊攝影機120直接與視訊儲存器270及/或監視器280連接，如由在圖2a中之此等裝置之間的直接箭頭所指示。在一些其他具體實例中，視訊攝影機120經由視訊伺服器260連接至視訊儲存器270及/或監視器280，如由視訊伺服器260與其他裝置之間的箭頭所指示。

圖 2b描繪經由視訊網路系統250連接至視訊攝影機120之 使用者裝置 295。使用者裝置295可為例如電腦或行動電話。使用者裝置295可例如控制視訊攝影機120及/或顯示自視訊攝影機120發出的視訊。使用者裝置295可進一步包括監視器280及視訊儲存器270之功能性兩者。

為了在本文中更好地理解具體實例，首先將描述成像系統。

圖 3為 成像系統 300之示意圖，在此狀況下為諸如視訊攝影機120之數位視訊攝影機。成像系統在 影像感測器 301上對場景進行成像。影像感測器301可具備拜耳濾波器，使得不同像素將以已知圖案接收特定波長區之輻射。典型地，所捕獲影像之各像素係由表示某一波長帶內所捕獲光之強度的一或多個值表示。此等值通常被稱為色彩分量或色彩通道。術語「影像」可指影像框或視訊框，包括源自已捕獲影像之影像感測器的資訊。

在已讀取影像感測器301之個別感測器像素之信號後，可由 影像信號處理器 302執行不同影像處理動作。影像信號處理器302可包含 影像處理部分 302a（有時被稱作影像處理管線）及 視訊後處理部分 302b。

典型地對於視訊處理，影像包含於影像串流中。圖3繪示來自影像感測器301之 第一視訊串流 310。第一影像串流310可包含多個所捕獲影像框，諸如 第一所捕獲影像框 311及 第二所捕獲影像框 312。

影像處理可包含去馬賽克、色彩校正、雜訊濾波（用於消除空間及/或時間雜訊）、失真校正（用於消除例如桶形失真之效應）、全域及/或局部色調映射（例如，使能夠對含有廣泛範圍之強度的場景進行成像）、變換（例如，修正及旋轉）、平場校正（例如，用於移除漸暈效應）、疊對應用（例如，隱私遮罩、解釋性文本）等。影像信號處理器302亦可與執行物件偵測、識別、警報等之分析引擎相關聯。

影像處理部分302a可例如執行影像穩定化、應用雜訊濾波、失真校正、全域及/或局部色調映射、變換及平場校正。視訊後處理部分302b可例如為影像之裁剪部分，應用重疊，且包含分析引擎。

在影像信號處理器302之後，可將影像轉遞至 編碼器 303，其中根據諸如H.264之編碼協定對影像框中之資訊進行寫碼。接著將經編碼影像框轉遞至例如接收用戶端（此處由監視器280例示）、轉遞至視訊伺服器260、儲存器270等。

視訊寫碼程序產生可經編碼以形成壓縮位元串流的數個值。此等值可包括： ● 量化變換係數， ● 使解碼器能夠重建預測之資訊， ● 關於經壓縮資料之結構及在編碼期間使用之壓縮工具的資訊，及 ● 關於完整視訊序列之資訊。

使用例如可變長度寫碼及/或算術寫碼將此等值及參數（語法元素）轉換成二進位碼。此等編碼方法中之各者產生資訊之高效、緊密的二進位表示（亦被稱作經編碼位元串流）。接著可儲存及/或傳輸經編碼位元串流。

在具有多個攝影機之攝影機系統中，本文中之具體實例提議使用來自周圍攝影機之偵測資訊以增強攝影機中之遮蔽品質。舉例而言，可藉由增大偵測特定物件類型之物件的機率來增強遮蔽品質，即使該些物件在攝影機中之一者中被部分遮擋亦如此，同時仍有較低數目個被錯誤地偵測為待偵測物件類型的物件，亦即，較低數目個誤報偵測。

偵測資訊可包含偵測得分或偵測機率。不同攝影機由於攝影機解析度、不同攝影機之安裝位置及其處理功率，可具有不同的偵測人的前置條件，此又影響連同攝影機一起使用的視訊網路之特性。此等特性之實例為輸入至視訊網路之影像的大小。在一個攝影機之影像框中被稍微遮擋的一個人在另一攝影機之影像框中可完全可見。像素密度太低而無法在一個攝影機中偵測到的一個人在人之像素密度更高的另一攝影機中可為可偵測的。 ● 攝影機系統可能需要找出攝影機之間的空間重疊。舉例而言，攝影機系統可呈現有由攝影機捕獲之共用偵測資訊的區域之重疊或確定該重疊。此可經由已知的場景分段方法使用地理位置、水平及傾斜角、變焦、視場及安裝高度之資訊來進行。 ● 影像處理裝置，諸如攝影機，其自周圍攝影機收集由兩個或更多個攝影機捕獲的區域中之物件的偵測得分。該區域可被稱作空間重疊區域。 ● 影像處理裝置基於來自至少一個其他攝影機之偵測得分而相應地調整偵測得分。 ● 影像處理裝置可基於經調整偵測得分而將隱私遮罩應用於所偵測物件。將在下文例如關於圖5之動作503更詳細地解釋此情形。

現將參看圖 4a、圖 4b、圖 4c、圖 4d及圖 5且進一步參看圖1、圖2a、圖2b及圖3描述本文中之例示性具體實例。

圖 4a繪示包括由另一物件（諸如牆壁）遮擋之物件（諸如人）及 多攝影機系統 400的場景。多攝影機系統400包含至少 第一攝影機 401及 第二攝影機 402。第一攝影機401及第二攝影機402可為視訊攝影機。多攝影機系統400亦可包含 視訊伺服器 460。第一攝影機401及第二攝影機402可自不同角度捕獲物件。

在其中可實施具體實例之情境中，第一攝影機401可捕獲整個人之大部分，而第二攝影機402僅捕獲人之較小部分，諸如人之頭及手臂。第一攝影機401及第二攝影機402中之各者可指派偵測得分，例如，指示所偵測物件屬於諸如人類之物件類型的機率值。

圖 4b繪示由多攝影機系統400之第一攝影機401捕獲的 影像框之第一串流 421及由攝影機系統400之第二攝影機402捕獲的 影像框之第二串流 422。第二攝影機402不同於第一攝影機401。影像框之第一串流421包含捕獲 第一物件 431之 影像框 421_2。第一物件431可包含 第一部分 431a。影像框之第二串流422包含捕獲 第二物件 432之 影像框 422_2。第二物件432可包含 第二部分 432a。在本文中之情境下，第一物件431可對應於第二物件432，因為已被捕獲的係相同的真實物件。又，第一部分431a可對應於第二部分432a。

圖 5繪示描述用於確定指示在影像框之串流422中捕獲的物件屬於物件類型（諸如特定物件類型）之機率的機率值的方法之流程圖。舉例而言，物件類型可為人類或動物。換言之，該方法可用於確定物件屬於物件類型的機率。

方法可在攝影機系統400中執行且可更特定而言用於遮蔽或計數在影像框之串流中捕獲的物件。當指示在影像框之串流422中捕獲的物件屬於物件類型的機率值高於用於遮蔽物件的臨限值或用於計數物件的臨限值時，可執行物件的遮蔽或計數。用於遮蔽物件的臨限值與用於計數物件的臨限值可不同。

特定而言，具體實例可由多攝影機系統400之影像處理裝置執行。影像處理裝置可為第一攝影機401及第二攝影機402或視訊伺服器460中之任一者。第一攝影機401及第二攝影機402可各自為視訊攝影機，諸如監控攝影機。

可以任何合適次序（例如，按不同於下文所呈現之次序的次序）採取以下動作。動作 501

方法包含在由多攝影機系統400之第一攝影機401捕獲的影像框之第一串流421中捕獲的場景之 第一區域 441中偵測第一物件431或第一物件431之第一部分431a。動作 502

該方法進一步包含基於第一物件431或第一物件431之第一部分431a之特性確定第一機率值，該第一機率值指示所偵測第一物件431或第一部分431a屬於諸如人類之物件類型的第一機率。換言之，該方法包含確定第一物件屬於物件類型的第一機率。

舉例而言，確定可藉由對第一物件431之若干部分的機率值進行加權來執行。指示第一物件431之所偵測部分431a屬於物件部分類型之各別機率的各別機率值可基於第一物件431之所偵測部分431a的特性而確定。動作 503

當第一機率值高於第一臨限值時，可確定所偵測第一物件431或第一部分431a屬於物件類型，諸如人類。此外，當第一機率值高於第一臨限值時，可執行一些其他動作：舉例而言，隱私遮罩（諸如遮罩濾波器或遮罩重疊）可應用於影像框之第一串流421中的第一物件431或應用於第一物件431之至少一部分（諸如第一物件431之第一部分431a），以便遮蔽（例如，隱藏）影像框之第一串流421中的第一物件431或第一物件431之至少部分（諸如第一物件431之第一部分431a）。特定而言，隱私遮罩可藉由遮蔽各影像框中之區域來獲得，且可包含：色彩遮蔽，其亦可被稱作素色遮蔽或單色遮蔽；馬賽克遮蔽，其亦被稱作像素化、像素化隱私遮蔽或透明像素化；高斯模糊；索貝爾濾波器；背景模型遮蔽，其係藉由將背景應用為遮罩（物件看起來透明）；變色遮罩（取決於背景而改變色彩之遮罩）。在詳細實例中，可藉由忽略影像資料及使用另一像素值而非待遮蔽之像素來獲得色彩遮罩。舉例而言，另一像素值可對應於特定色彩，諸如紅色或灰色。

在另一具體實例中，當第一機率值高於第一臨限值時，物件可被視為特定預定義物件。因此，第一臨限值可為遮蔽臨限值、計數臨限值或與某一其他功能相關聯的另一臨限值，由於第一機率值高於第一臨限值而待對物件執行該某一其他功能。動作 504

該方法進一步包含在由攝影機系統400之第二攝影機402在影像框之第二串流422中所捕獲的場景之 第二區域 442中偵測第二物件432或第二物件432之第二部分432a。第二攝影機402不同於第一攝影機401。第二區域442至少部分地與第一區域441重疊。動作 505

該方法進一步包含基於第二物件432或第二物件432之第二部分432a的特性確定第二機率值，該第二機率值指示所偵測第二物件432或第二部分432a屬於物件類型的第二機率。換言之，該方法包含確定第二物件屬於物件類型的第二機率。

當第二機率值高於第二臨限值時，可確定所偵測第二物件432或第二部分432a屬於物件類型，諸如人類。換言之，所偵測第二物件432或第二部分432a可偵測為人類或屬於人類。

當第二機率值低於第二臨限值時，可確定第二物件432不屬於物件類型。然而，在本文中之具體實例中，該方法藉由考慮來自第一攝影機401之第一機率值而在第二機率值低於第二臨限值時亦繼續評估第二物件432是否屬於物件類型。動作 506

基於第一機率值繼續評估對第二物件432之偵測的又一條件可為第一物件431及第二物件432之共同定位的確定，以確保第一物件431係與第二物件432相同之物件，且因此當評估第二物件432之偵測時考慮第一機率值係合適的。

因此，該方法可進一步包含確定第二物件432或第二物件432之第二部分432a與第一物件431或第一物件431之第一部分431a共同定位於第二區域442與第一區域441之重疊區域中。

換言之，方法可進一步包含確定第一物件431及第二物件432為相同物件。

舉例而言，可確定第二物件432與第一物件431共同定位。舉例而言，可確定在影像框之第一串流421中的第一人與影像框之第二串流422中的第二人共同定位。基於共同定位之確定，可確定第一人與第二人係同一人。舉例而言，若以90%之機率確定第一物件431係一人，且以70%之機率進一步確定第二物件432係一人，且在影像框中未偵測到其他物件，則可確定該人可能係同一人。

換言之，可確定第一物件431及第二物件432係鏈接的，例如藉由在給定基於一組約束條件之匹配層級的情況下確定與第一物件431及第二物件432相關聯的運動軌道項目係鏈接的（亦即，被確定屬於一個真實世界物件）。軌道項目可基於所接收第一及第二影像系列以及所確定的第一及第二特性化特徵集及移動資料而建立。

在另一實例中，可確定第二物件432與第一物件431之第一部分431a共同定位。

在另一實例中，可確定第二物件432之第二部分432a與第一物件431共同定位。

在另一實例中，可確定第二物件432之第二部分432a與第一物件431之第一部分共同定位。舉例而言，可確定第一物件之頭部與第二物件之頭部共同定位。此方法亦可應用於其他部分，諸如臂、軀幹以及腿。

動作506可在動作507之後或之前執行。動作 507

當第二機率值低於第二臨限值且第一機率值高於第一臨限值時，該方法包含藉由增大第二機率值來確定經更新第二機率值。

第二臨限值亦可為遮蔽臨限值、計數臨限值或與某一其他功能相關聯的另一臨限值，由於第二機率值高於第二臨限值而待對第二物件432或對第二部分432a執行該某一其他功能。

第二臨限值與第一臨限值可不同。然而，在本文中之一些具體實例中，其為相同的。圖 4c繪示當第一及第二臨限值相同且第一機率值高於第一臨限值時，第二機率值可如何自低於第二臨限值增大至高於第二臨限值的簡單實例。

在本文中之一些具體實例中，第一臨限值為90%，而第二臨限值為70%。第二臨限值可低於第一臨限值。當第二物件432由某一其他物件（諸如牆壁）部分遮擋時，此可例如為一優點。

在一情境下，第一攝影機401確定第一物件係人類的第一機率值為95%。第二攝影機402確定第二物件係人類的第二機率值為68%。接著，第二機率值可增大，例如，增大5%或10%。只要第一機率值高於第一臨限值，增大可為固定值。然而，在本文中之一些具體實例中，第二機率值之增大係基於第一機率值。舉例而言，第二機率值之增大可與第一機率值成比例。在本文中之一些具體實例中，當第一機率值為60%時，第二機率值增大5%，且當第一機率值為70%時，第二機率值增大10%，且當第一機率值為80%時，第二機率值增大15%。

基於第一機率值增大第二機率值可包含：確定第一機率值與第一臨限值之間的差，及基於該差增大第二機率值。舉例而言，若第一機率值與第一臨限值之間的差為5%，則第二機率值可增大10%。在另一實例中，若第一機率值與第一臨限值之間的差為10%，則第二機率值可增大20%。

在一些其他具體實例中，基於第一機率值增大第二機率值包含用差增大第二機率值。舉例而言，若第一機率值與第一臨限值之間的差為5%，則第二機率值可增大5%。在另一實例中，若第一機率值為95%且共同臨限值（諸如共同遮蔽臨限值）為80%，則差為15%，且因此例如67%之第二機率值可增大15%，從而產生82%，其高於80%之共同臨限值。因此，亦可遮蔽或計數第二物件。

在本文中之一些具體實例中，回應於根據以上動作506確定第二物件432或第二物件432之部分432a與第一物件431或第一物件431之部分431a共同定位於重疊區域中而確定經更新第二機率值。

在本文中之一些具體實例中，各別第一及第二臨限值對於物件或物件部分之類型係特定的。舉例而言，各別第一及第二臨限值可對於不同物件類型係特定的，或對於諸如頭部、臂、軀幹、腿等的不同物件部分類型係特定的，或此兩者。由於遮蔽面部可能比遮蔽臂更重要，因此面部的遮蔽臨限值可能比臂的另一遮蔽臨限值更低。舉例而言，頭部的遮蔽臨限值可為70%而臂的遮蔽臨限值可為90%，且軀幹的臨限值可為80%。

藉由增大第二機率值來確定經更新第二機率值的另外條件可為：第二機率值除了低於第二臨限值以外亦高於第三臨限值。因此，第二機率值高於較低第三臨限值可為一額外條件。為何第二機率值高於較低第三臨限值可為一優點的原因在於：若第二機率值低於第三臨限值，例如低於20%，則物件偵測器非常確信該物件並非應被遮蔽的物件，例如，非人類。然而，若第二機率值係在20%與80%之間，則物件可為被遮擋之人，且因此若另一台攝影機在偵測物件時更確信物件為一待遮蔽物件，則其機率值可增大。

在本文中的一些具體實例中，第二部分432a之第二物件部分類型為與第一部分431a之第一物件部分類型相同的物件部分類型。舉例而言，方法可將第一面與第二面以及第一腿與第二腿等進行比較。

當第一機率值與第一臨限值之間的差高於第四臨限值時（例如，當該差高於10%時），僅增大第二機率值可係一優點。以此方式，可控制誤報之數目。舉例而言，在較大臨限值差異之情況下，誤報之數目可較低。

舉例而言，在第一臨限值為70%之情境下，第二臨限值為90%且第四臨限值為75%。72%之第一機率值足夠大以用於在影像框之第一串流421中將第一物件偵測為人類，但對於增大第二機率值而言該第一機率值可被視為過低。動作 508

在一些具體實例中，可回應於經更新第二機率值高於第二臨限值且回應於確定第二物件屬於某一物件類型而執行其他動作。舉例而言，當物件類型為待遮蔽物件類型時，則第一及第二臨限值可用於遮蔽待遮蔽物件類型的物件或物件之部分。接著該方法進一步包含：當經更新第二機率值高於第二臨限值時，在影像框之第二串流422中將隱私遮罩應用於第二物件432之至少一部分（諸如第二部分432a）以遮蔽彼部分。舉例而言，若在第一攝影機401及第二攝影機402兩者中捕獲人類之面部且針對第二攝影機402更新面部得分，則此可引起在影像之第二串流422中對面部的隱私遮蔽。因此，方法可進一步包含藉由移除識別特徵來匿名化未經識別之人，例如，藉由上文在動作503中所提及之方法中之任一者。

在一些其他具體實例中，物件類型為待計數的物件類型。接著，第一臨限值及第二臨限值可用於計數待計數物件類型的物件或物件之部分。接著方法進一步包含：當經更新第二機率值高於第二臨限值時，增大與影像框之第二串流422相關聯的計數器值。舉例而言，計數器值可用於物件或物件部分。

圖 4d繪示一情境，在該情境中場景包含 第一人類 451 及第二人類 452及在兩人451、452之間的 第三物件 453。第三物件453之形狀類似於人類451、452之身體部分的形狀。第三物件可為例如類似於頭部之氣球。在一實例中，第二攝影機402捕獲三個物件451、452、453，且圖5之方法可用於三個物件451、452、453中之各者。因此，圖4d中之三個物件451、452、453中之各者可為影像框之第二串流422中的第二物件432。對應地，圖4d中之三個物件中之各者可為影像框之第一串流421中的第一物件431。

該方法可由第二攝影機或由視訊伺服器460或甚至由第一攝影機401執行。

該方法可接著包含確定第二機率值。對於第一人類451（左側）、第三物件453（氣球）及第二人類452（右側），第二機率值可分別為69%、70%以及80%。在一情境下，用於偵測及遮蔽人類之第二臨限值為80%。此意謂在無圖5之方法的情況下，僅第二人類452將被遮蔽。若執行將第二臨限值普遍降低10%，則第三物件453將被遮蔽，但第一人類451未被遮蔽。然而，若自影像框之第一串流421導出的第一機率值高於第一臨限值且第二機率值低於各別第一物件431（諸如第一人類451及第二人類452）之第二臨限值，則第二機率值增大。因此，若在來自第一攝影機401之影像框之第一串流421中偵測到第一人類451，其中第一機率值為90%，且指示所偵測第一人類451屬於人類類型，則第二機率值增大，例如，增大15%。接著經更新第二機率值將為84%，其高於第二臨限值，且第一人類451將被遮蔽。指示所偵測第三物件453屬於人類物件類型之機率的第三物件453之第一機率值將較低，例如，18%。此意謂由於第三物件453之第一機率值低於第一臨限值，因此第二機率值將不增大。因此，在來自第一攝影機401及第二攝影機402之影像串流中之任一者中第三物件453將不被遮蔽。

參看圖 6，展示 影像處理裝置 600之具體實例的示意性方塊圖。如上文所提及，影像處理裝置600經組態用於確定指示在影像框之串流中捕獲的物件屬於物件類型的機率值。此外，影像處理裝置600可為多攝影機系統400之部分。

如上文所提及，影像處理裝置600可包含或為以下中之任一者：攝影機，諸如監控攝影機、監視攝影機；攝錄影機；網路視訊記錄器；及無線通信裝置130。特定而言，影像處理裝置600可為第一攝影機401或第二攝影機402，諸如監控攝影機；或視訊伺服器460，其可為多攝影機系統400之部分。用於確定指示在影像框之串流中捕獲的物件屬於物件類型之機率值的方法亦可在若干影像處理裝置中，諸如在第一攝影機401及第二攝影機402中以分散方式執行。舉例而言，動作501至動作503可由第一攝影機401執行，而動作504至動作508可由第二攝影機402執行。

影像處理裝置600可進一步包含 處理模組 601，諸如用於執行本文中所描述之方法的構件。該構件可以一或多個硬體模組及/或一或多個軟體模組之形式體現。

影像處理裝置600可進一步包含 記憶體 602。記憶體可包含（諸如含有或儲存）例如呈 電腦程式 603形式之指令，其可包含電腦可讀取程式碼單元，該些電腦可讀取程式碼單元在影像處理裝置600上執行時使影像處理裝置600執行確定指示在影像框之串流中捕獲的物件屬於物件類型的機率值的方法。影像處理裝置600可包含電腦，且接著電腦可讀取程式碼單元可在電腦上執行且使電腦執行確定指示在影像框之串流中捕獲的物件屬於物件類型的機率值的方法。

根據本文中之一些具體實例，影像處理裝置600及/或處理模組601包含 處理電路 604作為例示性硬體模組，其可包含一或多個處理器。因此，處理模組601可以處理電路604之形式體現或由該處理電路「實現」。該些指令可由處理電路604執行，由此影像處理裝置600可操作以執行如上文所描述之圖5之方法。作為另一實例，該些指令在由影像處理裝置600及/或處理電路604執行時可使影像處理裝置600執行根據圖5之方法。

鑒於以上內容，在一個實例中，提供一種影像處理裝置600，其用於確定指示在影像框之串流中捕獲的物件屬於物件類型的機率值。

再次，記憶體602含有可由該處理電路604執行之指令，藉此影像處理裝置600可操作以用於執行根據圖5之方法。

圖6進一步繪示包含如上文直接描述之電腦程式603的載體 605或程式載體。載體605可為電子信號、光信號、無線電信號及電腦可讀取媒體中之一者。

在一些具體實例中，影像處理裝置600及/或處理模組601可包含 偵測模組 610、 確定模組 620、 遮蔽模組 630及 計數模組 640中之一或多者，作為例示性硬體模組。在其他實例中，前述例示性硬體模組中之一或多者可實施為一或多個軟體模組。

此外，處理模組601可包含輸入 / 輸出單元 606。根據一具體實例，輸入/輸出單元606可包含經組態用於捕獲上文所描述之原始影像框（諸如來自影像感測器301之視訊串流310中所包含的原始影像框）的影像感測器。

根據上述各種具體實例，影像處理裝置600及/或處理模組601及/或偵測模組610經組態以自影像處理裝置600之影像感測器301接收影像串流310之所捕獲影像框311、312。

影像處理裝置600及/或處理模組601及/或偵測模組610經組態以在由多攝影機系統400之第一攝影機401捕獲的影像框之第一串流421中捕獲的場景之第一區域441中偵測第一物件431或第一物件431之第一部分431a。

影像處理裝置600及/或處理模組601及/或確定模組620經進一步組態以基於第一物件431或第一物件431之第一部分431a的特性確定第一機率值，該第一機率值指示所偵測第一物件431或第一部分431a屬於物件類型的第一機率。

影像處理裝置600及/或處理模組601及/或偵測模組610經進一步組態以在由攝影機系統400之第二攝影機402在影像框之第二串流422中捕獲的場景之第二區域442中偵測第二物件432或第二物件432之第二部分432a。第二攝影機402不同於第一攝影機401。第二區域442至少部分地與第一區域441重疊。

影像處理裝置600及/或處理模組601及/或確定模組620經進一步組態以基於第二物件432或第二物件432之第二部分432a的特性確定第二機率值，該第二機率值指示所偵測第二物件432或第二部分432a屬於物件類型的第二機率。

影像處理裝置600及/或處理模組601及/或偵測模組610經進一步組態以在第二機率值低於第二臨限值且第一機率值高於第一臨限值時藉由增大第二機率值來確定經更新第二機率值。

影像處理裝置600及/或處理模組601及/或確定模組620可經進一步組態以基於第一機率值增大第二機率值。

影像處理裝置600及/或處理模組601及/或確定模組620可經進一步組態以藉由確定第一機率值與第一臨限值之間的差且基於該差增大第二機率值而基於第一機率值增大第二機率值。

影像處理裝置600及/或處理模組601及/或遮蔽模組630可進一步經組態以在經更新第二機率值高於第二臨限值時將隱私遮罩應用於影像框之第二串流422中的第二物件432之至少部分。

影像處理裝置600及/或處理模組601及/或計數模組640可經進一步組態以在經更新第二機率值高於第二臨限值時增大與影像框之第二串流422相關聯的計數器值。

影像處理裝置600及/或處理模組601及/或確定模組620可經進一步組態以在第二機率值除了低於第二臨限值以外亦高於第三臨限值時增大第二機率值。

影像處理裝置600及/或處理模組601及/或確定模組620可經進一步組態以確定第二物件432或第二物件之第二部分432a與第一物件431或第一物件431之第一部分431a共同定位於第二區域442與第一區域441之重疊區域中，且回應於確定第二物件432或第二物件432之第二部分432a與第一物件431或第一物件431之第一部分431a共同定位於重疊區域中而確定經更新第二機率值。

如本文中所使用，術語「模組」可指一或多個功能模組，其各者可實施為一或多個硬體模組及/或一或多個軟體模組及/或組合軟體/硬體模組。在一些實例中，模組可表示實現為軟體及/或硬體之功能單元。

如本文中所使用，術語「電腦程式載體」、「程式載體」或「載體」可指電子信號、光學信號、無線電信號及電腦可讀取媒體中之一者。在一些實例中，電腦程式載體可不包括暫時傳播信號，諸如電子、光學及/或無線電信號。因此，在此等實例中，電腦程式載體可為非暫時性載體，諸如非暫時性電腦可讀取媒體。

如本文中所使用，術語「處理模組」可包括一或多個硬體模組、一或多個軟體模組或其組合。任何此類模組，無論為硬體、軟體或組合式硬體軟體模組，皆可為如本文中所揭示之連接構件、提供構件、組態構件、回應構件、停用構件或其類似者。作為一實例，表述「構件」可為對應於上文結合諸圖所列之模組的模組。

如本文中所使用，術語「軟體模組」可指軟體應用程式、動態鏈路庫（Dynamic Link Library；DLL）、軟體組件、軟體物件、根據組件物件模型（Component Object Mode；COM）之物件、軟體組件、軟體功能、軟體引擎、可執行二進位軟體檔案或其類似者。

術語「處理模組」或「處理電路」在本文中可涵蓋處理單元，該處理單元包含例如一或多個處理器、特殊應用積體電路（Application Specific integrated Circuit；ASIC）、場可程式化閘陣列（Field-Programmable Gate Array；FPGA）或其類似者。處理電路或其類似者可包含一或多個處理器核心。

如本文中所使用，表述「經組態以/用於」可意謂處理電路經組態以諸如借助於軟體組態及/或硬體組態經調適以或可操作以執行本文中所描述之動作中之一或多者。

如本文中所使用，術語「動作」可指動作、步驟、操作、回應、反應、活動或其類似者。應注意，本文中之動作可在適用時拆分成兩個或更多個子動作。此外，亦應注意，本文中所描述之動作中之兩者或多於兩者亦可在適用時合併成單一動作。

如本文中所使用，術語「記憶體」可指硬碟、磁性儲存媒體、攜帶型電腦磁盤或光碟、快閃記憶體、隨機存取記憶體（Random Access Memory；RAM）或其類似者。此外，術語「記憶體」可指處理器之內部暫存器記憶體或其類似者。

如本文中所使用，術語「電腦可讀取媒體」可為通用序列匯流排（Universal Serial Bus；USB）記憶體、DVD光碟、藍光光碟、作為資料串流接收之軟體模組、快閃記憶體、硬碟機、記憶卡，諸如MemoryStick、多媒體卡（Multimedia Card；MMC）、安全數位（Secure Digital；SD）卡等。電腦可讀取媒體之前述實例中之一或多者可提供為一或多個電腦程式產品。

如本文中所使用，術語「電腦可讀取程式碼單元」可為電腦程式之文本、以經編譯格式表示電腦程式的整個二進位檔案或其部分，或在其之間的任何內容。

如本文中所使用，術語「數目」及/或「值」可為任何種類之數目，諸如二進位、實數、虛數或有理數或其類似者。此外，「數目」及/或「值」可為一或多個字元，諸如字母或一串字母。「數目」及/或「值」亦可由一串位元表示，亦即，零及/或一。

如本文中所使用，表述「在一些具體實例中」已用以指示所描述具體實例之特徵可與本文中所揭示之任何其他具體實例組合。

儘管已描述各種態樣之具體實例，但許多不同更改、修改及其類似者對於所屬技術領域中具有通常知識者將變得顯而易見。因此所描述之具體實例並不意欲限制本發明之範圍。

110:影像捕獲裝置 120:視訊攝影機 130:無線通信裝置 140:汽車 201:數位影像 250:視訊網路系統 260:視訊伺服器 270:視訊儲存器 280:監視器 295:使用者裝置 300:成像系統 301:影像感測器 302:影像信號處理器 302a:影像處理部分 302b:視訊後處理部分 303:編碼器 310:第一視訊串流 311:第一所捕獲影像框 312:第二所捕獲影像框 400:多攝影機系統 401:第一攝影機 402:第二攝影機 421:影像框之第一串流 421_2:影像框 422:影像框之第二串流 422_2:影像框 431:第一物件 431a:第一部分 432:第二物件 432a:第二部分 441:第一區域 442:第二區域 451:第一人類 452:第二人類 453:第三物件 460:視訊伺服器 501:動作 502:動作 503:動作 504:動作 505:動作 506:動作 507:動作 508:動作 600:影像處理裝置 601:處理模組 602:記憶體 603:電腦程式 604:處理電路 605:載體 606:輸入/輸出單元 610:偵測模組 620:確定模組 630:遮蔽模組 640:計數模組

將自以下實施方式及隨附圖式容易地理解本文所揭示之具體實例的各種態樣，包括其特定特徵及優點，其中： [圖1]繪示影像捕獲裝置之例示性具體實例， [圖2a]繪示視訊網路系統之例示性具體實例， [圖2b]繪示視訊網路系統及使用者裝置之例示性具體實例， [圖3]係繪示成像系統之例示性具體實例的示意性方塊圖， [圖4a]係繪示影像處理裝置中之方法之具體實例的示意性方塊圖， [圖4b]係繪示影像處理裝置中之方法之具體實例的示意性方塊圖， [圖4c]係繪示影像處理裝置中之方法之具體實例的示意性方塊圖， [圖4d]係繪示影像處理裝置中之方法之具體實例的示意性方塊圖， [圖5]係繪示影像處理裝置中之方法之具體實例的流程圖， [圖6]係繪示影像處理裝置之具體實例的方塊圖。

501:動作

502:動作

503:動作

504:動作

505:動作

506:動作

507:動作

508:動作

Claims

一種在一多攝影機系統（400）中執行之方法，其用於確定一機率值，該機率值指示在影像框之一串流（422）中捕獲的一物件屬於一物件類型的一機率，該方法包含：在由該多攝影機系統（400）之一第一攝影機（401）捕獲之影像框之一第一串流（421）中捕獲的一場景之一第一區域（441）中偵測（501）一第一物件（431）或該第一物件（431）之一第一部分（431a）；基於該第一物件（431）或該第一物件（431）之該第一部分（431a）的特性確定（502）一第一機率值，該第一機率值指示該所偵測第一物件（431）或第一部分（431a）屬於該物件類型的一第一機率；在由該攝影機系統（400）之不同於該第一攝影機（401）的一第二攝影機（402）在影像框之一第二串流（422）中捕獲的該場景之一第二區域（442）中偵測（504）一第二物件（432）或該第二物件（432）之一第二部分（432a），其中該第二區域（442）至少部分地與該第一區域（441）重疊；基於該第二物件（432）或該第二物件（432）之該第二部分（432a）的特性確定（505）一第二機率值，該第二機率值指示該所偵測第二物件（432）或該第二部分（432a）屬於該物件類型的一第二機率；及當該第二機率值低於一第二臨限值且該第一機率值高於一第一臨限值時，藉由增大該第二機率值來確定（507）一經更新第二機率值。
如請求項1之方法，其中該第二機率值之該增大係基於該第一機率值。
如請求項2之方法，其中基於該第一機率值的該第二機率值之該增大包含：確定該第一機率值與該第一臨限值之間的一差；及基於該差增大該第二機率值。
如請求項3之方法，其中基於該第一機率值的該第二機率值之該增大包含：用該差增大該第二機率值。
如請求項1至4中任一項之方法，其中該物件類型為待遮蔽之一物件類型，該些第一及第二臨限值係用於遮蔽待遮蔽之該物件類型的物件或物件之部分，該方法進一步包含：當該經更新第二機率值高於該第二臨限值時，在影像框之該第二串流（422）中將一隱私遮罩應用（508）於該第二物件（432）之至少一部分。
如請求項1至4中任一項之方法，其中該物件類型為待計數之一物件類型，該些第一及第二臨限值係用於計數待計數之該物件類型的物件或物件之部分，該方法進一步包含：當該經更新第二機率值高於該第二臨限值時，增大與影像框之該第二串流（422）相關聯的一計數器值。
如請求項1至4中任一項之方法，其中該些各別第一及第二臨限值對於物件或物件部分之該類型係特定的。
如請求項1至4中任一項之方法，其中用於藉由增大該第二機率值來確定該經更新第二機率值的一另外條件為該第二機率值除了低於該第二臨限值以外亦高於一第三臨限值。
如請求項1至4中任一項之方法，其進一步包含確定（506）該第二物件（432）或該第二物件之該第二部分（432a）與該第一物件（431）或該第一物件（431）之該第一部分（431a）共同定位於該第二區域（442）與該第一區域（441）之一重疊區域中；且回應於確定該第二物件（432）或該第二物件（432）之該第二部分（432a）與該第一物件（431）或該第一物件（431）之該第一部分（431a）共同定位於該重疊區域中而確定該經更新第二機率值。
如請求項1至4中任一項之方法，其中該第二部分（432a）之一第二物件部分類型為與該第一部分（431a）之一第一物件部分類型相同的物件部分類型。
一種多攝影機系統（400）之影像處理裝置（402，460），其經組態以執行如請求項1至10中任一項之方法。
如請求項11之影像處理裝置（402，460），其中該影像處理裝置（402，460）為一攝影機（402），諸如一監控攝影機，或一視訊伺服器（460）。
一種電腦程式（603），其包含電腦可讀取程式碼單元，該些電腦可讀取程式碼單元在一影像處理裝置（110）上執行時使該影像處理裝置（110）執行如請求項1至10中任一項之方法。
一種電腦可讀取媒體（605），其包含如請求項13之電腦程式。