TWI721510B

TWI721510B - 雙目圖像的深度估計方法、設備及儲存介質

Info

Publication number: TWI721510B
Application number: TW108126234A
Authority: TW
Inventors: 肖瑞超; 孫文秀; 楊成熙
Original assignee: 大陸商深圳市商湯科技有限公司
Priority date: 2018-07-27
Filing date: 2019-07-24
Publication date: 2021-03-11
Also published as: JP2021502626A; CN109191512B; SG11202003899WA; US11295466B2; TW202008310A; WO2020019765A1; CN109191512A; US20200258250A1; JP7123133B2

Abstract

本發明實施例公開了一種雙目圖像的深度估計方法及裝置、設備、程式及介質，其中，方法包括：將待處理雙目圖像輸入預定神經網路，得到視差圖像及其置信度圖像，其中，所述視差圖像中各像素在預設分佈的離散參數與該像素的置信度呈負相關關係；根據所述視差圖像得到所述待處理雙目圖像的深度圖像。本發明實施例可以在得到視差圖像的同時得到對應的置信度圖像，利用置信度圖像來對視差圖像進行檢測，從而獲得更加精確的深度圖像。

Description

雙目圖像的深度估計方法、設備及儲存介質

本發明涉及電腦視覺技術，尤其是一種雙目圖像的深度估計方法及裝置、電子設備、電腦程式及儲存介質。

隨著機器學習技術的發展，深度學習網路已經應用于眾多現實場景中，例如自動駕駛等。在這些應用中，預測結果是十分重要的，特別是在基於深度學習的回歸任務中，例如雙目立體匹配，通常預測結果都被假設為準確的。然而這樣的假設並不夠合理，若預測錯誤的像素出現在十分重要的區域，例如：比較細小的障礙物，可能會造成基於深度學習的避讓系統失靈。另外，將這些深度學習網路部署於其他場景中時也有可能出現較差甚至不合理的結果。

本發明實施例提供一種雙目圖像的深度估計方案。

根據本發明實施例的一個方面，提供一種雙目圖像的深度估計方法，包括：將待處理雙目圖像輸入預定神經網路，得到視差圖像及其置信度圖像，其中，所述視差圖像中各像素在預設分佈的離散參數與該像素的置信度呈負相關關係；根據所述視差圖像得到所述待處理雙目圖像的深度圖像。

可選地，在本發明上述方法實施例中，所述將待處理雙目圖像輸入預定神經網路，得到置信度圖像，包括：將所述待處理雙目圖像經過雙目立體匹配神經網路後，依次經過兩個卷積層和一個歸一化層得到所述置信度圖像。

可選地，在本發明上述任一方法實施例中，還包括：利用損失函數訓練所述預定神經網路，其中，所述損失函數由所述視差圖像中各像素的置信度及該像素在所述預設分佈的離散參數計算得到。

可選地，在本發明上述任一方法實施例中，所述損失函數包括：正則化項和調整所述視差圖像中各像素在所述損失函數中的權重的聚焦損失項。

可選地，在本發明上述任一方法實施例中，所述正則化項包括：與置信度相關的正則化項和與預定神經網路參數相關的正則化項。

可選地，在本發明上述任一方法實施例中，所述損失函數由所述視差圖像中各像素的置信度及該像素在所述預設分佈的離散參數計算得到，包括：基於所述視差圖像及其所述置信度圖像、所述預定神經網路參數和真實視差圖像，得到關於所述預定神經網路參數的似然函數；基於所述視差圖像中各像素服從的所述預設分佈，得到所述視差圖像中各像素的置信度與該像素在所述預設分佈的離散參數之間的負相關關係；基於所述視差圖像中各像素的置信度與該像素在所述預設分佈的離散參數之間的負相關關係，所述預定神經網路參數服從所述預設分佈，所述視差圖像中各像素的置信度服從非遞減的分佈，對所述似然函數取負對數，得到所述損失函數。

可選地，在本發明上述任一方法實施例中，所述預設分佈包括拉普拉斯分佈或者高斯分佈。

可選地，在本發明上述任一方法實施例中，回應於所述預設分佈為拉普拉斯分佈的情況，所述損失函數包括：由所述視差圖像與真實視差圖像中各像素的視差值的差值的絕對值與該像素的置信度的比值的平均值得到的聚焦損失項，由所述視差圖像中各像素的置信度的平均值得到的正則化項，和由所述預定神經網路參數得到的正則化項。

可選地，在本發明上述任一方法實施例中，回應於預設分佈為高斯分佈的情況，所述損失函數包括：由所述視差圖像與真實視差圖像中各像素的視差值的差值的平方與該像素的置信度的比值的平均值得到的聚焦損失項，由所述視差圖像中各像素的置信度的平均值得到的正則化項，和由所述預定神經網路參數得到的正則化項。

根據本發明實施例的另一個方面，提供一種雙目圖像的深度估計裝置，包括：視差圖像獲取單元，用於將待處理雙目圖像輸入預定神經網路，得到視差圖像及其置信度圖像，其中，所述視差圖像中各像素在預設分佈的的離散參數與該像素的置信度呈負相關關係；深度圖像獲取單元，用於根據所述視差圖像得到所述待處理雙目圖像的深度圖像。

可選地，在本發明上述裝置實施例中，所述視差圖像獲取單元，用於將所述待處理雙目圖像經過雙目立體匹配神經網路後，依次經過兩個卷積層和一個歸一化層得到所述置信度圖像。

可選地，在本發明上述任一裝置實施例中，還包括：神經網路訓練單元，用於利用損失函數訓練所述預定神經網路，其中，所述損失函數由所述視差圖像中各像素的置信度及該像素在所述預設分佈的離散參數計算得到。

可選地，在本發明上述任一裝置實施例中，所述損失函數包括：正則化項和調整所述視差圖像中各像素在所述損失函數中的權重的聚焦損失項。

可選地，在本發明上述任一裝置實施例中，所述正則化項包括：與置信度相關的正則化項和與預定神經網路參數相關的正則化項。

可選地，在本發明上述任一裝置實施例中，所述神經網路訓練單元，包括：損失函數獲得模組；所述損失函數獲得模組，用於基於所述視差圖像及其所述置信度圖像、所述預定神經網路參數和真實視差圖像，得到關於所述預定神經網路參數的似然函數；基於所述視差圖像中各像素服從的所述預設分佈，得到所述視差圖像中各像素的置信度與該像素在所述預設分佈的離散參數之間的負相關關係；以及基於所述視差圖像中各像素的置信度與該像素在所述預設分佈的離散參數之間的負相關關係，所述預定神經網路參數服從所述預設分佈，所述視差圖像中各像素的置信度服從非遞減的分佈，對所述似然函數取負對數，得到所述損失函數。

可選地，在本發明上述任一裝置實施例中，所述預設分佈包括拉普拉斯分佈或者高斯分佈。

可選地，在本發明上述任一裝置實施例中，回應於預設分佈為拉普拉斯分佈的情況，所述損失函數包括：由所述視差圖像與真實視差圖像中各像素的視差值的差值的絕對值與該像素的置信度的比值的平均值得到的聚焦損失項，由所述視差圖像中各像素的置信度的平均值得到的正則化項，和由所述預定神經網路參數得到的正則化項。

可選地，在本發明上述任一裝置實施例中，回應於預設分佈為高斯分佈的情況，所述損失函數包括：由所述視差圖像與真實視差圖像中各像素的視差值的差值的平方與該像素的置信度的比值的平均值得到的聚焦損失項，由所述視差圖像中各像素的置信度的平均值得到的正則化項，和由所述預定神經網路參數得到的正則化項。根據本發明實施例的又一個方面，提供的一種電子設備，包括上述任一實施例所述的裝置。

根據本發明實施例的再一個方面，提供的一種電子設備，包括：記憶體，用於儲存可執行指令；以及處理器，用於執行所述可執行指令從而完成上述任一實施例所述的方法。

根據本發明實施例的再一個方面，提供的一種電腦程式，包括電腦可讀代碼，當所述電腦可讀代碼在設備上運行時，所述設備中的處理器執行用於實現上述任一實施例所述方法的指令。

根據本發明實施例的再一個方面，提供的一種電腦儲存介質，用於儲存電腦可讀指令，所述指令被執行時實現上述任一實施例所述的方法。

基於本發明上述實施例提供的雙目圖像的深度估計方法及裝置、電子設備、電腦程式及儲存介質，通過將待處理雙目圖像輸入預定神經網路，得到視差圖像及其置信度圖像，其中視差圖像中各像素在預設分佈的離散參數與該像素的置信度呈負相關關係，然後根據視差圖像得到待處理雙目圖像的深度圖像，利用預定神經網路在得到視差圖像的同時得到對應的置信度圖像，可以通過無監督的學習方式得到視差圖像對應的置信度圖像，而不需要置信度標注作為監督，由於置信度具有物理意義，即視差圖像中各像素在預設分佈的離散參數與該像素的置信度呈負相關關係，因此可以利用置信度圖像來檢測視差圖像中可能出現錯誤的區域，說明分析視差圖像，得到更加精確的深度圖像。

下面通過附圖和實施例，對本發明的技術方案做進一步的詳細描述。

310:視差圖像獲取單元

320:深度圖像獲取單元

400:電子設備

401:中央處理單元(CPU)

402:唯讀記憶體(ROM)

403:隨機訪問記憶體

404:匯流排

405:I/O介面

406:輸入部分

407:輸出部分

408:儲存部分

409:通信部分

410:驅動器

411:可拆卸介質

412:通信部

413:影像處理器(GPU)

構成說明書的一部分的附圖描述了本發明的實施例，並且連同描述一起用於解釋本發明的原理。

參照附圖，根據下面的詳細描述，可以更加清楚地理解本發明，其中：圖1為本發明一些實施例的雙目圖像的深度估計方法的流程圖；圖2為本發明一些實施例的獲得包含置信度的損失函數的流程圖；圖3為本發明一些實施例的雙目圖像的深度估計裝置的結構示意圖；圖4為本發明一些實施例提供的電子設備的結構示意圖。

現在將參照附圖來詳細描述本發明的各種示例性實施例。應注意到：除非另外具體說明，否則在這些實施例中闡述的部件和步驟的相對佈置、數位運算式和數值不限制本發明的範圍。

同時，應當明白，為了便於描述，附圖中所示出的各個部分的尺寸並不是按照實際的比例關係繪製的。

以下對至少一個示例性實施例的描述實際上僅僅是說明性的，決不作為對本發明及其應用或使用的任何限制。

對於相關領域普通技術人員已知的技術、方法和設備可能不作詳細討論，但在適當情況下，所述技術、方法和設備應當被視為說明書的一部分。

應注意到：相似的標號和字母在下面的附圖中表示類似項，因此，一旦某一項在一個附圖中被定義，則在隨後的附圖中不需要對其進行進一步討論。

本發明實施例可以應用於電腦系統/伺服器，其可與眾多其它通用或專用計算系統環境或配置一起操作。適於與電腦系統/伺服器一起使用的眾所周知的計算系統、環境和/或配置的例子包括但不限於：個人電腦系統、伺服器電腦系統、瘦客戶機、厚客戶機、手持或膝上設備、基於微處理器的系統、機上盒、可程式設計消費電子產品、網路個人電腦、小型電腦系統、大型電腦系統和包括上述任何系統的分散式雲計算技術環境，等等。

電腦系統/伺服器可以在由電腦系統執行的電腦系統可執行指令(諸如程式模組)的一般語境下描述。通常，程式模組可以包括常式、程式、目的程式、元件、邏輯、資料結構等等，它們執行特定的任務或者實現特定的抽象資料類型。電腦系統/伺服器可以在分散式雲計算環境中實施，分散式雲計算環境中，任務是由通過通信網路連結的遠端處理設備執行的。在分散式雲計算環境中，程式模組可以位於包括存放裝置的本地或遠端計算系統儲存介質上。

圖1是本發明一些實施例的雙目圖像的深度估計方法的流程圖。如圖1所示，該方法包括：102，將待處理雙目圖像輸入預定神經網路，得到視差圖像及其置信度圖像。

在本實施例中，待處理雙目圖像可以是從圖像採集設備直接獲取的圖像，例如：圖像採集設備為攝像機等，也可以從存放裝置獲取的預先儲存的圖像，例如：存放裝置為U盤等，還可以是通過網路從網站伺服器獲取的圖像，從本實施例對待處理雙目圖像的獲得方式不作限定。將待處理雙目圖像的左視圖和右視圖，或者待處理雙目圖像的上視圖和下視圖輸入預定神經網路，得到視差圖像及其置信度圖像。左視圖、右視圖、上視圖和下視圖為相對的兩個視圖，具體還可以為其他稱謂，本實施例不做具體限定，在後續的實施例中採用左視圖、右視圖來描述。視差圖像可以是以左視圖為基準得到的左視圖對應的視差圖像，也可以是以右視圖為基準得到的右視圖對應的視差圖像，本實施例對此不作限定。置信度圖像可以是基於視差圖像獲得反應視差圖像中各像素的置信度的圖像，其中，視差圖像中各像素在預設分佈的離散參數與該像素的置信度呈負相關關係，離散參數包括但不限於標準差參數。

在本實施例中，預定神經網路可以是在對待處理雙目圖像的左視圖和右視圖進行處理之前，預先確定的神經網路，此時通過預定神經網路可以獲得需要的視差圖像，預定神經網路也可以是在對待處理雙目圖像的左視圖和右視圖進行處理之前，預先訓練的神經網路，此時待處理雙目圖像的左視圖和右視圖可以是從訓練資料集中獲取的圖像，可以通過待處理雙目圖像的左視圖和右視圖對預定神經網路進行訓練。

在一個可選的例子中，預定神經網路可以包括：雙目立體匹配神經網路、兩個卷積層和一個歸一化(Sigmoid)層，可以將待處理雙目圖像的左視圖和右視圖經過雙目立體匹配神經網路後，依次經過兩個卷積層和一個歸一化層得到置信度圖像。本實施例對獲得置信度圖像的網路結構不作限定。

104，根據視差圖像得到待處理雙目圖像的深度圖像。

可選地，在獲得待處理雙目圖像的視差圖像後，可以根據相機成像的投影模型，通過深度資訊與視差資訊的幾何運算關係，獲得待處理雙目圖像的深度圖像，本實施例對根據視差圖像獲得深度圖像的方法不作限定。

本實施例提供的雙目圖像的深度估計方法，通過將待處理雙目圖像的左視圖和右視圖輸入預定神經網路，得到視差圖像及其置信度圖像，其中視差圖像中各像素在預設分佈的離散參數與該像素的置信度呈負相關關係，然後根據視差圖像得到待處理雙目圖像的深度圖像，利用預定神經網路在得到視差圖像的同時得到對應的置信度圖像，可以通過無監督的學習方式得到視差圖像對應的置信度圖像，而不需要置信度標注作為監督，由於置信度具有物理意義，即視差圖像中各像素在預設分佈的離散參數與該像素的置信度呈負相關關係，因此可以利用置信度圖像來檢測視差圖像中可能出現錯誤的區域，說明分析視差圖像，得到更加精確的深度圖像。

在一些實施例中，可以利用損失函數訓練預定神經網路，其中，損失函數可以由視差圖像中各像素的置信度及該像素在預設分佈的離散參數計算得到，即根據置信度的物理意義：視差圖像中各像素在預設分佈的離散參數與該像素的置信度呈負相關關係，可以得到包含置信度的損失函數，利用損失函數中的置信度可以優化損失函數，使利用該損失函數訓練得到的預定神經網路具有更好的魯棒性。

可選地，損失函數可以包括：聚焦損失項和正則化項，其中，聚焦損失項可以通過置信度自動調整視差圖像中各像素在損失函數中的權重，使視差圖像中置信度較高的像素具有較大的權重，視差圖像中置信度較低的像素具有較小的權重，從而可以將學習得到的置信度同步應用到預定神經網路的訓練過程中，減小輸入資料中的雜訊帶來的影響，例如：輸入資料中的雜訊為待處理雙目圖像中被遮擋的區域等，使預定神經網路可以收斂於更優的階段，具有更好的魯棒性。

可選地，損失函數中的正則化項可以包括：與置信度相關的正則化項和與預定神經網路參數相關的正則化項，其中，與置信度相關的正則化項可以使視差圖像中置信度較低的像素的損失權重不會過小，從而保證訓練的效率，與預定神經網路參數相關的正則化項，也成為權重正則化項，可以防止在訓練過程中預定神經網路過擬合。

圖2為本發明一些實施例的獲得包含置信度的損失函數的流程圖。如圖2所示，該方法包括：202，基於待處理雙目圖像的視差圖像及其置信度圖像、預定神經網路參數和真實視差圖像，得到關於預定神經網路參數的似然函數。

可選地，可以基於待處理雙目圖像的視差圖像及其置信度圖像、預定神經網路參數和真實視差圖像，根據貝葉斯概率論得到關於預定神經網路參數的似然函數。

204，基於視差圖像中各像素服從的預設分佈，得到視差圖像中各像素的置信度與該像素在預設分佈的離散參數之間的負相關關係。

可選地，可以通過使視差圖像中的各像素服從不同標準差的預設分佈，得到視差圖像中各像素的置信度與該像素在預設分佈的離散參數之間的負相關關係。

206，基於視差圖像中各像素的置信度與該像素在預設分佈的離散參數之間的負相關關係，預定神經網路參數服從預設分佈，視差圖像中各像素的置信度服從非遞減的分佈，對似然函數取負對數，得到損失函數。

可選地，預定神經網路參數可以服從均值為零、標準差為1的預設分佈。

可選地，預設分佈可以為拉普拉斯分佈或者高斯分佈。

在一些實施例中，回應於預設分佈為拉普拉斯分佈的情況，損失函數包括：由待處理雙目圖像的視差圖像與真實視差圖像中各像素的視差值的差值的絕對值與該像素的置信度的比值的平均值得到的聚焦損失項，由視差圖像中各像素的置信度的平均值得到的正則化項，和由預定神經網路參數得到的正則化項。

其中，根據貝葉斯概率論，基於待處理雙目圖像的視差圖像及其置信度圖像、預定神經網路參數和真實視差圖像，得到關於預定神經網路參數的似然函數為：

其中，x={x₁，x₂，...，x_T}為待處理雙目圖像，y={y ₁，y ₂，...，y _N}為真實視差圖像，其中T和N分別為待處理雙目圖像和真實視差圖像中的像素數量，w為預定神經網路的參數，c={c ₁，c ₂，...，c _N}為置信度圖像。

根據視差圖像中各像素服從不同標準差的拉普拉斯分佈：

得到視差圖像中各像素的置信度與該像素在拉普拉斯分佈的離散參數之間的負相關關係為：b _i=f(c _i)=-kc _i+a (公式三)

其中，b={b ₁，b ₂，...，b _N}為不同標準差的拉普拉斯分佈，b _i為拉普拉斯分佈的標準差參數，即離散參數，c _i

[0,1]作為一個隨機變數，以b _i與c _i的線性遞減函數表示負相關關係，k和a為滿足a

k+1的兩個正常數，使得總是滿足b _i

1。

根據預定神經網路參數服從均值為零、標準差為1的拉普拉斯分佈：

根據視差圖像中各像素的置信度服從非遞減的分佈，其中γ

0：

將公式二、公式三、公式四和公式五帶入公式一，對似然函數取負對數，得到損失函數：

(公式六)聚焦損失項置信度正則化項權重正則化項

在另一些實施例中，回應於預設分佈為高斯分佈的情況，損失函數包括：由待處理雙目圖像的視差圖像與真實標視差圖像中各像素的視差值的差值的平方與該像素的置信度的比值的平均值得到的聚焦損失項，由視差圖像中各像素的置信度的平均值得到的正則化項，和由預定神經網路參數得到的正則化項。

根據視差圖像中各像素服從不同標準差的高斯分佈：

(公式七)

得到視差圖像中各像素的置信度與該像素在高斯分佈的離散參數之間的負相關關係為：b _i=f(c _i)=-kc _i+a (公式三)

其中，b={b ₁，b ₂，...，b _N}為不同標準差的高斯分佈，b _i為高斯分佈的標準差參數，即離散參數，c _i

k+1的兩個正常數，使得總是滿足b _i

1。

根據預定神經網路參數服從均值為零、標準差為1的高斯分佈：

根據視差圖像中各像素的置信度服從非遞減的分佈，其中γ

0：

將公式七、公式三、公式八和公式五帶入公式一，對似然函數取負對數，得到損失函數：

本發明上述各實施例的方法，可以應用於移動終端或者自動駕駛等設備的影像處理，其中，移動終端例如為手機、平板電腦等。

圖3是本發明一些實施例的雙目圖像的深度估計裝置的結構示意圖。

如圖3所示，該裝置包括：視差圖像獲取單元310和深度圖像獲取單元320。其中，視差圖像獲取單元310，用於將待處理雙目圖像輸入預定神經網路，得到視差圖像及其置信度圖像。

在一個可選的例子中，預定神經網路可以包括：雙目立體匹配神經網路、兩個卷積層和一個歸一化(Sigmoid)層，視差圖像獲取單元310可以將待處理雙目圖像的左視圖和右視圖經過雙目立體匹配神經網路後，依次經過兩個卷積層和一個歸一化層得到置信度圖像。本實施例對獲得置信度圖像的網路結構不作限定。

深度圖像獲取單元320，用於根據視差圖像得到待處理雙目圖像的深度圖像。

本實施例提供的雙目圖像的深度估計裝置，通過將待處理雙目圖像的左視圖和右視圖輸入預定神經網路，得到視差圖像及其置信度圖像，其中視差圖像中各像素在預設分佈的離散參數與該像素的置信度呈負相關關係，然後根據視差圖像得到待處理雙目圖像的深度圖像，利用預定神經網路在得到視差圖像的同時得到對應的置信度圖像，可以通過無監督的學習方式得到視差圖像對應的置信度圖像，而不需要置信度標注作為監督，由於置信度具有物理意義，即視差圖像中各像素在預設分佈的離散參數與該像素的置信度呈負相關關係，因此可以利用置信度圖像來檢測視差圖像中可能出現錯誤的區域，說明分析視差圖像，得到更加精確的深度圖像。

在一些實施例中，雙目圖像的深度估計裝置還可以包括：神經網路訓練單元，用於利用損失函數訓練預定神經網路，其中，損失函數可以由視差像圖中各像素的置信度及該像素在預設分佈的離散參數計算得到，即根據置信度的物理意義：視差圖像中各像素在預設分佈的離散參數與該像素的置信度呈負相關關係，可以得到包含置信度的損失函數，利用損失函數中的置信度可以優化損失函數，使利用該損失函數訓練得到的預定神經網路具有更好的魯棒性。

可選地，損失函數可以包括：聚焦損失項和正則化項，其中，聚焦損失項可以通過置信度自動調整視差圖像中各像素在損失函數中的權重，使視差像圖中置信度較高的像素具有較大的權重，視差圖像中置信度較低的像素具有較小的權重，從而可以將學習得到的置信度同步應用到預定神經網路的訓練過程中，減小輸入資料中的雜訊帶來的影響，例如：輸入資料中的雜訊為待處理雙目圖像中被遮擋的區域等，使預定神經網路可以收斂於更優的階段，具有更好的魯棒性。

可選地，神經網路訓練單元可以包括：損失函數獲得模組，用於獲得包含置信度的損失函數。

在一個可選的例子中，損失函數獲得模組，可以基於待處理雙目圖像的視差圖像及其置信度圖像、預定神經網路參數和真實視差圖像，得到關於預定神經網路參數的似然函數；基於視差圖像中各像素服從的預設分佈，得到視差圖像中各像素的置信度與該像素在預設分佈的離散參數之間的負相關關係；以及基於視差圖像中各像素的置信度與該像素在預設分佈的離散參數之間的負相關關係，預定神經網路參數服從預設分佈，視差圖像中各像素的置信度服從非遞減的分佈，對似然函數取負對數，得到損失函數。

可選地，損失函數獲得模組可以基於待處理雙目圖像的視差圖像及其置信度圖像、預定神經網路參數和真實視差圖像，根據貝葉斯概率論得到關於預定神經網路參數的似然函數。

可選地，損失函數獲得模組可以通過使視差圖像中的各像素服從不同標準差的預設分佈，得到視差圖像中各像素的置信度與該像素在預設分佈的離散參數之間的負相關關係。

可選地，預設分佈可以為拉普拉斯分佈或者高斯分佈。

在另一些實施例中，回應於預設分佈為高斯分佈的情況，損失函數包括：由待處理雙目圖像的視差圖像與真實視差圖像中各像素的視差值的差值的平方與該像素的置信度的比值的平均值得到的聚焦損失項，由視差圖像中各像素的置信度的平均值得到的正則化項，和由預定神經網路參數得到的正則化項。

本發明實施例還提供了一種電子設備，例如可以是移動終端、個人電腦(PC)、平板電腦、伺服器等。下面參考圖4，其示出了適於用來實現本申請實施例的終端設備或伺服器的電子設備400的結構示意圖：如圖4所示，電子設備400包括一個或多個處理器、通信部等，所述一個或多個處理器例如：一個或多個中央處理單元(CPU)401，和/或一個或多個影像處理器(GPU)413等，處理器可以根據儲存在唯讀記憶體(ROM)402中的可執行指令或者從儲存部分408載入到隨機訪問記憶體(RAM)403中的可執行指令而執行各種適當的動作和處理。通信部412可包括但不限於網卡，所述網卡可包括但不限於IB(Infiniband)網卡，處理器可與唯讀記憶體402和/或隨機訪問記憶體403中通信以執行可執行指令，通過匯流排404與通信部412相連、並經通信部412與其他目標設備通信，從而完成本申請實施例提供的任一項方法對應的操作，例如，將待處理雙目圖像的左視圖和右視圖輸入預定神經網路，得到視差圖像及其置信度圖像，其中，所述視差圖像中各像素在預設分佈的離散參數與該像素的置信度呈負相關關係；根據所述視差圖像得到所述待處理雙目圖像的深度圖像。

此外，在RAM 403中，還可儲存有裝置操作所需的各種程式和資料。CPU401、ROM402以及 RAM403通過匯流排404彼此相連。在有RAM403的情況下，ROM402為可選模組。RAM403儲存可執行指令，或在運行時向ROM402中寫入可執行指令，可執行指令使中央處理單元401執行上述通信方法對應的操作。輸入/輸出(I/O)介面405也連接至匯流排404。通信部412可以集成設置，也可以設置為具有多個子模組(例如多個IB網卡)，並在匯流排連結上。

以下部件連接至I/O介面405：包括鍵盤、滑鼠等的輸入部分406；包括諸如陰極射線管(CRT)、液晶顯示器(LCD)等以及揚聲器等的輸出部分407；包括硬碟等的儲存部分408；以及包括諸如LAN卡、數據機等的網路介面卡的通信部分409。通信部分409經由諸如網際網路的網路執行通信處理。驅動器410也根據需要連接至I/O介面405。可拆卸介質411，諸如磁片、光碟、磁光碟、半導體記憶體等等，根據需要安裝在驅動器410上，以便於從其上讀出的電腦程式根據需要被安裝入儲存部分408。

需要說明的，如圖4所示的架構僅為一種可選實現方式，在具體實踐過程中，可根據實際需要對上述圖4的部件數量和類型進行選擇、刪減、增加或替換；在不同功能部件設置上，也可採用分離設置或集成設置等實現方式，例如GPU413和CPU401可分離設置或者可將GPU413集成在CPU401上，通信部可分離設置，也可集成設置在CPU401或GPU413上，等等。這些可替換的實施方式均落入本發明公開的保護範圍。

特別地，根據本發明的實施例，上文參考流程圖描述的過程可以被實現為電腦軟體程式。例如，本發明的實施例包括一種電腦程式產品，其包括有形地包含在機器可讀介質上的電腦程式，電腦程式包含用於執行流程圖所示的方法的程式碼，程式碼可包括對應執行本申請實施例提供的方法步驟對應的指令，例如，將待處理雙目圖像的左視圖和右視圖輸入預定神經網路，得到視差圖像及其置信度圖像，其中，所述視差圖像中各像素在預設分佈的離散參數與該像素的置信度呈負相關關係；根據所述視差圖像得到所述待處理雙目圖像的深度圖像。在這樣的實施例中，該電腦程式可以通過通信部分409從網路上被下載和安裝，和/或從可拆卸介質411被安裝。在該電腦程式被中央處理單元(CPU)401執行時，執行本申請的方法中限定的上述功能。

在一個或多個可選實施方式中，本發明實施例還提供了一種電腦程式程式產品，用於儲存電腦可讀指令，該指令被執行時使得電腦執行上述任一可能的實現方式中的雙目圖像的深度估計方法。

該電腦程式產品可以具體通過硬體、軟體或其結合的方式實現。在一個可選例子中，該電腦程式產品具體體現為電腦儲存介質，在另一個可選例子中，該電腦程式產品具體體現為軟體產品，例如軟體發展包(Software Development Kit，SDK)等等。

在一個或多個可選實施方式中，本發明實施例還提供了一種雙目圖像的深度估計方法及其對應的裝置、電子設備、電腦儲存介質、電腦程式以及電腦程式產品，其中，該方法包括：第一裝置向第二裝置發送基於雙目圖像的深度估計指示，該指示使得第二裝置執行上述任一可能的實施例中的雙目圖像的深度估計方法；第一裝置接收第二裝置發送的雙目圖像的深度估計的結果。

在一些實施例中，該雙目圖像的深度估計指示可以具體為調用指令，第一裝置可以通過調用的方式指示第二裝置執行雙目圖像的深度估計，相應地，回應於接收到調用指令，第二裝置可以執行上述雙目圖像的深度估計方法中的任意實施例中的步驟和/或流程。

應理解，本發明實施例中的“第一”、“第二”等術語僅僅是為了區分，而不應理解成對本發明實施例的限定。

還應理解，在本發明中，“多個”可以指兩個或兩個以上，“至少一個”可以指一個、兩個或兩個以上。

還應理解，對於本發明中提及的任一部件、資料或結構，在沒有明確限定或者在前後文給出相反啟示的情況下，一般可以理解為一個或多個。

還應理解，本發明對各個實施例的描述著重強調各個實施例之間的不同之處，其相同或相似之處可以相互參考，為了簡潔，不再一一贅述。

可能以許多方式來實現本發明的方法和裝置。例如，可通過軟體、硬體、固件或者軟體、硬體、固件的任何組合來實現本發明的方法和裝置。用於所述方法的步驟的上述順序僅是為了進行說明，本發明的方法的步驟不限於以上具體描述的順序，除非以其它方式特別說明。此外，在一些實施例中，還可將本發明實施為記錄在記錄介質中的程式，這些程式包括用於實現根據本發明的方法的機器可讀指令。因而，本發明還覆蓋儲存用於執行根據本發明的方法的程式的記錄介質。

本發明的描述是為了示例和描述起見而給出的，而並不是無遺漏的或者將本發明限於所公開的形式。很多修改和變化對於本領域的普通技術人員而言是顯然的。選擇和描述實施例是為了更好說明本發明的原理和實際應用，並且使本領域的普通技術人員能夠理解本發明從而設計適於特定用途的帶有各種修改的各種實施例。

102:將待處理雙目圖像輸入預定神經網路，得到視差圖像及其置信度圖像

104:根據視差圖像得到待處理雙目圖像的深度圖像

Claims

一種雙目圖像的深度估計方法，包括：將待處理雙目圖像輸入預定神經網路，得到視差圖像及其置信度圖像，其中，所述視差圖像中各像素在預設分佈的離散參數與該像素的置信度呈負相關關係，所述預定神經網路利用損失函數訓練得到，所述損失函數由所述視差圖像中各像素的置信度及該像素在所述預設分佈的離散參數計算得到；根據所述視差圖像得到所述待處理雙目圖像的深度圖像。
根據請求項1所述的方法，其中，所述將待處理雙目圖像輸入預定神經網路，得到置信度圖像，包括：將所述待處理雙目圖像經過雙目立體匹配神經網路後，依次經過兩個卷積層和一個歸一化層得到所述置信度圖像。
根據請求項1所述的方法，其中，所述損失函數包括：正則化項和調整所述視差圖像中各像素在所述損失函數中的權重的聚焦損失項。
根據請求項3所述的方法，其中，所述正則化項包括：與置信度相關的正則化項和與預定神經網路參數相關的正則化項。
根據請求項1所述的方法，其中，所述損失函數由所述視差圖像中各像素的置信度及該像素在所述預設分佈的離散參數計算得到，包括：基於所述視差圖像及其所述置信度圖像、所述預定神經網路參數和真實視差圖像，得到關於所述預定神經網路參數的似然函數；基於所述視差圖像中各像素服從的所述預設分佈，得到所述視差圖像中各像素的置信度與該像素在所述預設分佈的離散參數之間的負相關關係；基於所述視差圖像中各像素的置信度與該像素在所述預設分佈的離散參數之間的負相關關係，所述預定神經網路參數服從所述預設分佈，所述視差圖像中各像素的置信度服從非遞減的分佈，對所述似然函數取負對數，得到所述損失函數。
根據請求項1所述的方法，其中，所述預設分佈包括拉普拉斯分佈或者高斯分佈。
根據請求項6所述的方法，其中，回應於所述預設分佈為拉普拉斯分佈的情況，所述損失函數包括：由所述視差圖像與真實視差圖像中各像素的視差值的差值的絕對值與該像素的置信度的比值的平均值得到的聚焦損失項，由所述視差圖像中各像素的置信度的平均值得到的正則化項，和由所述預定神經網路參數得到的正則化項。
根據請求項6所述的方法，其中，回應於預設分佈為高斯分佈的情況，所述損失函數包括：由所述視差圖像與真實視差圖像中各像素的視差值的差值的平方與該像素的置信度的比值的平均值得到的聚焦損失項，由所述視差圖像中各像素的置信度的平均值得到的正則化項，和由所述預定神經網路參數得到的正則化項。
一種電子設備，包括：記憶體，用於儲存可執行指令；以及處理器，用於執行所述可執行指令從而完成請求項1至8中任意一項所述的方法。
一種電腦儲存介質，用於儲存電腦可讀取的指令，其特徵在於，所述指令被執行時實現請求項1至8中任意一項所述的方法。