TW202011263A

TW202011263A - 基於定損圖像判定模型的圖像處理方法和裝置

Info

Publication number: TW202011263A
Application number: TW108119500A
Authority: TW
Inventors: 郭昕; 程遠; 黃俊
Original assignee: 香港商阿里巴巴集團服務有限公司
Priority date: 2018-08-31
Filing date: 2019-06-05
Publication date: 2020-03-16
Also published as: CN110569695A; CN110569695B; WO2020047440A1; US11216690B2; US20200074222A1

Abstract

本說明書實施例提供了一種訓練定損圖像判定模型的方法、裝置以及一種圖像處理方法和裝置，該圖像處理方法包括：獲取事故車輛的視頻流；從該視頻流先後獲取以第一順序排列的多個圖像；獲取該多個圖像各自的特徵資訊；以及透過以該第一順序將該多個圖像各自的特徵資訊先後輸入透過該模型訓練方法訓練的定損圖像判定模型，分別確定該多個圖像是否為定損圖像，其中該定損圖像為用於對該事故車輛進行定損的圖像。

Description

基於定損圖像判定模型的圖像處理方法和裝置

本說明書實施例涉及圖像處理技術領域，更具體地，涉及一種訓練定損圖像判定模型的方法和裝置、以及一種圖像處理方法和裝置。

在常規的車險理賠場景中,保險公司需要派出專業的查勘定損人員到事故現場進行現場查勘定損，給出車輛的維修方案和賠償金額，拍攝現場照片，並將定損照片留檔以供核查人員核損核價。由於需要人工查勘定損，保險公司需要投入大量的人力成本，和專業知識的培訓成本。從普通用戶的體驗來說，理賠流程由於等待人工查勘員現場拍照、定損員在維修地點定損、核損人員在後台核損，理賠週期較長。隨著互聯網的發展，出現一種理賠方案，其中，透過用戶在現場拍攝車損照片，並將該照片上傳至伺服器，從而透過演算法或人工基於該車損照片進行定損和理賠。然而，在該方案中，通常對拍攝的照片有一定的要求，而用戶通常很難做到符合這些要求。針對這樣的需求，在現有技術中，由保險公司客服透過手機視頻共享功能，實時查看用戶的拍攝全過程，並透過語音等方式與用戶溝通以確定將要截取的用於定損的圖像。因此，需要一種更有效的獲取車輛定損圖像的方案。

本說明書實施例旨在提供一種更有效的訓練定損圖像判定模型的方法和裝置、以及圖像處理方法和裝置，以解決現有技術中的不足。為實現上述目的，本說明書一個方面提供一種訓練定損圖像判定模型的方法，該模型包括循環神經網路，該方法包括：獲取以第一順序排列的多個樣本，該多個樣本與多個圖像分別對應，其中，該多個圖像先後取自於事故車輛的視頻流，其中，每個樣本包括對應圖像的特徵資訊、以及對應圖像的標籤值，該標籤值指示對應圖像是否為定損圖像，其中，該定損圖像為用於對該事故車輛進行定損的圖像；以及使用該多個樣本訓練該模型，以使得相比於訓練前，訓練後的該模型的與該多個樣本對應的預測損失函數減小。在一個實施例中，在該訓練定損圖像判定模型的方法中，該循環神經網路為以下一種：LSTM、RNN、GRU。在一個實施例中，在該訓練定損圖像判定模型的方法中，該特徵資訊包括以下至少一種特徵：屬性特徵、語義特徵、以及光流特徵。本說明書另一方面提供一種圖像處理方法，包括：獲取事故車輛的視頻流；從該視頻流先後獲取以第一順序排列的多個圖像；獲取該多個圖像各自的特徵資訊；以及透過以該第一順序將該多個圖像各自的特徵資訊先後輸入透過上述模型訓練方法訓練的定損圖像判定模型，分別確定該多個圖像是否為定損圖像，其中該定損圖像為用於對該事故車輛進行定損的圖像。在一個實施例中，在該圖像處理方法中，該方法在移動設備端執行，該移動設備包括攝影鏡頭，其中，獲取事故車輛的視頻流包括，根據用戶指令，透過該攝影鏡頭採集事故車輛的視頻流。在一個實施例中，在該圖像處理方法中，獲取該多個圖像各自的特徵資訊包括，透過以該第一順序將該多個圖像先後輸入預定分類模型，獲取該多個圖像各自的屬性特徵。在一個實施例中，在該圖像處理方法中，該預定分類模型進行以下至少一種關於圖像的分類：是否模糊、是否包括車輛損傷、是否光照充足、拍攝角度是否偏斜、以及拍攝距離是否合適。在一個實施例中，在該圖像處理方法中，獲取該多個圖像各自的特徵資訊包括，透過以該第一順序將該多個圖像先後輸入目標檢測及分割模型，獲取該多個圖像各自的語義特徵。在一個實施例中，在該圖像處理方法中，該語義特徵包括以下至少一項：目標框個數、分割類別數、最大目標框的圖像占比、以及最大分割類別的圖像占比。在一個實施例中，在該圖像處理方法中，獲取該多個圖像各自的特徵資訊包括，透過以該第一順序將該多個圖像先後輸入光流模型，獲取該多個圖像各自的光流特徵。在一個實施例中，在該圖像處理方法中，該多個圖像中包括第一圖像，其中，分別確定該多個圖像是否為定損圖像包括，確定該第一圖像是否為定損圖像，該方法還包括，在確定該第一圖像為定損圖像的情況中，將該第一圖像上傳給伺服器。本說明書另一方面提供一種訓練定損圖像判定模型的裝置，該模型包括循環神經網路，該裝置包括：獲取單元，配置為，獲取以第一順序排列的多個樣本，該多個樣本與多個圖像分別對應，其中，該多個圖像先後取自於事故車輛的視頻流，其中，每個樣本包括對應圖像的特徵資訊、以及對應圖像的標籤值，該標籤值指示對應圖像是否為定損圖像，其中，該定損圖像為用於對該事故車輛進行定損的圖像；以及訓練單元，配置為，使用該多個樣本訓練該模型，以使得相比於訓練前，訓練後的該模型的與該多個樣本對應的預測損失函數減小。本說明書另一方面提供一種圖像處理裝置，包括：視頻流獲取單元，配置為，獲取事故車輛的視頻流；圖像獲取單元，配置為，從該視頻流先後獲取以第一順序排列的多個圖像；特徵獲取單元，配置為，獲取該多個圖像各自的特徵資訊；以及確定單元，配置為，透過以該第一順序將該多個圖像各自的特徵資訊先後輸入透過上述模型訓練裝置訓練的定損圖像判定模型，分別確定該多個圖像是否為定損圖像，其中該定損圖像為用於對該事故車輛進行定損的圖像。在一個實施例中，在該圖像處理裝置中，該裝置在移動設備端實施，該移動設備包括攝影鏡頭，其中，該視頻流獲取單元還配置為，根據用戶指令，透過該攝影鏡頭採集事故車輛的視頻流。在一個實施例中，在該圖像處理裝置中，該特徵獲取單元還配置為，透過以該第一順序將該多個圖像先後輸入預定分類模型，獲取該多個圖像各自的屬性特徵。在一個實施例中，在該圖像處理裝置中，該預定分類模型進行以下至少一種關於圖像的分類：是否模糊、是否包括車輛損傷、是否光照充足、拍攝角度是否偏斜、以及拍攝距離是否合適。在一個實施例中，在該圖像處理裝置中，該特徵獲取單元還配置為，透過以該第一順序將該多個圖像先後輸入目標檢測及分割模型，獲取該多個圖像各自的語義特徵。在一個實施例中，在該圖像處理裝置中，該語義特徵包括以下至少一項：目標框個數、分割類別數、最大目標框的圖像占比、以及最大分割類別的圖像占比。在一個實施例中，在該圖像處理裝置中，該特徵獲取單元還配置為，透過以該第一順序將該多個圖像先後輸入光流模型，獲取該多個圖像各自的光流特徵。在一個實施例中，在該圖像處理裝置中，該多個圖像中包括第一圖像，其中，該確定單元還配置為，確定該第一圖像是否為定損圖像，該裝置還包括上傳單元，配置為，在確定該第一圖像為定損圖像的情況中，將該第一圖像上傳給伺服器。本說明書另一方面還提供一種計算設備，包括記憶體和處理器，其特徵在於，該記憶體中儲存有可執行代碼，該處理器執行該可執行代碼時，實現上述任一項模型訓練方法和圖像處理方法。透過根據本說明書實施例的圖像處理方案，透過在手機端上部署多個特徵提取模型，對來自攝影鏡頭的圖像提取相應的圖像特徵，將這些特徵送入時序模型，以檢測該圖像是否是可用於定損的關鍵幀。透過這樣的演算法流程，可以幫助用戶免去拍照的步驟，同時可以獲得高質量的魯邦的定損幀，提供給伺服器端的演算法以用於定損。從而提升了用戶體驗，提高了演算法精度。

下面將結合圖式描述本說明書實施例。圖1示出了根據本說明書實施例的圖像處理系統100的示意圖。如圖1所示，系統100包括移動設備11和伺服器12。移動設備11例如為手機、可通信的智能設備等。伺服器12例如為保險公司用於處理定損照片的伺服器。移動設備11包括攝影鏡頭111、特徵提取模組112、和圖像判定模組113。其中，特徵提取模組112中部署有分類模型1121、目標檢測及分割模型1122以及光流模型1123。圖像判定模組113中部署有例如lstm神經網路模型，以用於確定是否將圖像用作定損圖像。該系統用於從用戶拍攝車輛的視頻流中自動獲取用於定損的關鍵幀，免去用戶拍照的步驟。例如在車輛事故現場中，將不需要保險公司的定損人員到達現場，只需要出險的車主使用移動設備11打開用於理賠的APP中的拍攝介面，調用攝影鏡頭採集車輛的視頻流，即可由APP自動獲取可用的定損圖像上傳給伺服器12。具體是，在用戶打開拍攝介面以透過攝影鏡頭採集車輛的視頻流之後，APP獲取該視頻流，並將該視頻流輸入特徵提取模組112。特徵提取模組對視頻流中的每幀或多幀進行處理，例如，每間隔預定幀處理一幀。在特徵提取模組112中，透過分類模型1121獲取圖像幀的一些基本屬性特徵，如是否模糊、光線是否充足等，透過目標檢測及分割模型1122獲取圖像幀的語義特徵，如目標框的個數、分割類別的個數等，另外，還透過光流模型1123獲取圖像幀與其它圖像幀(如上一輸入幀)的光流特徵。在獲取上述多個特徵之後，特徵提取模組112將上述特徵傳送給圖像判斷模組113。圖像判定模組113為透過使用多個標定視頻流進行訓練所獲得的定損圖像判定模型，透過基於上述特徵進行判定，可確定對應的圖像是否為定損圖像，即是否為可用於定損的圖像。當確定該圖像是定損圖像之後，移動設備11將該圖像發送給伺服器12，以用於確定定損結果。在伺服器12中，透過訓練好的定損演算法模型對用戶上傳的定損圖像進行處理，從而獲取定損結果。圖2示出根據本說明書實施例的一種訓練定損圖像判定模型的方法的流程圖。該模型包括循環神經網路。該方法包括：在步驟S202，獲取以第一順序排列的多個樣本，該多個樣本與多個圖像分別對應，其中，該多個圖像先後取自於事故車輛的視頻流，其中，每個樣本包括對應圖像的特徵資訊、以及對應圖像的標籤值，該標籤值指示對應圖像是否為定損圖像，其中，該定損圖像為用於對該事故車輛進行定損的圖像；以及在步驟S204，使用該多個樣本訓練該模型，以使得相比於訓練前，訓練後的該模型的與該多個樣本對應的預測損失函數減小。首先，在步驟S202，獲取以第一順序排列的多個樣本，該多個樣本與多個圖像分別對應，其中，該多個圖像先後取自於事故車輛的視頻流，其中，每個樣本包括對應圖像的特徵資訊、以及對應圖像的標籤值，該標籤值指示對應圖像是否為定損圖像，其中，該定損圖像為用於對該事故車輛進行定損的圖像。該定損圖像判定模型為時序模型，其包括的循環神經網路例如為LSTM、RNN、GRU等等。這些循環神經網路的共性是，透過順序輸入一組向量，獲得與該一組向量對應的輸出值。其中，對在某個時間點輸入的向量的計算與在該時間點之前輸入的一個或多個向量相關。即，循環神經網路針對當前輸入的輸出與之前的計算資訊相關。因此，該模型針對有時序性的多個輸入圖像進行計算。例如，對於多個順序排列的車損圖像，在確定第一圖像為車損圖像之後，在對第二圖像進行判定時，如果第二圖像與第一圖像比較接近，模型將考慮第一圖像的輸出結果，將第二圖像判定為不是車損圖像。從而，可透過從多個(如幾萬個)事故車輛的視頻流分別獲取多組樣本，以進行對該模型的訓練。該視頻流是用戶(車主或者保險公司業務人員)針對多起事故車輛拍攝的視頻。例如，從一起事故車輛可拍攝多個視頻流，而從每個視頻流可獲取多組樣本。在獲取一組樣本的過程中，針對一個視頻流，首先，從該視頻流中以時間前後順序抽取多個圖像，例如每隔半分鐘抽取一幀圖像，從該多個圖像獲取各自的特徵資訊或特徵向量，並獲取各個圖像的是否為定損圖像的標籤值，從而以順序排列的多個(特徵資訊，標籤值)對構成一組樣本。這裡，一組樣本中的多個樣本與上述多個圖像一一對應，並且，一組樣本中各個樣本的排列順序也與多個圖像的排列順序相對應。該順序體現了視頻流的前後時序，從而，可由上述模型對該組樣本進行預測，以預測其中哪些圖像可用作定損圖像。在上述一組樣本中，圖像的特徵資訊包括但不限於以下至少一種特徵：：屬性特徵、語義特徵、以及光流特徵。屬性特徵為圖像的一些基本屬性特徵，例如，圖像是否模糊、圖像是否包括車損、圖像光照是否充足、圖像的拍攝角度是否合適、圖像的拍攝距離是否合適等等。這些基本特徵都可透過將圖像輸入訓練好的分類模型而獲取，這將在下文詳細說明。語義特徵為與圖像像素對應的物體類別相關的特徵，圖像上的物體類別可透過目標框或物體分割示出，語義特徵例如可以為目標框個數、物體類別數目等等。光流特徵例如為當前輸入圖像與上一輸入圖像的光流變化，從而可體現各個圖像之間的關聯關係。另外，該圖像的標籤值可透過演算法模型進行標識，也可以透過人工標識。在步驟S204，使用該多個樣本訓練該模型，以使得相比於訓練前，訓練後的該模型的與該多個樣本對應的預測損失函數減小。如本領域技術人員所知，基於該各個樣本包括的特徵向量和標籤值，可透過例如梯度下降法調整該模型的參數。具體是，首先，將該特徵向量和標籤值代入模型損失函數，這裡的損失函數例如為上述多個樣本的各自的預測函數與標籤值之差的平方和、或者為多個樣本的各自的預測函數與標籤值之差的絕對值之和，等等。其中，透過對多個樣本各自的預測函數輸入特徵向量，可最後計算出與各個樣本對應的模型預測值，該預測值預測對應的圖像是否可用作定損圖像。由於該模型例如為lstm模型，其對多個樣本中各個樣本的預測函數各不相同，其中各個樣本的預測函數與該各個樣本的排列順序相對應，例如，排在後面樣本的預測函數中還包括排在前面的樣本的預測函數結果。然後，在損失函數中對模型參數求梯度，並向梯度的反方向調整參數的值，從而使得訓練後的模型的損失函數的值減小。這裡，模型訓練方法不限於上述梯度下降法，而是可以採用本領域技術人員可獲得的其它各種模型優化方法，如隨機梯度下降法、批量梯度下降法(BGD)、適應性動量估計法(Adam)、RMSprop等。圖3示出根據本說明書實施例的一種圖像處理方法的流程圖。該方法包括：在步驟S302，獲取事故車輛的視頻流；在步驟S304，從該視頻流先後獲取以第一順序排列的多個圖像；在步驟S306，獲取該多個圖像各自的特徵資訊；以及在步驟S308，透過以該第一順序將該多個圖像各自的特徵資訊先後輸入透過圖2所示方法訓練的定損圖像判定模型，分別確定該多個圖像是否為定損圖像，其中該定損圖像為用於對該事故車輛進行定損的圖像。首先，在步驟S302，獲取事故車輛的視頻流。在一個實施例中，圖3所示方法在移動設備端執行，該移動設備包括攝影鏡頭，其中，獲取事故車輛的視頻流包括，根據用戶指令，透過該攝影鏡頭採集事故車輛的視頻流。下文中將以移動設備端為例說明圖3所示方法。可以理解，圖3所示方法不限於僅在移動設備端執行，例如，透過從事故車輛的車主獲取其拍攝的事故車輛的視頻流，可以在保險公司的伺服器端執行圖3所示的方法，以從該視頻流獲取定損圖像。如上文所述，上述移動設備例如為手機。用戶例如透過手機中安裝的車險理賠APP進行事故車輛的定損照片的獲取。用戶例如透過該APP中的相機圖標打開拍攝介面，並將攝影鏡頭對準事故車輛。在打開拍攝介面之後，APP透過攝影鏡頭連續採集該車輛的圖像，從而獲取該車輛的視頻流，同時，在手機螢幕上實時顯示攝影鏡頭採集到的圖像。APP當如上所述採集車輛視頻流的同時，還實時將該視頻流輸入手機端APP中部署的各個演算法模型。該攝影鏡頭可設定為每隔預定時段(例如125ms)採集一幀圖像。在步驟S304，從該視頻流先後獲取以第一順序排列的多個圖像。由於，在本說明書實施例中，使用例如lstm的時序模型對多個圖像是否可用作定損圖像進行預測，因此，透過從視頻流中先後獲取多個圖像，從而獲取順序排列的多個圖像，以用於準備該時序模型的輸入。在該說明書實施例中，希望達到的效果是，用戶在用攝影鏡頭採集視頻流的同時(或者等待時間非常短)，APP可在手機端確定與該視頻流對應的定損照片，將該定損照片上傳伺服器，並從伺服器接收透過伺服器端演算法獲取的車輛定損結果。因此，APP在透過攝影鏡頭採集車輛的視頻流之後，可根據模型處理時間確定獲取該視頻流中的哪些幀，例如，可獲取視頻流中的每幀圖像用於模型預測，也可在視頻流中每隔幾幀抽取一幀圖像用於模型預測。在步驟S306，獲取該多個圖像各自的特徵資訊。在一個實施例中，可在手機端部署輕量級的圖像分類模型，以對視頻流中的車輛的圖像快速進行本地處理。例如，該預定分類模型例如是使用MobileNet v2、ShuffleNet、SqueezeNet等移動端模型訓練的多任務分類模型。例如，可透過使用大量的帶標籤的車損照片訓練該分類模型，其中，車損照片可包含與是否模糊、是否包括車輛損傷、是否光照充足、拍攝角度是否偏斜、拍攝距離是否合適等分別相關的多個標籤，以進行多任務學習。在上述例如MobileNet v2的移動端模型中，透過對傳統的二維卷積網路進行優化，可以有效地減少模型參數、加快運算效率，從而可以在移動端部署這類演算法。該優化例如包括，透過使用多個小卷積核的疊加來達到和大卷積核相同的效果，而使得所使用的參數以指數倍率下降，透過使用深度可分離卷積(depth-wise separable convolution)來替代一般的二維卷積操作，以減少參數數量，等等。透過如上所述訓練的該預定分類模型例如可進行以下至少一種關於該圖像的分類：是否模糊、是否包括車輛損傷、是否光照充足、以及拍攝角度是否偏斜(如拍攝角度是否是俯拍、斜拍等偏斜角度)、以及拍攝距離是否合適，等等。從而，基於該分類模型的分類結果，可獲取圖像多個基本屬性特徵，該屬性特徵示出該圖像是否滿足預定的車輛定損照片的基本要求。可以理解，該分類模型執行的對圖像的分類不限於上述列出的幾種，可根據需要增加相應的分類。在一個實施例中，可在手機端部署目標檢測及分割模型，以用於在手機端對視頻流中的車輛的零件和損傷進行檢測和分割，從而獲取圖像的與目標框和目標分割資訊相關的語義特徵。該目標檢測及分割模型是用於移動端的輕量化的模型，其例如透過MobileNet v2+SSDLite而實現，或者還可以透過MobileNet v2+DeepLab v3、MaskRCNN等實現。在一個實施例中，該目標檢測及分割模型與上述分類模型包括共用的底層的卷積神經網路。在一個實施例中，該目標檢測及分割模型可透過大量加標註(目標框或分割資訊)的車輛損傷圖像進行訓練獲得。其中，在該訓練樣本中針對車輛的零件、或損傷區域進行標註，從而可訓練出用於針對車輛零件和車輛損傷的目標檢測及分割模型。透過將車輛圖像輸入例如如上所述訓練的目標檢測及分割模型，該目標檢測及分割模型可自動檢測出該圖像中的車輛零件和/或車輛損傷，並在目標位置添加目標框和/或目標分割資訊。從而可基於該目標框和/或目標分割資訊，獲取圖像的語義特徵。該語義特徵即與圖像各部分對應的目標或內容相關的特徵，更具體地，是與目標框和/或目標分割資訊相關的特徵。例如，該語義特徵包括但不限於以下至少一項：目標框個數、分割類別數、最大目標框的圖像占比、以及最大分割類別的圖像占比等等。在一個實施例中，可在手機端部署光流模型，從而透過多個FlowNet構建幀與幀之間的光流資訊。例如，透過FlowNet1處理第一定損圖像(當前輸入的圖像，例如第t幀圖像)，透過FlowNet2處理第二定損圖像(前一次輸入的圖像，例如第t-1幀圖像)，透過融合FlowNet1與FlowNet2的輸出，從而獲得第一定損圖像與第二定損圖像之間的光流。對於非第一幀的每個當前幀圖像，都可以獲取與上一幀圖像之間的光流，作為當前幀圖像的光流特徵，對於第一幀圖像，可將其與自身的光流作為光流特徵。可將透過如上所述獲取的屬性特徵、語義特徵和光流特徵中的至少一個特徵用於構成圖像的特徵資訊，該特徵資訊例如為特徵向量的形式，從而獲取對上述定損圖像判定模型的輸入。然而，可以理解，圖像的特徵資訊不限於上述多個特徵，還可以根據具體業務需要包括其它各種特徵，如圖像的拍攝位置轉換特徵等等。在獲取該多個圖像各自的特徵資訊過程中，為了節省時間，對於每幀從視頻流中抽取的圖像，可單獨地進行：在抽取圖像之後緊接著將圖像輸入上述各個模型，以基本實時地獲取該圖像的特徵資訊。從而依據APP從視頻流獲取該多個圖像的先後順序，先後地獲取該多個圖像各自的特徵資訊。在步驟S308，透過以該第一順序將該多個圖像各自的特徵資訊先後輸入透過圖2所示方法訓練的定損圖像判定模型，分別確定該多個圖像是否為定損圖像，其中該定損圖像為用於對該事故車輛進行定損的圖像。當將如上所述準備的多個特徵資訊(即特徵向量)以第一順序輸入訓練好的定損圖像判定模型之後，該模型根據特徵向量本身以及特徵向量輸入的順序，獲取輸出值，即預測值，以預測對應的圖像是否可用作定損圖像。在該計算中，針對排在後面的特徵向量的預測結果除了基於該特徵向量本身、還基於針對排在前面的特徵向量的預測結果計算獲得。即，透過該模型輸出的與各個特徵向量分別對應的多個預測值是有關聯性的，而不是獨立獲取的。在該說明書實施例中，為了節省模型計算時間，對於每幀從視頻流中抽取的圖像，可單獨進行：在抽取圖像之後，緊接著獲取該圖像的特徵資訊，並且，在獲取特徵資訊之後，緊接著將該圖像的特徵資訊輸入定損圖像判定模型。從而依據APP從視頻流獲取該多個圖像的先後順序，先後地獲取該多個圖像各自的特徵資訊，並先後地將各個特徵資訊輸入定損圖像判定模型，從而先後地確定該多個圖像各自是否為定損圖像。例如，該多個圖像中包括第一圖像，當確定第一圖像為定損圖像之後，APP將該第一圖像上傳給伺服器，以用於伺服器端對該事故車輛的定損結果的確定。APP可以在透過如上所述獲取該視頻流的全部定損圖像之後，將這些多個定損圖像一起上傳，也可以在每次確定一個定損圖像之後，上傳該單個定損圖像。圖4示出根據本說明書實施例的一種訓練定損圖像判定模型的裝置400。該模型包括循環神經網路，該裝置包括：獲取單元41，配置為，獲取以第一順序排列的多個樣本，該多個樣本與多個圖像分別對應，其中，該多個圖像先後取自於事故車輛的視頻流，其中，每個樣本包括對應圖像的特徵資訊、以及對應圖像的標籤值，該標籤值指示對應圖像是否為定損圖像，其中，該定損圖像為用於對該事故車輛進行定損的圖像；以及訓練單元42，配置為，使用該多個樣本訓練該模型，以使得相比於訓練前，訓練後的該模型的與該多個樣本對應的預測損失函數減小。圖5示出根據本說明書實施例的一種圖像處理裝置500。該裝置包括：視頻流獲取單元51，配置為，獲取事故車輛的視頻流；圖像獲取單元52，配置為，從該視頻流先後獲取以第一順序排列的多個圖像；特徵獲取單元53，配置為，獲取該多個圖像各自的特徵資訊；以及確定單元54，配置為，透過以該第一順序將該多個圖像各自的特徵資訊先後輸入透過上述模型訓練裝置訓練的定損圖像判定模型，分別確定該多個圖像是否為定損圖像，其中該定損圖像為用於對該事故車輛進行定損的圖像。在一個實施例中，該裝置500在移動設備端實施，該移動設備包括攝影鏡頭，其中，該視頻流獲取單元51還配置為，根據用戶指令，透過該攝影鏡頭採集事故車輛的視頻流。在一個實施例中，在該圖像處理裝置中，該特徵獲取單元53還配置為，透過以該第一順序將該多個圖像先後輸入預定分類模型，獲取該多個圖像各自的屬性特徵。在一個實施例中，在該圖像處理裝置中，該預定分類模型進行以下至少一種關於圖像的分類：是否模糊、是否包括車輛損傷、是否光照充足、拍攝角度是否偏斜、以及拍攝距離是否合適。在一個實施例中，在該圖像處理裝置中，該特徵獲取單元53還配置為，透過以該第一順序將該多個圖像先後輸入目標檢測及分割模型，獲取該多個圖像各自的語義特徵。在一個實施例中，在該圖像處理裝置中，該語義特徵包括以下至少一項：目標框個數、分割類別數、最大目標框的圖像占比、以及最大分割類別的圖像占比。在一個實施例中，在該圖像處理裝置中，該特徵獲取單元53還配置為，透過以該第一順序將該多個圖像先後輸入光流模型，獲取該多個圖像各自的光流特徵。在一個實施例中，在該圖像處理裝置中，該多個圖像中包括第一圖像，其中，該確定單元54還配置為，確定該第一圖像是否為定損圖像，該裝置還包括上傳單元55，配置為，在確定該第一圖像為定損圖像的情況中，將該第一圖像上傳給伺服器。本說明書另一方面還提供一種計算設備，包括記憶體和處理器，其特徵在於，該記憶體中儲存有可執行代碼，該處理器執行該可執行代碼時，實現上述任一項模型訓練方法和圖像處理方法。透過根據本說明書實施例的圖像處理方案，透過在手機端上部署多個特徵提取模型，對來自攝影鏡頭的圖像提取相應的圖像特徵，將這些特徵送入時序模型，以檢測該圖像是否是可用於定損的關鍵幀。透過這樣的演算法流程，可以幫助用戶免去拍照的步驟，同時可以獲得高質量的魯邦的定損幀，提供給伺服器端的演算法以用於定損。從而提升了用戶體驗，提高了演算法精度。本說明書中的各個實施例均採用遞進的方式描述，各個實施例之間相同相似的部分互相參見即可，每個實施例重點說明的都是與其他實施例的不同之處。尤其，對於系統實施例而言，由於其基本相似於方法實施例，所以描述的比較簡單，相關之處參見方法實施例的部分說明即可。上述對本說明書特定實施例進行了描述。其它實施例在所附申請專利範圍的範圍內。在一些情況下，在申請專利範圍中記載的動作或步驟可以按照不同於實施例中的順序來執行並且仍然可以實現期望的結果。另外，在圖式中描繪的過程不一定要求示出的特定順序或者連續順序才能實現期望的結果。在某些實施方式中，多任務處理和並行處理也是可以的或者可能是有利的。本領域普通技術人員應該還可以進一步意識到，結合本文中所公開的實施例描述的各示例的單元及演算法步驟，能夠以電子硬體、電腦軟體或者二者的結合來實現，為了清楚地說明硬體和軟體的可互換性，在上述說明中已經按照功能一般性地描述了各示例的組成及步驟。這些功能究竟以硬體還是軟體方式來執軌道，取決於技術方案的特定應用和設計約束條件。本領域普通技術人員可以對每個特定的應用來使用不同方法來實現所描述的功能，但是這種實現不應認為超出本發明的範圍。結合本文中所公開的實施例描述的方法或演算法的步驟可以用硬體、處理器執軌道的軟體模組，或者二者的結合來實施。軟體模組可以置於隨機記憶體(RAM)、內部記憶體、唯讀記憶體(ROM)、電可程式化ROM、電可抹除可程式化ROM、暫存器、硬碟、可移動磁碟、CD-ROM、或技術領域內所公知的任意其它形式的儲存介質中。以上所述的具體實施方式，對本發明的目的、技術方案和有益效果進行了進一步詳細說明，所應理解的是，以上所述僅為本發明的具體實施方式而已，並不用於限定本發明的保護範圍，凡在本發明的精神和原則之內，所做的任何修改、等同替換、改進等，均應包含在本發明的保護範圍之內。

202、204:步驟 302~308:步驟 100:圖像處理系統 11:移動設備 12:伺服器 111:攝影鏡頭 112:特徵提取模組 113:圖像判定模組 1121:分類模型 1122:目標檢測及分割模型 1123:光流模型 400:訓練定損圖像判定模型的裝置 41:獲取單元 42:訓練單元 500:圖像處理裝置 51:視頻流獲取單元 52:圖像獲取單元 53:特徵獲取單元 54:確定單元 55:上傳單元

透過結合圖式描述本說明書實施例，可以使得本說明書實施例更加清楚：圖1示出了根據本說明書實施例的圖像處理系統100的示意圖；圖2示出根據本說明書實施例的一種訓練定損圖像判定模型的方法的流程圖；圖3示出根據本說明書實施例的一種圖像處理方法的流程圖；圖4示出根據本說明書實施例的一種訓練定損圖像判定模型的裝置400；以及圖5示出根據本說明書實施例的一種圖像處理裝置500。

Claims

一種訓練定損圖像判定模型的方法，該模型包括循環神經網路，該方法包括：獲取以第一順序排列的多個樣本，該多個樣本與多個圖像分別對應，其中，該多個圖像先後取自於事故車輛的視頻流，其中，每個樣本包括對應圖像的特徵資訊、以及對應圖像的標籤值，該標籤值指示對應圖像是否為定損圖像，其中，該定損圖像為用於對該事故車輛進行定損的圖像；以及使用該多個樣本訓練該模型，以使得相比於訓練前，訓練後的該模型的與該多個樣本對應的預測損失函數減小。
根據請求項1所述的訓練定損圖像判定模型的方法，其中，該循環神經網路為以下一種：LSTM、RNN、GRU。
根據請求項1所述的訓練定損圖像判定模型的方法，其中，該特徵資訊包括以下至少一種特徵：屬性特徵、語義特徵、以及光流特徵。
一種圖像處理方法，包括：獲取事故車輛的視頻流；從該視頻流先後獲取以第一順序排列的多個圖像；獲取該多個圖像各自的特徵資訊；以及透過以該第一順序將該多個圖像各自的特徵資訊先後輸入透過請求項1-3中任一項所述的方法訓練的定損圖像判定模型，分別確定該多個圖像是否為定損圖像，其中該定損圖像為用於對該事故車輛進行定損的圖像。
根據請求項4所述的圖像處理方法，其中，該方法在移動設備端執行，該移動設備包括攝影鏡頭，其中，獲取事故車輛的視頻流包括，根據用戶指令，透過該攝影鏡頭採集事故車輛的視頻流。
根據請求項4所述的圖像處理方法，其中，獲取該多個圖像各自的特徵資訊包括，透過以該第一順序將該多個圖像先後輸入預定分類模型，獲取該多個圖像各自的屬性特徵。
根據請求項6所述的圖像處理方法，其中，該預定分類模型進行以下至少一種關於圖像的分類：是否模糊、是否包括車輛損傷、是否光照充足、拍攝角度是否偏斜、以及拍攝距離是否合適。
根據請求項4所述的圖像處理方法，其中，獲取該多個圖像各自的特徵資訊包括，透過以該第一順序將該多個圖像先後輸入目標檢測及分割模型，獲取該多個圖像各自的語義特徵。
根據請求項8所述的圖像處理方法，其中，該語義特徵包括以下至少一項：目標框個數、分割類別數、最大目標框的圖像占比、以及最大分割類別的圖像占比。
根據請求項4所述的圖像處理方法，其中，獲取該多個圖像各自的特徵資訊包括，透過以該第一順序將該多個圖像先後輸入光流模型，獲取該多個圖像各自的光流特徵。
根據請求項5所述的圖像處理方法，其中，該多個圖像中包括第一圖像，其中，分別確定該多個圖像是否為定損圖像包括，確定該第一圖像是否為定損圖像，該方法還包括，在確定該第一圖像為定損圖像的情況中，將該第一圖像上傳給伺服器。
一種訓練定損圖像判定模型的裝置，該模型包括循環神經網路，該裝置包括：獲取單元，配置為，獲取以第一順序排列的多個樣本，該多個樣本與多個圖像分別對應，其中，該多個圖像先後取自於事故車輛的視頻流，其中，每個樣本包括對應圖像的特徵資訊、以及對應圖像的標籤值，該標籤值指示對應圖像是否為定損圖像，其中，該定損圖像為用於對該事故車輛進行定損的圖像；以及訓練單元，配置為，使用該多個樣本訓練該模型，以使得相比於訓練前，訓練後的該模型的與該多個樣本對應的預測損失函數減小。
根據請求項12所述的訓練定損圖像判定模型的裝置，其中，該循環神經網路為以下一種：LSTM、RNN、GRU。
根據請求項12所述的訓練定損圖像判定模型的裝置，其中，該特徵資訊包括以下至少一種特徵：屬性特徵、語義特徵、以及光流特徵。
一種圖像處理裝置，包括：視頻流獲取單元，配置為，獲取事故車輛的視頻流；圖像獲取單元，配置為，從該視頻流先後獲取以第一順序排列的多個圖像；特徵獲取單元，配置為，獲取該多個圖像各自的特徵資訊；以及確定單元，配置為，透過以該第一順序將該多個圖像各自的特徵資訊先後輸入透過請求項12-14中任一項所述的裝置訓練的定損圖像判定模型，分別確定該多個圖像是否為定損圖像，其中該定損圖像為用於對該事故車輛進行定損的圖像。
根據請求項15所述的圖像處理裝置，其中，該裝置在移動設備端實施，該移動設備包括攝影鏡頭，其中，該視頻流獲取單元還配置為，根據用戶指令，透過該攝影鏡頭採集事故車輛的視頻流。
根據請求項15所述的圖像處理裝置，其中，該特徵獲取單元還配置為，透過以該第一順序將該多個圖像先後輸入預定分類模型，獲取該多個圖像各自的屬性特徵。
根據請求項17所述的圖像處理裝置，其中，該預定分類模型進行以下至少一種關於圖像的分類：是否模糊、是否包括車輛損傷、是否光照充足、拍攝角度是否偏斜、以及拍攝距離是否合適。
根據請求項15所述的圖像處理裝置，其中，該特徵獲取單元還配置為，透過以該第一順序將該多個圖像先後輸入目標檢測及分割模型，獲取該多個圖像各自的語義特徵。
根據請求項19所述的圖像處理裝置，其中，該語義特徵包括以下至少一項：目標框個數、分割類別數、最大目標框的圖像占比、以及最大分割類別的圖像占比。
根據請求項15所述的圖像處理裝置，其中，該特徵獲取單元還配置為，透過以該第一順序將該多個圖像先後輸入光流模型，獲取該多個圖像各自的光流特徵。
根據請求項16所述的圖像處理裝置，其中，該多個圖像中包括第一圖像，其中，該確定單元還配置為，確定該第一圖像是否為定損圖像，該裝置還包括上傳單元，配置為，在確定該第一圖像為定損圖像的情況中，將該第一圖像上傳給伺服器。
一種計算設備，包括記憶體和處理器，其特徵在於，該記憶體中儲存有可執行代碼，該處理器執行該可執行代碼時，實現請求項1-11中任一項所述的方法。