TWI733276B - 檢測器的配置方法及裝置、目標檢測方法及裝置、電子設備、電腦可讀儲存媒體和電腦程式 - Google Patents

檢測器的配置方法及裝置、目標檢測方法及裝置、電子設備、電腦可讀儲存媒體和電腦程式 Download PDF

Info

Publication number
TWI733276B
TWI733276B TW108146123A TW108146123A TWI733276B TW I733276 B TWI733276 B TW I733276B TW 108146123 A TW108146123 A TW 108146123A TW 108146123 A TW108146123 A TW 108146123A TW I733276 B TWI733276 B TW I733276B
Authority
TW
Taiwan
Prior art keywords
expansion rate
convolution operation
convolution
detector
fixed
Prior art date
Application number
TW108146123A
Other languages
English (en)
Other versions
TW202109365A (zh
Inventor
彭君然
孫明
Original Assignee
大陸商北京市商湯科技開發有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 大陸商北京市商湯科技開發有限公司 filed Critical 大陸商北京市商湯科技開發有限公司
Publication of TW202109365A publication Critical patent/TW202109365A/zh
Application granted granted Critical
Publication of TWI733276B publication Critical patent/TWI733276B/zh

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/255Detecting or recognising potential candidate objects based on visual cues, e.g. shapes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/217Validation; Performance evaluation; Active pattern learning techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/20Image enhancement or restoration by the use of local operators
    • G06T5/30Erosion or dilatation, e.g. thinning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/764Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20084Artificial neural networks [ANN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/07Target detection

Abstract

本公開涉及一種檢測器的配置方法及裝置、目標檢測方法及裝置、電子設備、電腦可讀儲存媒體和電腦程式。所述方法包括:確定檢測器中進行膨脹卷積的卷積操作的固定膨脹率;對於所述檢測器中任一進行膨脹卷積的卷積操作,在所述卷積操作的固定膨脹率滿足分解條件的情況下,將所述卷積操作分解為第一子卷積操作和第二子卷積操作,並確定所述卷積操作的固定膨脹率對應的上限膨脹率和下限膨脹率,將所述上限膨脹率作為所述第一子卷積操作的膨脹率,將所述下限膨脹率作為所述第二子卷積操作的膨脹率;確定所述第一子卷積操作對應的輸出通道數和所述第二子卷積操作對應的輸出通道數。本公開實施例配置得到的檢測器能夠減少目標檢測所需時間,從而能夠適用於實時場景。

Description

檢測器的配置方法及裝置、目標檢測方法及裝置、電子設 備、電腦可讀儲存媒體和電腦程式
本公開涉及電腦視覺技術領域,尤其涉及一種檢測器的配置方法及裝置、目標檢測方法及裝置、電子設備、電腦可讀儲存媒體和電腦程式。
目標檢測是電腦視覺中十分重要和基礎的一項技術,旨在圖像中檢測出目標的位置和類別。目標檢測技術在大量領域中有至關重要的作用,如自動駕駛中的行人和車輛檢測、智能家居中的活體檢測、安防監控中的行人檢測等。在人臉識別、身份識別、目標跟蹤等任務中,為了鎖定目標或提供初始幀,目標檢測也是必不可少的環節。在實際應用場景中,目標的尺度變化多樣、大小不一。
本公開提出了一種目標檢測技術方案。
根據本公開的一方面,提供了一種檢測器的配置方法,包括:確定檢測器中進行膨脹卷積的卷積操作的固定膨脹率;對於所述檢測器中任一進行膨脹卷積的卷積操作,在所述卷積操作的固定膨脹率滿足分解條件的情況 下,將所述卷積操作分解為第一子卷積操作和第二子卷積操作,並確定所述卷積操作的固定膨脹率對應的上限膨脹率和下限膨脹率,將所述上限膨脹率作為所述第一子卷積操作的膨脹率,將所述下限膨脹率作為所述第二子卷積操作的膨脹率;根據所述卷積操作的輸出通道數以及所述卷積操作的固定膨脹率,確定所述第一子卷積操作對應的輸出通道數和所述第二子卷積操作對應的輸出通道數。
在本公開實施例中,通過在所述卷積操作的固定膨脹率滿足分解條件的情況下,將所述卷積操作分解為第一子卷積操作和第二子卷積操作,例如,在所述卷積操作的固定膨脹率為小數的情況下,將所述卷積操作分解為具有整數膨脹率的第一子卷積操作和第二子卷積操作,由此能夠在卷積計算的過程中減少引入雙線性插值操作,從而能夠提高計算速度。
在一種可能的實現方式中,所述檢測器包括主體網路,所述檢測器中進行膨脹卷積的卷積操作包括:所述檢測器的所述主體網路中原始卷積核尺寸為指定尺寸的一個或多個卷積操作。
在一種可能的實現方式中,所述檢測器還包括膨脹學習器;所述確定檢測器中進行膨脹卷積的卷積操作的固定膨脹率,包括:通過所述膨脹學習器獲得所述卷積操作針對多個訓練圖像的第一膨脹率;根據所述第一膨脹率,確定所述卷積操作的固定膨脹率。
在該實現方式中,通過根據所述卷積操作針對多個訓練圖像的第一膨脹率確定所述卷積操作的固定膨脹率,由此確定的固定膨脹率的準確性較 高,從而能夠保證檢測器進行目標檢測的準確性。
在一種可能的實現方式中,所述膨脹率學習器包括全域平均池化層和全連接層。
在一種可能的實現方式中,所述通過所述膨脹率學習器獲得所述卷積操作針對多個訓練圖像的第一膨脹率,包括:對於所述多個訓練圖像中的任一訓練圖像,通過所述膨脹率學習器獲得所述卷積操作針對所述訓練圖像的第二膨脹率;基於所述第二膨脹率,獲得所述訓練圖像對應的目標檢測結果;根據所述訓練圖像對應的目標檢測結果,更新所述膨脹率學習器的參數;通過參數更新後的所述膨脹率學習器獲得所述卷積操作針對所述訓練圖像的第一膨脹率。
在該實現方式中,通過膨脹率學習器進行多輪學習,能夠提高用於確定固定膨脹率的第一膨脹率的準確性,由此能夠提高所確定的固定膨脹率的準確性較高,從而能夠保證檢測器進行目標檢測的準確性。
在一種可能的實現方式中,所述根據所述第一膨脹率,確定所述卷積操作的固定膨脹率,包括:將所述第一膨脹率的平均值確定為所述卷積操作的固定膨脹率。
在一種可能的實現方式中,所述卷積操作的固定膨脹率滿足分解條件包括以下任意一項:所述卷積操作的固定膨脹率為小數;所述卷積操作的固定膨脹率與整數的最小距離大於第一閾值,其中,所述卷積操作的固定膨脹率與整數的最小距離表示所述卷積操作的固定膨脹率和與所述卷積操作的固 定膨脹率最接近的整數之間的距離。
根據該實現方式,在所述卷積操作的縱向固定膨脹率和橫向固定膨脹率中的一項與整數的最小距離小於或等於第一閾值時,可以不對該項進行分解,由此能夠降低檢測器配置的計算量。
在一種可能的實現方式中,所述確定所述卷積操作的固定膨脹率對應的上限膨脹率和下限膨脹率,包括:將大於所述卷積操作的固定膨脹率且與所述卷積操作的固定膨脹率最接近的整數確定為所述卷積操作的固定膨脹率對應的上限膨脹率;將小於所述卷積操作的固定膨脹率且與所述卷積操作的固定膨脹率最接近的整數確定為所述卷積操作的固定膨脹率對應的下限膨脹率。
在一種可能的實現方式中,所述根據所述卷積操作的輸出通道數以及所述卷積操作的固定膨脹率,確定所述第一子卷積操作對應的輸出通道數和所述第二子卷積操作對應的輸出通道數,包括:根據所述卷積操作的固定膨脹率與所述下限膨脹率的差值,確定所述卷積操作對應的整體差值係數;根據所述卷積操作的輸出通道數以及所述卷積操作對應的整體差值係數,確定所述第一子卷積操作對應的輸出通道數和所述第二子卷積操作對應的輸出通道數。
在一種可能的實現方式中,在所述確定所述第一子卷積操作對應的輸出通道數和所述第二子卷積操作對應的輸出通道數之後,還包括:採用目標訓練圖像集訓練所述檢測器,以優化所述檢測器的參數。
根據本公開的一方面,提供了一種目標檢測方法,包括:獲取待 檢測圖像;採用上述檢測器的配置方法訓練得到的所述檢測器對所述待檢測圖像進行目標檢測,獲得所述待檢測圖像對應的目標檢測結果。
根據本公開的一方面,提供了一種檢測器的配置裝置,包括:第一確定模組,用於確定檢測器中進行膨脹卷積的卷積操作的固定膨脹率;第二確定模組,用於對於所述檢測器中任一進行膨脹卷積的卷積操作,在所述卷積操作的固定膨脹率滿足分解條件的情況下,將所述卷積操作分解為第一子卷積操作和第二子卷積操作,並確定所述卷積操作的固定膨脹率對應的上限膨脹率和下限膨脹率,將所述上限膨脹率作為所述第一子卷積操作的膨脹率,將所述下限膨脹率作為所述第二子卷積操作的膨脹率;第三確定模組,用於根據所述卷積操作的輸出通道數以及所述卷積操作的固定膨脹率,確定所述第一子卷積操作對應的輸出通道數和所述第二子卷積操作對應的輸出通道數。
在一種可能的實現方式中,所述檢測器包括主體網路,所述檢測器中進行膨脹卷積的卷積操作包括:所述檢測器的所述主體網路中原始卷積核尺寸為指定尺寸的一個或多個卷積操作。
在一種可能的實現方式中,所述檢測器還包括膨脹學習器;所述第一確定模組包括:第一確定子模組,用於通過所述膨脹學習器獲得所述卷積操作針對多個訓練圖像的第一膨脹率;第二確定子模組,用於根據所述第一膨脹率,確定所述卷積操作的固定膨脹率。
在一種可能的實現方式中,所述膨脹率學習器包括全域平均池化層和全連接層。
在一種可能的實現方式中,所述第一確定子模組用於:對於所述多個訓練圖像中的任一訓練圖像,通過所述膨脹率學習器獲得所述卷積操作針對所述訓練圖像的第二膨脹率;基於所述第二膨脹率,獲得所述訓練圖像對應的目標檢測結果;根據所述訓練圖像對應的目標檢測結果,更新所述膨脹率學習器的參數;通過參數更新後的所述膨脹率學習器獲得所述卷積操作針對所述訓練圖像的第一膨脹率。
在一種可能的實現方式中,所述第二確定子模組用於:將所述第一膨脹率的平均值確定為所述卷積操作的固定膨脹率。
在一種可能的實現方式中,所述卷積操作的固定膨脹率滿足分解條件包括以下任意一項:所述卷積操作的固定膨脹率為小數;所述卷積操作的固定膨脹率與整數的最小距離大於第一閾值,其中,所述卷積操作的固定膨脹率與整數的最小距離表示所述卷積操作的固定膨脹率和與所述卷積操作的固定膨脹率最接近的整數之間的距離。
在一種可能的實現方式中,所述第二確定模組包括:第三確定子模組,用於將大於所述卷積操作的固定膨脹率且與所述卷積操作的固定膨脹率最接近的整數確定為所述卷積操作的固定膨脹率對應的上限膨脹率;第四確定子模組,用於將小於所述卷積操作的固定膨脹率且與所述卷積操作的固定膨脹率最接近的整數確定為所述卷積操作的固定膨脹率對應的下限膨脹率。
在一種可能的實現方式中,所述第三確定模組包括:第五確定子模組,用於根據所述卷積操作的固定膨脹率與所述下限膨脹率的差值,確定所 述卷積操作對應的整體差值係數;第六確定子模組,用於根據所述卷積操作的輸出通道數以及所述卷積操作對應的整體差值係數,確定所述第一子卷積操作對應的輸出通道數和所述第二子卷積操作對應的輸出通道數。
在一種可能的實現方式中,還包括:訓練模組,用於採用目標訓練圖像集訓練所述檢測器,以優化所述檢測器的參數。
根據本公開的一方面,提供了一種目標檢測裝置,包括:獲取模組,用於獲取待檢測圖像;目標檢測模組,用於採用上述檢測器的配置裝置訓練得到的所述檢測器對所述待檢測圖像進行目標檢測,獲得所述待檢測圖像對應的目標檢測結果。
根據本公開的一方面,提供了一種電子設備,包括:一個或多個處理器;與所述一個或多個處理器關聯的記憶體,所述記憶體用於儲存可執行指令,所述可執行指令在被所述一個或多個處理器讀取執行時,執行上述檢測器的配置方法。
根據本公開的一方面,提供了一種電腦可讀儲存媒體,其上儲存有電腦程式指令,所述電腦程式指令被處理器執行時實現上述檢測器的配置方法。
根據本公開的一方面,提供了一種電腦程式,包括電腦可讀代碼,當所述電腦可讀代碼在電子設備中運行時,所述電子設備中的處理器執行用於實現上述方法。
在本公開實施例中,通過確定檢測器中進行膨脹卷積的卷積操作 的固定膨脹率,對於所述檢測器中任一進行膨脹卷積的卷積操作,在所述卷積操作的固定膨脹率滿足分解條件的情況下,將所述卷積操作分解為第一子卷積操作和第二子卷積操作,確定所述卷積操作的固定膨脹率對應的上限膨脹率和下限膨脹率,將所述上限膨脹率作為所述第一子卷積操作的膨脹率,將所述下限膨脹率作為所述第二子卷積操作的膨脹率,並根據所述卷積操作的輸出通道數以及所述卷積操作的固定膨脹率,確定所述第一子卷積操作對應的輸出通道數和所述第二子卷積操作對應的輸出通道數,由此通過對檢測器中進行膨脹卷積的卷積操作進行分解,能夠在卷積計算的過程中減少引入較為耗時的雙線性插值操作,從而能夠提高計算速度,減少目標檢測所需時間,從而能夠適用於實時場景。
應當理解的是,以上的一般描述和後文的細節描述僅是示例性和解釋性的,而非限制本公開。
根據下面參考附圖對示例性實施例的詳細說明,本公開的其它特徵及方面將變得清楚。
21:第一確定模組
22:第二確定模組
23:第三確定模組
800:電子設備
802:處理組件
804:記憶體
806:電源組件
808:多媒體組件
810:音頻組件
812:輸入/輸出介面
814:感測器組件
816:通訊組件
820:處理器
1900:電子設備
1922:處理組件
1926:電源組件
1932:記憶體
1950:網路介面
1958:輸入輸出介面
S11~S13:步驟
此處的附圖被併入說明書中並構成本說明書的一部分,這些附圖示出了符合本公開的實施例,並與說明書一起用於說明本公開的技術方案:圖1示出本公開實施例提供的檢測器的配置方法的流程圖。
圖2示出本公開實施例提供的檢測器的配置方法中的膨脹率學習器的示意 圖。
圖3示出本公開實施例提供的檢測器的配置方法中第一子卷積操作Convu對應的輸出通道數和第二子卷積操作Conv1對應的輸出通道數的示意圖。
圖4示出本公開實施例提供的檢測器的配置方法中檢測器中進行膨脹卷積的卷積操作分解為兩個子卷積操作Convu和Conv1的示意圖。
圖5示出本公開實施例提供的檢測器的配置方法的示意圖。
圖6示出本公開實施例提供的檢測器的配置裝置的方塊圖。
圖7示出本公開實施例提供的一種電子設備800的方塊圖。
圖8示出本公開實施例提供的一種電子設備1900的方塊圖。
以下將參考附圖詳細說明本公開的各種示例性實施例、特徵和方面。附圖中相同的附圖標記表示功能相同或相似的元件。儘管在附圖中示出了實施例的各種方面,但是除非特別指出,不必按比例繪製附圖。
在這裡專用的詞“示例性”意為“用作例子、實施例或說明性”。這裡作為“示例性”所說明的任何實施例不必解釋為優於或好於其它實施例。
本文中術語“和/或”,僅僅是一種描述關聯對象的關聯關係,表示可以存在三種關係,例如,A和/或B,可以表示:單獨存在A,同時存在A和B,單獨存在B這三種情況。另外,本文中術語“至少一種”表示多種中的任 意一種或多種中的至少兩種的任意組合,例如,包括A、B、C中的至少一種,可以表示包括從A、B和C構成的集合中選擇的任意一個或多個元素。
另外,為了更好地說明本公開,在下文的具體實施方式中給出了眾多的具體細節。本領域技術人員應當理解,沒有某些具體細節,本公開同樣可以實施。在一些實例中,對於本領域技術人員熟知的方法、手段、元件和電路未作詳細描述,以便於凸顯本公開的主旨。
為了解決類似於上文所述的技術問題,本公開實施例提供了一種檢測器的配置方法及裝置、目標檢測方法及裝置、電子設備和儲存媒體,以減少目標檢測所需時間,從而能夠適用於實時場景。
圖1示出本公開實施例提供的檢測器的配置方法的流程圖。所述檢測器的配置方法的執行主體可以是檢測器的配置裝置。例如,所述檢測器的配置方法可以由終端設備或伺服器或其它處理設備執行。其中,終端設備可以是用戶設備(User Equipment,UE)、移動設備、用戶終端、終端、行動電話、室內無線電話、個人數位助理(Personal Digital Assistant,PDA)、手持設備、電腦設備、車載設備或者可穿戴設備等。在一些可能的實現方式中,所述檢測器的配置方法可以通過處理器調用記憶體中儲存的電腦可讀指令的方式來實現。如圖1所示,所述檢測器的配置方法包括步驟S11至步驟S13。
其中,在步驟S11之前,可以先確定檢測器的檢測器類型和檢測器的主體網路。例如,檢測器的檢測器類型可以為Faster-RCNN、RFCN、RetinaNet或者SSD等,檢測器的主體網路可以為VGG、ResNet、ResNeXt等。
在步驟S11中,確定檢測器中進行膨脹卷積的卷積操作的固定膨脹率。
在本公開實施例中,所述檢測器中進行膨脹卷積的卷積操作的數量可以為一個或多個。例如,所述檢測器中進行膨脹卷積的卷積操作可以為所述檢測器中的部分或全部卷積操作。即,所述檢測器可以包括進行膨脹卷積的卷積操作,也可以包括不進行膨脹卷積的卷積操作。
在本公開實施例中,檢測器的同一卷積操作針對不同訓練圖像的膨脹率可以不同,也可以相同。檢測器的不同卷積操作針對同一訓練圖像的膨脹率可以不同,也可以相同。
在一種可能的實現方式中,若所述卷積操作的卷積核包括兩個維度,則所述卷積操作的膨脹率可以包括縱向膨脹率和橫向膨脹率。其中,所述卷積操作的縱向膨脹率和橫向膨脹率可以不同,也可以相同。例如,固定膨脹率可以包括縱向固定膨脹率和橫向固定膨脹率。相應地,下文中的第一膨脹率可以包括第一縱向膨脹率和第一橫向膨脹率,第二膨脹率可以包括第二縱向膨脹率和第二橫向膨脹率。通過配置卷積操作的不同維度對應的膨脹率,能夠使檢測器中卷積操作的卷積核尺寸更為靈活,由此得到的檢測器能夠進一步提高目標檢測的準確性。
在另一種可能的實現方式中,所述卷積操作的膨脹率可以不分縱向膨脹率和橫向膨脹率。在該實現方式中,可以默認所述卷積操作的縱向膨脹率和橫向膨脹率相同,即,可以默認所述卷積操作的不同維度的膨脹率相同。
在一種可能的實現方式中,膨脹的卷積核尺寸=膨脹率×(原始卷積核尺寸-1)+1。例如,若所述卷積操作針對所述訓練圖像的膨脹率包括縱向膨脹率和橫向膨脹率,則膨脹的卷積核縱向尺寸=縱向膨脹率×(原始卷積核縱向尺寸-1)+1,膨脹的卷積核橫向尺寸=橫向膨脹率×(原始卷積核橫向尺寸-1)+1。
在一種可能的實現方式中,所述檢測器包括主體網路;所述檢測器中進行膨脹卷積的卷積操作包括:所述檢測器的所述主體網路中原始卷積核尺寸為指定尺寸的一個或多個卷積操作。例如,指定尺寸可以包括3×3,或者,指定尺寸可以包括5×5、7×7等。
作為該實現方式的一個示例,所述檢測器中進行膨脹卷積的卷積操作包括:所述檢測器的主體網路中原始卷積核尺寸為指定尺寸的所有卷積操作。例如,主體網路為ResNet,所述檢測器中進行膨脹卷積的卷積操作可以包括ResNet的conv2、conv3、conv4和conv5中的所有3×3卷積操作。
作為該實現方式的另一個示例,所述檢測器中進行膨脹卷積的卷積操作包括:所述檢測器的主體網路中原始卷積核尺寸為指定尺寸的部分卷積操作。例如,所述檢測器中進行膨脹卷積的卷積操作可以包括:所述檢測器的所述主體網路的指定卷積層中原始卷積核尺寸為指定尺寸的一個或多個卷積操作。例如,主體網路為ResNet,指定卷積層可以為conv3、conv4和conv5,所述檢測器中進行膨脹卷積的卷積操作可以包括ResNet的conv3、conv4和conv5中的所有3×3卷積操作。在這個例子中,所述檢測器中進行膨脹卷積的卷積操 作可以不包括conv2中的3×3卷積操作。
在另一種可能的實現方式中,所述檢測器中進行膨脹卷積的卷積操作可以包括:所述檢測器的主體網路中的指定卷積層中的卷積操作。例如,主體網路為ResNet,所述檢測器中進行膨脹卷積的卷積操作可以包括conv2、conv3、conv4和conv5中的卷積操作。
在另一種可能的實現方式中,所述檢測器中進行膨脹卷積的卷積操作還可以包括:所述檢測器中主體網路以外的卷積操作。例如,所述檢測器中進行膨脹卷積的卷積操作還可以包括所述檢測器中主體網路以外的原始卷積核尺寸為指定尺寸的卷積操作。
在一種可能的實現方式中,所述檢測器還包括膨脹學習器;所述確定檢測器中進行膨脹卷積的卷積操作的固定膨脹率,包括:通過所述膨脹學習器獲得所述卷積操作針對多個訓練圖像的第一膨脹率;根據所述第一膨脹率,確定所述卷積操作的固定膨脹率。在該實現方式中,通過根據所述卷積操作針對多個訓練圖像的第一膨脹率確定所述卷積操作的固定膨脹率,由此確定的固定膨脹率的準確性較高,從而能夠保證檢測器進行目標檢測的準確性。
在該實現方式中,膨脹率學習器可以用於學習所述卷積操作針對訓練圖像的膨脹率。膨脹率學習器可以與所述檢測器中進行膨脹卷積的卷積操作一一對應。即,一個膨脹率學習器可以用於學習一個進行膨脹卷積的卷積操作的膨脹率。在該實現方式中,膨脹率學習器可以設置在進行膨脹卷積的卷積操作與該進行膨脹卷積的卷積操作的上一個操作之間。
作為該實現方式的一個示例,所述膨脹率學習器包括全域平均池化層和全連接層。例如,膨脹率學習器可以包括一個全域平均池化層和一個全連接層。在該示例中,可以通過全域平均池化操作和全連接操作,獲得所述卷積操作針對多個訓練圖像的第一膨脹率。例如,對於檢測器中任一進行膨脹卷積的卷積操作,可以將所述卷積操作之前的特徵(即檢測器的初始結構中所述卷積操作的輸入特徵圖)經過全域平均池化操作和全連接操作預測出所述卷積操作針對所述訓練圖像的膨脹率。圖2示出本公開實施例提供的檢測器的配置方法中的膨脹率學習器的示意圖。如圖2所示,膨脹率學習器可以包括全局平均池化(GAP,Global Average Pooling)層和全連接層。其中,全連接層可以為線性(Linear)層。如圖2所示,對於檢測器中任一進行膨脹卷積的卷積操作,可以在所述卷積操作之前分別連接全域平均池化層和全連接層,並將所述卷積操作替換為可變形卷積,使用預測出的膨脹率進行卷積操作。
作為該實現方式的一個示例,所述通過所述膨脹率學習器獲得所述卷積操作針對多個訓練圖像的第一膨脹率,包括:對於所述多個訓練圖像中的任一訓練圖像,通過所述膨脹率學習器獲得所述卷積操作針對所述訓練圖像的第二膨脹率;基於所述第二膨脹率,獲得所述訓練圖像對應的目標檢測結果;根據所述訓練圖像對應的目標檢測結果,更新所述膨脹率學習器的參數;通過參數更新後的所述膨脹率學習器獲得所述卷積操作針對所述訓練圖像的第一膨脹率。
在該示例中,對於所述多個訓練圖像中的任一訓練圖像,可以 根據所述檢測器中各個進行膨脹卷積的卷積操作針對所述訓練圖像的第二膨脹率,確定所述各個進行膨脹卷積的卷積操作對應的膨脹的卷積核尺寸,並基於膨脹後的檢測器,獲得所述訓練圖像對應的目標檢測結果。其中,所述訓練圖像對應的目標檢測結果可以包括所述訓練圖像中的目標檢測框的位置訊息和所述訓練圖像屬於各個分類的機率。根據所述訓練圖像對應的目標檢測結果以及所述訓練圖像的真實值,可以得到檢測器的損失函數的值,從而可以根據檢測器的損失函數的值,更新所述膨脹率學習器的參數。其中,針對任一訓練圖像訓練膨脹率的次數可以為預設值,例如,預設值可以為13;或者,針對任一訓練圖像可以訓練至膨脹率收斂為止。在該示例中,通過膨脹率學習器進行多輪學習,能夠提高用於確定固定膨脹率的第一膨脹率的準確性,由此能夠提高所確定的固定膨脹率的準確性較高,從而能夠保證檢測器進行目標檢測的準確性。
在該示例中,所述卷積操作針對所述訓練圖像的第一膨脹率,可以指針對所述訓練圖像訓練完成後,所述卷積操作針對所述訓練圖像的膨脹率。即,所述卷積操作針對所述訓練圖像的第一膨脹率,可以指針對所述訓練圖像訓練膨脹率的次數達到預設值後,所述卷積操作針對所述訓練圖像的膨脹率,或者可以指所述卷積操作針對所述訓練圖像的收斂的膨脹率。
在該示例中,檢測器針對不同的訓練圖像分別訓練膨脹率,由此對於檢測器的任一進行膨脹卷積的卷積層,均能獲得與多個訓練圖像對應的多個第一膨脹率。
作為該實現方式的一個示例,所述根據所述第一膨脹率,確定所述卷積操作的固定膨脹率,包括:將所述第一膨脹率的平均值確定為所述卷積操作的固定膨脹率。例如,若所述卷積操作的固定膨脹率包括縱向固定膨脹率和橫向固定膨脹率,則可以將所述卷積操作針對多個訓練圖像的第一縱向膨脹率的平均值確定為所述卷積操作的縱向固定膨脹率,將所述卷積操作針對多個訓練圖像的第一橫向膨脹率的平均值確定為所述卷積操作的橫向固定膨脹率。例如,縱向固定膨脹率為1.7,橫向固定膨脹率2.9。
在該示例中,對於檢測器中進行膨脹卷積的任一卷積操作,可以根據所述卷積操作針對部分訓練圖像(例如1000張訓練圖像)的第一膨脹率,確定所述卷積操作的固定膨脹率。例如,對於檢測器的conv3的第一個3×3卷積操作,可以根據所述卷積操作針對1000張訓練圖像的第一膨脹率,確定所述卷積操作的固定膨脹率。或者,對於檢測器中進行膨脹卷積的任一卷積操作,可以根據所述卷積操作針對全部訓練圖像的第一膨脹率,確定所述卷積操作的固定膨脹率。
在步驟S12中,對於所述檢測器中任一進行膨脹卷積的卷積操作,在所述卷積操作的固定膨脹率滿足分解條件的情況下,將所述卷積操作分解為第一子卷積操作和第二子卷積操作,並確定所述卷積操作的固定膨脹率對應的上限膨脹率和下限膨脹率,將所述上限膨脹率作為所述第一子卷積操作的膨脹率,將所述下限膨脹率作為所述第二子卷積操作的膨脹率。
例如,所述卷積操作的固定膨脹率為D,所述卷積操作的固定膨 脹率對應的上限膨脹率為Du,所述卷積操作的固定膨脹率對應的下限膨脹率為Dl。
在一種可能的實現方式中,所述卷積操作的固定膨脹率滿足分解條件包括以下任意一項:所述卷積操作的固定膨脹率為小數;所述卷積操作的固定膨脹率與整數的最小距離大於第一閾值,其中,所述卷積操作的固定膨脹率與整數的最小距離表示所述卷積操作的固定膨脹率和與所述卷積操作的固定膨脹率最接近的整數之間的距離。
作為該實現方式的一個示例,若所述卷積操作的固定膨脹率包括縱向固定膨脹率和橫向固定膨脹率,則所述卷積操作的固定膨脹率為小數可以為:所述卷積操作的縱向固定膨脹率和橫向固定膨脹率中的至少一項為小數。
作為該實現方式的一個示例,若所述卷積操作的固定膨脹率包括縱向固定膨脹率和橫向固定膨脹率,則所述卷積操作的固定膨脹率與整數的最小距離大於第一閾值可以為:所述卷積操作的縱向固定膨脹率和橫向固定膨脹率中的至少一項與整數的最小距離大於第一閾值。例如,第一閾值為0.05,某一卷積操作的縱向固定膨脹率為2.02,橫向固定膨脹率為1.7,則所述卷積操作的縱向固定膨脹率與整數的最小距離為0.02,小於第一閾值,所述卷積操作的橫向固定膨脹率與整數的最小距離為0.3,大於第一閾值,因此,可以判定所述卷積操作滿足分解條件。
在一個示例中,若所述卷積操作的縱向固定膨脹率和橫向固定膨脹率中的一項與整數的最小距離小於或等於第一閾值,另一項與整數的最小距 離大於第一閾值,則可以根據該另一項進行分解。例如,所述卷積操作的縱向固定膨脹率為2.02、橫向固定膨脹率為1.7,則可以得到第一子卷積操作的縱向膨脹率為2、橫向膨脹率為2,第二子卷積操作的縱向膨脹率為2、橫向膨脹率為1。根據該示例,在所述卷積操作的縱向固定膨脹率和橫向固定膨脹率中的一項與整數的最小距離小於或等於第一閾值時,可以不對該項進行分解,由此能夠降低檢測器配置的計算量。
在一種可能的實現方式中,所述確定所述卷積操作的固定膨脹率對應的上限膨脹率和下限膨脹率,包括:將大於所述卷積操作的固定膨脹率且與所述卷積操作的固定膨脹率最接近的整數確定為所述卷積操作的固定膨脹率對應的上限膨脹率;將小於所述卷積操作的固定膨脹率且與所述卷積操作的固定膨脹率最接近的整數確定為所述卷積操作的固定膨脹率對應的下限膨脹率。例如。縱向固定膨脹率為1.7,橫向固定膨脹率2.9,則可以將縱向上限膨脹率確定為2,將縱向下限膨脹率確定為1,將橫向上限膨脹率確定為3,將橫向下限膨脹率確定為2。在這個例子中,可以將縱向上限膨脹率2、橫向上限膨脹率3確定為第一子卷積操作的膨脹率,將縱向下限膨脹率1、橫向下限膨脹率2確定為第二子卷積操作的膨脹率。
在本公開實施例中,通過在所述卷積操作的固定膨脹率滿足分解條件的情況下,將所述卷積操作分解為第一子卷積操作和第二子卷積操作,例如,在所述卷積操作的固定膨脹率為小數的情況下,將所述卷積操作分解為具有整數膨脹率的第一子卷積操作和第二子卷積操作,由此能夠在卷積計算的過 程中減少引入雙線性插值操作,從而能夠提高計算速度。
在步驟S13中,根據所述卷積操作的輸出通道數以及所述卷積操作的固定膨脹率,確定所述第一子卷積操作對應的輸出通道數和所述第二子卷積操作對應的輸出通道數。
例如,所述卷積操作的輸出通道數為C,第一子卷積操作對應的輸出通道數為Cu,所述第二子卷積操作對應的輸出通道數Cl。
在一種可能的實現方式中,所述根據所述卷積操作的輸出通道數以及所述卷積操作的固定膨脹率,確定所述第一子卷積操作對應的輸出通道數和所述第二子卷積操作對應的輸出通道數,包括:根據所述卷積操作的固定膨脹率與所述下限膨脹率的差值,確定所述卷積操作對應的整體差值係數;根據所述卷積操作的輸出通道數以及所述卷積操作對應的整體差值係數,確定所述第一子卷積操作對應的輸出通道數和所述第二子卷積操作對應的輸出通道數。
在該實現方式中,可以根據所述卷積操作的固定膨脹率D與所述下限膨脹率Dl的差值D-Dl,確定所述卷積操作對應的整體差值係數。
作為該實現方式的一個示例,若所述卷積操作的固定膨脹率包括縱向固定膨脹率和橫向固定膨脹率,則可以確定所述卷積操作的縱向固定膨脹率與縱向下限膨脹率的第一差值,確定所述卷積操作的橫向固定膨脹率與橫向下限膨脹率的第二差值,並將第一差值與第二差值的平均值作為所述卷積操作對應的整體差值係數。例如,所述卷積操作的固定膨脹率包括縱向固定膨脹率1.7和橫向固定膨脹率2.9,所述卷積操作的縱向固定膨脹率1.7與縱向下限膨脹 率1的第一差值a=0.7,所述卷積操作的橫向固定膨脹率2.9與橫向下限膨脹率2的第二差值a=0.9,則所述卷積操作對應的整體差值係數a=0.8。
例如,第一子卷積操作對應的輸出通道數Cu=aC,第二子卷積操作對應的輸出通道數Cl=(1-a)C。
圖3示出本公開實施例提供的檢測器的配置方法中第一子卷積操作Convu對應的輸出通道數和第二子卷積操作Conv1對應的輸出通道數的示意圖。在圖3中,第一子卷積操作Convu的縱向膨脹率為2、橫向膨脹率為3,第二子卷積操作Conv1的縱向膨脹率為1、橫向膨脹率為2。H×W×Cin表示所述卷積操作的輸入特徵圖的高、寬和通道數,因此,第一子卷積操作Convu和第二子卷積操作Conv1的輸入特徵圖的高、寬和通道數也為H×W×Cin。Cout表示所述卷積操作的輸出通道數,所述卷積操作的縱向固定膨脹率為1.7、橫向固定膨脹率為2.9。第一子卷積操作Convu對應的輸出通道數為0.8,第二子卷積操作Conv1對應的輸出通道數為0.2。
當然,在另一種可能的實現方式中,也可以根據所述卷積操作的固定膨脹率與所述上限膨脹率的差值,確定所述卷積操作對應的整體差值係數。
在本公開實施例中,通過對檢測器中進行膨脹卷積的卷積操作進行分解,由此能夠在卷積計算的過程中減少引入較為耗時的雙線性插值操作,從而能夠提高計算速度,減少目標檢測所需時間,從而能夠適用於實時場景。
在一種可能的實現方式中,在所述確定所述第一子卷積操作對應 的輸出通道數和所述第二子卷積操作對應的輸出通道數之後,還包括:採用目標訓練圖像集訓練所述檢測器,以優化所述檢測器的參數。
在該實現方式中,在確定所述第一子卷積操作對應的輸出通道數和所述第二子卷積操作對應的輸出通道數之後,檢測器中可以不再包括膨脹率學習器,檢測器中進行膨脹卷積的卷積操作可以分解為兩個子卷積操作。圖4示出本公開實施例提供的檢測器的配置方法中檢測器中進行膨脹卷積的卷積操作分解為兩個子卷積操作Convu和Conv1的示意圖。
圖5示出本公開實施例提供的檢測器的配置方法的示意圖。如圖5所示,檢測器的主體網路為ResNet,對Res2、Res3、Res4和Res5中的3×3卷積操作進行分解,將Res2、Res3、Res4和Res5中的每個3×3卷積操作分別分解為兩個子卷積操作。
在一種可能的實現方式中,在訓練檢測器時,可以使用SGD作為學習優化器,動量為0.9,權重衰退率設置為0.0001,初始學習率為0.00125每張訓練圖像。訓練時間可以設置為13個週期,在第8個週期和第11個週期之後可以進行學習率下降,下降比率為10倍。
本公開實施例提供的檢測器的配置方法能夠適用於需要硬編碼的場景,在保證能處理多尺度目標的前提下,去除了自適應模組,達到了減小耗時、提高檢測速度的效果。另外,本公開實施例提供的硬編碼方法相比於自適應方法能夠加速與硬件兼容,有利於實際應用。
本公開實施例還提供了一種目標檢測方法,所述目標檢測方法包 括:獲取待檢測圖像;採用上述檢測器的配置方法訓練得到的所述檢測器對所述待檢測圖像進行目標檢測,獲得所述待檢測圖像對應的目標檢測結果。
本公開實施例利用帶有膨脹率結構的深度學習網路進行目標檢測,能夠同時準確地檢測多種尺度的目標,且能夠在保證目標檢測準確性的前提下,減少多尺度目標檢測所需時間,從而能夠適用於多尺度目標檢測的實時場景。例如,本公開實施例能夠適用於自動駕駛中針對大小遠近不同的車輛和行人的檢測、實時智能視訊分析中的關鍵幀檢測、安防監控中的行人檢測、智能家居中的活體檢測等。
可以理解,本公開提及的上述各個方法實施例,在不違背原理邏輯的情況下,均可以彼此相互結合形成結合後的實施例,限於篇幅,本公開不再贅述。
本領域技術人員可以理解,在具體實施方式的上述方法中,各步驟的撰寫順序並不意味著嚴格的執行順序而對實施過程構成任何限定,各步驟的具體執行順序應當以其功能和可能的內在邏輯確定。
此外,本公開還提供了檢測器的配置裝置、目標檢測裝置、電子設備、電腦可讀儲存媒體、程式,相應技術方案和描述和參見方法部分的相應記載,不再贅述。
圖6示出本公開實施例提供的檢測器的配置裝置的方塊圖。如圖6所示,所述檢測器的配置裝置包括:第一確定模組21,用於確定檢測器中進行膨脹卷積的卷積操作的固定膨脹率;第二確定模組22,用於對於所述檢測器中 任一進行膨脹卷積的卷積操作,在所述卷積操作的固定膨脹率滿足分解條件的情況下,將所述卷積操作分解為第一子卷積操作和第二子卷積操作,並確定所述卷積操作的固定膨脹率對應的上限膨脹率和下限膨脹率,將所述上限膨脹率作為所述第一子卷積操作的膨脹率,將所述下限膨脹率作為所述第二子卷積操作的膨脹率;第三確定模組23,用於根據所述卷積操作的輸出通道數以及所述卷積操作的固定膨脹率,確定所述第一子卷積操作對應的輸出通道數和所述第二子卷積操作對應的輸出通道數。
在一種可能的實現方式中,所述檢測器包括主體網路,所述檢測器中進行膨脹卷積的卷積操作包括:所述檢測器的所述主體網路中原始卷積核尺寸為指定尺寸的一個或多個卷積操作。
在一種可能的實現方式中,所述檢測器還包括膨脹學習器;所述第一確定模組21包括:第一確定子模組,用於通過所述膨脹學習器獲得所述卷積操作針對多個訓練圖像的第一膨脹率;第二確定子模組,用於根據所述第一膨脹率,確定所述卷積操作的固定膨脹率。
在一種可能的實現方式中,所述膨脹率學習器包括全域平均池化層和全連接層。
在一種可能的實現方式中,所述第一確定子模組用於:對於所述多個訓練圖像中的任一訓練圖像,通過所述膨脹率學習器獲得所述卷積操作針對所述訓練圖像的第二膨脹率;基於所述第二膨脹率,獲得所述訓練圖像對應的目標檢測結果;根據所述訓練圖像對應的目標檢測結果,更新所述膨脹率學 習器的參數;通過參數更新後的所述膨脹率學習器獲得所述卷積操作針對所述訓練圖像的第一膨脹率。
在一種可能的實現方式中,所述第二確定子模組用於:將所述第一膨脹率的平均值確定為所述卷積操作的固定膨脹率。
在一種可能的實現方式中,所述卷積操作的固定膨脹率滿足分解條件包括以下任意一項:所述卷積操作的固定膨脹率為小數;所述卷積操作的固定膨脹率與整數的最小距離大於第一閾值,其中,所述卷積操作的固定膨脹率與整數的最小距離表示所述卷積操作的固定膨脹率和與所述卷積操作的固定膨脹率最接近的整數之間的距離。
在一種可能的實現方式中,所述第二確定模組22包括:第三確定子模組,用於將大於所述卷積操作的固定膨脹率且與所述卷積操作的固定膨脹率最接近的整數確定為所述卷積操作的固定膨脹率對應的上限膨脹率;第四確定子模組,用於將小於所述卷積操作的固定膨脹率且與所述卷積操作的固定膨脹率最接近的整數確定為所述卷積操作的固定膨脹率對應的下限膨脹率。
在一種可能的實現方式中,所述第三確定模組23包括:第五確定子模組,用於根據所述卷積操作的固定膨脹率與所述下限膨脹率的差值,確定所述卷積操作對應的整體差值係數;第六確定子模組,用於根據所述卷積操作的輸出通道數以及所述卷積操作對應的整體差值係數,確定所述第一子卷積操作對應的輸出通道數和所述第二子卷積操作對應的輸出通道數。
在一種可能的實現方式中,還包括:訓練模組,用於採用目標訓 練圖像集訓練所述檢測器,以優化所述檢測器的參數。
本公開實施例還提供了一種目標檢測裝置,包括:獲取模組,用於獲取待檢測圖像;目標檢測模組,用於採用上述檢測器的配置裝置訓練得到的所述檢測器對所述待檢測圖像進行目標檢測,獲得所述待檢測圖像對應的目標檢測結果。
在一些實施例中,本公開實施例提供的裝置具有的功能或包含的模組可以用於執行上文方法實施例描述的方法,其具體實現可以參照上文方法實施例的描述,為了簡潔,這裡不再贅述。
本公開實施例還提出一種電腦可讀儲存媒體,其上儲存有電腦程式指令,所述電腦程式指令被處理器執行時實現上述方法。其中,所述電腦可讀儲存媒體可以是非揮發性電腦可讀儲存媒體,也可以是揮發性電腦可讀儲存媒體。
本公開實施例還提出一種電腦程式,包括電腦可讀代碼,當所述電腦可讀代碼在電子設備中運行時,所述電子設備中的處理器執行用於實現上述方法。
本公開實施例還提出一種電子設備,包括:一個或多個處理器;與所述一個或多個處理器關聯的記憶體,所述記憶體用於儲存可執行指令,所述可執行指令在被所述一個或多個處理器讀取執行時,執行上述方法。
電子設備可以被提供為終端、伺服器或其它形態的設備。
圖7示出本公開實施例提供的一種電子設備800的方塊圖。例如, 電子設備800可以是移動電話,電腦,數位廣播終端,訊息收發設備,遊戲控制台,平板設備,醫療設備,健身設備,個人數位助理等終端。
參照圖7,電子設備800可以包括以下一個或多個組件:處理組件802,記憶體804,電源組件806,多媒體組件808,音頻組件810,輸入/輸出(I/O)的介面812,感測器組件814,以及通訊組件816。
處理組件802通常控制電子設備800的整體操作,諸如與顯示,電話呼叫,數據通訊,相機操作和記錄操作相關聯的操作。處理組件802可以包括一個或多個處理器820來執行指令,以完成上述的方法的全部或部分步驟。此外,處理組件802可以包括一個或多個模組,便於處理組件802和其他組件之間的交互。例如,處理組件802可以包括多媒體模組,以方便多媒體組件808和處理組件802之間的交互。
記憶體804被配置為儲存各種類型的數據以支持在電子設備800的操作。這些數據的示例包括用於在電子設備800上操作的任何應用程式或方法的指令,連絡人數據,電話簿數據,訊息,圖片,視訊等。記憶體804可以由任何類型的揮發性或非揮發性儲存裝置或者它們的組合實現,如靜態隨機存取記憶體(SRAM),電子抹除式可複寫唯讀記憶體(EEPROM),可擦除可規劃式唯讀記憶體(EPROM),可程式化唯讀記憶體(PROM),唯讀記憶體(ROM),磁記憶體,快閃記憶體,磁片或光碟。
電源組件806為電子設備800的各種組件提供電力。電源組件806可以包括電源管理系統,一個或多個電源,及其他與為電子設備800生成、管 理和分配電力相關聯的組件。
多媒體組件808包括在所述電子設備800和用戶之間的提供一個輸出介面的螢幕。在一些實施例中,螢幕可以包括液晶顯示器(LCD)和觸控面板(TP)。如果螢幕包括觸控面板,螢幕可以被實現為觸控式螢幕,以接收來自用戶的輸入信號。觸控面板包括一個或多個觸控感測器以感測觸摸、滑動和觸摸面板上的手勢。所述觸控感測器可以不僅感測觸摸或滑動動作的邊界,而且還檢測與所述觸摸或滑動操作相關的持續時間和壓力。在一些實施例中,多媒體組件808包括一個前置攝影機和/或後置攝影機。當電子設備800處於操作模式,如拍攝模式或視訊模式時,前置攝影機和/或後置攝影機可以接收外部的多媒體數據。每個前置攝影機和後置攝影機可以是一個固定的光學透鏡系統或具有焦距和光學變焦能力。
音頻組件810被配置為輸出和/或輸入音頻信號。例如,音頻組件810包括一個麥克風(MIC),當電子設備800處於操作模式,如呼叫模式、記錄模式和語音識別模式時,麥克風被配置為接收外部音頻信號。所接收的音頻信號可以被進一步儲存在記憶體804或經由通訊組件816發送。在一些實施例中,音頻組件810還包括一個揚聲器,用於輸出音頻信號。
I/O介面812為處理組件802和周邊介面模組之間提供介面,上述周邊介面模組可以是鍵盤,滑鼠,按鈕等。這些按鈕可包括但不限於:主頁按鈕、音量按鈕、啟動按鈕和鎖定按鈕。
感測器組件814包括一個或多個感測器,用於為電子設備800提供 各個方面的狀態評估。例如,感測器組件814可以檢測到電子設備800的打開/關閉狀態,組件的相對定位,例如所述組件為電子設備800的顯示器和小鍵盤,感測器組件814還可以檢測電子設備800或電子設備800一個組件的位置改變,用戶與電子設備800接觸的存在或不存在,電子設備800方位或加速/減速和電子設備800的溫度變化。感測器組件814可以包括接近感測器,被配置用來在沒有任何的物理接觸時檢測附近物體的存在。感測器組件814還可以包括光感測器,如CMOS或CCD圖像感測器,用於在成像應用中使用。在一些實施例中,該感測器組件814還可以包括加速度感測器,陀螺儀感測器,磁感測器,壓力感測器或溫度感測器。
通訊組件816被配置為便於電子設備800和其他設備之間有線或無線方式的通訊。電子設備800可以接入基於通訊標準的無線網路,如Wi-Fi、2G、3G、4G/LTE、5G或它們的組合。在一個示例性實施例中,通訊組件816經由廣播通道接收來自外部廣播管理系統的廣播信號或廣播相關訊息。在一個示例性實施例中,所述通訊組件816還包括近場通訊(NFC)模組,以促進短程通訊。例如,在NFC模組可基於射頻識別(RFID)技術,紅外數據協會(IrDA)技術,超寬帶(UWB)技術,藍牙(BT)技術和其他技術來實現。
在示例性實施例中,電子設備800可以被一個或多個特殊應用積體電路(ASIC)、數位信號處理器(DSP)、數位信號處理設備(DSPD)、可程式化邏輯裝置(PLD)、現場可程式化邏輯閘陣列(FPGA)、控制器、微控制器、微處理器或其他電子元件實現,用於執行上述方法。
在示例性實施例中,還提供了一種非揮發性電腦可讀儲存媒體,例如包括電腦程式指令的記憶體804,上述電腦程式指令可由電子設備800的處理器820執行以完成上述方法。
圖8示出本公開實施例提供的一種電子設備1900的方塊圖。例如,電子設備1900可以被提供為一伺服器。參照圖8,電子設備1900包括處理組件1922,其進一步包括一個或多個處理器,以及由記憶體1932所代表的記憶體資源,用於儲存可由處理組件1922的執行的指令,例如應用程式。記憶體1932中儲存的應用程式可以包括一個或一個以上的每一個對應於一組指令的模組。此外,處理組件1922被配置為執行指令,以執行上述方法。
電子設備1900還可以包括一個電源組件1926被配置為執行電子設備1900的電源管理,一個有線或無線網路介面1950被配置為將電子設備1900連接到網路,和一個輸入輸出(I/O)介面1958。電子設備1900可以操作基於儲存在記憶體1932的操作系統,例如Windows Server®,Mac OS X®,Unix®,Linux®,FreeBSD®或類似。
在示例性實施例中,還提供了一種非揮發性電腦可讀儲存媒體,例如包括電腦程式指令的記憶體1932,上述電腦程式指令可由電子設備1900的處理組件1922執行以完成上述方法。
本公開可以是系統、方法和/或電腦程式產品。電腦程式產品可以包括電腦可讀儲存媒體,其上載有用於使處理器實現本公開的各個方面的電腦可讀程式指令。
電腦可讀儲存媒體可以是可以保持和儲存由指令執行設備使用的指令的有形設備。電腦可讀儲存媒體例如可以是─但不限於─電儲存裝置、磁儲存裝置、光儲存裝置、電磁儲存裝置、半導體儲存裝置或者上述的任意合適的組合。電腦可讀儲存媒體的更具體的例子(非窮舉的列表)包括:可攜式電腦盤、硬碟、隨機存取記憶體(RAM)、唯讀記憶體(ROM)、可擦除可規劃式唯讀記憶體(EPROM或閃存)、靜態隨機存取記憶體(SRAM)、可擕式壓縮磁碟唯讀記憶體(CD-ROM)、數位多功能盤(DVD)、記憶棒、軟碟、機械編碼設備、例如其上儲存有指令的打孔卡或凹槽內凸起結構、以及上述的任意合適的組合。這裡所使用的電腦可讀儲存媒體不被解釋為瞬時信號本身,諸如無線電波或者其他自由傳播的電磁波、通過波導或其他傳輸媒介傳播的電磁波(例如,通過光纖電纜的光脈衝)、或者通過電線傳輸的電信號。
這裡所描述的電腦可讀程式指令可以從電腦可讀儲存媒體下載到各個計算/處理設備,或者通過網路、例如網際網路、區域網路、廣域網路和/或無線網路下載到外部電腦或外部儲存裝置。網路可以包括銅傳輸電纜、光纖傳輸、無線傳輸、路由器、防火牆、交換器、閘道電腦和/或邊緣伺服器。每個計算/處理設備中的網路介面卡或者網路介面從網路接收電腦可讀程式指令,並轉發該電腦可讀程式指令,以供儲存在各個計算/處理設備中的電腦可讀儲存媒體中。
用於執行本公開操作的電腦程式指令可以是彙編指令、指令集架構(ISA)指令、機器指令、機器相關指令、微代碼、固件指令、狀態設置數 據、或者以一種或多種編程語言的任意組合編寫的源代碼或目標代碼,所述編程語言包括面向對象的編程語言-諸如Smalltalk、C++等,以及常規的過程式編程語言-諸如“C”語言或類似的編程語言。電腦可讀程式指令可以完全地在用戶電腦上執行、部分地在用戶電腦上執行、作為一個獨立的套裝軟體執行、部分在用戶電腦上部分在遠端電腦上執行、或者完全在遠端電腦或伺服器上執行。在涉及遠端電腦的情形中,遠端電腦可以通過任意種類的網路-包括區域網路(LAN)或廣域網路(WAN)-連接到用戶電腦,或者,可以連接到外部電腦(例如利用網際網路服務提供商來通過網際網路連接)。在一些實施例中,通過利用電腦可讀程式指令的狀態訊息來個性化定制電子電路,例如可編程邏輯電路、現場可編程門陣列(FPGA)或可編程邏輯陣列(PLA),該電子電路可以執行電腦可讀程式指令,從而實現本公開的各個方面。
這裡參照根據本公開實施例的方法、裝置(系統)和電腦程式產品的流程圖和/或方塊圖描述了本公開的各個方面。應當理解,流程圖和/或方塊圖的每個方框以及流程圖和/或方塊圖中各方框的組合,都可以由電腦可讀程式指令實現。
這些電腦可讀程式指令可以提供給通用電腦、專用電腦或其它可編程數據處理裝置的處理器,從而生產出一種機器,使得這些指令在通過電腦或其它可編程數據處理裝置的處理器執行時,產生了實現流程圖和/或方塊圖中的一個或多個方框中規定的功能/動作的裝置。也可以把這些電腦可讀程式指令儲存在電腦可讀儲存媒體中,這些指令使得電腦、可編程數據處理裝置和/或其 他設備以特定方式工作,從而,儲存有指令的電腦可讀介質則包括一個製造品,其包括實現流程圖和/或方塊圖中的一個或多個方框中規定的功能/動作的各個方面的指令。
也可以把電腦可讀程式指令加載到電腦、其它可編程數據處理裝置、或其它設備上,使得在電腦、其它可編程數據處理裝置或其它設備上執行一系列操作步驟,以產生電腦實現的過程,從而使得在電腦、其它可編程數據處理裝置、或其它設備上執行的指令實現流程圖和/或方塊圖中的一個或多個方框中規定的功能/動作。
附圖中的流程圖和方塊圖顯示了根據本公開的多個實施例的系統、方法和電腦程式產品的可能實現的體系架構、功能和操作。在這點上,流程圖或方塊圖中的每個方框可以代表一個模組、程式段或指令的一部分,所述模組、程式段或指令的一部分包含一個或多個用於實現規定的邏輯功能的可執行指令。在有些作為替換的實現中,方框中所標注的功能也可以以不同於附圖中所標注的順序發生。例如,兩個連續的方框實際上可以基本並行地執行,它們有時也可以按相反的順序執行,這依所涉及的功能而定。也要注意的是,方塊圖和/或流程圖中的每個方框、以及方塊圖和/或流程圖中的方框的組合,可以用執行規定的功能或動作的專用的基於硬件的系統來實現,或者可以用專用硬件與電腦指令的組合來實現。
以上已經描述了本公開的各實施例,上述說明是示例性的,並非窮盡性的,並且也不限於所披露的各實施例。在不偏離所說明的各實施例的範 圍和精神的情況下,對於本技術領域的普通技術人員來說許多修改和變更都是顯而易見的。本文中所用術語的選擇,旨在最好地解釋各實施例的原理、實際應用或對市場中的技術的技術改進,或者使本技術領域的其它普通技術人員能理解本文披露的各實施例。
S11~S13:步驟

Claims (23)

  1. 一種用於對圖像進行目標檢測的檢測器的配置方法,包括:確定檢測器中進行膨脹卷積的卷積操作的固定膨脹率,其中,所述卷積操作的固定膨脹率是根據所述卷積操作針對多個訓練圖像的第一膨脹率確定的;對於所述檢測器中任一進行膨脹卷積的卷積操作,在所述卷積操作的固定膨脹率滿足分解條件的情況下,將所述卷積操作分解為第一子卷積操作和第二子卷積操作,並確定所述卷積操作的固定膨脹率對應的上限膨脹率和下限膨脹率,將所述上限膨脹率作為所述第一子卷積操作的膨脹率,將所述下限膨脹率作為所述第二子卷積操作的膨脹率;根據所述卷積操作的輸出通道數以及所述卷積操作的固定膨脹率,確定所述第一子卷積操作對應的輸出通道數和所述第二子卷積操作對應的輸出通道數;利用所述檢測器對待檢測圖像進行目標檢測,以獲得所述待檢測圖像對應的目標檢測結果。
  2. 如請求項1所述的方法,其中,所述檢測器包括主體網路,所述檢測器中進行膨脹卷積的卷積操作包括:所述檢測器的所述主體網路中原始卷積核尺寸為指定尺寸的一個或多個卷積操作。
  3. 如請求項2所述的方法,其中,所述檢測器還包括膨脹學習器;所述確定檢測器中進行膨脹卷積的卷積操作的固定膨脹率,包括:通過所述膨脹學習器獲得所述卷積操作針對多個訓練圖像的第 一膨脹率;根據所述第一膨脹率,確定所述卷積操作的固定膨脹率。
  4. 如請求項3所述的方法,其中,所述膨脹率學習器包括全域平均池化層和全連接層。
  5. 如請求項3所述的方法,其中,所述通過所述膨脹率學習器獲得所述卷積操作針對多個訓練圖像的第一膨脹率,包括:對於所述多個訓練圖像中的任一訓練圖像,通過所述膨脹率學習器獲得所述卷積操作針對所述訓練圖像的第二膨脹率;基於所述第二膨脹率,獲得所述訓練圖像對應的目標檢測結果;根據所述訓練圖像對應的目標檢測結果,更新所述膨脹率學習器的參數;通過參數更新後的所述膨脹率學習器獲得所述卷積操作針對所述訓練圖像的第一膨脹率。
  6. 如請求項1至5中任意一項所述的方法,其中,所述卷積操作的固定膨脹率滿足分解條件包括以下任意一項:所述卷積操作的固定膨脹率為小數;所述卷積操作的固定膨脹率與整數的最小距離大於第一閾值,其中,所述卷積操作的固定膨脹率與整數的最小距離表示所述卷積操作的固定膨脹率和與所述卷積操作的固定膨脹率最接近的整數之間的距離。
  7. 如請求項1至5中任意一項所述的方法,其中,所述確定所述卷積操作的固定膨脹率對應的上限膨脹率和下限膨脹率,包括:將大於所述卷積操作的固定膨脹率且與所述卷積操作的固定膨脹率最接近的整數確定為所述卷積操作的固定膨脹率對應的上限膨 脹率;將小於所述卷積操作的固定膨脹率且與所述卷積操作的固定膨脹率最接近的整數確定為所述卷積操作的固定膨脹率對應的下限膨脹率。
  8. 如請求項1至5中任意一項所述的方法,其中,所述根據所述卷積操作的輸出通道數以及所述卷積操作的固定膨脹率,確定所述第一子卷積操作對應的輸出通道數和所述第二子卷積操作對應的輸出通道數,包括:根據所述卷積操作的固定膨脹率與所述下限膨脹率的差值,確定所述卷積操作對應的整體差值係數;根據所述卷積操作的輸出通道數以及所述卷積操作對應的整體差值係數,確定所述第一子卷積操作對應的輸出通道數和所述第二子卷積操作對應的輸出通道數。
  9. 如請求項1至5中任意一項所述的方法,其中,在所述確定所述第一子卷積操作對應的輸出通道數和所述第二子卷積操作對應的輸出通道數之後,還包括:採用目標訓練圖像集訓練所述檢測器,以優化所述檢測器的參數。
  10. 一種目標檢測方法,包括:獲取待檢測圖像;採用請求項9訓練得到的所述檢測器對所述待檢測圖像進行目標檢測,獲得所述待檢測圖像對應的目標檢測結果。
  11. 一種用於對圖像進行目標檢測的檢測器的配置裝置,包括:第一確定模組,用於確定檢測器中進行膨脹卷積的卷積操作的 固定膨脹率,其中,所述卷積操作的固定膨脹率是根據所述卷積操作針對多個訓練圖像的第一膨脹率確定的;第二確定模組,用於對於所述檢測器中任一進行膨脹卷積的卷積操作,在所述卷積操作的固定膨脹率滿足分解條件的情況下,將所述卷積操作分解為第一子卷積操作和第二子卷積操作,並確定所述卷積操作的固定膨脹率對應的上限膨脹率和下限膨脹率,將所述上限膨脹率作為所述第一子卷積操作的膨脹率,將所述下限膨脹率作為所述第二子卷積操作的膨脹率;第三確定模組,用於根據所述卷積操作的輸出通道數以及所述卷積操作的固定膨脹率,確定所述第一子卷積操作對應的輸出通道數和所述第二子卷積操作對應的輸出通道數;該配置裝置用於利用所述檢測器對待檢測圖像進行目標檢測,以獲得所述待檢測圖像對應的目標檢測結果。
  12. 如請求項11所述的裝置,其中,所述檢測器包括主體網路,所述檢測器中進行膨脹卷積的卷積操作包括:所述檢測器的所述主體網路中原始卷積核尺寸為指定尺寸的一個或多個卷積操作。
  13. 如請求項12所述的裝置,其中,所述檢測器還包括膨脹學習器;所述第一確定模組包括:第一確定子模組,用於通過所述膨脹學習器獲得所述卷積操作針對多個訓練圖像的第一膨脹率;第二確定子模組,用於根據所述第一膨脹率,確定所述卷積操作的固定膨脹率。
  14. 如請求項13所述的裝置,其中,所述膨脹率學習器包括全域平均池 化層和全連接層。
  15. 如請求項13所述的裝置,其中,所述第一確定子模組用於:對於所述多個訓練圖像中的任一訓練圖像,通過所述膨脹率學習器獲得所述卷積操作針對所述訓練圖像的第二膨脹率;基於所述第二膨脹率,獲得所述訓練圖像對應的目標檢測結果;根據所述訓練圖像對應的目標檢測結果,更新所述膨脹率學習器的參數;通過參數更新後的所述膨脹率學習器獲得所述卷積操作針對所述訓練圖像的第一膨脹率。
  16. 如請求項11至15中任意一項所述的裝置,其中,所述卷積操作的固定膨脹率滿足分解條件包括以下任意一項:所述卷積操作的固定膨脹率為小數;所述卷積操作的固定膨脹率與整數的最小距離大於第一閾值,其中,所述卷積操作的固定膨脹率與整數的最小距離表示所述卷積操作的固定膨脹率和與所述卷積操作的固定膨脹率最接近的整數之間的距離。
  17. 如請求項11至15中任意一項所述的裝置,其中,所述第二確定模組包括:第三確定子模組,用於將大於所述卷積操作的固定膨脹率且與所述卷積操作的固定膨脹率最接近的整數確定為所述卷積操作的固定膨脹率對應的上限膨脹率;第四確定子模組,用於將小於所述卷積操作的固定膨脹率且與所述卷積操作的固定膨脹率最接近的整數確定為所述卷積操作的固定膨脹率對應的下限膨脹率。
  18. 如請求項11至15中任意一項所述的裝置,其中,所述第三確定模組包括:第五確定子模組,用於根據所述卷積操作的固定膨脹率與所述下限膨脹率的差值,確定所述卷積操作對應的整體差值係數;第六確定子模組,用於根據所述卷積操作的輸出通道數以及所述卷積操作對應的整體差值係數,確定所述第一子卷積操作對應的輸出通道數和所述第二子卷積操作對應的輸出通道數。
  19. 如請求項11至15中任意一項所述的裝置,其中,還包括:訓練模組,用於採用目標訓練圖像集訓練所述檢測器,以優化所述檢測器的參數。
  20. 一種目標檢測裝置,包括:獲取模組,用於獲取待檢測圖像;目標檢測模組,用於採用請求項19訓練得到的所述檢測器對所述待檢測圖像進行目標檢測,獲得所述待檢測圖像對應的目標檢測結果。
  21. 一種電子設備,包括:一個或多個處理器;與所述一個或多個處理器關聯的記憶體,所述記憶體用於儲存可執行指令,所述可執行指令在被所述一個或多個處理器讀取執行時,執行請求項1至10中任意一項所述的方法。
  22. 一種電腦可讀儲存媒體,其上儲存有電腦程式指令,所述電腦程式指令被處理器執行時實現請求項1至10中任意一項所述的方法。
  23. 一種電腦程式,包括電腦可讀代碼,當所述電腦可讀代碼在電子設備中運行時,所述電子設備中的處理器執行用於實現請求項1至10中 的任意請求項所述的方法。
TW108146123A 2019-08-30 2019-12-17 檢測器的配置方法及裝置、目標檢測方法及裝置、電子設備、電腦可讀儲存媒體和電腦程式 TWI733276B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201910816321.1A CN110543849B (zh) 2019-08-30 2019-08-30 检测器的配置方法及装置、电子设备和存储介质
CN201910816321.1 2019-08-30

Publications (2)

Publication Number Publication Date
TW202109365A TW202109365A (zh) 2021-03-01
TWI733276B true TWI733276B (zh) 2021-07-11

Family

ID=68711000

Family Applications (1)

Application Number Title Priority Date Filing Date
TW108146123A TWI733276B (zh) 2019-08-30 2019-12-17 檢測器的配置方法及裝置、目標檢測方法及裝置、電子設備、電腦可讀儲存媒體和電腦程式

Country Status (7)

Country Link
US (1) US20210326649A1 (zh)
JP (1) JP2022515274A (zh)
KR (1) KR20210113242A (zh)
CN (1) CN110543849B (zh)
SG (1) SG11202106971YA (zh)
TW (1) TWI733276B (zh)
WO (1) WO2021036013A1 (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113989169A (zh) * 2020-07-08 2022-01-28 嘉楠明芯(北京)科技有限公司 一种膨胀卷积加速计算方法及装置
CN112101374B (zh) * 2020-08-01 2022-05-24 西南交通大学 基于surf特征检测和isodata聚类算法的无人机障碍物检测方法
CN112037157A (zh) * 2020-09-14 2020-12-04 Oppo广东移动通信有限公司 数据处理方法及装置、计算机可读介质及电子设备
CN111951269B (zh) * 2020-10-16 2021-01-05 深圳云天励飞技术股份有限公司 图像处理方法及相关设备

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108197606A (zh) * 2018-01-31 2018-06-22 浙江大学 一种基于多尺度膨胀卷积的病理切片中异常细胞的识别方法
CN109886090A (zh) * 2019-01-07 2019-06-14 北京大学 一种基于多时间尺度卷积神经网络的视频行人再识别方法
CN110047069A (zh) * 2019-04-22 2019-07-23 北京青燕祥云科技有限公司 一种图像检测装置

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6151682A (en) * 1997-09-08 2000-11-21 Sarnoff Corporation Digital signal processing circuitry having integrated timing information
CN107742150B (zh) * 2016-10-31 2020-05-12 腾讯科技(深圳)有限公司 一种卷积神经网络的数据处理方法和装置
CN108229478B (zh) * 2017-06-30 2020-12-29 深圳市商汤科技有限公司 图像语义分割及训练方法和装置、电子设备、存储介质和程序
NZ759818A (en) * 2017-10-16 2022-04-29 Illumina Inc Semi-supervised learning for training an ensemble of deep convolutional neural networks
US11734545B2 (en) * 2017-11-14 2023-08-22 Google Llc Highly efficient convolutional neural networks
CN108364061B (zh) * 2018-02-13 2020-05-05 北京旷视科技有限公司 运算装置、运算执行设备及运算执行方法
CN108647776A (zh) * 2018-05-08 2018-10-12 济南浪潮高新科技投资发展有限公司 一种卷积神经网络卷积膨胀处理电路及方法
CN108960069A (zh) * 2018-06-05 2018-12-07 天津大学 一种用于单阶段物体检测器的增强上下文的方法
CN109598269A (zh) * 2018-11-14 2019-04-09 天津大学 一种基于多分辨率输入与金字塔膨胀卷积的语义分割方法
CN109829863B (zh) * 2019-01-22 2021-06-25 深圳市商汤科技有限公司 图像处理方法及装置、电子设备和存储介质
CN110009095B (zh) * 2019-03-04 2022-07-29 东南大学 基于深度特征压缩卷积网络的道路行驶区域高效分割方法
CN110009648B (zh) * 2019-03-04 2023-02-24 东南大学 基于深浅特征融合卷积神经网络的路侧图像车辆分割方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108197606A (zh) * 2018-01-31 2018-06-22 浙江大学 一种基于多尺度膨胀卷积的病理切片中异常细胞的识别方法
CN109886090A (zh) * 2019-01-07 2019-06-14 北京大学 一种基于多时间尺度卷积神经网络的视频行人再识别方法
CN110047069A (zh) * 2019-04-22 2019-07-23 北京青燕祥云科技有限公司 一种图像检测装置

Also Published As

Publication number Publication date
US20210326649A1 (en) 2021-10-21
CN110543849B (zh) 2022-10-04
SG11202106971YA (en) 2021-07-29
WO2021036013A1 (zh) 2021-03-04
TW202109365A (zh) 2021-03-01
KR20210113242A (ko) 2021-09-15
JP2022515274A (ja) 2022-02-17
CN110543849A (zh) 2019-12-06

Similar Documents

Publication Publication Date Title
TWI733276B (zh) 檢測器的配置方法及裝置、目標檢測方法及裝置、電子設備、電腦可讀儲存媒體和電腦程式
US20210012523A1 (en) Pose Estimation Method and Device and Storage Medium
TWI747325B (zh) 目標對象匹配方法及目標對象匹配裝置、電子設備和電腦可讀儲存媒介
US11048983B2 (en) Method, terminal, and computer storage medium for image classification
CN106651955B (zh) 图片中目标物的定位方法及装置
US11461925B2 (en) Pose prediction method and apparatus, and model training method and apparatus
TW202131281A (zh) 圖像處理方法及圖像處理裝置、電子設備和電腦可讀儲存媒介
US10564945B2 (en) Method and device for supporting multi-framework syntax
TW202026943A (zh) 錨點確定方法及裝置、電子設備和儲存介質
EP3687157A1 (en) Method for capturing images and electronic device
CN110458218B (zh) 图像分类方法及装置、分类网络训练方法及装置
US11216904B2 (en) Image processing method and apparatus, electronic device, and storage medium
US11734804B2 (en) Face image processing method and apparatus, electronic device, and storage medium
EP3879530A1 (en) Video processing method, video processing device, and storage medium
TW202117671A (zh) 圖像處理方法、電子設備和電腦可讀儲存介質
CN110059623B (zh) 用于生成信息的方法和装置
TWI738144B (zh) 訊息處理方法及其裝置、電子設備和儲存媒體
TW202107337A (zh) 一種人臉圖像識別方法及裝置、電子設備和電腦可讀儲存媒體
KR20220011783A (ko) 심볼 식별 방법 및 장치, 전자 기기 및 저장 매체
CN112306235A (zh) 一种手势操作方法、装置、设备和存储介质
CN108984628B (zh) 内容描述生成模型的损失值获取方法及装置
EP3425533A1 (en) Displaying page
TW202219822A (zh) 字元檢測方法、電子設備及電腦可讀儲存介質
TW202119281A (zh) 人臉識別方法、電子設備和儲存介質
US20190370934A1 (en) Image processing methods and apparatuses, electronic devices, and storage media