TWI741437B - 影像分析裝置與影像分析方法 - Google Patents
影像分析裝置與影像分析方法 Download PDFInfo
- Publication number
- TWI741437B TWI741437B TW108144943A TW108144943A TWI741437B TW I741437 B TWI741437 B TW I741437B TW 108144943 A TW108144943 A TW 108144943A TW 108144943 A TW108144943 A TW 108144943A TW I741437 B TWI741437 B TW I741437B
- Authority
- TW
- Taiwan
- Prior art keywords
- image
- container door
- correlation
- corrected image
- same
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/26—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
- G06V10/267—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/24—Aligning, centring, orientation detection or correction of the image
- G06V10/243—Aligning, centring, orientation detection or correction of the image by compensating for image skew or non-uniform image deformations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/13—Edge detection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/90—Determination of colour characteristics
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/50—Extraction of image or video features by performing operations within image blocks; by using histograms, e.g. histogram of oriented gradients [HoG]; by summing image-intensity values; Projection analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/56—Extraction of image or video features relating to colour
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/74—Image or video pattern matching; Proximity measures in feature spaces
- G06V10/75—Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
- G06V10/751—Comparing pixel values or logical combinations thereof, or feature values having positional relevance, e.g. template matching
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Software Systems (AREA)
- Databases & Information Systems (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Computing Systems (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- General Engineering & Computer Science (AREA)
- Image Analysis (AREA)
Abstract
一種影像分析裝置與影像分析方法被揭露。該影像分析裝置分別正規化第一影像與第二影像,以產生第一校正後影像與第二校正後影像,該第一校正後影像中的第一貨櫃門與該第二校正後影像中的第二貨櫃門的尺寸相同且像素座標相同。該影像分析裝置以相同的方式,分割該第一校正後影像為複數第一區塊,且分割該第二校正後影像為複數第二區塊。該影像分析裝置計算各該第一區塊與相對應的第二區塊之間的相關性,各該複數相關性包含灰階相關性與至少一彩色相關性。該影像分析裝置基於該複數相關性,判斷該第一與該第二貨櫃門是否代表同一個貨櫃門。
Description
本發明的實施例是關於一種影像分析裝置與影像分析方法。更具體而言,本發明的實施例是關於一種透過影像分析判斷二影像中的二個貨櫃門是否代表同一個貨櫃門的影像分析裝置與影像分析方法。
為了判斷入站貨櫃(運送後的貨櫃)是否與出站貨櫃(運送前的貨櫃)是同一個貨櫃,現有的做法大多是由入站的檢驗人員人工地比對出站貨櫃的貨櫃門影像和入站貨櫃的貨櫃門外觀。然而,普遍來說,這樣的人工檢驗的效率與精確性並不理想。在少數情況下,有可能會透過普通電腦來取代所述人工檢驗的某些動作,但這樣的普通電腦並不具有單獨檢驗貨櫃的能力,故整體上的效率和精確性仍不佳。因此,如何改善現有的貨櫃檢驗的效率與精確性,將是本發明所屬技術領域中亟待解決的問題。
為了解決至少上述的問題,本發明的實施例提供了一種影像分析裝置,其可包含互相電性連接的一儲存器與一處理器。該儲存器可用以儲存一第一影像與一第二影像,該第一影像包含一第一貨櫃門,該第二影像包含一第二貨櫃門。該處理器可用以:分別正規化該第一影像與該第二影
像,以產生一第一校正後影像與一第二校正後影像,該第一校正後影像中的該第一貨櫃門與該第二校正後影像中的該第二貨櫃門的尺寸相同且像素座標相同;以相同的方式,分割該第一校正後影像為複數第一區塊,且分割該第二校正後影像為複數第二區塊;計算各該第一區塊與相對應的第二區塊之間的一相關性,各該複數相關性包含一灰階相關性與至少一彩色相關性;以及基於該複數相關性,判斷該第一貨櫃門與該第二貨櫃門是否代表同一個貨櫃門。
為了解決至少上述的問題,本發明的實施例還提供了一種由一影像分析裝置執行的影像分析方法,其可包含以下步驟:分別正規化一第一影像與一第二影像,以產生一第一校正後影像與一第二校正後影像,該第一校正後影像中的該第一貨櫃門與該第二校正後影像中的該第二貨櫃門的尺寸相同且像素座標相同;以相同的方式,分割該第一校正後影像為複數第一區塊,且分割該第二校正後影像為複數第二區塊;計算各該第一區塊與相對應的第二區塊之間的一相關性,各該複數相關性包含一灰階相關性與至少一彩色相關性;以及基於該複數相關性,判斷該第一貨櫃門與該第二貨櫃門是否代表同一個貨櫃門。
在本發明的實施例中,藉由針對第一影像與第二影像的正規化處理,能夠在相同比較基礎下自動化地比較第一校正後影像和第二校正後影像並直接根據比較的結果來判斷入站貨櫃是否與出站貨櫃代表同一個貨櫃。因此,本發明的實施例能夠提供較高的檢驗效率。另一方面,在比對第一校正後影像與一第二校正後影像的過程中,不需要計算這二個影像之間的差異,而是分別計算同一位置的二個相對應區塊(第一區塊和第二區
塊)之間的相關性,故可以增強這二個影像之間的局部差異。除此之外,因針對同一位置的二個相對應區塊所計算的相關性包含了灰階相關性與彩色相關性,故能更反映出更多面向的特徵(例如圖案、形狀、顏色等)差異。因此,本發明的實施例也能夠提供較高的檢驗精確性。
以上內容並非為了限制本發明,而只是概括地敘述了本發明可解決的技術問題、可採用的技術手段以及可達到的技術功效,以讓本發明所屬技術領域中具有通常知識者初步地瞭解本發明。根據檢附的圖式及以下的實施方式所記載的內容,本發明所屬技術領域中具有通常知識者便可進一步瞭解本發明的各種實施例的細節。
如下所示:
1‧‧‧影像分析裝置
11‧‧‧處理器
13‧‧‧儲存器
IM1‧‧‧第一影像
IM2‧‧‧第二影像
D1‧‧‧第一貨櫃門
D2‧‧‧第二貨櫃門
ED1‧‧‧第一貨櫃門的邊緣
ED2‧‧‧第二貨櫃門的邊緣
RIM1‧‧‧第一校正後影像
RIM2‧‧‧第二校正後影像
x‧‧‧x軸
y‧‧‧y軸
B1、B11、B12‧‧‧第一區塊
B2、B21、B22‧‧‧第二區塊
R3、R31、R32‧‧‧相關性
4‧‧‧影像分析方法
41、43、45、47‧‧‧步驟
檢附的圖式可輔助說明本發明的各種實施例,其中:
第1圖例示了根據本發明的某些實施例的影像分析裝置;
第2A-2B圖例示了第1圖所示的影像分析裝置如何分析影像;
第3圖是根據本發明的某些實施例的相關性計算的示意圖;以及
第4圖例示了根據本發明的某些實施例的影像分析方法。
以下將透過多個實施例來說明本發明,惟這些實施例並非用以限制本發明只能根據所述操作、環境、應用、結構、流程或步驟來實施。為了易於說明,與本發明的實施例無直接關聯的內容或是不需特別說明也能理解的內容,將於本文以及圖式中省略。於圖式中,各元件(element)的尺寸以及各元件之間的比例僅是範例,而非用以限制本發明。除了特別說明之外,在以下內容中,相同(或相近)的元件符號可對應至相同(或相近)
的元件。在可被實現的情況下,如未特別說明,以下所述的每一個元件的數量可以是一個或多個。
本揭露使用之用語僅用於描述實施例,並不意圖限制本發明。除非上下文另有明確說明,否則單數形式「一」也旨在包括複數形式。「包括」、「包含」等用語指示所述特徵、整數、步驟、操作、元素及/或元件的存在,但並不排除一或多個其他特徵、整數、步驟、操作、元素、元件及/或前述之組合之存在。用語「及/或」包含一或多個相關所列項目的任何及所有的組合。
第1圖例示了根據本發明的某些實施例的影像分析裝置。第1圖所示內容僅是為了舉例說明本發明的實施例,而非為了限制本發明。
參照第1圖,影像分析裝置1可基本上包含互相電性連接(直接或間接連接)的處理器11與儲存器13。影像分析裝置1可以是例如但不限於:伺服器、筆記型電腦、平板電腦、桌上型電腦、行動裝置等。
處理器11可以是各種具備訊號處理功能的微處理器(microprocessor)或微控制器(microcontroller)。微處理器或微控制器是一種可程式化的特殊積體電路,其具有運算、儲存、輸出/輸入等能力,且可接受並處理各種編碼指令,藉以進行各種邏輯運算與算術運算,並輸出相應的運算結果。舉例而言,如後所述,處理器11可用以根據儲存於儲存器13的二個影像,分別產生二個校正後影像,並以相同的方式分割該二個校正後影像。在分割該二個校正後影像後,處理器11還可以計算相應的二個區塊之間的相關性,並根據所有的區塊相關性判斷此二個影像中出現的第一貨櫃門與第二貨櫃門是否代表同一個貨櫃門。
儲存器13可包含第一級儲存裝置(又稱主記憶體或內部記憶體),通常簡稱為記憶體,其與處理器11直接連接。處理器11可讀取儲存在記憶體內的指令集,並在需要時執行這些指令集。儲存器13還可包含第二級儲存裝置(又稱外部記憶體或輔助記憶體),其透過記憶體的I/O通道來與處理器11連接,並使用資料緩衝器來將資料傳輸至第一級儲存裝置。第二級記憶體可例如是各種類型的硬碟、光碟等。儲存器13亦可包含第三級儲存裝置,例如可直接插入或自電腦拔除的隨身碟、或是雲端硬碟。儲存器13可儲存影像分析裝置1本身產生的資料以及輸入至影像分析裝置1的各種資料。舉例而言,如後所述,儲存器13可用以儲存多個影像,該多個影像包含第一影像IM1與第二影像IM2。
在某些實施例中,除了處理器11與儲存器13,影像分析裝置1還可以包含輸入單元、輸出單元、及/或網路單元等等。輸入單元用以提供各種輸入介面(例如:文字、聲音、及/或影像輸入介面),以使影像分析裝置1從外部裝置(例如:滑鼠、鍵盤、麥克風、觸控螢幕)接收資料或指令。輸出單元用以提供各種輸出介面(例如:文字、聲音、及/或影像輸出介面),以使影像分析裝置1輸出資料或指令到外部裝置(例如:喇叭、顯示器、觸控螢幕)。網路單元用以提供各種網路介面(例如:有線網路介面及/或無線網路介面),以使影像分析裝置1透過各種網路(例如:無線行動網路、光纖網路、Wi-Fi網路等)與其他網路裝置連接。
第2A-2B圖例示了根據某些實施例第1圖所示的影像分析裝置進行影像分析的流程,而第3圖是根據本發明的某些實施例的相關性計算的示意圖。第2A-2B、3圖所示內容僅是為了舉例說明本發明的實施例,而
非為了限制本發明。舉例而言,在第2A-2B圖中,第一貨櫃門D1和第二貨櫃門D2的圖案只是作為例示,而非限制。另外,呈現在第2B圖中的相關性的數值只是例示,而非限制。
參照第2A圖,首先,處理器11可先從儲存器13擷取出第一影像IM1與第二影像IM2,其中第一影像IM1包含第一貨櫃門D1,且第二影像IM2包含第二貨櫃門D2。在第一影像IM1的座標系統的第一貨櫃門D1與第二影像IM2的第二貨櫃門D2的尺寸與像素座標不相同時,處理器11可分別正規化儲存器13所儲存的第一影像IM1與第二影像IM2,以產生一第一校正後影像RIM1與一第二校正後影像RIM2,且使第一校正後影像RIM1中的第一貨櫃門D1與第二校正後影像RIM2的第二貨櫃門D2之尺寸相同且對應的像素座標相同。另外,可使用二維座標(x軸與y軸)系統來定義與表示第一校正後影像RIM1與第二校正後影像RIM2。
在某些實施例中,處理器11可從第一影像IM1中辨識出該第一貨櫃門D1的邊緣ED1,然後根據該第一貨櫃門D1的該邊緣ED1的位置正規化該第一影像IM1。相似地,處理器11可從第二影像IM2中辨識出該第二貨櫃門D2的邊緣ED2,且根據該第二貨櫃門D2的該邊緣ED2的位置正規化該第二影像IM2。
以下有關處理器11正規化第一影像IM1與第二影像IM2的過程,將以第一影像IM1為例來說明,而在理解處理器11如何正規化第一影像IM1之後,本發明所屬技術領域中具有通常知識者將能夠了解處理器11如何正規化第二影像IM2。
舉例而言,處理器11可以透過索伯運算子(Sobel operator)
分別計算出第一影像IM1中第一貨櫃門D1的邊緣ED1以及第二影像IM2中第二貨櫃門D2的邊緣ED2。詳言之,處理器11可以透過處理器11可使用x軸方向的核函數(X-Direction Kernel)與y軸方向的核函數(Y-Direction Kernel)以分別在第一影像IM1上進行卷積運算,並根據運算結果偵測出第一影像IM1中貨櫃門的邊緣ED1。以相同的方法,處理器11可偵測出第二影像IM2中第二貨櫃門D2的邊緣ED2。舉例而言,x軸方向的核函數與y軸方向的核函數可表示如下:
根據邊緣ED1與邊緣ED2,處理器11可分別從第一影像IM1與第二影像IM2中辨識出第一貨櫃門D1與第二貨櫃門D2。在偵測出第一影像IM1中第一貨櫃門D1的邊緣ED1之後,處理器11可根據第一貨櫃門D1的轉角的座標正規化第一影像IM1,以產生第一校正後影像RIM1。同樣地,在偵測出第二影像IM2中第二貨櫃門D2的邊緣ED2之後,處理器11可根據第二貨櫃門D2的轉角的座標正規化第二影像IM2,以產生第二校正後影像RIM2。舉例而言,處理器11可以根據以下線性轉換式來計算出第一校正後影像RIM1與第二校正後影像RIM2:
在式一中,(x,y)是指第一影像IM1/第二影像IM2的像素的原始座標,而(T x (x,y),T y (x,y))則是指第一影像IM1/第二影像IM2被正規
化後相同像素的新座標。處理器11可根據第一影像IM1中第一貨櫃門D1中的複數個像素(例如,在邊緣ED1上的複數個像素)的原始座標(x,y),以及其被轉換為第一校正後影像RIM1後的對應的複數個預設像素的座標(T x (x,y),T y (x,y)),計算出該式一中的係數c 1 、c 2 、c 3 、c 4 、c 5 、c 6 、c 7 、c 8,以建立第一影像IM1轉換為第一校正後影像RIM1的一座標轉換規則。須說明,在上述示例中,式一中係數的數量為八個,故處理器11將需要根據第一影像IM1中的至少八個像素以及第一校正後影像RIM1中的對應的八個預設像素的座標,始能建立該座標轉換規則。同理,處理器11可以根據類似操作,以建立第二影像IM2轉換為第二校正後影像RIM2的一座標轉換規則。然後,處理器11可根據上述座標轉換規則,分別正規化第一影像IM1與第二影像IM2,以產生第一校正後影像RIM1與第二校正後影像RIM2。
第一校正後影像RIM1中的第一貨櫃門D1與第二校正後影像RIM2中的第二貨櫃門D2的尺寸相同且像素座標相同。換言之,第一校正後影像RIM1中的第一貨櫃門D1與第二校正後影像RIM2中的第二貨櫃門D2的像素數量相同,且第一校正後影像RIM1中的第一貨櫃門D1的每一個像素的座標分別與第二校正後影像RIM2中的第二貨櫃門D2的每一個像素的座標彼此完全對應。
在產生第一校正後影像RIM1與第二校正後影像RIM2之後,處理器11以相同的方式,分割第一校正後影像RIM1為複數第一區塊B1,且分割第二校正後影像RIM2為複數第二區塊B2。詳言之,如第2A圖所示,處理器11分別將第一校正後影像RIM1與第二校正後影像RIM2分割成數量相同的第一區塊B1與第二區塊B2,且對應的第一區塊B1與第二區塊B2之尺寸
也相同。區塊的數量可以根據不同的需求而調整,並不以第2A-2B圖中所示內容為限。
在分別分割第一校正後影像RIM1與第二校正後影像RIM2後,處理器11可計算各第一區塊B1與對應的第二區塊B2之間的相關性,各該複數相關性可單純包含灰階相關性,也可以包含灰階相關性與至少一彩色相關性。
在某些實施例中,處理器11可以根據以下函式來計算第一校正後影像RIM1的各第一區塊B1與相對應的第二校正後影像RIM2的第二區塊B2之間的相關性:
以第3圖為例,第一區塊B1與第二區塊B2的尺寸皆為k×j,f(s,t)表示為第一校正後影像RIM1中第一區塊B1中的像素,是第一區塊B1的所有像素的平均值,w(s,t)表示為相對應的第二校正後影像RIM2中第二區塊B2中的像素,是第二區塊B2的所有像素的平均值。根據式二,處理器11便可計算各第一區塊B1和相對應的第二區塊B2之間的相關性。
在某些實施例中,第一校正後影像RIM1與第二校正後影像RIM2中的像素可以僅以灰階參數來表示,或者以灰階參數和色彩參數來表示。舉例而言,可以使用YCbCr色彩空間來表示第一校正後影像RIM1與第二校正後影像RIM2中的像素,其中「Y」、「Cb」和「Cr」分別為流明(luminance)、藍色濃度偏移量和紅色濃度偏移量。「Y」可代表像素的灰階
值,而「Cb」值或「Cr」值則可代表像素的色彩值。
在使用YCbCr色彩空間表示第一校正後影像RIM1與第二校正後影像RIM2中的像素的情況下,處理器11針對每一個第一區塊B1以及相對應的第二區塊B2所計算的相關性也就屬於YCbCr色彩空間。舉例而言,在分別以「Y」、「Cb」和「Cr」來表示第一區塊B1與對應的第二區塊B2的像素的情況下,處理器11可分別計算出與「Y」相關的灰階相關性、以及與「Cb」和「Cr」相關的二個色彩相關性,然後根據此三個相關性,決定第一區塊B1與對應的第二區塊B2之間的最終相關性。在此範例中,處理器11可以從此三個相關性中選擇最小的一個作為第一區塊B1與對應的第二區塊B2之間的最終相關性。或者,處理器11可以將此三個相關性的平均值作為第一區塊B1與對應的第二區塊B2之間的最終相關性。
在某些實施例中,也可以使用RGB色彩空間或HSI色彩空間來表示第一校正後影像RIM1與第二校正後影像RIM2中的像素,並在此情況下計算各第一區塊B1與對應的第二區塊B2之間的相關性。
接著參照第2B圖,根據上述,處理器11可以計算各第一區塊B1與對應的第二區塊B2之間的相關性R3。舉例而言,處理器11可以計算第一區塊B11與對應的第二區塊B21之間的相關性R31,且計算第一區塊B12與對應的第二區塊B22之間的相關性R32,以此類推。每一個相關性R3可以是介於「0」與「1」之間的數值,且數值越高代表兩個區塊之間的相關性越高(相似度越高);反之,則代表兩個區塊之間越不相關(相似度越低)。舉例而言,因第一區塊B11與第二區塊B21的內容相當近似,故相關性R31達到「0.91」,而因第一區塊B12與第二區塊B22的內容不同(具有不同的形狀的
圖案),故相關性R32僅有「0.23」。
在計算出所有第一區塊B1與對應的第二區塊B2之間的相關性R3之後,處理器11可基於該些相關性R3,判斷第一貨櫃門D1與第二貨櫃門D2是否代表同一個貨櫃門。在某些實施例中,處理器11可針對各該複數第一區塊B1設定一相關性門檻值,且藉由分別比較該複數相關性R3與該複數相關性門檻值來判斷該第一貨櫃門D1與該第二貨櫃門D2是否代表同一個貨櫃門。根據不同的應用,這些相關性門檻值可以相同也可以不同。舉例而言,處理器11可以為所有第一區塊B1設定一個相同的相關性門檻值,若每一個相關性R3皆大於該相關性門檻值,則判定該第一貨櫃門D1與第二貨櫃門D2代表同一個貨櫃門;而若任一個相關性R3小於該相關性門檻值,則判定該第一貨櫃門D1與第二貨櫃門D2不代表同一個貨櫃門。又舉例而言,處理器11可根據每一個第一區塊B1的重要性(權重)設定不同的相關性門檻值,若每一個相關性R3皆大於相對應的相關性門檻值,則判定該第一貨櫃門D1與第二貨櫃門D2代表同一個貨櫃門;而若任一個相關性R3小於相對應的相關性門檻值,則判定該第一貨櫃門D1與第二貨櫃門D2不代表同一個貨櫃門。
第4圖例示了根據本發明的某些實施例的影像分析方法。第4圖所示內容僅是為了舉例說明本發明的實施例,而非為了限制本發明。
參照第4圖,一種由一影像分析裝置執行的影像分析方法4可包含以下步驟:分別正規化一第一影像與一第二影像,以產生一第一校正後影像與一第二校正後影像,該第一校正後影像中的一第一貨櫃門與該第二校正後影像中的一第二貨櫃門的尺寸相同且像素座標相同(標示為步驟
41);以相同的方式,分割該第一校正後影像為複數第一區塊,且分割該第二校正後影像為複數第二區塊(標示為步驟43);計算各該第一區塊與相對應的第二區塊之間的一相關性,各該複數相關性包含一灰階相關性與至少一彩色相關性(標示為步驟45);以及基於該複數相關性,判斷該第一貨櫃門與該第二貨櫃門是否代表同一個貨櫃門(標示為步驟47)。
第4圖所示的步驟順序並非限制,且在仍可以實施影像分析方法4的情況下,該步驟順序可以被調整。
在某些實施例中,步驟47還可包含以下步驟:針對各該複數第一區塊設定一相關性門檻值,且藉由分別比較該複數相關性與該複數相關性門檻值來判斷該第一貨櫃門與該第二貨櫃門是否代表同一個貨櫃門。
在某些實施例中,上述各該複數相關性可以屬於YCbCr色彩空間。
在某些實施例中,步驟41還可包含以下步驟:從第一影像中辨識出該第一貨櫃門的邊緣,且根據該第一貨櫃門的該邊緣正規化該第一影像;以及從第二影像中辨識出該第二貨櫃門的邊緣,且根據該第二貨櫃門的該邊緣正規化該第二影像。
影像分析方法4的每一個實施例本質上都會與影像分析裝置1的某一個實施例相對應。因此,即使上文漏未針對影像分析方法4的每一個實施例進行詳述,本發明所屬技術領域中具有通常知識者仍可根據上文針對影像分析裝置1的說明而直接瞭解影像分析方法4的未詳述的實施例。
上述實施例只是舉例來說明本發明,而非為了限制本發明。任何針對上述實施例進行修飾、改變、調整、整合而產生的其他實施例,只
要是本發明所屬技術領域中具有通常知識者不難思及的,都涵蓋在本發明的保護範圍內。本發明的保護範圍以申請專利範圍為準。
4‧‧‧影像分析方法
41、43、45、47‧‧‧步驟
Claims (6)
- 一種影像分析裝置,包含:一儲存器,用以儲存一第一影像與一第二影像,該第一影像包含一第一貨櫃門,該第二影像包含一第二貨櫃門;以及一處理器,與該儲存器電性連接,且用以:分別正規化該第一影像與該第二影像,以產生一第一校正後影像與一第二校正後影像,該第一校正後影像中的該第一貨櫃門與該第二校正後影像中的該第二貨櫃門的尺寸相同且像素座標相同;以相同的方式,分割該第一校正後影像為複數第一區塊,且分割該第二校正後影像為複數第二區塊;計算各該第一區塊與相對應的第二區塊之間的一相關性,各該複數相關性包含一灰階相關性與至少一彩色相關性;以及基於該複數相關性,判斷該第一貨櫃門與該第二貨櫃門是否代表同一個貨櫃門;其中,該處理器還針對各該複數第一區塊設定一相關性門檻值,且藉由分別比較該複數相關性與該複數相關性門檻值來判斷該第一貨櫃門與該第二貨櫃門是否代表同一個貨櫃門。
- 如請求項1所述的影像分析裝置,其中各該複數相關性屬於YCbCr色彩空間。
- 如請求項1所述的影像分析裝置,其中該處理器還用以:從該第一影像中辨識出該第一貨櫃門的邊緣,且根據該第一貨櫃門的該邊緣正規化該第一影像;以及 從該第二影像中辨識出該第二貨櫃門的邊緣,且根據該第二貨櫃門的該邊緣正規化該第二影像。
- 一種由一影像分析裝置執行的影像分析方法,包含:分別正規化一第一影像與一第二影像,以產生一第一校正後影像與一第二校正後影像,該第一校正後影像中的一第一貨櫃門與該第二校正後影像中的一第二貨櫃門的尺寸相同且像素座標相同;以相同的方式,分割該第一校正後影像為複數第一區塊,且分割該第二校正後影像為複數第二區塊;計算各該第一區塊與相對應的第二區塊之間的一相關性,各該複數相關性包含一灰階相關性與至少一彩色相關性;以及基於該複數相關性,判斷該第一貨櫃門與該第二貨櫃門是否代表同一個貨櫃門;其中,判斷該第一貨櫃門與該第二貨櫃門是否代表同一個貨櫃門的該步驟還包含:針對各該複數第一區塊設定一相關性門檻值,且藉由分別比較該複數相關性與該複數相關性門檻值來判斷該第一貨櫃門與該第二貨櫃門是否代表同一個貨櫃門。
- 如請求項4所述的影像分析方法,其中各該複數相關性屬於YCbCr色彩空間。
- 如請求項4所述的影像分析方法,其中正規化該第一影像與該第二影像的該步驟還包含:從該第一影像中辨識出該第一貨櫃門的邊緣,且根據該第一貨櫃門的該邊緣正規化該第一影像;以及 從該第二影像中辨識出該第二貨櫃門的邊緣,且根據該第二貨櫃門的該邊緣正規化該第二影像。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW108144943A TWI741437B (zh) | 2019-12-09 | 2019-12-09 | 影像分析裝置與影像分析方法 |
CN201911257650.3A CN113033561B (zh) | 2019-12-09 | 2019-12-10 | 影像分析装置与影像分析方法 |
US16/709,653 US11164034B2 (en) | 2019-12-09 | 2019-12-10 | Image analysis apparatus and image analysis method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW108144943A TWI741437B (zh) | 2019-12-09 | 2019-12-09 | 影像分析裝置與影像分析方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
TW202123170A TW202123170A (zh) | 2021-06-16 |
TWI741437B true TWI741437B (zh) | 2021-10-01 |
Family
ID=76210920
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW108144943A TWI741437B (zh) | 2019-12-09 | 2019-12-09 | 影像分析裝置與影像分析方法 |
Country Status (3)
Country | Link |
---|---|
US (1) | US11164034B2 (zh) |
CN (1) | CN113033561B (zh) |
TW (1) | TWI741437B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20200339298A1 (en) * | 2019-04-23 | 2020-10-29 | Walmart Apollo, Llc | System and method for opening containers |
CN113591861B (zh) * | 2021-07-08 | 2024-05-14 | 杭州网易智企科技有限公司 | 图像处理方法、装置、计算设备及存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TWI231918B (en) * | 2003-03-27 | 2005-05-01 | Chunghwa Telecom Co Ltd | Automatic container number recognition method enabling color separation and result collection |
TW200813892A (en) * | 2006-04-24 | 2008-03-16 | Abb Ab | Automatic system for processing inspection data |
EP2270547A2 (en) * | 2009-06-04 | 2011-01-05 | Siemens Industry, Inc. | Cargo screening and tracking system and method |
US9686481B1 (en) * | 2014-03-17 | 2017-06-20 | Amazon Technologies, Inc. | Shipment evaluation using X-ray imaging |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9177210B2 (en) | 2007-10-30 | 2015-11-03 | Hki Systems And Service Llc | Processing container images and identifiers using optical character recognition and geolocation |
TWI416069B (zh) * | 2010-01-21 | 2013-11-21 | Tatung Co | 影像偵測方法 |
US9336575B2 (en) * | 2012-06-25 | 2016-05-10 | Konica Minolta, Inc. | Image processing apparatus, image processing method, and image processing program |
CN105957111B (zh) * | 2016-04-27 | 2018-09-18 | 深圳积木易搭科技技术有限公司 | 序列遥感影像的色调一致性校正方法及系统 |
TWI591543B (zh) | 2016-11-01 | 2017-07-11 | Chunghwa Telecom Co Ltd | Container loading and unloading container tracking system and method |
CN110428473B (zh) * | 2019-06-18 | 2022-06-14 | 南昌大学 | 一种基于辅助变量的对抗生成网络的彩色图像灰度化方法 |
-
2019
- 2019-12-09 TW TW108144943A patent/TWI741437B/zh active
- 2019-12-10 US US16/709,653 patent/US11164034B2/en active Active
- 2019-12-10 CN CN201911257650.3A patent/CN113033561B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TWI231918B (en) * | 2003-03-27 | 2005-05-01 | Chunghwa Telecom Co Ltd | Automatic container number recognition method enabling color separation and result collection |
TW200813892A (en) * | 2006-04-24 | 2008-03-16 | Abb Ab | Automatic system for processing inspection data |
EP2270547A2 (en) * | 2009-06-04 | 2011-01-05 | Siemens Industry, Inc. | Cargo screening and tracking system and method |
US9686481B1 (en) * | 2014-03-17 | 2017-06-20 | Amazon Technologies, Inc. | Shipment evaluation using X-ray imaging |
Also Published As
Publication number | Publication date |
---|---|
US20210174126A1 (en) | 2021-06-10 |
CN113033561B (zh) | 2023-07-07 |
CN113033561A (zh) | 2021-06-25 |
TW202123170A (zh) | 2021-06-16 |
US11164034B2 (en) | 2021-11-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2021057848A1 (zh) | 网络的训练方法、图像处理方法、网络、终端设备及介质 | |
WO2019137038A1 (zh) | 注视点确定方法、对比度调节方法及对比度调节装置、虚拟现实设备及存储介质 | |
TWI620441B (zh) | 即時影像擷取參數的機器學習之技術 | |
US9262690B2 (en) | Method and device for detecting glare pixels of image | |
WO2020253127A1 (zh) | 脸部特征提取模型训练方法、脸部特征提取方法、装置、设备及存储介质 | |
US9076221B2 (en) | Removing an object from an image | |
TWI741437B (zh) | 影像分析裝置與影像分析方法 | |
US8320670B1 (en) | Hough transform method for linear ribbon and circular ring detection in the gradient domain | |
WO2020228739A1 (zh) | 光伏组件缺陷的检测方法和装置、分类器的训练方法、终端设备及非暂时性存储介质 | |
CN106611415B (zh) | 一种皮肤区域的检测方法及装置 | |
WO2021042823A1 (zh) | 图片检测方法及装置 | |
US10517523B2 (en) | Skin aging state assessment method and electronic device | |
TWI731442B (zh) | 電子裝置及其利用觸控資料的物件資訊辨識方法 | |
WO2022105569A1 (zh) | 页面方向识别方法、装置、设备及计算机可读存储介质 | |
WO2017101534A1 (zh) | 液晶显示屏的色彩信号转换方法及装置 | |
EP3715834B1 (en) | Grain identification method and device, and computer storage medium | |
US8724862B2 (en) | Image processing apparatus, image processing method, and non-transitory computer readable storage medium | |
US10497148B2 (en) | Skin undertone determining method and an electronic device | |
US20190206089A1 (en) | Backdrop color detection | |
US10839519B2 (en) | Techniques to improve edge detection for images | |
JP7003776B2 (ja) | 色決定方法、装置及び電子機器 | |
US9336608B2 (en) | Color arrangement checking device, information storage medium storing a computer program thereof, and data processing method | |
AU2014277851A1 (en) | Detecting a gap between text columns from text line fragments | |
TWI715252B (zh) | 電子裝置及其利用觸控資料的物件資訊辨識方法 | |
JP5593884B2 (ja) | 特徴点判定装置、特徴点判定方法および特徴点判定プログラム |