TWI830628B - 影像產生方法與影像產生裝置 - Google Patents
影像產生方法與影像產生裝置 Download PDFInfo
- Publication number
- TWI830628B TWI830628B TW112110395A TW112110395A TWI830628B TW I830628 B TWI830628 B TW I830628B TW 112110395 A TW112110395 A TW 112110395A TW 112110395 A TW112110395 A TW 112110395A TW I830628 B TWI830628 B TW I830628B
- Authority
- TW
- Taiwan
- Prior art keywords
- image
- mask
- image mask
- processor
- moving
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 15
- 230000008859 change Effects 0.000 claims abstract description 12
- 230000009467 reduction Effects 0.000 claims description 16
- 230000004044 response Effects 0.000 claims description 5
- 230000000873 masking effect Effects 0.000 claims 1
- 238000012549 training Methods 0.000 description 9
- 238000010586 diagram Methods 0.000 description 6
- 238000013473 artificial intelligence Methods 0.000 description 4
- 238000012545 processing Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/774—Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T1/00—General purpose image data processing
- G06T1/0007—Image acquisition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T1/00—General purpose image data processing
- G06T1/20—Processor architectures; Processor configuration, e.g. pipelining
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T1/00—General purpose image data processing
- G06T1/60—Memory management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T11/00—2D [Two Dimensional] image generation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/60—Rotation of whole images or parts thereof
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computing Systems (AREA)
- Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Multimedia (AREA)
- Image Processing (AREA)
- Image Analysis (AREA)
- Facsimile Scanning Arrangements (AREA)
Abstract
本案揭示一種影像產生方法與影像產生裝置。所述方法包括:從儲存電路中讀取第一影像;在第一影像上設置影像遮罩,其中影像遮罩覆蓋第一影像的一部分影像區域;隨機移動影像遮罩,以改變影像遮罩在第一影像中的覆蓋範圍,且影像遮罩的覆蓋範圍不超出第一影像的邊緣;根據移動後的影像遮罩從第一影像中擷取第二影像;以及將第二影像儲存至儲存電路。
Description
本案是有關於一種影像產生方法與影像產生裝置。
傳統上,在影像辨識模型的開發與訓練階段中,開發人員往往需要花費許多時間收集訓練影像,例如以人工的方式收集大量與待辨識的目標相關但又彼此不同的影像,然後再利用這些訓練影像來訓練影像辨識模型,以提高影像辨識模型對待辨識的目標的識別能力。但是,這種訓練影像的收集方式的效率很低。實務上,甚至可能花費了大量時間也無法收集到足夠數量的訓練影像來對影像辨識模型進行訓練,從而導致影像辨識模型的影像辨識能力遲遲無法提升。
本案提供一種影像產生方法,其包括:從儲存電路中讀取第一影像;在所述第一影像上設置影像遮罩,其中所述影像遮
罩覆蓋所述第一影像的一部分影像區域;隨機移動所述影像遮罩,以改變所述影像遮罩在所述第一影像中的覆蓋範圍,且所述影像遮罩的所述覆蓋範圍不超出所述第一影像的邊緣;根據移動後的所述影像遮罩從所述第一影像中擷取第二影像;以及將所述第二影像儲存至所述儲存電路。
本案另提供一種影像產生裝置,其包括儲存電路與處理器。所述處理器耦接至所述儲存電路。所述處理器用以:從所述儲存電路中讀取第一影像;在所述第一影像上設置影像遮罩,其中所述影像遮罩覆蓋所述第一影像的一部分影像區域;隨機移動所述影像遮罩,以改變所述影像遮罩在所述第一影像中的覆蓋範圍,且所述影像遮罩的所述覆蓋範圍不超出所述第一影像的邊緣;根據移動後的所述影像遮罩從所述第一影像中擷取第二影像;以及將所述第二影像儲存至所述儲存電路。
基於上述,在從儲存電路中讀取第一影像後,影像遮罩可設置於第一影像上,以覆蓋第一影像的一部分影像區域。然後,所述影像遮罩可被隨機移動,以改變所述影像遮罩在第一影像中的覆蓋範圍。特別是,所述影像遮罩的覆蓋範圍不會超出第一影像的邊緣。然後,第二影像可根據移動後的影像遮罩從第一影像中擷取出來並且被儲存至儲存電路。藉此,即可根據少量的影像(即第一影像)來隨機產生類似但又各不相同的多個影像(即第二影像)。
10:電子裝置
11:處理器
12:儲存電路
13:輸入/輸出介面
101,102,102(1)~102(n),21,41,43,51,53,61,63:影像
22,42,52,62:影像遮罩
201~204:邊緣
A1~A4,B1~B4:端點
W1,W2:寬度
H1,H2:長度
D1~D4,D1’~D4’:距離
θ:旋轉角度
S701~S705:步驟
圖1是根據本發明的實施例所繪示的影像產生裝置的示意圖。
圖2是根據本發明的實施例所繪示的第一影像與影像遮罩的示意圖。
圖3是根據本發明的實施例所繪示的旋轉影像遮罩的示意圖。
圖4是根據本發明的實施例所繪示的移動影像遮罩並根據移動後的影像遮罩產生第二影像的示意圖。
圖5是根據本發明的實施例所繪示的移動影像遮罩並根據移動後的影像遮罩產生第二影像的示意圖。
圖6是根據本發明的實施例所繪示的移動影像遮罩並根據移動後的影像遮罩產生第二影像的示意圖。
圖7是根據本發明的實施例所繪示的影像產生方法的流程圖。
請參照圖1,電子裝置(亦稱為影像產生裝置)10可為智慧型手機、平板電腦、筆記型電腦、個人電腦或伺服器等各式具有資料儲存與影像處理功能的電子裝置,且電子裝置10的類型不限於此。
電子裝置10可包括處理器11、儲存電路12及輸入/輸出介面13。處理器11用以負責處理器11的整體或部分操作。例如,處理器11可包括中央處理單元(Central Processing Unit,CPU)、影像處理單元(Graphics Processing Unit,GPU)或是其他可程式化之一般用途或特殊用途的微處理器、數位訊號處理器(Digital Signal Processor,DSP)、可程式化控制器、特殊應用積體電路(Application Specific Integrated Circuits,ASIC)、可程式化邏輯裝置(Programmable Logic Device,PLD)或其他類似裝置或這些裝置的組合。
儲存電路12耦接至處理器11並用以儲存資料。例如,儲存電路12可包括非揮發性儲存電路與揮發性儲存電路。非揮發性儲存電路可包括唯讀記憶體(Read Only Memory,ROM)、快閃記憶體、傳統硬碟(Hard disk drive,HDD)或類似的非揮發性儲存媒體。揮發性儲存電路可包括動態隨機存取記憶體(Dynamic Random Access Memory,DRAM)或類似的揮發性儲存媒體。
輸入/輸出介面13耦接至處理器11並用以接收輸入訊號及/或發送輸出訊號。例如,輸入/輸出介面13可包括顯示器、網路介面卡、滑鼠、鍵盤、觸控板、觸控面板、搖桿、遙控器、麥克風及/或揚聲器等,且輸入/輸出介面13的類型不限於此。此外,電子裝置10還可包括電池、電源管理電路及/或其他類型的電路模組,本發明不加以限制。
在一實施例中,儲存電路12可用以儲存影像(亦稱為第一
影像)101。影像101可包括二維影像或三維影像。此外,影像101的數量可為一或多個,本發明不加以限制。
在一實施例中,處理器11可從儲存電路12中讀取影像101。在取得影像101後,處理器11可在影像101上設置一個影像遮罩。此影像遮罩可(僅)覆蓋影像101的一部分影像區域。須注意的是,此影像遮罩的形狀可為矩形、圓形、橢圓形或其他形狀,本發明不加以限制。此外,此影像遮罩的形狀可相同或不同於影像101的形狀,本發明不加以限制。
在一實施例中,處理器11可根據一個縮小比例與影像101的原始尺寸來產生此影像遮罩。因此,此影像遮罩的尺寸與影像101的原始尺寸之間的關係可符合此縮小比例之規範。例如,假設此縮小比例為0.8,則所產生的影像遮罩的尺寸與影像101的原始尺寸之間的關係可為:影像遮罩的尺寸為影像101的原始尺寸的0.8倍。或者,假設此縮小比例為0.9,則所產生的影像遮罩的尺寸與影像101的原始尺寸之間的關係可為:影像遮罩的尺寸為影像101的原始尺寸的0.9倍。須注意的是,此縮小比例還可以是介於0與1之間的其他數值(例如0.7、0.75、0.85或0.95等),本發明不加以限制。
在一實施例中,假設影像101的形狀為矩形,則影像101的原始尺寸可由影像101的長度、寬度及/或總面積來表示或界定。或者,在一實施例中,假設影像101的形狀為圓形或橢圓形,則影像101的原始尺寸可由影像101的半徑及/或總面積來表示或
界定。類似的,在一實施例中,假設影像遮罩的形狀為矩形,則影像遮罩的尺寸可由影像遮罩的長度、寬度及/或總面積來表示或界定。或者,在一實施例中,假設影像遮罩的形狀為圓形或橢圓形,則影像遮罩的尺寸可由影像遮罩的半徑及/或總面積來表示或界定。
在一實施例中,處理器11可將影像101的原始尺寸乘上此縮小比例,以決定此影像遮罩的尺寸。例如,處理器11可將影像101的長度、寬度、半徑或總面積乘上此縮小比例,以獲得影像遮罩的長度、寬度、半徑或總面積。
在一實施例中,處理器11可透過輸入/輸出介面13接收使用者操作。此使用者操作可帶有使用者所輸入或選擇的縮小比例之資訊。處理器11可根據此使用者操作來決定此縮小比例。或者,在一實施例中,此縮小比例亦可為預設值或者由使用者從多個候選值中挑選,本發明不加以限制。
在一實施例中,在設置影像遮罩後,處理器11可隨機移動此影像遮罩,以改變此影像遮罩在影像101中的覆蓋範圍。須注意的是,此影像遮罩的覆蓋範圍不可超出影像101的邊緣。也就是說,此影像遮罩可以在不超出影像101的邊緣之前提下,隨機在影像101中進行移動(例如平移及/或旋轉),以改變此影像遮罩的位置及其在影像101中的覆蓋範圍。
在一實施例中,在隨機移動影像遮罩後,處理器11可根據移動後的影像遮罩從101影像中擷取影像(亦稱為第二影
像)102。例如,在隨機移動影像遮罩後,處理器11可從影像遮罩當前的覆蓋範圍中擷取影像101的部分影像並根據所擷取的影像來產生影像102。然後,處理器11可將影像102儲存至儲存電路12中。
在一實施例中,影像102的數量可為一個。在一實施例中,影像102可包括多個影像102(1)~102(n)。在一實施例中,處理器11可隨機移動影像遮罩並根據移動後的影像遮罩從101影像中擷取影像102(i)。在擷取影像102(i)後,處理器11可再次隨機移動影像遮罩並根據移動後的影像遮罩從101影像中擷取影像102(j)。i與j皆介於1與n之間且i不等於j。依此類推,在一實施例中,處理器11可根據單一影像101隨機產生多個類似但又各不相同的多個影像102(1)~102(n)。
請參照圖1與圖2,在一實施例中,假設影像101包括影像21。影像21的形狀為矩形。影像21的長度與寬度分別以H1與W1來表示。影像21的寬度方向平行於二維座標空間(亦稱為X-Y平面)中的一個參考方向(亦稱為第一參考方向)。例如,第一參考方向為二維座標空間中的+/-X軸方向。影像21的長度方向平行於二維座標空間中的另一個參考方向(亦稱為第二參考方向)。例如,第二參考方向為二維座標空間中的+/-Y軸方向。此外,影像21具有四個邊緣201~204與四個端點A1~A4。端點A1~A4的座標分別為(X1a,Y1a)、(X1b,Y1b)、(X1c,Y1c)及(X1d,Y1d)。其中,(X1b,Y1b)=(X1a+W1,Y1a),(X1c,Y1c)=(X1a,Y1a+H1),且(X1d,
Y1d)=(X1a+W1,Y1a+H1)。
在一實施例中,處理器11可在影像21中設置影像遮罩22。影像遮罩22的形狀也為矩形。影像遮罩22的長度與寬度分別以H2與W2來表示。例如,假設對應於寬度的縮小比例為S1且對應於長度的縮小比例為S2,則W2=W1×S1,且H2=H1×S2。S1與S2皆為0與1之間的數值。
在一實施例中,影像遮罩22的寬度方向平行於第一參考方向(即+/-X軸方向)。影像遮罩22的長度方向平行於第二參考方向(即+/-Y軸方向)。影像遮罩22具有四個端點B1~B4。端點B1~B4的座標分別為(X2a,Y2a)、(X2b,Y2b)、(X2c,Y2c)及(X2d,Y2d)。其中,(X2b,Y2b)=(X2a+W2,Y2a),(X2c,Y2c)=(X2a,Y2a+H2),且(X2d,Y2d)=(X2a+W2,Y2a+H2)。此外,影像遮罩22在影像21中的覆蓋範圍以圖2中的斜線表示。在一實施例中,影像遮罩22的初始設置位置還可根據實務需求調整,本發明不加以限制。
在一實施例中,處理器11可隨機決定影像遮罩22的移動方向與移動距離。例如,處理器11可根據一或多個隨機函數來產生多個隨機值。處理器11可根據此些隨機值的其中之一(亦稱為第一隨機值)來決定影像遮罩22的移動方向。例如,不同的第一隨機值對應於不同的移動方向。此外,處理器11可根據此些隨機值的其中之另一(亦稱為第二隨機值)來決定影像遮罩22的移動距離。例如,不同的第二隨機值對應於不同的移動距離。然後,處理器11可根據所決定的移動方向與移動距離來移動(即平移)影像
遮罩22。
在一實施例中,處理器11可根據影像21的邊緣201與影像遮罩22的端點B1(或B2)之間在-Y軸方向上的距離D1決定對應於-Y軸方向的一個移動距離臨界值(亦稱為第一移動距離臨界值)。特別是,端點B1(或B2)相較於影像遮罩22的其餘端點B3(或B4)在-Y軸方向上更靠近邊緣201。例如,第一移動距離臨界值可小於或等於距離D1。然後,處理器11可將影像遮罩22在-Y軸方向上的移動距離限制為不大於第一移動距離臨界值。換言之,處理器11可基於第一移動距離臨界值來限制影像遮罩22在-Y軸方向上的隨機的移動距離。藉此,可避免移動後的影像遮罩22的覆蓋範圍超出影像21的邊緣201。
在一實施例中,處理器11可根據影像22的邊緣202與影像遮罩22的端點B2(或B4)之間在+X軸方向上的距離D2決定對應於+X軸方向的一個移動距離臨界值(亦稱為第二移動距離臨界值)。特別是,端點B2(或B4)相較於影像遮罩22的其餘端點B1(或B3)在+X軸方向上更靠近邊緣202。例如,第二移動距離臨界值可小於或等於距離D2。然後,處理器11可將影像遮罩22在+X軸方向上的移動距離限制為不大於第二移動距離臨界值。換言之,處理器11可基於第二移動距離臨界值來限制影像遮罩22在+X軸方向上的隨機的移動距離。藉此,可避免移動後的影像遮罩22的覆蓋範圍超出影像21的邊緣202。
在一實施例中,處理器11可根據影像21的邊緣203與
影像遮罩22的端點B3(或B4)之間在+Y軸方向上的距離D3決定對應於+Y軸方向的一個移動距離臨界值(亦稱為第三移動距離臨界值)。特別是,端點B3(或B4)相較於影像遮罩22的其餘端點B1(或B2)在+Y軸方向上更靠近邊緣203。例如,第三移動距離臨界值可小於或等於距離D3。然後,處理器11可將影像遮罩22在+Y軸方向上的移動距離限制為不大於第三移動距離臨界值。換言之,處理器11可基於第三移動距離臨界值來限制影像遮罩22在+Y軸方向上的隨機的移動距離。藉此,可避免移動後的影像遮罩22的覆蓋範圍超出影像21的邊緣203。
在一實施例中,處理器11可根據影像21的邊緣204與影像遮罩22的端點B1(或B3)之間在-X軸方向上的距離D4決定對應於-X軸方向的一個移動距離臨界值(亦稱為第四移動距離臨界值)。特別是,端點B1(或B3)相較於影像遮罩22的其餘端點B2(或B4)在-X軸方向上更靠近邊緣204。例如,第四移動距離臨界值可小於或等於距離D4。然後,處理器11可將影像遮罩22在-X軸方向上的移動距離限制為不大於第四移動距離臨界值。換言之,處理器11可基於第四移動距離臨界值來限制影像遮罩22在-X軸方向上的隨機的移動距離。藉此,可避免移動後的影像遮罩22的覆蓋範圍超出影像21的邊緣204。
請參照圖1與圖3,在一實施例中,處理器11可隨機決定影像遮罩22的一個旋轉角度(亦稱為第一旋轉角度)θ。例如,旋轉角度θ可為0至360度之間的任意角度。處理器11可根據旋
轉角度θ來旋轉影像遮罩22。例如,處理器11可以影像遮罩22的中心點C1為軸心,在X-Y平面上將影像遮罩22旋轉θ度。例如,中心點C1的座標可為(X3,Y3)。在根據旋轉角度θ來旋轉影像遮罩22後,影像遮罩22的四個端點B1~B4的座標可分別被更新為(X2a’,Y2a’)、(X2b’,Y2b’)、(X2c’,Y2c’)及(X2d’,Y2d’)。
在一實施例中,根據更新後的端點B1~B4的座標,處理器11可判斷旋轉後的影像遮罩22的覆蓋範圍是否超出影像21的任一邊緣。在一實施例中,響應於旋轉後的影像遮罩22的覆蓋範圍超出影像21的任一邊緣,處理器11可捨棄該次對影像遮罩22的旋轉。在一實施例中,響應於旋轉後的影像遮罩22的覆蓋範圍未超出影像21的任一邊緣,處理器11可保留該次對影像遮罩22的旋轉。
在一實施例中,響應於旋轉後的影像遮罩22的覆蓋範圍超出影像21的任一邊緣,處理器11可隨機決定影像遮罩22的另一個旋轉角度(亦稱為第二旋轉角度)。例如,第二旋轉角度也可為0至360度之間的任意角度,且第一旋轉角度不同於第二旋轉角度。然後,處理器11可根據第二旋轉角度來旋轉影像遮罩22。在一實施例中,處理器11可使用不同的隨機決定的旋轉角度來重複旋轉影像遮罩22,直到旋轉後的影像遮罩22未超出影像21的任一邊緣為止。須注意的是,在一實施例中,處理器11亦可根據使用者操作來決定第一旋轉角度及/或第二旋轉角度,本發明不加以限制。
在一實施例中,在旋轉影像遮罩22後,處理器11可隨機決定影像遮罩22的移動方向與移動距離。然後,處理器11可根據隨機決定的移動方向與移動距離來移動(即平移)影像遮罩22。
在一實施例中,在旋轉影像遮罩22後,處理器11可獲得距離D1’、D2’、D3’及D4’。距離D1’為旋轉後的影像遮罩22的端點B2與影像21的邊緣201之間的距離(即影像遮罩22的邊緣與邊緣201之間的最短距離)。距離D2’為旋轉後的影像遮罩22的端點B4與影像21的邊緣202之間的距離(即影像遮罩22的邊緣與邊緣202之間的最短距離)。距離D3’為旋轉後的影像遮罩22的端點B3與影像21的邊緣203之間的距離(即影像遮罩22的邊緣與邊緣203之間的最短距離)。距離D4’為旋轉後的影像遮罩22的端點B1與影像21的邊緣204之間的距離(即影像遮罩22的邊緣與邊緣204之間的最短距離)。處理器11可根據距離D1’、D2’、D3’及D4’來分別更新第一移動距離臨界值、第二移動距離臨界值、第三移動距離臨界值及第四移動距離臨界值。例如,更新後的第一移動距離臨界值、第二移動距離臨界值、第三移動距離臨界值及第四移動距離臨界值可分別小於或相同於距離D1’、D2’、D3’及D4’。
在一實施例中,在旋轉影像遮罩22後,處理器11可將影像遮罩22在-Y軸方向上的移動距離限制為不大於更新後的第一移動距離臨界值,將影像遮罩22在+X軸方向上的移動距離限制為不大於更新後的第二移動距離臨界值,將影像遮罩22在+Y
軸方向上的移動距離限制為不大於更新後的第三移動距離臨界值,並將影像遮罩22在-X軸方向上的移動距離限制為不大於更新後的第四移動距離臨界值。處理器11可基於此些移動距離臨界值來隨機移動(例如平移)影像遮罩22。藉此,可避免移動(即旋轉並平移)後的影像遮罩22的覆蓋範圍超出影像21的任一邊緣。然後,處理器11可根據移動後的影像遮罩22來產生影像102。
在一實施例中,處理器11可連續移動(例如旋轉及/或平移)影像遮罩22。處理器11可根據連續移動的影像遮罩22依序產生圖1的影像102(1)~102(n)。相關操作細節已詳述於上,在此不多加贅述。
請參照圖1與圖4,在一實施例中,假設影像101包括影像41,且影像102包括影像43。在設置影像遮罩42後,處理器11可隨機移動(例如平移)影像遮罩42,以改變影像遮罩42在影像41上的覆蓋範圍。在移動影像遮罩42後,處理器11可從影像41中擷取影像遮罩42的覆蓋範圍內的影像並根據所擷取的影像產生影像43。
請參照圖1與圖5,在一實施例中,假設影像101包括影像51,且影像102包括影像53。在設置影像遮罩52後,處理器11可隨機移動(例如旋轉)影像遮罩52,以改變影像遮罩52在影像51上的覆蓋範圍。在移動影像遮罩52後,處理器11可從影像51中擷取影像遮罩52的覆蓋範圍內的影像並根據所擷取的影像產生影像53。
請參照圖1與圖6,在一實施例中,假設影像101包括影像61,且影像102包括影像63。在設置影像遮罩62後,處理器11可隨機移動(例如旋轉並平移)影像遮罩62,以改變影像遮罩62在影像61上的覆蓋範圍。在移動影像遮罩62後,處理器11可從影像61中擷取影像遮罩62的覆蓋範圍內的影像並根據所擷取的影像產生影像63。
須注意的是,圖2至圖6中關於影像遮罩的設置與移動方式皆為範例,非用以限制本發明。例如,在另一實施例中,影像遮罩還可以移動至第一影像中的其他位置及/或基於不同的旋轉角度來旋轉影像遮罩,本發明不加以限制。
在一實施例中,圖1的影像101可視為用於產生影像102的種子。亦即,處理器11可根據影像101來產生類似但又各不相同的多個影像102(1)~102(n)。爾後,影像102(1)~102(n)可作為訓練資料來訓練支援機器視覺或影像辨識的人工智慧模型(例如深度學習模型),以提高人工智慧模型的影像辨識能力。
請參照圖7,在步驟S701中,從儲存電路中讀取第一影像。在步驟S702中,在第一影像上設置影像遮罩,其中所述影像遮罩覆蓋第一影像的一部分影像區域。在步驟S703中,隨機移動所述影像遮罩,以改變所述影像遮罩在第一影像中的覆蓋範圍,且所述影像遮罩的覆蓋範圍不超出第一影像的邊緣。在步驟S704中,根據移動後的影像遮罩從第一影像中擷取第二影像。在步驟S705中,將第二影像儲存至儲存電路。
然而,圖7中各步驟已詳細說明如上,在此便不再贅述。值得注意的是,圖7中各步驟可以實作為多個程式碼或是電路,本發明不加以限制。此外,圖7的方法可以搭配以上範例實施例使用,也可以單獨使用,本發明不加以限制。
綜上所述,透過在第一影像中隨機移動影像遮罩,類似但又各不相同的多個第二影像可被隨機產生。藉此,可根據少量的影像(即第一影像)來隨機產生類似但又各不相同的多個影像(即第二影像),從而有效提高用於訓練人工智慧模型的訓練資料的產生效率。須注意的是,所產生的第二影像亦可被用於其他用途(例如建立圖片庫等),而不限於人工智慧模型的訓練。
雖然本發明已以實施例揭露如上,然其並非用以限定本發明,任何所屬技術領域中具有通常知識者,在不脫離本發明的精神和範圍內,當可作些許的更動與潤飾,故本發明的保護範圍當視後附的申請專利範圍所界定者為準。
S701~S705:步驟
Claims (14)
- 一種影像產生方法,藉由處理器中儲存的程式碼執行,包括:從儲存電路中讀取第一影像;在該第一影像上設置影像遮罩,其中該影像遮罩覆蓋該第一影像的一部分影像區域;隨機移動該影像遮罩,以改變該影像遮罩在該第一影像中的覆蓋範圍,且該影像遮罩的該覆蓋範圍不超出該第一影像的邊緣;根據移動後的該影像遮罩從該第一影像中擷取第二影像;以及將該第二影像儲存至該儲存電路。
- 如請求項1所述的影像產生方法,其中在該第一影像上設置該影像遮罩的步驟包括:根據縮小比例與該第一影像的原始尺寸產生該影像遮罩。
- 如請求項2所述的影像產生方法,其中在該第一影像上設置該影像遮罩的步驟更包括:接收使用者操作;以及根據該使用者操作決定該縮小比例。
- 如請求項1所述的影像產生方法,其中隨機移動該影像遮罩的步驟包括:隨機決定該影像遮罩的移動方向與移動距離;以及根據該移動方向與該移動距離移動該影像遮罩。
- 如請求項4所述的影像產生方法,更包括:根據該第一影像的第一邊緣與該影像遮罩的第一端點之間在一參考方向上的距離決定對應於該參考方向的移動距離臨界值,其中該第一端點相較於該影像遮罩的其餘端點在該參考方向上更靠近該第一影像的該第一邊緣;以及將該影像遮罩在該參考方向上的移動距離限制為不大於該移動距離臨界值。
- 如請求項1所述的影像產生方法,其中隨機移動該影像遮罩的步驟包括:隨機決定該影像遮罩的第一旋轉角度;以及根據該第一旋轉角度旋轉該影像遮罩。
- 如請求項6所述的影像產生方法,其中隨機移動該影像遮罩的步驟更包括:響應於旋轉後的該影像遮罩的該覆蓋範圍超出該第一影像的該邊緣,隨機決定該影像遮罩的第二旋轉角度,其中該第一旋轉角度不同於該第二旋轉角度;以及根據該第二旋轉角度重新旋轉該影像遮罩。
- 一種影像產生裝置,包括:儲存電路;以及處理器,耦接至該儲存電路,其中該處理器用以:從該儲存電路中讀取第一影像; 在該第一影像上設置影像遮罩,其中該影像遮罩覆蓋該第一影像的一部分影像區域;隨機移動該影像遮罩,以改變該影像遮罩在該第一影像中的覆蓋範圍,且該影像遮罩的該覆蓋範圍不超出該第一影像的邊緣;根據移動後的該影像遮罩從該第一影像中擷取第二影像;以及將該第二影像儲存至該儲存電路。
- 如請求項8所述的影像產生裝置,其中該處理器在該第一影像上設置該影像遮罩的操作包括:根據縮小比例與該第一影像的原始尺寸產生該影像遮罩。
- 如請求項9所述的影像產生裝置,其中該處理器在該第一影像上設置該影像遮罩的操作更包括:接收使用者操作;以及根據該使用者操作決定該縮小比例。
- 如請求項8所述的影像產生裝置,其中該處理器隨機移動該影像遮罩的操作包括:隨機決定該影像遮罩的移動方向與移動距離;以及根據該移動方向與該移動距離移動該影像遮罩。
- 如請求項11所述的影像產生裝置,其中該處理器更用以:根據該第一影像的第一邊緣與該影像遮罩的第一端點之間在 一參考方向上的距離決定對應於該參考方向的移動距離臨界值,其中該第一端點相較於該影像遮罩的其餘端點在該參考方向上更靠近該第一影像的該第一邊緣;以及將該影像遮罩在該參考方向上的移動距離限制為不大於該移動距離臨界值。
- 如請求項8所述的影像產生裝置,其中該處理器隨機移動該影像遮罩的操作包括:隨機決定該影像遮罩的第一旋轉角度;以及根據該第一旋轉角度旋轉該影像遮罩。
- 如請求項13所述的影像產生裝置,其中該處理器隨機移動該影像遮罩的操作更包括:響應於旋轉後的該影像遮罩的該覆蓋範圍超出該第一影像的該邊緣,隨機決定該影像遮罩的第二旋轉角度,其中該第一旋轉角度不同於該第二旋轉角度;以及根據該第二旋轉角度重新旋轉該影像遮罩。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW112110395A TWI830628B (zh) | 2023-03-21 | 2023-03-21 | 影像產生方法與影像產生裝置 |
CN202310559593.4A CN118691451A (zh) | 2023-03-21 | 2023-05-18 | 图像产生方法与图像产生装置 |
US18/406,197 US20240320871A1 (en) | 2023-03-21 | 2024-01-07 | Image generation method and image generation device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW112110395A TWI830628B (zh) | 2023-03-21 | 2023-03-21 | 影像產生方法與影像產生裝置 |
Publications (2)
Publication Number | Publication Date |
---|---|
TWI830628B true TWI830628B (zh) | 2024-01-21 |
TW202439247A TW202439247A (zh) | 2024-10-01 |
Family
ID=90459311
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW112110395A TWI830628B (zh) | 2023-03-21 | 2023-03-21 | 影像產生方法與影像產生裝置 |
Country Status (3)
Country | Link |
---|---|
US (1) | US20240320871A1 (zh) |
CN (1) | CN118691451A (zh) |
TW (1) | TWI830628B (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107808363A (zh) * | 2017-11-23 | 2018-03-16 | 杭州电魂网络科技股份有限公司 | 图像遮罩处理方法及装置 |
TW202001404A (zh) * | 2018-05-09 | 2020-01-01 | 德商卡爾蔡司Smt有限公司 | 用以轉移微影光罩之原初結構部分的光學系統、用以將可配置微影光罩之至少一原初結構部分的物場進行成像的投射光學單元、以及微影光罩 |
CN111222537A (zh) * | 2019-11-19 | 2020-06-02 | 杭州事件视界科技有限公司 | 可快速制作并传播增强现实系统及方法 |
CN114373109A (zh) * | 2022-01-16 | 2022-04-19 | 安徽大学 | 一种基于深度学习的自然图像抠图方法及抠图装置 |
CN115794089A (zh) * | 2022-11-15 | 2023-03-14 | 网易(杭州)网络有限公司 | 图标的生成方法、装置、存储介质以及电子装置 |
-
2023
- 2023-03-21 TW TW112110395A patent/TWI830628B/zh active
- 2023-05-18 CN CN202310559593.4A patent/CN118691451A/zh active Pending
-
2024
- 2024-01-07 US US18/406,197 patent/US20240320871A1/en active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107808363A (zh) * | 2017-11-23 | 2018-03-16 | 杭州电魂网络科技股份有限公司 | 图像遮罩处理方法及装置 |
TW202001404A (zh) * | 2018-05-09 | 2020-01-01 | 德商卡爾蔡司Smt有限公司 | 用以轉移微影光罩之原初結構部分的光學系統、用以將可配置微影光罩之至少一原初結構部分的物場進行成像的投射光學單元、以及微影光罩 |
CN111222537A (zh) * | 2019-11-19 | 2020-06-02 | 杭州事件视界科技有限公司 | 可快速制作并传播增强现实系统及方法 |
CN114373109A (zh) * | 2022-01-16 | 2022-04-19 | 安徽大学 | 一种基于深度学习的自然图像抠图方法及抠图装置 |
CN115794089A (zh) * | 2022-11-15 | 2023-03-14 | 网易(杭州)网络有限公司 | 图标的生成方法、装置、存储介质以及电子装置 |
Also Published As
Publication number | Publication date |
---|---|
TW202439247A (zh) | 2024-10-01 |
US20240320871A1 (en) | 2024-09-26 |
CN118691451A (zh) | 2024-09-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112767489B (zh) | 一种三维位姿确定方法、装置、电子设备及存储介质 | |
US11301954B2 (en) | Method for detecting collision between cylindrical collider and convex body in real-time virtual scenario, terminal, and storage medium | |
TWI733127B (zh) | 資訊的檢測方法、裝置及設備 | |
JP6248647B2 (ja) | 画像照合方法、画像処理システム、及びプログラム | |
US20130127848A1 (en) | System and Method for Generating 3D Surface Patches from Unconstrained 3D Curves | |
US9311756B2 (en) | Image group processing and visualization | |
CN112949661B (zh) | 检测框自适应外扩方法、装置、电子设备及存储介质 | |
CN110648397A (zh) | 场景地图生成方法、装置、存储介质及电子设备 | |
CN112183529B (zh) | 四边形物体检测、模型训练方法、装置、设备及存储介质 | |
CN111310724A (zh) | 基于深度学习的活体检测方法、装置、存储介质及设备 | |
WO2021253789A1 (zh) | 重定位效果的评价方法、装置、电子设备和存储介质 | |
WO2022116678A1 (zh) | 目标物体位姿确定方法、装置、存储介质及电子设备 | |
US20180302553A1 (en) | Camera system and image-providing method | |
CN110163095B (zh) | 回环检测方法、回环检测装置及终端设备 | |
TWI711004B (zh) | 圖片處理方法和裝置 | |
CN112507938B (zh) | 一种文本图元的几何特征计算方法及识别方法、装置 | |
CN110895823A (zh) | 一种三维模型的纹理获取方法、装置、设备及介质 | |
US20240012966A1 (en) | Method and system for providing a three-dimensional computer aided-design (cad) model in a cad environment | |
JP2022519398A (ja) | 画像処理方法、装置及び電子機器 | |
TWI830628B (zh) | 影像產生方法與影像產生裝置 | |
CN113763505A (zh) | 图形生成方法、装置、计算机设备和存储介质 | |
CN112465692A (zh) | 图像处理方法、装置、设备及存储介质 | |
CN114329032B (zh) | 图像匹配像素检索方法、装置以及存储介质 | |
CN111369425B (zh) | 图像处理方法、装置、电子设备和计算机可读介质 | |
CN109658331B (zh) | 图像处理方法、装置、系统及计算机存储介质 |