TWI464604B - 資料分群方法與裝置、資料處理裝置及影像處理裝置 - Google Patents

資料分群方法與裝置、資料處理裝置及影像處理裝置 Download PDF

Info

Publication number
TWI464604B
TWI464604B TW099141260A TW99141260A TWI464604B TW I464604 B TWI464604 B TW I464604B TW 099141260 A TW099141260 A TW 099141260A TW 99141260 A TW99141260 A TW 99141260A TW I464604 B TWI464604 B TW I464604B
Authority
TW
Taiwan
Prior art keywords
data
group
points
module
data points
Prior art date
Application number
TW099141260A
Other languages
English (en)
Other versions
TW201222278A (en
Inventor
Yi Ta Wu
Hung I Pai
Kung Ming Lan
Original Assignee
Ind Tech Res Inst
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ind Tech Res Inst filed Critical Ind Tech Res Inst
Priority to TW099141260A priority Critical patent/TWI464604B/zh
Priority to CN201010595455.4A priority patent/CN102479247B/zh
Priority to US13/012,802 priority patent/US9058540B2/en
Publication of TW201222278A publication Critical patent/TW201222278A/zh
Application granted granted Critical
Publication of TWI464604B publication Critical patent/TWI464604B/zh

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/56Extraction of image or video features relating to colour
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2413Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
    • G06F18/24147Distances to closest patterns, e.g. nearest neighbour classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/762Arrangements for image or video recognition or understanding using pattern recognition or machine learning using clustering, e.g. of similar faces in social networks
    • G06V10/763Non-hierarchical techniques, e.g. based on statistics of modelling distributions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/764Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Multimedia (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Probability & Statistics with Applications (AREA)
  • Computing Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Image Analysis (AREA)

Description

資料分群方法與裝置、資料處理裝置及影像處理裝置
本揭露是有關於一種用於將相似的資料分成同一個資料叢集的資料分群方法,及使用此方法的資料分群裝置、資料處理裝置及影像處理裝置。
資料分群(Clustering)是屬於數學統計中多變量分析(Multivariate Data analysis)的一支,為一種非監督式的資料分析方法。資料分群的主要目的,是將原始資料分類成群,並找出各群組的代表點,藉以降低資料量、減低資料分析的複雜度。資料分群的運作方式,是根據資料的特徵分布情況,將具有相似特性的資料分成同一個「叢集」(cluster),進而將整個資料分成若干叢集,再對不同的叢集資料做進一步的分析。資料分群被廣泛的應用在資料採礦(data mining)、圖形辨識(pattern recognition)、市場區隔(market segmentation)、單元形成問題(cell formation problem),以及近年來熱門的生物資訊(bioinformatics)等等各種不同的領域之中。
目前的資料分群技術,可分為「分割式分群」(partitional clustering)技術以及「階層式分群」(hierarchical clustering)技術兩大類。
分割式分群技術的基本精神,在於縮小「叢集」中,每個點與「叢集中心」(cluster center)的距離平方差(square error)。分割式分群技術的運作方式,是在給定的n個物件或資料以及事先指定所要分割的K個「叢集數目」(number of clusters)的情況下,先依K值產生一個初始分割結果,再以反覆再配置技術(iterative relocation technique)將物件由原配屬群組移動到其他群組,藉此改善分割結果。一般來說,一個好的分割結果是讓同一群內的物件是彼此間靠近的或相似的,而不同群之間的物件彼此是遙遠的或是相異的。分割式分群技術中最著名的就是於1967年所提出的K-means分群技術。K-means分群技術是,先隨機挑選k個群組中心,再利用群重心點或中心點進行指派分割,將所有資料物件分別指派至與群中心最相似的群組,分完所有資料後重新計算群組中心,如此不斷重複,直到各群的群組中心值不再改變為止。
階層式分群技術通常以樹狀結構的方式來呈現,透過將資料層層分裂或聚合的方式以達到資料分群的目的。依據其樹狀結構的產生方式,可以再細分為「階層式聚合(agglomerative)分群技術」與「階層式分裂(divisive)分群技術」兩類。
階層式聚合分群技術是屬於由下而上(bottom-up)的方式完成分群的需求。在階層式聚合分群技術中,在初始時每筆資料會被視為一個叢集。換句話說,假如我們有n筆資料,在初始階段時會有n個叢集。然後由樹狀結構的底部開始聚合。每次聚合會將最近的兩個叢集合成為一個新的叢集,直到叢集數符合預設值為止。因此,叢集的數目在每次聚合時會減少一個,最後結合成為一群,假設我們經過m次聚合,則叢集數目則會由n個變成(n-m)個。
階層式分裂分群技術是屬於由上而下(top-down)的方式完成分群的需求。在階層式分裂分群技術中,在初始時所有資料會被視為一個叢集,經過每次的分裂時,都會產生一個新的叢集,直到叢集數符合預設值為止。換句話說,假如我們有n筆資料,在初始階段時僅有一個叢集,經過m次的分裂之後,叢集數目則會由1個變成m+1個。
由上述可知,目前的資料分群技術都需要疊代的運算,以將資料分組至適當的資料叢集。然而,在嵌入式系統中,內部記憶體是相當有限的,往往無足夠的記憶體空間來儲存執行上述資料分群技術所需記錄之資料點屬性。例如,假設分群的資料點數目為16001,每個資料點需要使用4位元組(byte)的整數以儲存資料點屬性。因此,在以上述資料分群技術來對資料分群下,共需要64004bytes的記憶體儲存空間。然而,目前嵌入式系統的內部記憶體大小大僅有64K。因此,在每次的疊代運算時,需要額外的內容交換(content switching)以將原本內部記憶體中的資料置換成未處理的資料,然後才可以完成分群的運算。此種內容,會隨著資料點的數目增多,而有越來越嚴重的資料傳輸消耗(data transmission cost),進而影響嵌入式系統的效能。
本揭露提供一種資料分群方法與裝置及配置此資料分群裝置的資料處理裝置與影像處理裝置,其能夠快速地根據將資料的所有資料點分群。
本揭露提出一種資料分群方法,用於分群多個資料點,其中每一資料點具有至少一種特徵值。本資料分群方法包括排序此些資料點並且根據一排序結果產生一處理順序。本資料分群方法也包括根據此處理順序使用非疊代方式,對每個資料點僅需一次的資料存取,將此些資料點分群成多個資料叢集。本資料分群方法更包括優化所產生的資料叢集。
本揭露提出一種資料分群方法,用於使用一非疊代方式將多個資料點分群成多個資料叢集,其中每一資料點具有至少一種特徵值。本資料分群方法包括:(a)從此些資料點之中選擇一目標資料點;(b)判斷是否已產生任何資料群,其中倘若未產生任何資料群時則執行步驟(c),並且倘若已產生一個或多個資料群時則執行步驟(d);(c)新增一個資料群並且將所選擇的目標資料點分組至所新增的資料群;(d)計算對應現有資料群的特徵值與所選擇的目標資料點的特徵值之間的特徵值差異,識別特徵值差異之中的最小特徵值差異,並且判斷最小特徵值差異是否小於對應最小特徵值差異之資料群的一差異門檻值,其中倘若最小特徵值差異非小於對應的差異門檻值時執行步驟(c),並且倘若最小特徵值差異小於對應的差異門檻值時將所選擇的目標資料點分組至對應最小特徵值差異的資料群中;(e)更新加入此目標資料點的資料群的特徵值,其中加入此目標資料點的資料群的特徵值是藉由平均屬於此資料群的資料點的特徵值所獲得;以及(f)判斷所有資料點是否已被分組,其中倘若所有資料點已被分組時,則將所產生的資料群作為資料叢集,倘若存有尚未被分組的資料點時,則重新執行步驟(a)。
本揭露提出一種資料處理裝置,用於分群多個資料點,其中每一資料點具有至少一種特徵值。本資料處理裝置包括資料前處理模組、資料分群裝置與資料後處理模組。資料前處理模組用以排序此些資料點並且根據排序結果產生處理順序。資料分群裝置用以根據處理順序使用非疊代方式,對每個資料點僅需一次的資料存取,將此些資料點分群成多個資料叢集。資料後處理模組用以優化所產生的資料叢集。
本揭露提出一種資料分群裝置,用於使用非疊代方式,對每個資料點僅需一次的資料存取,將多個資料點分群成多個資料叢集,其中每一資料點具有至少一種特徵值。本資料分群裝置包括資料輸入與資料叢集輸出子模組以及耦接至資料輸入與資料叢集輸出子模組的資料群產生子模組與特徵更新模組。在此,資料輸入與資料叢集輸出子模組用以依序地從該些資料點之中選擇一目標資料點,並且資料群產生子模組用以判斷是否已產生任何資料群。倘若未產生任何資料群時,此資料群產生子模組更用以新增一個資料群並且將資料輸入與資料叢集輸出子模組所選擇的目標資料點分組至所新增的資料群中。倘若已產生資料群時,資料群產生子模組更用以計算對應現有資料群的特徵值與所選擇的目標資料點的特徵值之間的特徵值差異,識別特徵值差異之中的最小特徵值差異,並且判斷此最小特徵值差異是否小於對應此最小特徵值差異的資料群的一差異門檻值。倘若此最小特徵值差異非小於對應的差異門檻值時,資料群產生子模組更用以新增一個資料群並且將所選擇的目標資料點分組至所新增的資料群中。倘若此最小特徵值差異小於對應的差異門檻值時,資料群產生子模組更用以將所選擇的目標資料點分組至對應此最小特徵值差異的資料群中。此外,特徵更新模組用以更新加入此目標資料點的資料群的特徵值,其中加入此目標資料點的資料群的特徵值是藉由平均屬於資料群的資料點的特徵值所獲得。再者,資料輸入與資料叢集輸出子模組更用以判斷所有該些資料點是否已被分組。倘若所有些資料點已被分組時,資料輸入與資料叢集輸出子模組更用以將所產生的資料群作為欲分群之資料的資料叢集。倘若存有資料點未被分組時,資料輸入與資料叢集輸出子模組更用以根據依序地從此些資料點之中選擇另一目標資料點。
本揭露提出一種影像處理裝置,其包括影像感測元件、資料前處理模組、資料分群裝置與資料後處理模組。影像感測元件用於擷取一影像,其中此影像具有多個資料點並且每一資料點具有至少一種特徵值。資料前處理模組用以排序此些資料點並且根據排序結果產生處理順序。資料分群裝置用以根據處理順序使用非疊代方式,對每個資料點僅需一次的資料存取,將此些資料點分群成多個資料叢集。資料後處理模組用以優化所產生的資料叢集。
基於上述,本揭露的資料分群方法與裝置以及配置此資料分群裝置的資料處理裝置與影像處理裝置能夠在無需疊代運算下快速地將資料分群。
為讓本揭露之上述特徵和優點能更明顯易懂,下文特舉實施例,並配合所附圖式作詳細說明如下。
本揭露的資料分群方法是使用一非疊代方式根據資料點的特徵值與資料叢集的特徵值,來直接地決定資料點的所屬資料叢集,由此快速地將資料點分群成多個資料叢集。基此,本揭露的資料分群方法可有效地減少資料傳輸所需的資源耗費。以下將以數個範例實施例來描述本揭露。
[第一範例實施例]
圖1是根據本揭露之第一範例實施例所繪示的影像處理裝置。
請參照圖1,影像處理裝置100包括微處理單元102、緩衝記憶體104、影像感測元件106以及資料處理裝置108。
微處理單元102用以控制資料處理裝置100的整體運作。例如,微處理單元102會下達指令給資料處理裝置108,以對資料進行分群。
緩衝記憶體104耦接至微處理單元102,並且用以暫存資料。在本範例實施例中,緩衝記憶體104為靜態隨機存取記憶體(Static Random-Access Memory,SRAM)。必須瞭解的是,本揭露不限於此,在另一範例實施例中,緩衝記憶體104可以是動態隨機存取記憶體(Dynamic Random Access Memory)或其他記憶體。
影像感測元件106耦接至微處理單元102。影像感測元件106用以根據微處理單元102的控制感測影像,並且輸出對應的影像資料。例如,微處理單元102會將影像感測元件106所輸出的影像資料暫存於緩衝記憶體104。在本範例實施例中,資料處理裝置108耦接至微處理單元102,並且包括資料前處理模組112、資料分群裝置114以及資料後處理模組116。
資料前處理模組112用以排序欲分群的資料點並且根據排序結果來產生處理順序。具體來說,微處理單元102會將欲分群的資料(例如,由影像感測元件106所擷取的影像資料)暫存於緩衝記憶體104中,並且當資料處理裝置108從微處理單元102中接受到請求對此資料進行分群的指令時,資料前處理模組112會根據此資料之所有資料點的特徵值來進行排序。
例如,以影像資料為例,每一資料點的特徵值為包含三個原色(即,紅色、綠色與藍色)色階的色彩強度值,而資料前處理模組112會依據影像資料之每一資料點的色彩強度值來建立對應的直方圖,並且依據所建立之直方圖來對所有資料點進行排序。
圖2是根據本揭露之第一範例實施例所繪示之建立對應資料的直方圖的範例。為了方便說明,在此僅以單一維度之特徵值(例如,紅色色階)來繪示1維直方圖。然而,必須瞭解的是,本揭露不限於此,資料點可以多維度之特徵值來建立對應的直方圖。
請參照圖2,資料前處理模組112將範圍為0~255的紅色色階等分為12個子色階,並且依據所有資料點的特徵值統計屬於每一子色階之資料點的數目。如圖2所示,所有資料點的特徵值分別地屬於子色階A~B,子色階A之資料點數目大於子色階B之資料點數目;子色階B之資料點數目大於子色階C之資料點數目;子色階C之資料點數目大於子色階D之資料點數目;子色階D之資料點數目大於子色階E之資料點數目;並且子色階E之資料點數目大於子色階F之資料點數目。
在建立對應的直方圖之後,資料前處理模組112會根據每一子色階之資料點的數目來排序資料點,並且根據此排序結果來產生處理順序。如圖2的範例所示,影像資料的所有資料點會根據子色階A、B、C、D、E、F的順序來排序。
然而,必須瞭解的是,本揭露不限於此,在本揭露之另一範例實施例中,資料前處理模組112亦可直接地根據所有資料點之特徵值的數值來進行排序。例如,資料前處理模組112可根據每一資料點的特徵值,由小到大或由大到小來排序所有資料點。
請再參照圖1,資料分群裝置114用以根據資料前處理模組112所產生之處理順序來使用非疊代方式將欲分群之資料的所有資料點分群成多個資料叢集。具體來說,資料分群裝置114會根據資料前處理模組112所產生之處理順序來選擇其中一個資料點並且根據所選擇之資料點的特徵值識別此資料點所屬的資料叢集或為此資料點建立新的資料叢集,由此直接地將資料點進行分群,而不以疊代方式來反覆確認每一資料點所屬之資料叢集。
資料分群裝置114包括資料輸入與資料叢集輸出子模組122、資料群產生子模組124與特徵更新模組126。
資料輸入與資料叢集輸出子模組122用以依據資料前處理模組112所產生之處理順序依序地接收欲分群之資料點。
資料群產生子模組124用以識別資料點的相似程度,以逐步將相似的資料點分組至相同的資料群。例如,資料群產生子模組124會計算資料點的特徵值與資料群的特徵值之間的特徵值差異,並且當特徵值差異小於差異門檻值時,則識別此資料點屬於此資料群,由此將相似的資料點分組至同一個資料群。在本第一範例實施例中,差異門檻值為固定數值,其可由使用者根據欲分群之資料的特性來自行設定。
特徵更新模組126用以更新所產生之資料群的特徵值。例如,特徵更新模組126會平均資料群內所有資料點的特徵值,作為此資料群的特徵值。
特別是,資料群產生子模組124會依序地指派每一資料點至適當的資料群,並且在完成欲分群之所有資料點的指派之後資料輸入與資料叢集輸出子模組122會將所產生的資料群輸出,以作為對應此資料的資料叢集。
為了更清楚地描述資料輸入與資料叢集輸出子模組122、資料群產生子模組124與特徵更新模組126的運作,以下以一範例來進行說明。
圖3A~3G是根據本揭露之第一範例實施例所繪示的分群運作示意圖,並且圖4是根據圖3A~3G所繪示的分群運作列表。
請參照圖3A,假設對應影像資料的資料點根據其特徵值分別地屬於子色階A~F,其中子色階C之資料點的特徵值皆為2,子色階A之資料點的特徵值皆為3,子色階E之資料點的特徵值皆為4,子色階D之資料點的特徵值皆為6,子色階B之資料點的特徵值皆為7,並且子色階F之資料點的特徵值皆為8。此外,在此假設差異門檻值為2。在此範例中,資料前處理模組112會根據子色階的資料點數目依序將子色階A的資料點、子色階B的資料點、子色階C的資料點、子色階D的資料點、子色階E的資料點以及子色階F的資料點傳送給資料分群裝置114。
請參照圖3B,當資料輸入與資料叢集輸出子模組122接收到子色階A的資料點時,資料群產生子模組124會識別目前無任何資料群。基此,資料群產生子模組124產生第1資料群並且將子色階A的資料點分組至第1資料群中。此外,特徵更新模組126會計算第1資料群的特徵值。如上所述,第1資料群的特徵值為第1資料群內之所有資料點的特徵值的平均值。因此,特徵更新模組126會將第1資料群的特徵值設定為3(如圖4所示)。
請參照圖3C,接著,當資料輸入與資料叢集輸出子模組122接收到子色階B的資料點時,資料群產生子模組124會識別存有第1資料群。基此,資料群產生子模組124會計算子色階B的資料點的特徵值與第1資料群之間的特徵值差異。在此,子色階B的資料點的特徵值與第1資料群之間的特徵值差異為4。在此範例中,由於子色階B的資料點的特徵值與第1資料群之間的特徵值差異大於差異門檻值,因此,資料群產生子模組124會產生第2資料群並且將子色階B的資料點分組至第2資料群中。此外,特徵更新模組126會計算第2資料群的特徵值。如圖4所示,第2資料群的特徵值會被設定為7,並且第2資料群包含子色階B的資料點。
請參照圖3D,接著,當資料輸入與資料叢集輸出子模組122接收到子色階C的資料點時,資料群產生子模組124會識別存有第1資料群與第2資料群。基此,資料群產生子模組124會計算子色階C的資料點的特徵值與第1資料群之間的特徵值差異以及子色階C的資料點的特徵值與第2資料群之間的特徵值差異。在此,子色階C的資料點的特徵值與第1資料群之間的特徵值差異為1並且子色階C的資料點的特徵值與第2資料群之間的特徵值差異為5。在此範例中,由於子色階C的資料點的特徵值與第1資料群之間的特徵值差異小於差異門檻值並且子色階C的資料點的特徵值與第2資料群之間的特徵值差異大於差異門檻值,因此,資料群產生子模組124會將子色階C的資料點分組至第1資料群中。此外,特徵更新模組126會更新第1資料群的特徵值。為了簡化計算,在此是以子色階A的特徵值(即,3)和子色階C的特徵值(即,2)的平均值來作為第1資料群的特徵值。如圖4所示,第1資料群的特徵值會被更新為2.5並且第1資料群會包含子色階A與子色階C的資料點。
請參照圖3E,接著,當資料輸入與資料叢集輸出子模組122接收到子色階D的資料點時,資料群產生子模組124會識別存有第1資料群與第2資料群。基此,資料群產生子模組124會計算子色階D的資料點的特徵值與第1資料群之間的特徵值差異以及子色階D的資料點的特徵值與第2資料群之間的特徵值差異。在此,子色階D的資料點的特徵值與第1資料群之間的特徵值差異為3.5並且子色階D的資料點的特徵值與第2資料群之間的特徵值差異為1。在此範例中,由於子色階D的資料點的特徵值與第1資料群之間的特徵值差異大於差異門檻值並且子色階D的資料點的特徵值與第2資料群之間的特徵值差異小於差異門檻值,因此,資料群產生子模組124會將子色階D的資料點分組至第2資料群中。此外,特徵更新模組126會更新第2資料群的特徵值。為了簡化計算,在此是以子色階B的特徵值(即,7)和子色階D的特徵值(即,6)的平均值來作為第2資料群的特徵值。如圖4所示,第2資料群的特徵值會被更新為6.5並且第2資料群會包含子色階B與子色階D的資料點。
請參照圖3F,接著,當資料輸入與資料叢集輸出子模組122接收到子色階E的資料點時,資料群產生子模組124會識別存有第1資料群與第2資料群。基此,資料群產生子模組124會計算子色階E的資料點的特徵值與第1資料群之間的特徵值差異以及子色階E的資料點的特徵值與第2資料群之間的特徵值差異。在此,子色階E的資料點的特徵值與第1資料群之間的特徵值差異為1.5並且子色階E的資料點的特徵值與第2資料群之間的特徵值差異為2.5。在此範例中,由於子色階E的資料點的特徵值與第1資料群之間的特徵值差異小於差異門檻值並且子色階E的資料點的特徵值與第2資料群之間的特徵值差異大於差異門檻值,因此,資料群產生子模組124會將子色階E的資料點分組至第1資料群中。此外,特徵更新模組126會更新第1資料群的特徵值。為了簡化計算,在此是以子色階A的特徵值(即,3)、子色階C的特徵值(即,2)和子色階E的特徵值(即,4)的平均值來作為第1資料群的特徵值。如圖4所示,第1資料群的特徵值會被更新為3並且第1資料群會包含子色階A、子色階C與子色階E的資料點。
請參照圖3G,接著,當資料輸入與資料叢集輸出子模組122接收到子色階F的資料點時,資料群產生子模組124會識別存有第1資料群與第2資料群。基此,資料群產生子模組124會計算子色階F的資料點的特徵值與第1資料群之間的特徵值差異以及子色階F的資料點的特徵值與第2資料群之間的特徵值差異。在此,子色階F的資料點的特徵值與第1資料群之間的特徵值差異為5並且子色階F的資料點的特徵值與第2資料群之間的特徵值差異為1.5。在此範例中,由於子色階F的資料點的特徵值與第1資料群之間的特徵值差異大於差異門檻值並且子色階F的資料點的特徵值與第2資料群之間的特徵值差異小於差異門檻值,因此,資料群產生子模組124會將子色階F的資料點分組至第2資料群中。此外,特徵更新模組126會更新第2資料群的特徵值。為了簡化計算,在此是以子色階B的特徵值(即,7)、子色階D的特徵值(即,6)和子色階F的特徵值(即,8)的平均值來作為第2資料群的特徵值。如圖4所示,第2資料群的特徵值會被更新為7並且第2資料群會包含子色階B、子色階D與子色階F的資料點。
在完成所有資料點的分群之後,資料輸入與資料叢集輸出子模組122會將資料群產生子模組124所產生的第1資料群與第2資料群輸出,作為對應所接收之資料的資料叢集。也就是說,在對所輸入之資料(如圖3A所示)分群之後,資料輸入與資料叢集輸出子模組122會輸出包含子色階A、子色階C與子色階E的資料點的資料叢集以及包含子色階B、子色階D與子色階F的資料點的資料叢集。
請再參照圖1,資料後處理模組116用以優化資料分群裝置114所產生的資料叢集。具體來說,資料後處理模組116會確認資料分群裝置114所產生的資料叢集是否適當。並且,當資料分群裝置114所產生的資料叢集不適當時,透過合併部分的資料叢集來進行優化。
例如,在本範例實施例中,資料後處理模組116會確認所產生的資料叢集是否存在孤立資料點或過度分割的資料叢集。
所謂的孤立資料點是指,當屬於一個資料叢集的某一個(或一群)資料點的周圍資料點都屬於另一個資料叢集時,此個(或群)資料點就是所謂的孤立資料點。
圖5A是根據本揭露之第一範例實施例所繪示的孤立資料點的示意圖,並且圖5B是根據圖5A所繪示之優化資料叢集的示意圖。
請參照圖5A,倘若影像資料的資料點可區分為子色階A1、B1、C1、D1、E1、F1、G1與H1並且經由資料分群裝置114分群為包含子色階F1、子色階C1、子色階B1、子色階A1與子色階D1之資料點的第1資料叢集以及包含子色階G1、子色階E1與子色階H1之資料點的第2資料叢集時,資料後處理模組116會識別子色階D1之資料點的周圍資料點(即,子色階E1之資料點和子色階H1之資料點)皆屬於第2資料叢集,並且由此將子色階D1之資料點從第1資料叢集中搬移至第2資料叢集(如圖5B所示)。
所謂過度分割的資料叢集是指,當位於邊界之資料叢集的資料點數目小於一資料點數門檻值時,則此邊界的資料叢集稱為過度分割的資料叢集。在此,資料點數門檻值可由使用者根據欲分群之資料的型態來自行設定。
圖6A是根據本揭露之第一範例實施例所繪示的過度分割之資料叢集的示意圖,並且圖6B是根據圖6A所繪示之優化資料叢集的示意圖。
請參照圖6A,倘若影像資料的資料點可區分為子色階A2、B2、C2、D2、E2、F2、G2與H2並且經由資料分群裝置114分群為包含子色階F2、子色階C2、子色階B2與子色階A2之資料點的第1資料叢集、包含子色階G2、子色階E2與子色階D2之資料點的第2資料叢集以及包含子色階H2之資料點的第3資料叢集時,如圖6B所示,資料後處理模組116會識別第3資料叢集(即,邊界資料叢集)的資料點數目小於資料點數門檻值並且將第3資料叢集合併至第2資料叢集(即,其鄰近資料叢集)。
在完成上述優化之後,資料後處理模組116會輸出優化後的資料叢集。例如,在本發明另一範例實施例中,影像處理裝置100更包括一顯示單元(未繪示),用以顯示將資料處理裝置108所產生的分群結果。
值得一提的是,在本揭露中,資料前處理模組112、資料分群裝置114以及資料後處理模組116可以是由硬體或軟體來實作。
圖7是根據本揭露之第一範例實施例所繪示的資料分群方法的流程圖。
請參照圖7,首先,在步驟S701中,將欲分群之資料的資料點根據其特徵值排序並且依據排序的結果產生處理順序。排序資料點與產生處理順序的方法已配合圖2描述如上,在此不再重複描述。值得一提的是,在本揭露另一範例實施例中,步驟S701是可被省略的,而不對資料點進行排序。例如,在進行線上即時分群時,由於無法待接收完所有資料後進行資料的排序,因此,在此例子中,欲分群之資料的資料點會依序接收順序以先進先出(First In First Out,FIFO)方式傳送至資料分群裝置114。
接著,在步驟S703中,根據所產生之處理順序使用非疊代方式將所有資料點分群成多個資料叢集。
圖8是繪示圖7的步驟S703的詳細步驟。
請參照圖8,首先,在步驟S801中,會判斷是否存有尚未分群的資料點。
倘若存有尚未分群的資料點時,在步驟S803中,會根據處理順序依序地從欲分群的資料點中選擇一個目標資料點。
接著,在步驟S805中,會判斷是否已產生任何資料群。
倘若未產生任何資料群時,則在步驟S807中,會新增一個資料群並且將所選擇的目標資料點分組至所新增的資料群中。之後,在步驟S809中,設定所新增的資料群的特徵值。
倘若已存有資料群時,則在步驟S811中,計算現有資料群的特徵值與目標資料點的特徵值之間的特徵值差異,並且在步驟S813中判斷所計算之特徵值差異之中最小特徵值差異是否小於差異門檻值。
倘若最小特徵值差異非小於差異門檻值時,則執行步驟S807。
倘若最小特徵值差異小於差異門檻值時,則在步驟S815中,將目標資料點分組至對應最小特徵值差異的資料群。之後,在步驟S817中,更新加入此目標資料點的資料群的特徵值。
在步驟S809與步驟S817之後,步驟S801會再次被執行以確認是否仍有未尚未分群的資料點。
倘若已無尚未分群的資料點時,在步驟S819中,會將所產生的資料群及其包含的資料點輸出,作為對應欲分群之資料的資料叢集。
請再參照圖7,最後,在步驟S705中,優化所產生的資料叢集。如上所述,例如,優化資料叢集可分為處理孤立資料點與處理過度分割之資料叢集兩個部分。
圖9是根據本揭露之第一範例實施例所繪示之處理孤立資料點的流程圖。
請參照圖9,首先,在步驟S901中,判斷欲分群之資料的資料點之中的一個或多個資料點的多個周圍資料點是否屬於所產生之資料叢集之中的同一個資料叢集。
倘若欲分群之資料的資料點之中的一個或多個資料點的多個周圍資料點是屬於所產生之資料叢集之中的同一個資料叢集時,則在步驟S903中,將此一個或多個資料點搬移至其周邊資料點所屬之資料叢集中。
圖10是根據本揭露之第一範例實施例所繪示之處理過度分割之資料叢集的流程圖。
請參照圖10,首先,在步驟S1001中,判斷分群至所產生之資料叢集之中的任一個邊界資料叢集的資料點的數目是否小於資料點數門檻值。
倘若分群至所產生之資料叢集之中的任一個邊界資料叢集的資料點的數目小於資料點數門檻值時,則在步驟S1003中,將此邊界資料叢集合併至其鄰近資料叢集。
[第二範例實施例]
第二範例實施例的資料分群方法本質上是相同於第一範例實施例的資料分群方法,其差異之處在於差異門檻值的設定方式。在第一範例實施例的資料分群方法中,差異門檻值是被設定為固定值,由此判斷目標資料點是否可被分群至現有的資料群中。然而,在第二範例實施例中,差異門檻值是對應資料群而動態地變動。也就是說,每一資料群會存有對應的差異門檻值,並且判斷目標資料點是否可被分群至現有的資料群中時必須根據每一資料群所對應的差異門檻值來判斷。以下將僅針對第二範例實施例與第一範例實施例的差異之處進行說明。
圖11是根據本揭露之第二範例實施例所繪示的資料分群方法的流程圖。
請參照圖11,首先,在步驟S1101中,資料前處理模組112會將欲分群之資料的資料點根據其特徵值排序並且依據排序的結果產生處理順序。排序資料點的方法相同於第一範例實施例,在此不再重複描述。必須瞭解的是,儘管在本範例實施例會根據排序結果來產生處理順序,但在本揭露另一範例實施例中,資料前處理模組112亦可根據資料點的接收順序來產生處理順序,而不進行排序。
之後,在步驟S1103中,資料輸入與資料叢集輸出子模組122會判斷是否存有尚未分群的資料點。
倘若存有尚未分群的資料點時,在步驟S1105中,資料輸入與資料叢集輸出子模組122會根據處理順序依序地從欲分群的資料點中選擇一個目標資料點。
接著,在步驟S1107中,資料群產生子模組124會判斷是否已產生任何資料群。
倘若未產生任何資料群時,則在步驟S1109中,資料群產生子模組124會新增一個資料群並且將所選擇的目標資料點分組至所新增的資料群中。之後,在步驟S1111中,特徵更新模組126會設定所新增的資料群的特徵值以及對應此資料群的初始差異門檻值。
倘若已存有資料群時,則在步驟S1113中,資料群產生子模組124會計算現有資料群的特徵值與目標資料點的特徵值之間的特徵值差異,並且在步驟S1115中,資料群產生子模組124會判斷所計算之特徵值差異之中最小特徵值差異是否小於對應最小特徵值差異之資料群的差異門檻值。
倘若最小特徵值差異非小於對應的差異門檻值時,則資料群產生子模組124會執行步驟S1109。
倘若最小特徵值差異小於對應的差異門檻值時,則在步驟S1117中,資料群產生子模組124會將目標資料點分組至對應最小特徵值差異的資料群。之後,在步驟S1119中,特徵更新模組126會更新加入此目標資料點的資料群的特徵值與差異門檻值。
例如,在第二範例實施例中,對應資料群的特徵值與差異門檻值會根據下述計算式(1)~(4)來更新:
D s =r i -r s  (3)
w =D s /(2×D i ) (4)
其中ri '為加入第s資料點之後第i資料群的特徵值,Di '為加入第s資料點之後第i資料群的差異門檻值,Ni 為未加入第s資料點之前第i資料群的資料點的數目,ri 為加入第s資料點之前第i資料群的特徵值,rs 為第s資料點的特徵值,Ds 為第i資料群的特徵值與第s資料點的特徵值之間的特徵值差異,並且w為比重值。
在步驟S1111與步驟S1119之後,步驟S1103會再次被執行以確認是否仍有未尚未分群的資料點。
倘若已無尚未分群的資料點時,在步驟S1121中,會將所產生的資料群及其包含的資料點輸出,作為對應欲分群之資料的資料叢集。
由於在第二範例實施例中,差異門檻值會根據資料群內之資料點的特徵值而動態地調整,因此可減少上述孤立資料點與過度分割之資料叢集的產生。因此,在本揭露之第二範例實施例中,無需執行優化資料叢集的步驟(即,第一範例實施例的步驟S705)。然而,本揭露不限於此,在以上述動態方式調整差異門檻值的範例實施例中,亦可執行優化資料叢集的步驟,以確保分群的品質。
綜上所述,本揭露之範例實施例所提出的資料分群方法與裝置及使用此方法的影像處理裝置與資料處理裝置能夠快速地將資料(例如,影像資料)的資料點進行分群,無進行反覆地疊代運算,由此可大幅減少資料傳輸消耗,進而影響嵌入式系統的效能。
雖然本揭露已以實施例揭露如上,然其並非用以限定本揭露,任何所屬技術領域中具有通常知識者,在不脫離本揭露之精神和範圍內,當可作些許之更動與潤飾,故本揭露之保護範圍當視後附之申請專利範圍所界定者為準。
100...影像處理裝置
102...微處理單元
104...緩衝記憶體
106...影像感測元件
108...資料處理裝置
112...資料前處理模組
114‧‧‧資料分群裝置
116‧‧‧資料後處理模組
122‧‧‧資料輸入與資料叢集輸出子模組
124‧‧‧資料群產生子模組
126‧‧‧特徵更新模組
S701、S703、S705‧‧‧資料分群的步驟
S801、S803、S805、S807、S809、S811、S813、S815、S817、S819、S821‧‧‧將資料點分群成資料叢集的步驟
S901、S903‧‧‧優化資料叢集的步驟
S1001、S1003‧‧‧優化資料叢集的步驟
S1101、S1103、S1105、S1107、S1109、S1111、S1113、S1115、S1117、S1119、S1121‧‧‧資料分群的步驟
圖1是根據本揭露之第一範例實施例所繪示的影像處理裝置。
圖2是根據本揭露之第一範例實施例所繪示之建立對應資料的直方圖的範例。
圖3A~3G是根據本揭露之第一範例實施例所繪示的分群運作示意圖。
圖4是根據圖3A~3G所繪示的分群運作列表。
圖5A是根據本揭露之第一範例實施例所繪示的孤立資料點的示意圖。
圖5B是根據圖5A所繪示之優化資料叢集的示意圖。
圖6A是根據本揭露之第一範例實施例所繪示的過度分割之資料叢集的示意圖。
圖6B是根據圖6A所繪示之優化資料叢集的示意圖。
圖7是根據本揭露之第一範例實施例所繪示的資料分群方法的流程圖。
圖8是繪示圖7的步驟S703的詳細步驟。
圖9是根據本揭露之第一範例實施例所繪示之處理孤立資料點的流程圖。
圖10是根據本揭露之第一範例實施例所繪示之處理過度分割之資料叢集的流程圖。
圖11是根據本揭露之第二範例實施例所繪示的資料分群方法的流程圖。
S701、S703、S705...資料分群的步驟

Claims (19)

  1. 一種資料分群方法,用於分群多個資料點,其中每一該些資料點具有至少一特徵值,該資料分群方法包括:排序該些資料點並且根據一排序結果產生一處理順序;根據該處理順序使用一非疊代方式將該些資料點分群成多個資料叢集;以及優化所產生的該些資料叢集,其中根據該處理順序使用該非疊代方式將該些資料點分群成該些資料叢集的步驟包括:根據該處理順序依序地從該些資料點之中選擇一目標資料點;根據對應一個或多個現有資料群的一個或多個特徵值與所選擇的該目標資料點的該特徵值之間的一個或多個特徵值差異將該目標資料點分組至新增的一資料群組或該一個或多個現有資料群中;以及依據該目標資料點的該特徵值以及一比重值來更新加入該目標資料點的該資料群的一差異門檻值,其中上述優化所產生的該些資料叢集的步驟包括:判斷分群至該些資料叢集之中的一邊界資料叢集的資料點的數目是否小於一資料點數門檻值;以及倘若分群至該邊界資料叢集的資料點的數目小於該資料點數門檻值時,將該邊界資料叢集合併至該些資料叢集之中的一鄰近資料叢集。
  2. 如申請專利範圍第1項所述之資料分群方法,其中排序該些資料點並且根據該排序結果產生處理順序的步驟包括:依據該些資料點的該些特徵值排序該些資料點並且根據該排序結果產生該處理順序。
  3. 如申請專利範圍第1項所述之資料分群方法,其中排序該些資料點並且根據該排序結果產生處理順序的步驟包括:依據該些資料點的一接收順序排序該些資料點並且根據該排序結果產生該處理順序。
  4. 如申請專利範圍第1項所述之資料分群方法,其中根據對應該一個或多個現有資料群的該一個或多個特徵值與所選擇的該目標資料點的該特徵值之間的該一個或多個特徵值差異將該目標資料點分組至所新增的該資料群組或該一個或多個現有資料群中的步驟包括:a.判斷是否已產生任何資料群,其中倘若未產生任何資料群時則執行步驟b,並且倘若已產生該一個或多個現有資料群時則執行步驟c;b.新增一個資料群並且將所選擇的該目標資料點分組至所新增的該資料群;c.計算對應該一個或多個現有資料群的該一個或多個特徵值與所選擇的該目標資料點的該特徵值之間的該一個或多個特徵值差異,識別該一個或多個特徵值差異之中的一最小特徵值差異,並且判斷該最小特徵值差異是否小於 該一個或多個現有資料群之中對應該最小特徵值差異的一資料群的該差異門檻值,其中倘若該最小特徵值差異非小於對應該最小特徵值差異的該資料群的該差異門檻值時執行步驟b,並且倘若該最小特徵值差異小於對應該最小特徵值差異的該資料群的該差異門檻值時將所選擇的該目標資料點分組至對應該最小特徵值差異的該資料群中;d.更新加入該目標資料點的該資料群的該特徵值,其中加入該目標資料點的該資料群的該特徵值藉由平均屬於該資料群的資料點的特徵值所獲得;以及e.判斷所有該些資料點是否已被分組,其中倘若所有該些資料點已被分組時則將所產生的該些資料群作為該些資料叢集,倘若該些資料點之中任一資料點未被分組時則根據該處理順序依序地從該些資料點之中選擇另一目標資料點。
  5. 如申請專利範圍第1項所述之資料分群方法,優化所產生的該些資料叢集的步驟包括:判斷該些資料點之中的一個或多個資料點的多個周圍資料點是否屬於該些資料叢集之中的同一個資料叢集;以及倘若該一個或多個資料點的該些周圍資料點是屬於該些資料叢集之中的同一個資料叢集時,將該一個或多個資料點搬移至該同一個資料叢集。
  6. 一種資料分群方法,用於使用一非疊代方式將多個資料點分群成多個資料叢集,其中每一該些資料點具有至 少一特徵值,該資料分群方法包括:a.從該些資料點之中選擇一目標資料點;b.判斷是否已產生任何資料群,其中倘若未產生任何資料群時則執行步驟c,並且倘若已產生一個或多個資料群時則執行步驟d;c.新增一個資料群並且將所選擇的該目標資料點分組至所新增的該資料群;d.計算對應該一個或多個資料群的一個或多個特徵值與所選擇的該目標資料點的該特徵值之間的一個或多個特徵值差異,識別該一個或多個特徵值差異之中的一最小特徵值差異,並且判斷該最小特徵值差異是否小於該一個或多個資料群之中對應該最小特徵值差異的一資料群的一差異門檻值,其中倘若該最小特徵值差異非小於對應該最小特徵值差異的該資料群的該差異門檻值時執行步驟c,並且倘若該最小特徵值差異小於對應該最小特徵值差異的該資料群的該差異門檻值時將所選擇的該目標資料點分組至對應該最小特徵值差異的該資料群中;e.更新加入該目標資料點的該資料群的該特徵值,其中加入該目標資料點的該資料群的該特徵值藉由平均屬於該資料群的資料點的特徵值所獲得;f.依據該目標資料點的該特徵值以及一比重值來更新加入該目標資料點的該資料群的該差異門檻值;g.判斷所有該些資料點是否已被分組,其中倘若所有該些資料點已被分組時則將所產生的該些資料群作為該些 資料叢集,倘若該些資料點之中任一資料點未被分組時則執行步驟a;以及h.判斷分群至該些資料叢集之中的一邊界資料叢集的資料點的數目是否小於一資料點數門檻值,倘若分群至該邊界資料叢集的資料點的數目小於該資料點數門檻值時,將該邊界資料叢集合併至該些資料叢集之中的一鄰近資料叢集。
  7. 如申請專利範圍第6項所述之資料分群方法,其中步驟a包括:依據該些資料點的一接收順序依序地從該些資料點之中選擇該目標資料點。
  8. 如申請專利範圍第6項所述之資料分群方法,其中步驟a包括:依據該些資料點的該些特徵值排序該些資料點並且根據一排序結果產生一處理順序;以及依據該處理順序依序地從該些資料點之中選擇該目標資料點。
  9. 一種資料處理裝置,用於分群多個資料點,其中每一該些資料點具有至少一特徵值,該資料處理裝置包括:一資料前處理模組,用以排序該些資料點並且根據一排序結果產生一處理順序;一資料分群裝置,用以根據該處理順序使用一非疊代方式將該些資料點分群成多個資料叢集,其中該資料分群裝置根據該處理順序依序地從該些資料點之中選擇一目標 資料點,且根據對應一個或多個現有資料群的一個或多個特徵值與所選擇的該目標資料點的該特徵值之間的一個或多個特徵值差異將該目標資料點分組至新增的一資料群組或該一個或多個現有資料群中,其中該資料分群裝置更用以依據該目標資料點的該特徵值以及一比重值來更新加入該目標資料點的該資料群的一差異門檻值;以及一資料後處理模組,用以優化所產生的該些資料叢集,其中該資料後處理模組更用以判斷分群至該些資料叢集之中的一邊界資料叢集的資料點的數目是否小於一資料點數門檻值,其中倘若分群至該邊界資料叢集的資料點的數目小於該資料點數門檻值時,將該邊界資料叢集合併至該些資料叢集之中的一鄰近資料叢集。
  10. 如申請專利範圍第9項所述之資料處理裝置,其中該資料前處理模組用以依據該些資料點的該些特徵值排序該些資料點並且根據該排序結果產生該處理順序。
  11. 如申請專利範圍第9項所述之資料處理裝置,其中該資料前處理模組用以依據該些資料點的一接收順序排序該些資料點並且根據該排序結果產生該處理順序。
  12. 如申請專利範圍第9項所述之資料處理裝置,其中該資料分群裝置包括:一資料輸入與資料叢集輸出子模組;一資料群產生子模組,耦接該資料輸入與資料叢集輸出子模組;以及一特徵更新模組,耦接該資料輸入與資料叢集輸出子 模組,其中該資料輸入與資料叢集輸出子模組用以根據該處理順序依序地從該些資料點之中選擇該目標資料點,其中該資料群產生子模組用以判斷是否已產生任何資料群,其中倘若未產生任何資料群時,該資料群產生子模組更用以新增一個資料群並且將該資料輸入與資料叢集輸出子模組所選擇的該目標資料點分組至所新增的該資料群,其中倘若已產生該一個或多個現有資料群時,該資料群產生子模組更用以計算對應該一個或多個現有資料群的該一個或多個特徵值與所選擇的該目標資料點的該特徵值之間的該一個或多個特徵值差異,識別該一個或多個特徵值差異之中的一最小特徵值差異,並且判斷該最小特徵值差異是否小於該一個或多個資料群之中對應該最小特徵值差異的一資料群的該差異門檻值,其中倘若該最小特徵值差異非小於對應該最小特徵值差異的該資料群的該差異門檻值時,該資料群產生子模組更用以新增一個資料群並且將所選擇的該目標資料點分組至所新增的該資料群,其中倘若該最小特徵值差異小於對應該最小特徵值差異的該資料群的該差異門檻值時,該資料群產生子模組更用以將所選擇的該目標資料點分組至對應該最小特徵值差異的該資料群中,其中該特徵更新模組用以更新加入該目標資料點的 該資料群的該特徵值,其中加入該目標資料點的該資料群的該特徵值藉由平均屬於該資料群的資料點的特徵值所獲得,其中該資料輸入與資料叢集輸出子模組更用以判斷所有該些資料點是否已被分組,其中倘若所有該些資料點已被分組時,該資料輸入與資料叢集輸出子模組更用以將所產生的該些資料群作為該些資料叢集,其中倘若該些資料點之中任一資料點未被分組時,該資料輸入與資料叢集輸出子模組更用以根據該處理順序依序地從該些資料點之中選擇另一目標資料點。
  13. 如申請專利範圍第9項所述之資料處理裝置,其中該資料後處理模組判斷該些資料點之中的一個或多個資料點的多個周圍資料點是否屬於該些資料叢集之中的同一個資料叢集,其中倘若該一個或多個資料點的該些周圍資料點是屬於該些資料叢集之中的同一個資料叢集時,該資料後處理模組將該一個或多個資料點搬移至該同一個資料叢集。
  14. 一種資料分群裝置,用於使用一非疊代方式將多個資料點分群成多個資料叢集,其中每一該些資料點具有至少一特徵值,該資料分群裝置包括:一資料輸入與資料叢集輸出子模組;一資料群產生子模組,耦接該資料輸入與資料叢集輸出子模組;以及 一特徵更新模組,耦接該資料輸入與資料叢集輸出子模組,其中該資料輸入與資料叢集輸出子模組用以依序地從該些資料點之中選擇一目標資料點,其中該資料群產生子模組用以判斷是否已產生任何資料群,其中倘若未產生任何資料群時,該資料群產生子模組更用以新增一個資料群並且將該資料輸入與資料叢集輸出子模組所選擇的該目標資料點分組至所新增的該資料群,其中倘若已產生一個或多個資料群時,該資料群產生子模組更用以計算對應該一個或多個資料群的一個或多個特徵值與所選擇的該目標資料點的該特徵值之間的一個或多個特徵值差異,識別該一個或多個特徵值差異之中的一最小特徵值差異,並且判斷該最小特徵值差異是否小於該一個或多個資料群之中對應該最小特徵值差異的一資料群的一差異門檻值,其中倘若該最小特徵值差異非小於對應該最小特徵值差異的該資料群的該差異門檻值時,該資料群產生子模組更用以新增一個資料群並且將所選擇的該目標資料點分組至所新增的該資料群,其中倘若該最小特徵值差異小於對應該最小特徵值差異的該資料群的該差異門檻值時,該資料群產生子模組更用以將所選擇的該目標資料點分組至對應該最小特徵值差異的該資料群中, 其中該特徵更新模組用以更新加入該目標資料點的該資料群的該特徵值,其中加入該目標資料點的該資料群的該特徵值藉由平均屬於該資料群的資料點的特徵值所獲得,其中該特徵更新模組更用以依據該目標資料點的該特徵值以及一比重值來更新加入該目標資料點的該資料群的該差異門檻值,其中該資料輸入與資料叢集輸出子模組更用以判斷所有該些資料點是否已被分組,其中倘若所有該些資料點已被分組時,該資料輸入與資料叢集輸出子模組更用以將所產生的該些資料群作為該些資料叢集,其中倘若該些資料點之中任一資料點未被分組時,該資料輸入與資料叢集輸出子模組更用以依序地從該些資料點之中選擇另一目標資料點。
  15. 一種影像處理裝置,包括:一影像感測元件,用於擷取一影像,其中該影像具有多個資料點並且每一該些資料點具有至少一特徵值;一資料前處理模組,用以排序該些資料點並且根據一排序結果產生一處理順序;一資料分群裝置,用以根據該處理順序使用一非疊代方式將該些資料點分群成多個資料叢集,其中該資料分群裝置根據該處理順序依序地從該些資料點之中選擇一目標資料點,且根據對應一個或多個現有資料群的一個或多個 特徵值與所選擇的該目標資料點的該特徵值之間的一個或多個特徵值差異將該目標資料點分組至新增的一資料群組或該一個或多個現有資料群中,其中該資料分群裝置更用以依據該目標資料點的該特徵值以及一比重值來更新加入該目標資料點的該資料群的一差異門檻值;以及一資料後處理模組,用以優化所產生的該些資料叢集,其中該些資料叢集之中的其中一個資料叢集的至少一個資料點會被搬移至另一個資料叢集,其中該資料後處理模組更用以判斷分群至該些資料叢集之中的一邊界資料叢集的資料點的數目是否小於一資料點數門檻值,其中倘若分群至該邊界資料叢集的資料點的數目小於該資料點數門檻值時,將該邊界資料叢集合併至該些資料叢集之中的一鄰近資料叢集。
  16. 如申請專利範圍第15項所述之影像處理裝置,其中該資料前處理模組用以依據該些資料點的該些特徵值排序該些資料點並且根據該排序結果產生該處理順序。
  17. 如申請專利範圍第15項所述之影像處理裝置,其中該資料前處理模組用以依據該些資料點的一接收順序排序該些資料點並且根據該排序結果產生該處理順序。
  18. 如申請專利範圍第15項所述之影像處理裝置,其中該資料分群裝置包括:一資料輸入與資料叢集輸出子模組;一資料群產生子模組,耦接該資料輸入與資料叢集輸出子模組;以及 一特徵更新模組,耦接該資料輸入與資料叢集輸出子模組,其中該資料輸入與資料叢集輸出子模組用以根據該處理順序依序地從該些資料點之中選擇該目標資料點,其中該資料群產生子模組用以判斷是否已產生任何資料群,其中倘若未產生任何資料群時,該資料群產生子模組更用以新增一個資料群並且將該資料輸入與資料叢集輸出子模組所選擇的該目標資料點分組至所新增的該資料群,其中倘若已產生該一個或多個現有資料群時,該資料群產生子模組更用以計算對應該一個或多個現有資料群的該一個或多個特徵值與所選擇的該目標資料點的該特徵值之間的該一個或多個特徵值差異,識別該一個或多個特徵值差異之中的一最小特徵值差異,並且判斷該最小特徵值差異是否小於該一個或多個資料群之中對應該最小特徵值差異的一資料群的該差異門檻值,其中倘若該最小特徵值差異非小於對應該最小特徵值差異的該資料群的該差異門檻值時,該資料群產生子模組更用以新增一個資料群並且將所選擇的該目標資料點分組至所新增的該資料群,其中倘若該最小特徵值差異小於對應該最小特徵值差異的該資料群的該差異門檻值時,該資料群產生子模組更用以將所選擇的該目標資料點分組至對應該最小特徵值差異的該資料群中, 其中該特徵更新模組用以更新加入該目標資料點的該資料群的該特徵值,其中加入該目標資料點的該資料群的該特徵值藉由平均屬於該資料群的資料點的特徵值所獲得,其中該資料輸入與資料叢集輸出子模組更用以判斷所有該些資料點是否已被分組,其中倘若所有該些資料點已被分組時,該資料輸入與資料叢集輸出子模組更用以將所產生的該些資料群作為該些資料叢集,其中倘若該些資料點之中任一資料點未被分組時,該資料輸入與資料叢集輸出子模組更用以根據該處理順序依序地從該些資料點之中選擇另一目標資料點。
  19. 如申請專利範圍第15項所述之影像處理裝置,其中該資料後處理模組判斷該些資料點之中的一個或多個資料點的多個周圍資料點是否屬於該些資料叢集之中的同一個資料叢集,其中倘若該一個或多個資料點的該些周圍資料點是屬於該些資料叢集之中的同一個資料叢集時,該資料後處理模組將該一個或多個資料點搬移至該同一個資料叢集。
TW099141260A 2010-11-29 2010-11-29 資料分群方法與裝置、資料處理裝置及影像處理裝置 TWI464604B (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
TW099141260A TWI464604B (zh) 2010-11-29 2010-11-29 資料分群方法與裝置、資料處理裝置及影像處理裝置
CN201010595455.4A CN102479247B (zh) 2010-11-29 2010-12-20 数据分群方法与装置、数据处理装置及图像处理装置
US13/012,802 US9058540B2 (en) 2010-11-29 2011-01-25 Data clustering method and device, data processing apparatus and image processing apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
TW099141260A TWI464604B (zh) 2010-11-29 2010-11-29 資料分群方法與裝置、資料處理裝置及影像處理裝置

Publications (2)

Publication Number Publication Date
TW201222278A TW201222278A (en) 2012-06-01
TWI464604B true TWI464604B (zh) 2014-12-11

Family

ID=46091895

Family Applications (1)

Application Number Title Priority Date Filing Date
TW099141260A TWI464604B (zh) 2010-11-29 2010-11-29 資料分群方法與裝置、資料處理裝置及影像處理裝置

Country Status (3)

Country Link
US (1) US9058540B2 (zh)
CN (1) CN102479247B (zh)
TW (1) TWI464604B (zh)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103514195B (zh) * 2012-06-21 2017-06-13 富士通株式会社 数据过滤装置和方法,以及数据处理装置和方法
EP2698764A1 (en) * 2012-08-14 2014-02-19 Thomson Licensing Method of sampling colors of images of a video sequence, and application to color clustering
TWI474139B (zh) * 2012-09-20 2015-02-21 Min Hwei College Of Health Care Man 資料分群方法與其電腦程式軟體
TWI497449B (zh) 2012-12-26 2015-08-21 Ind Tech Res Inst 非監督式調適方法與應用其之影像自動分類方法
TWI547816B (zh) 2014-12-31 2016-09-01 富智康(香港)有限公司 照片分群系統及方法
US10268923B2 (en) * 2015-12-29 2019-04-23 Bar-Ilan University Method and system for dynamic updating of classifier parameters based on dynamic buffers
CN106598494B (zh) * 2016-12-05 2022-07-29 东软集团股份有限公司 数据统计方法和装置
TWI697794B (zh) * 2018-01-24 2020-07-01 沅聖科技股份有限公司 資料採集處理裝置及其方法
CN109614613B (zh) * 2018-11-30 2020-07-31 北京市商汤科技开发有限公司 图像的描述语句定位方法及装置、电子设备和存储介质
US11403482B2 (en) 2020-01-15 2022-08-02 Aptiv Technologies Limited Adaptive search for LiDAR-based clustering
US11301351B2 (en) * 2020-03-27 2022-04-12 International Business Machines Corporation Machine learning based data monitoring
FR3112048A1 (fr) * 2020-06-26 2021-12-31 Orange Détermination du bruit dans un signal

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030044061A1 (en) * 2001-08-31 2003-03-06 Pradya Prempraneerach Color image segmentation in an object recognition system
US20070244844A1 (en) * 2006-03-23 2007-10-18 Intelliscience Corporation Methods and systems for data analysis and feature recognition
TWI312128B (zh) * 2006-04-26 2009-07-11 Nat Pingtung University Of Science & Technolog
TW201020970A (en) * 2008-11-20 2010-06-01 Ind Tech Res Inst Pixel region-based image segmentation method and system

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6798911B1 (en) 2001-03-28 2004-09-28 At&T Corp. Method and system for fuzzy clustering of images
US7397945B2 (en) 2003-11-20 2008-07-08 Hewlett-Packard Development Company, L.P. Method and system of image segmentation using regression clustering
JP4509860B2 (ja) * 2005-05-25 2010-07-21 株式会社東芝 データ分割装置、データ分割方法およびプログラム
CN100535926C (zh) * 2006-01-06 2009-09-02 佳能株式会社 数据处理,图像处理和图像分类方法及设备
US8145672B2 (en) 2008-10-10 2012-03-27 Exxonmobil Research And Engineering Company Method for clustering of large high-dimensional datasets
TWI374365B (en) 2008-10-29 2012-10-11 Univ Nat Pingtung Sci & Tech Method for data custering

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030044061A1 (en) * 2001-08-31 2003-03-06 Pradya Prempraneerach Color image segmentation in an object recognition system
US20070244844A1 (en) * 2006-03-23 2007-10-18 Intelliscience Corporation Methods and systems for data analysis and feature recognition
TWI312128B (zh) * 2006-04-26 2009-07-11 Nat Pingtung University Of Science & Technolog
TW201020970A (en) * 2008-11-20 2010-06-01 Ind Tech Res Inst Pixel region-based image segmentation method and system

Also Published As

Publication number Publication date
TW201222278A (en) 2012-06-01
US20120133789A1 (en) 2012-05-31
US9058540B2 (en) 2015-06-16
CN102479247A (zh) 2012-05-30
CN102479247B (zh) 2016-01-20

Similar Documents

Publication Publication Date Title
TWI464604B (zh) 資料分群方法與裝置、資料處理裝置及影像處理裝置
KR102424803B1 (ko) 터치 분류
JP5792747B2 (ja) テキスト分類の方法及びシステム
US9330341B2 (en) Image index generation based on similarities of image features
KR20200052439A (ko) 딥러닝 모델의 최적화 시스템 및 방법
CN101710334A (zh) 基于图像哈希的大规模图像库检索方法
CN110457577B (zh) 数据处理方法、装置、设备和计算机存储介质
WO2014118980A1 (ja) 情報変換方法、情報変換装置および情報変換プログラム
CN110751027B (zh) 一种基于深度多示例学习的行人重识别方法
CN112529068B (zh) 一种多视图图像分类方法、系统、计算机设备和存储介质
US20210397662A1 (en) Search needs evaluation apparatus, search needs evaluation system, and search needs evaluation method
CN107832456A (zh) 一种基于临界值数据划分的并行knn文本分类方法
CN106610977B (zh) 一种数据聚类方法和装置
US20170293660A1 (en) Intent based clustering
CN112148942A (zh) 基于数据聚类的业务指标数据分类方法及装置
KR20200103177A (ko) 빅데이터 분석을 위한 시장 세분화 반딧불 알고리즘 방법 및 시스템
CN112116028B (zh) 模型决策解释实现方法、装置及计算机设备
JP2014115920A (ja) 多クラス識別器、方法、及びプログラム
Liu et al. A weight-incorporated similarity-based clustering ensemble method
CN107578070A (zh) 基于邻域信息和平均差异度的K‑means初始聚类中心优选方法
CN116363416A (zh) 一种图像去重方法、装置、电子设备和存储介质
Pereira et al. Assessing active learning strategies to improve the quality control of the soybean seed vigor
US20230259756A1 (en) Graph explainable artificial intelligence correlation
CN102254040A (zh) 一种基于支撑向量机的Web划分方法
JP6924450B2 (ja) 検索ニーズ評価装置、検索ニーズ評価システム、及び検索ニーズ評価方法