TWI694344B - 為一作業環境檢測影響因子之裝置及方法 - Google Patents
為一作業環境檢測影響因子之裝置及方法 Download PDFInfo
- Publication number
- TWI694344B TWI694344B TW107138000A TW107138000A TWI694344B TW I694344 B TWI694344 B TW I694344B TW 107138000 A TW107138000 A TW 107138000A TW 107138000 A TW107138000 A TW 107138000A TW I694344 B TWI694344 B TW I694344B
- Authority
- TW
- Taiwan
- Prior art keywords
- data
- factors
- factor
- data type
- accuracy
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/02—Knowledge representation; Symbolic representation
- G06N5/022—Knowledge engineering; Knowledge acquisition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/10—Pre-processing; Data cleansing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2455—Query execution
- G06F16/24553—Query execution of query operations
- G06F16/24558—Binary matching operations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/211—Selection of the most significant subset of features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Software Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Business, Economics & Management (AREA)
- Computational Linguistics (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Human Resources & Organizations (AREA)
- Evolutionary Biology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Medical Informatics (AREA)
- Databases & Information Systems (AREA)
- Strategic Management (AREA)
- Educational Administration (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Game Theory and Decision Science (AREA)
- Operations Research (AREA)
- Tourism & Hospitality (AREA)
- Quality & Reliability (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Testing Or Calibration Of Command Recording Devices (AREA)
Abstract
一種為一作業環境檢測影響因子之裝置及方法。該裝置分析複數筆第一歷史記錄之複數個第一因子各自所對應之第一資料之一相異程度而產生各該第一因子之一檢測結果,各該檢測結果為一連續型資料或一離散型資料。該裝置根據該等第一歷史記錄及該等檢測結果訓練出一資料型態識別模型。該裝置利用複數筆第二歷史記錄之一訓練集合建立一基礎預測模型,藉由將該訓練集合中對應至一特定因子之該等第二資料重新排列以產生一對比集合,利用該對比集合建立一對比預測模型,藉由比較該基礎預測模型及該對比預測模型之準確度判斷該特定因子之一重要程度。
Description
本發明係關於一種為一作業環境檢測影響因子之裝置及方法。具體而言,本發明係關於一種為一作業環境檢測影響因子之資料型態及重要程度之裝置及方法。
為改善一作業環境(例如:生產線、智慧型建築)之各種效能(例如:產值、耗能),管理人員需要知道該作業環境中關鍵之影響因子(例如:溫度、濕度、機台編號等)。在分析一作業環境之哪些因子為關鍵之影響因子前,管理人員必須知道各因子對應之資料型態,亦即,必須知道各因子對應至連續型資料(亦即,數值大小具有意義之資料,例如:生產速率、產值、時間、溫度等)或離散型資料(亦即,數值大小不具意義之資料,例如:機台編號、性別等)。
目前業界之作法係由對各種資料有深入了解之專業人員事先定義資料庫之欄位格式,再判斷所接獲之因子之資料是否符合某一事先定義之欄位格式,藉此確認因子之資料型態。然而,隨著科技的快速發展,影響一作業環境之因子越來越多,且各因子所對應之資料格式繁雜不一,若仍採用事先定義格式再予以比對之作法,不僅耗時且準確率低,將無法應用
於實際的作業環境。此外,因子間亦會交互影響,在影響一作業環境之因子越來越多之情況下,要正確地且有效率地判斷出關鍵之影響因子亦變得十分困難。
有鑑於此,如何有效率地判斷一作業環境之巨量資料之資料型態(亦即,判斷資料為連續型資料或離散型資料),再據以準確地判斷出該作業環境之因子之重要程度,藉此找出哪些因子為關鍵之影響因子,乃業界亟需努力之目標。
為解決前述為一作業環境檢測因子之各種問題,本發明提供一種為一作業環境檢測影響因子之裝置及方法。
本發明所提供之一種為一作業環境檢測影響因子之裝置包含一儲存器及一處理器,其中該儲存器電性連接至該處理器。該儲存器儲存複數筆第一歷史記錄及該作業環境之複數筆第二歷史記錄,其中各該第一歷史記錄包含複數個第一資料一對一地對應至複數個第一因子,且各該第二歷史記錄包含複數個第二資料一對一地對應至複數個第二因子。該處理器藉由分析各該第一因子所對應之該等第一資料之一相異程度而產生各該第一因子之一檢測結果,其中各該檢測結果為一連續型資料及一離散型資料其中之一。該處理器根據該等第一歷史記錄及該等檢測結果訓練出一資料型態識別模型。
此外,該處理器利用該資料型態識別模型分析各該第二因子所對應之該等第二資料以判斷出各該第二因子之一資料型態,且利用該等第二歷史記錄之一第一子集及該等資料型態建立一基礎預測模型。該處理
器藉由將該第一子集中對應至一特定因子之該等第二資料重新排列以產生一對比集合,以及利用該對比集合及該等資料型態建立一對比預測模型。該處理器以該等第二歷史記錄之一第二子集測試該基礎預測模型以獲得一基礎準確度,以該第二子集測試該對比預測模型以獲得另一準確度,以及藉由比較該基礎準確度及該另一準確度判斷該特定因子之一重要程度。
本發明所提供之為一作業環境檢測影響因子之方法適用於一電子裝置。該電子裝置儲存複數筆第一歷史記錄及該作業環境之複數筆第二歷史記錄,其中各該第一歷史記錄包含複數個第一資料一對一地對應至複數個第一因子,且各該第二歷史記錄包含複數個第二資料一對一地對應至複數個第二因子。該方法包含下列步驟:(a)藉由分析各該第一因子所對應之該等第一資料之一相異程度而產生各該第一因子之一檢測結果,各該第一檢測結果為一連續型資料及一離散型資料其中之一,(b)根據該等第一歷史記錄及該等檢測結果訓練出一資料型態識別模型,(c)利用該資料型態識別模型分析各該第二因子所對應之該等第二資料以判斷出各該第二因子之一資料型態,(d)利用該等第二歷史記錄之一第一子集及該等資料型態建立一基礎預測模型,(e)藉由將該第一子集中對應至一特定因子之該等第二資料重新排列以產生一對比集合,(f)利用該對比集合及該等資料型態建立一對比預測模型,(g)以該等第二歷史記錄之一第二子集測試該基礎預測模型以獲得一基礎準確度,(h)以該第二子集測試該對比預測模型以獲得另一準確度,以及(i)藉由比較該基礎準確度及該另一準確度判斷該特定因子之一重要程度。
本發明先利用複數筆第一歷史記錄建立一資料型態識別模
型,再利用該資料型態識別模型及一作業環境之複數筆第二歷史記錄判斷該作業環境之影響因子。概要而言,本發明利用該資料型態識別模型判斷該等第二歷史記錄之各該第二因子之資料型態,再利用該等第二歷史記錄之一第一子集建立一基礎預測模型,且藉由將該第一子集中對應至一或多個特定因子之該等第二資料分別重新排列以產生一或多個對比集合,再建立一或多個對比預測模型。之後,本發明利用該等第二歷史記錄之一第二子集測試該基礎預測模型及該一或多個對比預測模型,再依據測試結果判斷該一或多個特定因子個別之重要程度,進而判斷出哪一或哪些特定因子較為重要。
本發明所提供之檢測技術能自動地、有效率地且準確地判斷資料型態為連續型或離散型,避免需人為事先定義資料欄位格式所導致之成本浪費及判斷誤差。此外,本發明可依據一作業環境之複數筆歷史資料建立複數個預測模型,測試該等預測模型之準確度,計算出特定因子之重要程度,進而找出該作業環境之關鍵的影響因子。本發明所提供之檢測技術能避免因作業環境之因子數量過多所導致之高成本及低準確度。
以下結合圖式闡述本發明之詳細技術及實施方式,俾使本發明所屬技術領域中具有通常知識者能理解所請求保護之發明之特徵。
10a、10b、……、10d:第一歷史記錄
12a、12b、……、12d:第二歷史記錄
1:檢測裝置
11:儲存器
13:處理器
D1:第一檢測結果
D2:第二檢測結果
D3:第三檢測結果
D4:第四檢測結果
102:第一子集
104:第二子集
106:第一對比集合
108:第二對比集合
S201~S217:步驟
S219~S231:步驟
第1A圖係描繪本發明之第一實施方式之檢測裝置1之架構示意圖;第1B圖係描繪本發明之第一歷史記錄之一具體範例之示意圖;第1C圖係描繪一具體範例中之各該第一因子之四種檢測結果;
第1D圖係描繪本發明之第二歷史記錄之一具體範例之示意圖;第1E圖係描繪本發明之一第一對比集合之一具體範例之示意圖;第1F圖係描繪本發明之一第二對比集合之一具體範例之示意圖;第2A圖係描繪本發明之第二實施方式之流程圖;以及第2B圖係描繪本發明之某些實施方式之流程圖。
以下將透過實施方式來解釋本發明所提供之一種為一作業環境檢測影響因子之裝置及方法。然而,該等實施方式並非用以限制本發明需在如該等實施方式所述之任何環境、應用或方式方能實施。因此,關於實施方式之說明僅為闡釋本發明之目的,而非用以限制本發明之範圍。應理解,在以下實施方式及圖式中,與本發明非直接相關之元件已省略而未繪示,且各元件之尺寸以及元件間之尺寸比例僅為例示而已,而非用以限制本發明之範圍。
本發明之第一實施方式為一種為一作業環境檢測影響因子之裝置(下稱「檢測裝置1」),其架構示意圖係描繪於第1圖。檢測裝置1包含一儲存器11及一處理器13,且二者彼此電性連接。儲存器11可為一記憶體、一通用串列匯流排(Universal Serial Bus;USB)碟、一硬碟、一光碟(Compact Disk;CD)、一隨身碟或本發明所屬技術領域中具有通常知識者所知且具有相同功能之任何其他儲存媒體或電路。處理器13可為各種處理單元、中央處理單元(Central Processing Unit;CPU)、數位訊號處理器(Digital Signal Processor;DSP)、微處理器或本發明所屬技術領域中具有通常知識者所知悉之其他計算裝置。
於本實施方式中,檢測裝置1之儲存器11儲存複數筆第一歷史記錄10a、10b、……、10d,且第一歷史記錄10a、10b、……、10d各自包含複數個第一資料一對一地對應至複數個第一因子。為便於理解,請參第1B圖所示之一具體範例。該具體範例將用於後續的說明,且應理解其非用以限制本發明之範圍。於該具體範例中,第一歷史記錄10a、10b、……、10d各自包含五個第一資料一對一地對應至五個第一因子(亦即,機台編號、溫度、濕度、壓力及良率)。需說明者,第一歷史記錄10a、10b、……、10d可為任何作業環境先前作業時所產生之記錄。本發明未限制取得第一歷史記錄10a、10b、……、10d之方式,且如何取得第一歷史記錄10a、10b、……、10d亦非本發明之重點,故不贅言。
此外,儲存器11還儲存複數筆第二歷史記錄12a、12b、……、12d,且第二歷史記錄12a、12b、……、12d各自包含複數個第二資料一對一地對應至複數個第二因子。需說明者,第二歷史記錄12a、12b、……、12d來自一欲檢測因子重要性之作業環境(例如:一生產線、一智慧型建築)。本發明未限制該等第二資料及該等第二因子之數量及種類。此外,第二歷史記錄12a、12b、……、12d與第一歷史記錄10a、10b、……、10d可來自不同的作業環境。
檢測裝置1所執行之運作可區分為二個階段,其中第一階段之運作在於利用第一歷史記錄10a、10b、……、10d建立一資料型態識別模型,而第二階段之運作則在於根據第二歷史記錄12a、12b、……、12d檢測該作業環境之因子之重要程度,進而找出哪些因子為關鍵之影響因子。
現說明檢測裝置1如何利用第一歷史記錄10a、10b、……、
10d建立一資料型態識別模型。概要而言,本發明之檢測裝置1可採用四種檢測技術分別檢測各該第一因子之資料型態,再利用第一歷史記錄10a、10b、……、10d及四種檢測技術之檢測結果訓練出一資料型態識別模型。茲先詳述檢測裝置1所採用之四種檢測技術。請一併參閱第1C圖,其係記錄各該第一因子實際資料型態以及四種檢測技術之檢測結果。
第一種檢測技術係檢測各該第一因子所對應之該等第一資料之相異值分布占比。具體而言,處理器13藉由分析各該第一因子所對應之該等第一資料之第一相異程度而產生各該第一因子之一第一檢測結果D1。需說明者,各該第一檢測結果D1為對應之該第一因子之資料型態(亦即,為連續型資料或離散型資料)。需說明者,連續型資料係指數值大小具有意義之資料(例如:時間、溫度、尺寸等),而離散型資料係指數值大小不具意義之資料(例如:機台編號及人員性別等)。
以第一因子「機台編號」為例,處理器13分析其所對應之該等第一資料(亦即,2、100、……、4)之相異程度,藉此產生第一因子「機台編號」之第一檢測結果D1(亦即,離散型資料,以數字1表示)。再以第一因子「溫度」為例,處理器13分析其所對應之該等第一資料(亦即,25、30、……、30)之相異程度,藉此產生第一因子「溫度」之第一檢測結果D1(亦即,連續型資料,以數字0表示)。另外,再以第一因子「良率」為例,處理器13分析其所對應之該等第一資料(亦即,60、62、……、80)之相異程度,藉此產生第一因子「良率」之第一檢測結果D1(亦即,連續型資料,以數字0表示)。
關於第一種檢測技術,於某些實施方式中,處理器13係藉由
對各該第一因子執行以下運作來產生對應之第一檢測結果D1:藉由比較第一因子所對應之該等第一資料之一眾數個數及一第一門檻值以產生一第一比較結果,藉由比較第一因子所對應之該等第一資料之一相異個數以產生一第二比較結果,以及根據第一比較結果及第二比較結果決定第一檢測結果D1。舉例而言,處理器13可依據以下公式(1)及公式(2)分別獲得各該第一因子之第一比較結果及第二比較結果,但應理解以下公式並非用以限制本發明之範圍:
上述公式(1)及公式(2)中,參數X代表一第一因子所對應之該等第一資料,參數N代表一第一因子所對應之該等第一資料之個數,Mode(X)代表一第一因子所對應之該等第一資料之眾數,Len(Mode(X))代表前述眾數之個數,參數T 1代表第一門檻值(例如:可為,但不以此為限),Distinct(X)代表一第一因子所對應之該等第一資料之相異數,Len(Distinct(X))代表前述相異數之個數,且參數T 2代表第二門檻值(例如:可為0.2,但不以此為限)。
處理器13判斷一第一因子所對應之該等第一資料之眾數個數是否高於第一門檻值,亦即,是否能使公式(1)成立,此為第一比較結果。另外,處理器13判斷一第一因子所對應之該等第一資料之相異數是否低於第二門檻值,亦即,是否能使公式(2)成立,此為第二比較結果。若一第一因子之第一比較結果為公式(1)不成立且第二比較結果為公式(2)不成立,則處
理器13判斷該第一因子之第一檢測結果D1為連續型資料。若一第一因子之第一比較結果及第二比較結果係公式(1)及公式(2)至少其中之一成立,則處理器13判斷該第一因子之第一檢測結果D1為離散型資料。
第二種檢測技術係檢測各該第一因子所對應之該等第一資料是否符合常態分布。具體而言,處理器13藉由將各該第一因子所對應之該等第一資料與一常態分布模型進行比對(亦即,判斷各該第一因子所對應之該等第一資料是否符合常態分布)以產生各該第一因子之一第二檢測結果D2。各該第二檢測結果D2為對應之該第一因子之資料型態(亦即,為連續型資料或離散型資料)。若一第一因子所對應之該等第一資料符合一常態分布模型(亦即,符合常態分布),則處理器13判斷該第一因子之第二檢測結果D2為連續型資料(於第1C圖中係以數字0表示)。若一第一因子所對應之該等第一資料不符合一常態分布模型(亦即,不符合常態分布),則處理器13判斷該第一因子之第二檢測結果D2為離散型資料(於第1C圖中係以數字1表示)。
第三種檢測技術係檢測各該第一因子所對應之該等第一資料之數值間斷性。具體而言,處理器13藉由一標籤編碼器(LabelEncoder)分析各該第一因子所對應之該等第一資料之一間斷性,藉此產生各該第一因子之一第三檢測結果D3。各該第三檢測結果D3為對應之該第一因子之資料型態(亦即,為連續型資料或離散型資料)。若處理器13藉由標籤編碼器判斷一第一因子所對應之該等第一資料具有間斷數值,則該第一因子之第三檢測結果D3為連續型資料(於第1C圖中係以數字0表示)。若處理器13藉由標籤編碼器判斷一第一因子所對應之該等第一資料為連續不間斷之數
值,則該第一因子之第三檢測結果D3為離散型資料(於第1C圖中係以數字1表示)。需說明者,本發明所屬技術領域中具有通常知識者應熟知標籤編碼器之運作方式,故不贅言。
第四種檢測技術係檢測各該第一因子所對應之該等第一資料所形成之群組之差異性。具體而言,處理器13藉由對各該第一因子執行以下運作來產生各該第一因子之一第四檢測結果D4:將各該第一因子所對應之該等第一資料分群為複數個資料群組(例如:採用密度式之聚類演算法(Density-Based Spatial Clustering of Applications with Noise;DBSCAN),但不以此為限),計算各該群組之一集中量數(例如:一中位數),計算該等集中量數間之一第二相異程度(例如:採用多樣本中位數差異檢測(Kruskal-Wallis test),但不以此為限),以及根據該等第二相異程度決定出第四檢測結果D4。各該第四檢測結果D4為對應之該第一因子之資料型態(亦即,為連續型資料或離散型資料)。若一第一因子所對應之第二相異程度為該等集中量數之相異不顯著,則處理器13判斷該第一因子之第四檢測結果D4為連續型資料(於第1C圖中係以數字0表示)。若一第一因子所對應之第二相異程度為該等集中量數之相異顯著,則處理器13判斷該第一因子之第四檢測結果D4為離散型資料(於第1C圖中係以數字1表示)。需說明者,本發明所屬技術領域中具有通常知識者應熟知密度式之聚類演算法以及多樣本中位數差異檢測之運作方式,故不贅言。
於本實施方式中,檢測裝置1之處理器13係採用第一種檢測技術。於其他實施方式中,檢測裝置1之處理器13則可採用第一種檢測技術搭配第二至第四種檢測技術之任意組合,例如:第一及第二種檢測技術、第
一及第三種檢測技術、第一及第四種檢測技術、第一至第四種檢測技術,茲不一一列舉。
接著,處理器13根據第一歷史記錄10a、10b、……、10d及前述檢測結果訓練出一資料型態識別模型(未繪示)。於本實施方式中,處理器13係採用第一種檢測技術,因此處理器13根據第一歷史記錄10a、10b、……、10d及該等第一檢測結果D1訓練出資料型態識別模型。於其他實施方式中,處理器13可採用第一種檢測技術搭配第二至第四種檢測技術之任意組合,因此處理器13根據第一歷史記錄10a、10b、……、10d、該等第一檢測結果D1及所搭配之其他檢測技術之該等檢測結果訓練出資料型態識別模型。舉例而言,若處理器13採用第一及第二種檢測技術,則處理器13根據第一歷史記錄10a、10b、……、10d、該等第一檢測結果D1及該等第二檢測結果D2訓練出資料型態識別模型。再舉例而言,若處理器13採用第一至第四種檢測技術,則處理器13根據第一歷史記錄10a、10b、……、10d、該等第一檢測結果D1、該等第二檢測結果D2、該等第三檢測結果D3及該等第四檢測結果D4訓練出資料型態識別模型。依據前述說明,本發明所屬技術領域中具有通常知識者應能理解當處理器13採用該等檢測技術之其他組合時,處理器13將採用哪些檢測結果及第一歷史記錄10a、10b、……、10d來訓練出資料型態識別模型,茲不贅言。
處理器13所訓練出之該資料型態識別模型為一能識別所輸入之複數筆資料為連續型資料或離散型資料之二元分類模型,例如:一羅吉斯回歸模型(Logistic regression),但不以此為限。本發明所屬技術領域中具有通常知識者應熟知如何利用根據第一歷史記錄10a、10b、……、10d及前
述該等檢測結果訓練出資料型態識別模型,茲不贅言。
現說明檢測裝置1於第二階段之運作,亦即,檢測裝置1如何利用該資料型態識別模型以及作業環境之第二歷史記錄12a、12b、……、12d檢測該作業環境之因子之重要程度,進而找出哪些因子為關鍵之影響因子。
如前所述,第二歷史記錄12a、12b、……、12d各自包含複數個第二資料一對一地對應至複數個第二因子。為便於理解,請參第1D圖所示之一具體範例。該具體範例將用於後續的說明,且應理解其非用以限制本發明之範圍。於該具體範例中,第二歷史記錄12a、12b、……、12d各自包含四個第二資料一對一地對應至四個第二因子X1、X2、X3、Y。處理器13係利用資料型態識別模型分析各該第二因子X1、X2、X3、Y所對應之該等第二資料以判斷出各該第二因子X1、X2、X3、Y之資料型態,其中該資料型態為連續型資料或離散型資料。
於某些實施方式中,處理器13所訓練出之資料型態識別模型還具有一第三門檻值(亦即,判斷資料型態之正確率最高的值)。於該等實施方式中,處理器13藉由對各該第二因子X1、X2、X3、Y執行以下運作以判斷各該第二因子X1、X2、X3、Y所對應之該資料型態:利用該資料型態識別模型及該第二因子所對應之該等第二資料計算出一資料型態識別值,再藉由比對該資料型態識別值與該第三門檻值以判斷出資料型態。舉例而言,若某一第二因子之資料型態識別值大於第三門檻值,則判斷該第二因子對應至離散型資料,而若某一第二因子之資料型態識別值不大於該第三門檻值,則判斷該第二因子為連續型資料。
於某些實施方式中,處理器13還可根據各該第二因子X1、
X2、X3、Y之資料型態識別值與該第三門檻值計算出各該第二因子X1、X2、X3、Y之一資料型態準確度。舉例而言,處理器13可計算各該第二因子X1、X2、X3、Y之資料型態識別值與該第三門檻值之差值,再根據差值計算出資料型態準確度,其中差值越小之第二因子之資料型態準確度越高。需說明者,一第二因子之資料型態準確度代表處理器13正確地判斷出該第二因子之資料型態之信心程度。為提升該等第二因子X1、X2、X3、Y之資料型態之準確度,檢測裝置1之使用人員可針對資料型態準確度較低(例如:第於另一門檻值)之第二因子之資料型態另行檢驗。
另外,處理器13將第二歷史記錄12a、12b、……、12d分為第一子集102及第二子集104。舉例而言,處理器13可依據一預設比例(例如:4:1)將第二歷史記錄12a、12b、……、12d分為第一子集102及第二子集104。處理器13係以第一子集102作為一訓練集合,且以第二子集104作為一測試集合。
處理器13利用第一子集102所包含之該等第二歷史記錄及該等第二因子X1、X2、X3、Y之資料型態建立一基礎預測模型(未繪示),例如:用於預測第二因子Y之值之基礎預測模型。舉例而言,該基礎預測模型可為一隨機森林(random forest)、一支援向量機(Support Vector Machine;SVM)、一神經網路(neural network)、一線性迴歸(linear regression)模型、一廣義線性模型(generalized linear model),但不以此為限。本發明所屬技術領域中具有通常知識者應熟知建立前述模型之細節,故不贅言。
茲假設欲知第二因子X1、X2、X3、Y中之一第一特定因子(例如:第二因子X2)之一第一重要程度。處理器13便將第一子集102中對
應至該第一特定因子(例如:第二因子X2)之該等第二資料重新排列(例如:任意地改變其順序)以產生一第一對比集合106,如第1E圖所示。處理器13再利用第一對比集合106及該等第二因子X1、X2、X3、Y之資料型態建立一第一對比預測模型(未繪示)。類似的,該第一對比預測模型可為一隨機森林、一支援向量機、一神經網路、一線性迴歸模型、一廣義線性模型,但不以此為限。需說明者,第一對比預測模型與基礎預測模型需為相同類型之預測模型。
在建立該基礎預測模型後,處理器13利用第二子集104所包含之該等第二歷史記錄測試該基礎預測模型以獲得一基礎準確度。同理,在建立該第一對比預測模型後,處理器13利用第二子集104所包含之該等第二歷史記錄測試該第一對比預測模型以獲得一第一準確度。舉例而言,若欲預測之第二因子之資料型態為連續型資料,則處理器13可利用皮爾遜相關係數(Pearson correlation coefficient)檢定計算出前述基礎準確度及第一準確度。若欲預測之第二因子之資料型態為離散型資料,則處理器13可利用卡方檢定(Chi-squared test)計算出前述基礎準確度及第一準確度。需說明者,前述皮爾遜相關係數檢定及卡方檢定僅為舉例而已,並非用以限制本發明之範圍。
接著,處理器13藉由比對基礎準確度及第一準確度以判斷出該第一特定因子(例如:第二因子X2)之該第一重要程度。舉例而言,處理器13可根據基礎準確度及第一準確度之差值決定該第一重要程度。基礎準確度及第一準確度之差值越大,該第一特定因子之重要程度越大(亦即,該第一特定因子對於作業環境之影響程度越大)。
於某些實施方式中,處理器13可測試該等第二因子X1、X2、X3、Y中之多個特定因子之重要程度,再找出哪些因子為該作業環境之關鍵地影響因子。
具體而言,處理器13可再藉由將第一子集102中對應至一第二特定因子(例如:第二因子X3)之該等第二資料重新排列(例如:任意地改變其順序)以產生一第二對比集合108,如第1F圖所示。處理器13再利用第二對比集合108及該等第二因子X1、X2、X3、Y之資料型態建立一第二對比預測模型(未繪示)。類似的,該第二對比預測模型可為一隨機森林、一支援向量機、一神經網路、一線性迴歸模型、一廣義線性模型,但不以此為限。需說明者,基礎預測模型、第一對比預測模型及第二對比預測模型需為相同類型之預測模型。
在建立基礎預測模型該第二對比預測模型後,處理器13利用第二子集104所包含之該等第二歷史記錄測試第二對比預測模型以獲得一第二準確度。處理器13再藉由比對該基礎準確度及該第二準確度以判斷出該第二特定因子(例如:第二因子X3)之第二重要程度。舉例而言,處理器13可根據基礎準確度及第二準確度之差值決定該第二重要程度。基礎準確度及第二準確度之差值越大,該第二特定因子之重要程度越大(亦即,該第二特定因子對於作業環境之影響程度越大)。
於某些實施方式中,處理器13還可再判斷第一特定因子(例如:第二因子X2)及第二特定因子(例如:第二因子X3)之重要程度何者為高。舉例而言,處理器13計算基礎準確度與第一準確度間之一第一絕對差值,計算基礎準確度與第二準確度間之一第二絕對差值,比較第一絕對差值
及第二絕對差值何者較大,再判斷出絕對差值較大者所對應之該特定因子之重要程度較高。換言之,若第一絕對差值大於第二絕對差值,處理器13會認定第一特定因子較第二特定因子重要(亦即,該第一特定因子對於作業環境之影響程度大於該第二特定因子對於作業環境之影響程度)。
依據前述說明,本發明所屬技術領域中具有通常知識者應能理解處理器13如何重複前述運作直到判斷完其他特定因子之重要程度,以及如何判斷該等特定因子間何者較為重要,故不贅述。
於某些實施方式中,檢測裝置1還可包含一顯示器(未繪示),且該顯示器電性連接至處理器13。於該等實施方式中,該顯示器可依據各該第二因子X1、X2、X3、Y之資料型態所對應之一呈現方式(例如:散點圖(Scatter diagram)、盒鬚圖(Boxplot)、柱狀圖(Bar charts))顯示各該第二因子X1、X2、X3、Y所對應之該等第二資料。舉例而言,若該等第二因子X1、X2、X3、Y皆為連續型資料,該顯示器可採用散點圖來顯示各該第二因子X1、X2、X3、Y所對應之該等第二資料。若該等第二因子X1、X2、X3、Y包含連續型資料及離散型資料,該顯示器可以盒鬚圖來呈現各該第二因子X1、X2、X3、Y所對應之該等第二資料。若該等第二因子X1、X2、X3、Y皆為離散型資料,該顯示器可以柱狀圖來顯示各該第二因子X1、X2、X3、Y所對應之該等第二資料。
綜上所述,檢測裝置1提供多種不同方式來訓練出一資料型態識別模型,其係用於自動化地判斷出一因子所對應之資料型態為連續型資料或離散型資料。透過該資料型態識別模型,不需要由專業人員事先定義格式才能比對及分析。因此,檢測裝置1所提供之資料型態識別模型能應用
於複雜的作業環境(例如:因子數量極多),且能有效率地且準確地辨識出一因子所對應之資料型態。
此外,檢測裝置1會根據一作業環境之複數筆歷史記錄檢測該作業環境之因子之重要程度,進而找出哪些因子為關鍵之影響因子。簡言之,檢測裝置1將該等歷史記錄區分為訓練集合與測試集合,將該訓練集合之一或多個特定因子所對應之資料分別重新排列以產生一或多個對比集合,再利用訓練集合及對比集合產生多個預測模型。檢測裝置1利用測試集合來測試這些預測模型,再依據測試結果判斷出該一或多個特定因子之重要程度,進而判斷出哪一或哪些特定因子較為重要。因此,即使是一複雜的作業環境(例如:因子數量極多)且因子間交互影響,檢測裝置1仍能有效率地分析因子之重要程度,且找出關鍵之影響因子。
本發明之第二實施方式為一種為一作業環境檢測影響因子之方法(下稱「檢測方法」),其流程圖係描繪於第2A圖。該檢測方法適用於一電子裝置,例如:第一實施方式所述之檢測裝置1。
於本實施方式中,該電子裝置儲存複數筆第一歷史記錄(例如:第1A圖及第1B圖所示之第一歷史記錄10a、10b、……、10d),且各該第一歷史記錄包含複數個第一資料一對一地對應至複數個第一因子。此外,該電子裝置還儲存該作業環境之複數筆第二歷史記錄(例如:第1A圖及第1D圖所示之第二歷史記錄12a、12b、……、12d),且各該第二歷史記錄包含複數個第二資料一對一地對應至複數個第二因子。
於步驟S201,由該電子裝置藉由分析各該第一因子所對應之該等第一資料之一第一相異程度而產生各該第一因子之一第一檢測結果
(例如:第1C圖所示之第一檢測結果D1),其中該第一檢測結果為一連續型資料及一離散型資料其中之一。接著,執行步驟S203,由該電子裝置根據該等第一歷史記錄及該等第一檢測結果訓練出一資料型態識別模型。
於某些實施方式中,步驟S201係藉由對各該第一因子執行以下步驟以產生對應之該第一檢測結果:藉由比較該第一因子所對應之該等第一資料之一眾數個數及一第一門檻值以產生一第一比較結果,藉由比較該第一因子所對應之該等第一資料之一相異個數及一第二門檻值產生一第二比較結果,以及根據該第一比較結果及該第二比較結果決定該第一檢測結果。
於某些實施方式中,該檢測方法於執行步驟S203前還會由該電子裝置執行以下步驟:藉由將各該第一因子所對應之該等第一資料與一常態分布模型比對而產生各該第一因子之一第二檢測結果(例如:第1C圖所示之第二檢測結果D2),其中各該第二檢測結果為該連續型資料及該離散型資料其中之一。需說明者,於該等實施方式中,步驟S203係根據該等第一歷史記錄、該等第一檢測結果及該等第二檢測結果訓練出該資料型態識別模型。
於某些實施方式中,該檢測方法於執行步驟S203前還會由該電子裝置執行以下步驟:藉由一標籤編碼器(LabelEncoder)分析各該第一因子所對應之該等第一資料之一間斷性而產生各該第一因子之一第三檢測結果(例如:第1C圖所示之第三檢測結果D3),其中各該第三檢測結果為該連續型資料及該離散型資料其中之一。需說明者,於該等實施方式中,步驟S203係根據該等第一歷史記錄、該等第一檢測結果及該等第三檢測結果
訓練出該資料型態識別模型。
於某些實施方式中,該檢測方法於執行步驟S203前還會由該電子裝置藉由對各該第一因子執行以下步驟來產生各該第一因子之一第四檢測結果(例如:第1C圖所示之第四檢測結果D4):將該第一因子所對應之該等第一資料分群為複數個資料群組,計算各該群組之一集中量數,計算該等集中量數間之一第二相異程度,以及根據該第二相異程度決定該第四檢測結果。各該第四檢測結果為該連續型資料及該離散型資料其中之一。需說明者,於該等實施方式中,步驟S203係根據該等第一歷史記錄、該等第一檢測結果及該等第四檢測結果訓練出該資料型態識別模型。
於某些實施方式中,該檢測方法可同時採用前述第一至第四種檢測技術以獲得該等第一檢測結果、該等第二檢測結果、該等第三檢測結果及該等第四檢測結果。於該等實施方式中,步驟S203係由該電子裝置根據該等第一歷史記錄、該等第一檢測結果、該等第二檢測結果、該等第三檢測結果及該等第四檢測結果訓練出該資料型態識別模型。需說明者,於某些實施方式中,該檢測方法可採用前述第一種檢測技術及第二至第四種檢測技術之任意組合。於該等實施方式中,步驟S203係由該電子裝置根據該等第一歷史記錄以及所採用之該等檢測技術所對應之該等檢測結果來訓練出該資料型態識別模型。
之後,由該電子裝置執行步驟S205,利用該資料型態識別模型分析各該第二因子所對應之該等第二資料以判斷出各該第二因子之一資料型態。於某些實施方式中,該資料型態識別模型還具有一第三門檻值(亦即,判斷資料型態之正確率最高的值)。於該等實施方式中,步驟S205係由
該電子裝置對各該第二因子執行下列步驟以判斷各該第二因子所對應之該資料型態:利用該資料型態識別模型及該第二因子所對應之該等第二資料計算出該資料型態識別值,再藉由比對該資料型態識別值與該第三門檻值以判斷出該資料型態。舉例而言,若該資料型態識別值大於該第三門檻值,則判斷該第二因子為離散型資料,而若該資料型態識別值不大於該第三門檻值,則判斷該第二因子為連續型資料。於該等實施方式中,該檢測方法還可包含一步驟,由該電子裝置根據各該第二因子之該資料型態識別值與該第三門檻值計算各該第二因子之一資料型態準確度。各該第二因子之該資料型態準確度可代表該檢測方法判斷出正確的資料型態之信心程度。
於步驟S207,由該電子裝置利用該等第二歷史記錄之一第一子集(例如:第1D圖之第一子集102)及該等第二因子之該等資料型態建立一基礎預測模型。於步驟S209,由該電子裝置以該等第二歷史記錄之一第二子集(例如:第1圖所示之第二子集104)測試該基礎預測模型以獲得一基礎準確度。另外,於步驟S211,由該電子裝置將該第一子集中對應至一第一特定因子(該第一特定因子為該等第二因子其中之一,例如:第1D圖所示之第二因子X2)之該等第二資料重新排列以產生一第一對比集合(例如:第1E圖所示之第一對比集合106)。於步驟S213,由該電子裝置利用該第一對比集合及該等第二因子之該等資料型態建立一第一對比預測模型。於步驟S215,由該電子裝置以該第二子集測試該第一對比預測模型以獲得一第一準確度。之後,於步驟S217,由該電子裝置藉由比較該基礎準確度及該第一準確度以判斷出該第一特定因子之一第一重要程度。
需說明者,前述步驟S207及步驟S209係為基礎預測模型之
建立與測試,而步驟S211、步驟S213及步驟S215係為第一對比預測模型之建立與測試。於某些實施方式中,檢測方法可先執行步驟S211至步驟S215,再執行步驟S207至步驟S209。於某些實施方式中,檢測方法則可平行地執行基礎預測模型之相關步驟(亦即,步驟S207至步驟S209)以及第一對比預測模型之相關步驟(亦即,步驟S211至步驟S215)。依據前述說明,本發明所屬技術領域中具有通常知識者應可理解該等步驟尚能以其他的順序加以執行,茲不贅言。
於某些實施方式中,該檢測方法可執行如第2B圖所示之流程。於該等實施方式中,該檢測方法先執行步驟S201至步驟S209,再執行步驟S211至步驟S217。之後,於步驟S219,由該電子裝置計算該基礎準確度及該第一準確度間之一第一絕對差值。
另外,於步驟S209後,該檢測方法還會執行步驟S221至步驟S229。具體而言,於步驟S221,由該電子裝置藉由將該第一子集中對應至一第二特定因子(例如:第1D圖所示之第二因子X3)之該等第二資料重新排列以產生一第二對比集合(例如:第1F圖所示之第二對比集合108)。接著,於步驟S223,由該電子裝置利用該第二對比集合及該等第二因子之該等資料型態建立一第二對比預測模型。於步驟S225,由該電子裝置以該第二子集測試該第二對比預測模型以獲得一第二準確度。於步驟S227,由該電子裝置藉由比較該基礎準確度及該第二準確度以判斷出該第二特定因子之一第二重要程度。之後,於步驟S229,由該電子裝置計算該基礎準確度及該第二準確度間之一第二絕對差值。需說明者,於某些實施方式中,該檢測方法可於執行完步驟S219之後再執行步驟S221至步驟S229。
於步驟S231,由該電子裝置基於該第一絕對差值及該第二絕對差值之大小,判斷該第一重要程度及該第二重要程度何者較高。具體而言,若步驟S231判斷該第一絕對差值大於該第二絕對差值,則該電子裝置基於此判斷結果確認該第一重要程度高於該第二重要程度(亦即,該第一特定因子對該作業環境之影響大於該第二特定因子對該作業環境之影響)。相反的,若步驟S231判斷該第二絕對差值大於該第一絕對差值,則該電子裝置基於此判斷結果確認該第二重要程度高於該第一重要程度(亦即,該第二特定因子對該作業環境之影響大於該第一特定因子對該作業環境之影響)。
需說明者,本發明未限制檢測方法所挑選之特定因子之數量。因此,檢測方法還可從該等第二因子中挑選其他的特定因子產生其他的對比預測模型,計算其他對比預測模型之準確度,判斷其他特定因子之重要程度,再綜合地判斷該等重要程度之高低(亦即,綜合地判斷該等特定因子對該作業環境之影響之高低)。舉例而言,檢測方法可將各該第二因子視為一特定因子,並一一地進行前述步驟,茲不贅言。
於某些實施方式中,該檢測方法還會由該電子裝置依據各該第二因子之該資料型態所對應之一呈現方式顯示各該第二因子所對應之該等資料。舉例而言,若該等第二因子皆為連續型資料,可以散點圖呈現;若該等第二因子包含連續型資料及離散型資料,可以盒鬚圖呈現;若該等第二因子皆為離散型資料,可以柱狀圖呈現。
除了上述步驟,第二實施方式能執行第一實施方式所描述之檢測裝置1之所有運作及步驟,具有同樣之功能,且達到同樣之技術效果。本發明所屬技術領域中具有通常知識者可直接瞭解第二實施方式如何基於
上述第一實施方式以執行此等運作及步驟,具有同樣之功能,並達到同樣之技術效果,故不贅述。
需說明者,於本發明專利說明書及申請專利範圍中,某些用語(包含:歷史記錄、資料、因子、特定因子、門檻值、檢測結果、子集、對比集合、準確度、重要程度及絕對差值)前被冠以「第一」、「第二」或「第三」,該等「第一」、「第二」及「第三」僅用來區分不同用語。
綜上所述,本發明所提供之檢測技術(至少包含裝置及方法)可為一作業環境檢測其影響因子。本發明先藉由一或多個檢測技術分析複數筆第一歷史記錄之各個第一因子係為連續型資料或離散型資料,再據以訓練出一資料型態識別模型。透過該資料型態識別模型,本發明不需要由專業人員事先定義欄位格式便能有效率地且準確地辨識出一因子所對應之資料型態,且能應用於複雜之作業環境(例如:因子數量極多)。
本發明所提供之檢測技術還可透過該資料型態識別模型,檢測一作業環境之複數筆第二歷史記錄之各個第二因子之資料型態(亦即,為連續型資料或離散型資料),再利用該等第二因子之資料型態及該等第二歷史記錄之一訓練集合建立出基礎預測模型。此外,本發明所提供之檢測技術還藉由將該訓練集合中對應至一或多個特定因子之第二資料分別重新排列以產生一或多個對比預測模型。藉由計算及比較基礎預測模型及該一或多個對比預測模型之準確度,本發明可檢測出該一或多個特定因子之重要程度,進而判斷出哪一或哪些特定因子較為重要。因此,即使是一複雜的作業環境且因子間交互影響,本發明仍能有效率地分析因子之重要程度,且找出關鍵之影響因子。
上述實施方式僅用來例舉本發明之部分實施態樣,以及闡釋本發明之技術特徵,而非用來限制本發明之保護範疇及範圍。任何本發明所屬技術領域中具有通常知識者可輕易完成之改變或均等性之安排均屬於本發明所主張之範圍,而本發明之權利保護範圍以申請專利範圍為準。
S201~S217‧‧‧步驟
Claims (20)
- 一種為一作業環境檢測影響因子之裝置,包含:一儲存器,儲存複數筆第一歷史記錄及該作業環境之複數筆第二歷史記錄,其中各該第一歷史記錄包含複數個第一資料一對一地對應至複數個第一因子,各該第二歷史記錄包含複數個第二資料一對一地對應至複數個第二因子;一處理器,電性連接至該儲存器,藉由分析各該第一因子所對應之該等第一資料之一第一相異程度而產生各該第一因子之一第一檢測結果,各該第一檢測結果為一連續型資料及一離散型資料其中之一,其中,該處理器還根據該等第一歷史記錄及該等第一檢測結果訓練出一資料型態識別模型,利用該資料型態識別模型分析各該第二因子所對應之該等第二資料以判斷出各該第二因子之一資料型態,利用該等第二歷史記錄之一第一子集及該等資料型態建立一基礎預測模型,藉由將該第一子集中對應至一第一特定因子之該等第二資料重新排列以產生一第一對比集合,利用該第一對比集合及該等資料型態建立一第一對比預測模型,以該等第二歷史記錄之一第二子集測試該基礎預測模型以獲得一基礎準確度,以該第二子集測試該第一對比預測模型以獲得一第一準確度,以及藉由比較該基礎準確度及該第一準確度判斷該第一特定因子之一第一重要程度。
- 如請求項1所述之裝置,其中該處理器係藉由對各該第一因子執行以下運作來產生對應之該第一檢測結果:藉由比較該第一因子所對應之該等第一資料之一眾數個數及一第一 門檻值產生一第一比較結果,藉由比較該第一因子所對應之該等第一資料之一相異個數及一第二門檻值產生一第二比較結果,以及根據該第一比較結果及該第二比較結果決定該第一檢測結果。
- 如請求項1所述之裝置,其中該處理器還藉由將各該第一因子所對應之該等第一資料與一常態分布模型比對而產生各該第一因子之一第二檢測結果,各該第二檢測結果為該連續型資料及該離散型資料其中之一,其中,該處理器係根據該等第一歷史記錄、該等第一檢測結果及該等第二檢測結果訓練出該資料型態識別模型。
- 如請求項1所述之裝置,其中該處理器還藉由一標籤編碼器(LabelEncoder)分析各該第一因子所對應之該等第一資料之一間斷性而產生各該第一因子之一第三檢測結果,各該第三檢測結果為該連續型資料及該離散型資料其中之一,其中,該處理器係根據該等第一歷史記錄、該等第一檢測結果及該等第三檢測結果訓練出該資料型態識別模型。
- 如請求項1所述之裝置,其中該處理器還藉由對各該第一因子執行以下運作來產生各該第一因子之一第四檢測結果:將該第一因子所對應之該等第一資料分群為複數個資料群組,計算各該群組之一集中量數,計算該等集中量數間之一第二相異程度,以及根據該第二相異程度決定該第四檢測結果,其中該第四檢測結果為該連續型資料及該離散型資料其中之一, 其中,該處理器係根據該等第一歷史記錄、該等第一檢測結果及該等第四檢測結果訓練出該資料型態識別模型。
- 如請求項1所述之裝置,其中該資料型態識別模型具有一門檻值,且該處理器係藉由對各該第二因子執行以下運作以判斷對應之該資料型態:利用該資料型態識別模型及該第二因子所對應之該等第二資料計算出一資料型態識別值,以及藉由比對該資料型態識別值及該門檻值以判斷出該資料型態。
- 如請求項6所述之裝置,其中該處理器還根據各該第二因子之該資料型態識別值與該門檻值計算各該第二因子之一資料型態準確度。
- 如請求項1所述之裝置,其中該處理器還藉由將該第一子集中對應至一第二特定因子之該等第二資料重新排列以產生一第二對比集合,利用該第二對比集合及該等資料型態建立一第二對比預測模型,以該第二子集測試該第二對比預測模型以獲得一第二準確度,以及藉由比較該基礎準確度及該第二準確度判斷該第二特定因子之一第二重要程度。
- 如請求項8所述之裝置,其中該處理器還計算該基礎準確度及該第一準確度間之一第一絕對差值,計算該基礎準確度及該第二準確度間之一第二絕對差值,判斷該第一絕對差值大於該第二絕對差值,且基於該第一絕對差值大於該第二絕對差值之判斷結果確認該第一重要程度高於該第二重要程度。
- 如請求項1所述之裝置,還包含:一顯示器,電性連接至該處理器,且依據各該第二因子之該資料型態所對應之一呈現方式顯示各該第二因子所對應之該等第二資料。
- 一種為一作業環境檢測影響因子之方法,由一電子裝置執行,該電子裝置儲存複數筆第一歷史記錄及該作業環境之複數筆第二歷史記錄,各該第一歷史記錄包含複數個第一資料一對一地對應至複數個第一因子,各該第二歷史記錄包含複數個第二資料一對一地對應至複數個第二因子,該方法包含下列步驟:(a)藉由分析各該第一因子所對應之該等第一資料之一第一相異程度而產生各該第一因子之一第一檢測結果,各該第一檢測結果為一連續型資料及一離散型資料其中之一;(b)根據該等第一歷史記錄及該等第一檢測結果訓練出一資料型態識別模型;(c)利用該資料型態識別模型分析各該第二因子所對應之該等第二資料以判斷出各該第二因子之一資料型態;(d)利用該等第二歷史記錄之一第一子集及該等資料型態建立一基礎預測模型;(e)藉由將該第一子集中對應至一第一特定因子之該等第二資料重新排列以產生一第一對比集合;(f)利用該第一對比集合及該等資料型態建立一第一對比預測模型;(g)以該等第二歷史記錄之一第二子集測試該基礎預測模型以獲得一基礎準確度;(h)以該第二子集測試該第一對比預測模型以獲得一第一準確度;以及(i)藉由比較該基礎準確度及該第一準確度判斷該第一特定因子之一 第一重要程度。
- 如請求項11所述之方法,其中該步驟(a)係藉由對各該第一因子執行下列步驟來產生對應之該第一檢測結果:藉由比較該第一因子所對應之該等第一資料之一眾數個數及一第一門檻值產生一第一比較結果;藉由比較該第一因子所對應之該等第一資料之一相異個數及一第二門檻值產生一第二比較結果;以及根據該第一比較結果及該第二比較結果決定該第一檢測結果。
- 如請求項11所述之方法,還包括下列步驟:藉由將各該第一因子所對應之該等第一資料與一常態分布模型比對而產生各該第一因子之一第二檢測結果,各該第二檢測結果為該連續型資料及該離散型資料其中之一,其中,該步驟(b)係根據該等第一歷史記錄、該等第一檢測結果及該等第二檢測結果訓練出該資料型態識別模型。
- 如請求項11所述之方法,還包括下列步驟:藉由一標籤編碼器(LabelEncoder)分析各該第一因子所對應之該等第一資料之一間斷性而產生各該第一因子之一第三檢測結果,各該第三檢測結果為該連續型資料及該離散型資料其中之一,其中,該步驟(b)係根據該等第一歷史記錄、該等第一檢測結果及該等第三檢測結果訓練出該資料型態識別模型。
- 如請求項11所述之方法,還包括下列步驟:藉由對各該第一因子執行以下步驟來產生各該第一因子之一第四檢 測結果:將該第一因子所對應之該等第一資料分群為複數個資料群組;計算各該群組之一集中量數;計算該等集中量數間之一第二相異程度;以及根據該第二相異程度決定該第四檢測結果,其中該第四檢測結果為該連續型資料及該離散型資料其中之一,其中,該步驟(b)係根據該等第一歷史記錄、該等第一檢測結果及該等第四檢測結果訓練出該資料型態識別模型。
- 如請求項11所述之方法,其中該步驟(c)藉由對各該第二因子執行下列步驟以判斷對應之該資料型態:利用該資料型態識別模型及該第二因子所對應之該等第二資料計算出一資料型態識別值;以及藉由比對該資料型態識別值及該資料型態識別模型之一門檻值以判斷出該資料型態。
- 如請求項16所述之方法,還包括下列步驟:根據各該第二因子之該資料型態識別值與該門檻值計算各該第二因子之一資料型態準確度。
- 如請求項11所述之方法,還包括下列步驟:藉由將該第一子集中對應至一第二特定因子之該等第二資料重新排列以產生一第二對比集合;利用該第二對比集合及該等資料型態建立一第二對比預測模型;以該第二子集測試該第二對比預測模型以獲得一第二準確度;以及 藉由比較該基礎準確度及該第二準確度判斷該第二特定因子之一第二重要程度。
- 如請求項18所述之方法,還包括下列步驟:計算該基礎準確度及該第一準確度間之一第一絕對差值;計算該基礎準確度及該第二準確度間之一第二絕對差值;判斷該第一絕對差值大於該第二絕對差值;以及基於該第一絕對差值大於該第二絕對差值之判斷結果確認該第一重要程度高於該第二重要程度。
- 如請求項11所述之方法,還包括下列步驟:依據各該第二因子之該資料型態所對應之一呈現方式顯示各該第二因子所對應之該等第二資料。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW107138000A TWI694344B (zh) | 2018-10-26 | 2018-10-26 | 為一作業環境檢測影響因子之裝置及方法 |
CN201811322685.6A CN111104955A (zh) | 2018-10-26 | 2018-11-08 | 为一作业环境检测影响因子的装置及方法 |
US16/205,218 US20200134480A1 (en) | 2018-10-26 | 2018-11-29 | Apparatus and method for detecting impact factor for an operating environment |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW107138000A TWI694344B (zh) | 2018-10-26 | 2018-10-26 | 為一作業環境檢測影響因子之裝置及方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
TW202016776A TW202016776A (zh) | 2020-05-01 |
TWI694344B true TWI694344B (zh) | 2020-05-21 |
Family
ID=70326289
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW107138000A TWI694344B (zh) | 2018-10-26 | 2018-10-26 | 為一作業環境檢測影響因子之裝置及方法 |
Country Status (3)
Country | Link |
---|---|
US (1) | US20200134480A1 (zh) |
CN (1) | CN111104955A (zh) |
TW (1) | TWI694344B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117171675B (zh) * | 2023-11-02 | 2024-01-12 | 北京建工环境修复股份有限公司 | 基于多源数据的水环境微生物检测方法、系统及介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TW201614551A (en) * | 2014-06-02 | 2016-04-16 | Yottamine Analytics Llc | Digital event profile filters based on cost sensitive support vector machine for fraud detection, risk rating or electronic transaction classification |
TWI560635B (en) * | 2013-03-15 | 2016-12-01 | Univ Nat Cheng Kung | System and method for rating and selecting models |
TWI638242B (zh) * | 2016-08-05 | 2018-10-11 | 荷蘭商Asml荷蘭公司 | 供關於一工業製程使用之診斷系統及獲得診斷資訊之方法 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20110191141A1 (en) * | 2010-02-04 | 2011-08-04 | Thompson Michael L | Method for Conducting Consumer Research |
US20170200107A1 (en) * | 2016-01-07 | 2017-07-13 | Mark Ducros Stouse | Correlation processes for identifying cause and effect relationships in complex business environments |
CN108073629B (zh) * | 2016-11-16 | 2021-08-17 | 北京京东尚科信息技术有限公司 | 通过网站访问数据识别购买模式的方法及装置 |
TW201820173A (zh) * | 2016-11-17 | 2018-06-01 | 財團法人資訊工業策進會 | 去識別化資料產生裝置、方法及其電腦程式產品 |
-
2018
- 2018-10-26 TW TW107138000A patent/TWI694344B/zh active
- 2018-11-08 CN CN201811322685.6A patent/CN111104955A/zh active Pending
- 2018-11-29 US US16/205,218 patent/US20200134480A1/en not_active Abandoned
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TWI560635B (en) * | 2013-03-15 | 2016-12-01 | Univ Nat Cheng Kung | System and method for rating and selecting models |
TW201614551A (en) * | 2014-06-02 | 2016-04-16 | Yottamine Analytics Llc | Digital event profile filters based on cost sensitive support vector machine for fraud detection, risk rating or electronic transaction classification |
TWI638242B (zh) * | 2016-08-05 | 2018-10-11 | 荷蘭商Asml荷蘭公司 | 供關於一工業製程使用之診斷系統及獲得診斷資訊之方法 |
Also Published As
Publication number | Publication date |
---|---|
US20200134480A1 (en) | 2020-04-30 |
CN111104955A (zh) | 2020-05-05 |
TW202016776A (zh) | 2020-05-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108960434B (zh) | 基于机器学习模型解释来分析数据的方法及装置 | |
CN113852603B (zh) | 网络流量的异常检测方法、装置、电子设备和可读介质 | |
CN107203467A (zh) | 一种分布式环境下监督学习算法的基准测试方法和装置 | |
CN113688042A (zh) | 测试场景的确定方法、装置、电子设备及可读存储介质 | |
KR20150018642A (ko) | 머신 상태 모니터링에서 결함 진단을 위한 일반화된 패턴 인식 | |
CN107133135A (zh) | 一种基于统计学与声音定位的键盘按键检测方法 | |
US20170147675A1 (en) | High dimensional clusters profile generation | |
CN111832880A (zh) | 对正在进行的生产批运行的质量指示符的计算机实现的确定 | |
CN113379469A (zh) | 一种异常流量检测方法、装置、设备及存储介质 | |
TWI694344B (zh) | 為一作業環境檢測影響因子之裝置及方法 | |
CN115907275B (zh) | 一种基于产品特性的设备推荐信息的生成方法及电子设备 | |
CN110647826B (zh) | 商品训练图片的获取方法、装置、计算机设备和存储介质 | |
US10372849B2 (en) | Performing and communicating sheet metal simulations employing a combination of factors | |
CN116245630A (zh) | 一种反欺诈检测方法、装置、电子设备及介质 | |
CN110826616A (zh) | 信息处理方法及装置、电子设备、存储介质 | |
CN109977400A (zh) | 一种校验处理的方法、装置、计算机存储介质及终端 | |
Giurcăneanu et al. | Cluster structure inference based on clustering stability with applications to microarray data analysis | |
Carbery et al. | Missingness analysis of manufacturing systems: a case study | |
Chakraborty et al. | A multiple k-means cluster ensemble framework for clustering citation trajectories | |
CN113646717B (zh) | 生产过程的生产批运行的质量指标的计算机实现的确定 | |
US11177018B2 (en) | Stable genes in comparative transcriptomics | |
Langer et al. | Gideon-TS: Efficient Exploration and Labeling of Multivariate Industrial Sensor Data. | |
JP2021193503A (ja) | 分割プログラム、分割方法および情報処理装置 | |
US20140214339A1 (en) | Identification of outliers among chemical assays | |
CN113704467B (zh) | 基于数据模板的海量文本监控方法及装置、介质、设备 |