TWI709852B - 用於經由多預測模型架構之異常偵測之系統與方法 - Google Patents

用於經由多預測模型架構之異常偵測之系統與方法 Download PDF

Info

Publication number
TWI709852B
TWI709852B TW107140790A TW107140790A TWI709852B TW I709852 B TWI709852 B TW I709852B TW 107140790 A TW107140790 A TW 107140790A TW 107140790 A TW107140790 A TW 107140790A TW I709852 B TWI709852 B TW I709852B
Authority
TW
Taiwan
Prior art keywords
data item
model
data
data items
reconstruction
Prior art date
Application number
TW107140790A
Other languages
English (en)
Other versions
TW201923582A (zh
Inventor
學謙 胡
Original Assignee
美商艾維泰公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 美商艾維泰公司 filed Critical 美商艾維泰公司
Publication of TW201923582A publication Critical patent/TW201923582A/zh
Application granted granted Critical
Publication of TWI709852B publication Critical patent/TWI709852B/zh

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Molecular Biology (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Image Analysis (AREA)
  • Testing And Monitoring For Control Systems (AREA)

Abstract

在一些實施例中,可經由一多模型架構促進異常偵測。在一些實施例中,一第一模型可經組態以產生對應於一概念之資料項之隱藏表示。一第二模型可經組態以自該等隱藏表示產生該等資料項之重構。該第一模型可經組態以依據該等資料項評估該等重構且基於該等重構之該評估更新該第一模型之組態。在該第一模型之該更新之後,該第一模型可自一第一資料項產生該第一資料項之一隱藏表示。該第二模型可自該隱藏表示產生該第一資料項之一重構。可基於該第一資料項與該重構之間的差異偵測該第一資料項中之一異常。

Description

用於經由多預測模型架構之異常偵測之系統與方法
本發明係關於辨識或偵測概念或異常,包含例如經由一或多個神經網路或其他預測模型偵測異常。
近年來,歸因於電腦硬體效能、訓練集大小、人工智慧理論理解之進展及其他進展,人工智慧及機器學習領域經歷複蘇。此複蘇使其他技術領域取得諸多進展,包含辨識或其他預測系統。既有機器學習系統可對資料進行分類,諸如X射線影像、磁共振影像、體積掃描(例如,CT掃描)或用於診斷目的之其他資料。此等機器學習系統通常依賴於透過標籤呈現已知異常。例如,視網膜病理之分類取決於向學習系統呈現對應於已知病理之數百萬個影像且幫助學習系統將該等影像之各者分類為對應於已知病理之一者。然而,當呈現對應於一未知病理之一影像時,學習系統將該影像分類為對應於已知病理之一者,即使該影像不匹配已知病理之任一者。存在此等及其他缺點。
本發明之態樣係關於用於經由神經網路或其他預測模型促進辨識或偵測概念或異常之方法、裝置及/或系統。
在一些實施例中,一個預測模型可經訓練以將一訓練資料集之資料項(例如,關於一給定概念之一「正常」資料集)映射至一隨機分佈本徵向量空間中,且另一預測模型可經訓練以(例如,自該向量空間之本徵向量之輸入)產生類似於該訓練資料集之資料項之輸出資料。在一些實施例中,兩個預測模型可配置於一預測模型架構中,其中(i)將一資料項作為輸入提供給將該資料項轉換為一本徵向量之預測模型,(ii)將該本徵向量作為輸入提供給基於該本徵向量產生該資料項之一重構使得該重構類似於原始資料項之預測模型。應注意,前述架構之預測模型配置並非產生具有輸入資料項之每個細節之一重構之一典型自動編碼器。作為一實例,前述架構經組態以在訓練程序期間自密切匹配於輸入資料之一「正常」集產生資料項。
在一些實施例中,一第一預測模型可經組態以產生一資料項之一隱藏表示,且一第二預測模型可經組態以基於一資料項之一隱藏表示產生該資料項之一重構。在一些實施例中,該第一預測模型經組態以基於由該第二預測模型產生之一資料項之一重構更新其組態,其目的係產生該資料項之一隱藏表示,該第二預測模型可使用該隱藏表示來產生更類似於該資料項之一更佳重構。當關於對應於相同概念(例如,健康大腦、患有腫瘤之大腦、健康心臟、患有特定病症之患病心臟、貓、狗或其他概念)之一資料項集合進行恰當訓練時,該第一預測模型及該第二預測模型之組合經組態以產生非常類似於對應輸入資料項之重構。當提供一資料項且該資料項不對應於(若干)概念(對其(等)訓練該第一預測模型及該第二預測模型之組合)時,該模型組合可嘗試產生該資料項之一重構,但鑑於該模型組合偏向於產生類似於對應於已知訓練集之(若干)概念之資料項之重構,該重構將可能與該資料項具有足夠差異。此等差異可用來偵測在該資料項中存在一異常。
在一些實施例中,一第三預測模型可經組態以指示(i)兩個或更多個資料項(例如,輸入資料項與其對應重構)之間的類似性或差異,(ii)兩個資料項是否類似或不同(例如,該兩個資料項之特定特性是否在一或多個臨限值範圍內,諸如經由訓練學習之或手動預定義之臨限值),(iii)在一資料項中是否存在一異常(例如,基於該第三預測模型對該資料項之及其(若干)重構之相互評估),(iv)一資料項是否具有對應於訓練集之「正常」之一分類(或概念),或(v)其他資訊。
在一些實施例中,該第三預測模型可經訓練以最小化網路偏差以最佳化異常(例如,包含小異常)之偵測。在一些實施例中,可獲得對應於(若干)相同概念(例如,對其(等)訓練該第一預測模型及該第二預測模型)之一資料項集合且將該資料項集合提供給該第一預測模型及該第二預測模型之組合以引起該組合產生對應輸入資料項之重構。可將該等資料項之各者及其對應重構提供給該第三預測模型以訓練該第三預測模型,以將資料項與其重構之對應對之各者辨識為類似(例如,指示相對於所訓練「正常」無異常)。作為一實例,關於該等對應對之各者,可將回饋提供給該第三預測模型,該第三預測模型使用該回饋作為一參考以評估其對資料輸入與其重構是否或如何類似或不同之預測。該第三預測模型可基於其評估更新其組態之一或多者。該回饋可例如指示該集合之各資料項與其重構類似或不存在異常。在一些實施例中,與習知統計技術(例如,其等需要一程式設計員手動調整類似性臨限值)相比,該第三預測模型經組態以自動調整將賦予特定類似性及差異之權重(若有)。以此方式,例如,該第三預測模型產生更準確結果(例如,藉由經由前述訓練解決網路偏差)。
透過本發明之詳細描述及其隨附圖式,本發明之各種其他態樣、特徵及優點將變得顯而易見。亦應理解,前文一般描述及下文詳細描述兩者係例示性的且不限制本發明之範疇。如說明書及發明申請專利範圍中所使用,除非內文另有明確規定,否則「一」、「一個」及「該」之單數形式包含複數個指涉物。另外,如說明書及發明申請專利範圍中所使用,除非內文另有明確規定,否則術語「或」意謂「及/或」。
本申請案主張以下申請案之優先權:(i) 2017年11月17日申請之標題為「System and Method for Detection of Anomaly」之美國臨時申請案第62/587,738號,(ii) 2018年6月18日申請之標題為「System and Method for Anomaly Detection via a Multi-Prediction-Model Architecture」之美國專利申請案第16/011,136號,及(iii) 2018年7月9日申請之標題為「System and Method for Anomaly Detection via a Multi-Prediction-Model Architecture」美國專利申請案第16/029,747號,該等案之各者之全文以引用方式併入本文中。
在下文描述中,出於解釋目的,闡述眾多特定細節以便提供對本發明之實施例之一透徹理解。然而,熟習此項技術者將明白,可在無此等特定細節或具有一等效配置之情況下實踐本發明之實施例。在其他例項中,以方塊圖形式展示熟知結構及器件以避免不必要地模糊本發明之實施例。
圖1展示根據一或多項實施例之用於經由神經網路或其他預測模型促進辨識或偵測概念或異常之一系統100。如圖1中所展示,系統100可包含架構102,其中一機器學習模型(例如,ML模型104a)將資料106視作輸入,一機器學習模型(例如,ML模型104b)提供資料108作為輸出,且將一第一機器學習模型之輸出(例如,資料110)作為輸入提供給一第二機器學習模型。如圖1A中所指示,在一些實施例中,可將第二機器學習模型(例如,ML模型104b)之輸出作為輸入提供給第一機器學習模型(例如,ML模型104a)。作為一實例,由ML模型104b產生之資料108可自動作為參考回饋提供給ML模型104a,且ML模型104a可使用該回饋來更新其組態之一或多者(例如,ML模型104a之一或多個層、ML模型104a之一或多個權重或其他參數等)。因此,在一些實施例中,可根據前述方式自動訓練架構102之一或多個機器學習模型,而無需人為干預。應注意,儘管本文中之實施例係關於多個模型(例如,多個神經網路、機器學習模型等)來描述,但在一些實施例中此等多個模型可為一較大模型/網路內之子模型/網路(例如,包含多個神經網路之一網路、包含多個子模型之一模型等)。在一些實施例中,當由架構102接收由一或多個感測器(例如,相機、麥克風、加速度計或其他感測器)擷取之一資料項(例如,一音訊、影像、視訊、感測器資料記錄或其他資料項)時,架構102之組件處理該資料項以(i)促進辨識或偵測關於該資料項之一概念或異常,(ii)重構該資料項之一版本,(iii)判定類似性或差異(例如,在該資料項與其對應重構之間)或關於該資料項之其他資訊,或(iv)執行其他操作。
如圖1B中所展示,系統100可包含(若干)伺服器112、客戶端器件114 (或客戶端器件114a至114n)或其他組件。伺服器112可包含模型子系統116、回饋子系統118、偵測子系統120或其他組件。各客戶端器件114可包含任何類型之行動終端機、固定終端機或其他器件。藉由實例,客戶端器件114可包含一桌上型電腦、一筆記本電腦、一平板電腦、一智慧型電話、一可穿戴器件或其他客戶端器件。例如,使用者可利用一或多個客戶端器件114來彼此互動,與一或多個伺服器或系統100之其他組件互動。應注意,雖然一或多個操作在本文中被描述為由伺服器112之特定組件執行,但在一些實施例中可由伺服器112之其他組件或系統100之其他組件執行彼等操作。作為一實例,雖然一或多個操作在本文中被描述為由伺服器112之組件執行,但在一些實施例中可由客戶端器件114之組件執行彼等操作。應注意,儘管一些實施例在本文中關於機器學習模型來描述,但在其他實施例中,代替機器學習模型或除了機器學習模型以外,亦可使用其他預測模型(例如,統計模型或其他分析模型) (例如,在一或多項實施例中,取代一機器學習模型之一統計模型及取代一非機械學習模型之一非統計模型)。
如所論述,既有機器學習系統可對資料進行分類以用於診斷目的。此等機器學習系統通常依賴於透過標籤呈現已知異常。例如,視網膜病理之分類取決於向學習系統呈現對應於已知病理之數百萬個影像且幫助學習系統將該等影像之各者分類為對應於已知病理之一者。然而,當呈現對應於一未知病理之一影像時,學習系統將該影像分類為對應於已知病理之一者,即使該影像不匹配已知病理之任一者。例如,此等學習系統將提供概率勝算作為輸出以估計所呈現影像屬於一或多個已知分類之可能性。然而,此假定所有可能結果係已知的。例如,在一個使用案例中,經訓練以辨識狗及貓之一網路將可能60%辨識一斑馬係狗及40%辨識一斑馬係貓,但將不輸出一未知類別。在另一使用案例中,因為肺癌可在肺部之任何地方產生且不受任何特定大小、位置或形狀限制,所以肺癌之偵測係具挑戰性之問題。因此,實際上不可能基於詳盡地涵蓋所有可能肺癌案例之一訓練集枚舉及訓練一學習系統。
在一些實施例中,系統100可使用一或多個預測模型來促進辨識或偵測概念及異常或執行其他操作。預測模型可包含神經網路、其他機器學習模型或其他預測模型。作為一實例,神經網路可基於神經單元(或人工神經元)之一大集合。神經網路可鬆散地模仿一生物腦工作之方式(例如,經由由軸突連接之生物神經元之大群集)。一神經網路之各神經單元可與該神經網路之諸多其他神經單元連接。此等連接可加強或抑制其等對所連接神經單元之激發狀態之影響。在一些實施例中,各個別神經單元可具有將所有其輸入之值組合在一起之一求和函數。在一些實施例中,各連接(或神經單元本身)可具有一臨限函數使得信號必須在被允許傳播至其他神經單元之前超過臨限值。與傳統電腦程式相比,此等神經網路系統可為自我學習且經訓練,而非明確程式化,且在解決問題之特定領域中可表現得明顯更佳。在一些實施例中,神經網路可包含多個層(例如,其中一信號路徑自前層橫越至後層)。在一些實施例中,可由神經網路利用反向傳播技術,其中正向刺激用來重設「前」神經單元上之權重。在一些實施例中,對神經網路之刺激及抑制可更自由流動,其中連接以一更混亂且復雜之方式相互作用。
在一些實施例中,一個預測模型可經訓練以將一訓練資料集之資料項(例如,關於一給定概念之一「正常」資料集)映射至一隨機分佈本徵向量空間中,且另一預測模型可經訓練以(例如,自該向量空間之本徵向量之輸入)產生類似於該訓練資料集之資料項之輸出資料。在一些實施例中,兩個預測模型可配置於一預測模型架構中,其中(i)將一資料項作為輸入提供給將該資料項轉換為一本徵向量之預測模型,(ii)將該本徵向量作為輸入提供給基於該本徵向量產生該資料項之一重構使得該重構類似於原始資料項之預測模型。應注意,前述架構之預測模型配置並非產生具有輸入資料項之每個細節之一重構之一典型自動編碼器。作為一實例,前述架構經組態以在訓練程序期間自密切匹配於輸入資料之一「正常」集產生資料項。
在一些實施例中,一第一預測模型(例如,ML模型104a)可經組態以產生一資料項之一隱藏表示,且一第二預測模型可經組態以基於一資料項之一隱藏表示產生該資料項之一重構。作為一實例,一資料項可包含一文件、一音訊(例如,超音波或其他音訊記錄)、一影像(例如,體積掃描、超音波影像、磁共振影像(MRI)、x射線影像等)、一視訊(例如,超音波視訊、MRI視訊等)、一感測器資料記錄或其他資料項。感測器資料記錄可例如包含醫療感測器信號之記錄,例如磁場信號、射頻(RF)信號、腦電圖(EEG)信號、心電圖(ECG)信號、肌電圖(EMG)信號、肌動圖(MMG)信號、眼電圖(EOG)信號、腦磁圖(MEGA)信號或其他信號。一資料項之一隱藏表示可包含該資料項之一壓縮表示(例如,有損、無損等)、具有小於該資料項之一資源大小之其他表示或其他隱藏表示。
在一些實施例中,第一預測模型經組態以基於由第二預測模型產生之一資料項之一重構更新其組態,其目的係產生該資料項之一隱藏表示,第二預測模型可使用該隱藏表示來產生更類似於該資料項之一更佳重構。當關於對應於相同概念(例如,健康大腦、患有腫瘤之大腦、健康心臟、患有特定病症之患病心臟、貓、狗或其他概念)之一資料項集合進行恰當訓練時,第一預測模型及第二預測模型之組合經組態以產生非常類似於對應輸入資料項之重構。當提供一資料項且該資料項不對應於(若干)概念(對其(等)訓練第一預測模型及第二預測模型之組合)時,該模型組合可嘗試產生該資料項之一重構,但鑑於該模型組合偏向於產生類似於對應於該已知訓練集之(若干)概念之資料項之重構,該重構將可能與該資料項具有足夠差異。此等差異可由系統100 (例如,預測模型或系統100之其他組件)使用以偵測在該資料項中存在一異常。
在一些實施例中,關於前述第一預測模型及第二預測模型,系統100可使用第一預測模型及第二預測模型來偵測存在關於一或多個資料項之一異常(例如,在已知概念之外)。在一些實施例中,系統100可獲得對應於一概念之一資料項集合且將資料項提供給一第一預測模型。第一預測模型可基於所提供資料項產生資料項之隱藏表示,且系統100可將隱藏表示提供給第二預測模型。第二預測模型可基於所提供隱藏表示自資料項之隱藏表示產生資料項之重構。系統100可將資料項之重構作為參考回饋提供給第一預測模型以引起第一預測模型評估資料項之重構(例如,藉由依據資料項評估重構)。第一預測模型可基於評估更新第一預測模型之一或多個組態(例如,表示產生相關組態)。作為一實例,第一預測模型可基於重構之評估調整第一預測模型之權重或其他參數。例如,更新/調整可組態第一預測模型以依引起第二預測模型產生更類似於對應於隱藏表示之資料項之重構之一方式改良其隱藏表示產生。作為一實例,第一預測模型可學習(或繼續學習)一或多種生成演算法以改良其隱藏表示產生(例如,藉由更新/調整生成演算法或此等演算法之參數)。
在一些實施例中,第一預測模型可將一資料項編碼為表示該資料項之一向量(例如,在一本徵空間中表示該資料項之一本徵向量)且產生該向量作為該資料項之一隱藏表示。作為一實例,第一機器學習模型可學習一或多種生成演算法以產生一資料項之一隱藏表示(例如,在一本徵空間中表示該資料項之一本徵向量)。可由第一機器學習模型基於對一資料項集合之訓練、來自另一機器學習模型之回饋(例如,如本文中所描述)或來自其他源之回饋(例如,使用者提供之回饋)、或其他資料來學習生成演算法。在一些實施例中,第二機器學習模型可「解碼」一資料項之一隱藏表示以重構該資料項之一版本。作為一實例,第二機器學習模型可學習一或多種生成演算法以產生一資料項之一重構。可由第二機器學習模型基於對隱藏表示之訓練、來自另一機器學習模型之回饋(例如,經由生成對抗網路技術)或來自其他源之回饋(例如,使用者提供之回饋)、或其他資料來學習生成演算法。
在一些實施例中,第二預測模型可(例如,獨立於第一預測模型)經訓練為一生成模型,作為一生成對抗網路之部分,其中該生成模型及一辨別模型在一零和博弈框架中彼此「競爭」。在一個使用案例中,該生成模型自本徵向量產生候選者,且該辨別模型評估候選者,其中該生成模型學習自一本徵空間映射至一特定所關注資料分佈(例如,對應於一或若干給定概念),且其中該辨別網路辨別來自該資料分佈之例項與由該生成模型產生之候選者。可在增加該辨別模型之錯誤率(例如,「欺騙」該辨別模型猜測所產生候選者係來自該資料分佈之例項)之訓練目的下組態該生成模型,而可在減小其錯誤率之訓練目的下組態該辨別模型。
在一進一步使用案例中,可提供一已知資料集作為辨別模型之初始訓練資料,且可自訓練資料集提供樣本給辨別模型,直至辨別模型達到一臨限準確度位準。可利用自一預定義本徵空間取樣之一隨機化輸入來接種生成模型,且接著藉由辨別模型評估由生成模型產生之樣本。可在兩個模型中應用反向傳播使得(i)生成模型產生更密切類似於訓練資料集之資料項(例如,訓練資料集之影像或其他資料項)及(ii)辨別模型能更佳地識別自訓練資料中之實際資料項之「假」重現。在一些使用案例中,生成模型可為一反迴旋神經網路,且辨別模型可為一迴旋神經網路。
在一些實施例中,模型子系統116可獲得一資料項集合且將資料項提供給一第一預測模型(例如,一多模型架構之一預測模型、來自(若干)模型資料庫136之一預測模型等)。作為回應,關於各資料項,第一預測模型可基於該資料項產生一隱藏表示。作為一實例,資料項可包含文件、音訊、影像、視訊、感測器資料記錄、或對應於一或多個給定概念(例如,健康大腦、患有腫瘤之大腦、健康心臟、患有特定病症之患病心臟、貓、狗或其他概念)之其他資料項。此等資料項可包含來自一或多個資料庫之訓練資料、即時串流資料(例如,來自一或多個感測器)或其他資料。隱藏表示可包含資料項之壓縮表示、具有小於其等對應資料項之資源大小之其他表示或其他隱藏表示。在一些實施例中,第一預測模型可基於由第一預測模型(例如,經由對資料項之訓練、來自另一預測模型或其他源之回饋、或其他資料)學習之一或多種生成演算法將輸入資料(例如,資料項)編碼為表示資料項之向量(例如,在一本徵空間中表示該資料項之本徵向量)。在一些實施例中,關於各隱藏表示,回饋子系統118可將(例如,自隱藏表示產生之)資料項之一重構作為回饋提供給第一預測模型。第一預測模型可基於重構更新其組態之一或多者且產生資料項之一額外隱藏表示。針對資料項之各額外隱藏表示,可重複前述操作,直至自額外隱藏表示導出之一重構充分類似於原始資料項(例如,基於滿足一或多個類似性臨限值之資料項與重構之間的類似性)。作為一實例,第一預測模型可學習(或繼續學習)一或多種生成演算法以改良其隱藏表示產生(例如,藉由更新/調整生成演算法或此等演算法之參數),使得當另一給定預測模型被提供資料項之一隱藏表示時,該另一預測模型產生充分類似於資料項之一資料項重構(例如,密切類似於原始輸入影像之一影像之一重構、聽起來類似於原始輸入音訊檔案之一音訊檔案之一重構等)。
在一些實施例中,模型子系統116可獲得資料項之隱藏表示(例如,由一第一預測模型產生之隱藏表示)且將隱藏表示提供給一第二預測模型。作為回應,第二預測模型可自隱藏表示產生資料項之重構。在一些實施例中,第二預測模型可將隱藏表示轉換成資料項之重構。在由第一預測模型產生一資料項之一隱藏表示之一個使用案例中,可將該隱藏表示提供給第二預測模型,且第二預測模型可基於該隱藏表示產生該資料項之一重構(例如,使用由第二預測模型學習之一或多種生成演算法以自該隱藏表示產生該重構)。在一些實施例中,偵測子系統120可基於資料項之重構判定關於資料項之資訊,諸如(i)資料項之一分類(例如,資料項中之一給定概念之識別),(ii)資料項中之一異常之存在(例如,未知關於資料項之分類之識別),(iii)資料項之哪些部分對應於一異常(或一未知分類/概念)或該異常之位置,或(iv)其他資訊。
在一個使用案例中,關於圖2,架構200可包含對0及1之影像訓練之ML模型104a及104b (例如,0及1之電腦產生影像、0及1之手寫影像等)。如圖2中所指示,架構200經組態使得輸入202 (例如,「0」之一影像)提供給ML模型104a,呈本徵向量204之形式(例如,在一本徵向量空間中表示「0」之影像之一本徵向量)之ML模型104a之一輸出提供給ML模型104b,且由ML模型104b提供輸出206 (例如,「0」之一重構)。基於訓練以辨識一影像中之0或1 (或將一影像分類為0或1),架構200將產生密切類似於此等輸入影像之0及1之輸入影像之重構。在一進一步使用案例中,可使用來自MNIST資料庫(例如,通常用於訓練各種影像處理系統之手寫數字之一大資料庫)之一簡單標準資料集來訓練架構200。作為一實例,架構200最初可經訓練以將大約12,000個手寫0及1 (或其他數目個0及1)視為正常。作為輸入提供給ML模型104b之任何隨機本徵向量將產生0或1作為來自ML模型104b之輸出。同時(或在其他時間期間),ML模型104a在訓練階段期間將任何輸入映射至本徵向量空間中,其目的係儘可能密切地匹配輸入資料及輸出資料。
因而,關於圖3A,(提供給經訓練架構200)之螢幕截圖302、304、306、308及310之頂部上之輸入影像(例如,分別係0、0、0、1、1)密切類似於各自螢幕截圖之底部上之經重構影像。然而,當將不同數字之影像作為輸入提供給架構200時,架構200將產生極大地偏向於已知訓練集之影像之重構。因而,儘管在除0及1之外的數字之輸入影像與架構200產生之重構之間可存在一些類似特性(例如,定向、位置、陰影、厚度等),然在此情況中之差異可係可獨特辨識的。關於圖3B,例如螢幕截圖312、314及316之頂部上之輸入影像(例如,分別係2、2、9)完全不同於經重構影像(例如,分別類似於0、0、1)。即,當呈現諸如數字2之一異常(例如,架構200先前未見)時,網路繼續產生0及1,因此導致輸入影像與重構之間的一大差異。輸入影像與重構之間的此等不同特性(或在此情況中,大差異)可用來判定相對於已知訓練集之「正常」在輸入影像之各者中存在一異常(例如,其中0及1係「正常」,且除0或1之外的任何數字或字元係一異常)。
在一些實施例中,關於圖1A,ML模型104b可保留一「控件」作為架構102之部分,而ML模型104a在訓練程序期間不斷學習。如所指示,ML模型104b之輸出(例如,資料項之重構)可作為回饋提供給ML模型104a,其可由ML模型104a使用以更新ML模型104之一或多個組態(例如,權重、其他參數或其他組態)。在一些實施例中,儘管ML模型104a之輸出可作為輸入提供給ML模型104b (例如,待轉換成一重構之一隱藏表示),但ML模型104a之輸出可不作為回饋提供給ML模型104b。作為一實例,ML模型104b可獨立於ML模型104a進行訓練。如本文中所指示,在一些實施例中,ML模型104b可經訓練為一生成模型,作為生成對抗網路之部分(例如,其中該生成模型及一辨別模型在一零和博弈框架中彼此「競爭」)。在一些實施例中,儘管ML模型104b可為一生成模型,但無需實施一對抗網路以訓練ML模型104b,且可使用其他技術來訓練ML模型104b。
在一些實施例中,一多模型架構可包含第一預測模型、第二預測模型及第三預測模型(或其他預測模型)。作為一實例,第一預測模型可具有圖1A之ML模型104a之組態 (或本文中所描述之其他圖之ML模型A),且第二預測模型可具有圖1A之ML模型104b之組態 (或本文中所描述之其他圖之ML模型B)。第三預測模型可經組態以指示(i)兩個或更多個資料項(例如,輸入資料項與其對應重構)之間的類似性或差異,(ii)兩個資料項是否類似或不同(例如,兩個資料項之特定特性是否在一或多個臨限值範圍內,諸如經由訓練學習或手動預定義之臨限值),(iii)一資料項中是否存在一異常(例如,基於第三預測模型對該資料項及其(若干)重構之相互評估),(iv)一資料項是否具有對應於訓練集之「正常」之一分類(或概念),或(v)其他資訊。作為一實例,關於圖4,架構400可包含ML模型A、B及C,其中資料106 (例如,一輸入資料項)提供給ML模型A及ML模型C,ML模型A之輸出110 (例如,該資料項之一隱藏表示)提供給ML模型B,且ML模型B之輸出108(例如,該資料項之一重構)由ML模型B提供給ML模型C。ML模型C可基於資料項及重構產生呈自資料項與重構之間的類似性或差異導出之前述指示之一或多者之形式之輸出402。
在一些實施例中,第三預測模型可經訓練以最小化網路偏差以最佳化異常(例如,包含小異常)之偵測。在一些實施例中,可獲得對應於(若干)相同概念(例如,對其(等)訓練第一預測模型及第二預測模型)之一資料項集合,且將該資料項集合提供給第一預測模型及第二預測模型之組合以引起該組合產生對應輸入資料項之重構。模型子系統116可將資料項之各者及其對應重構提供給第三預測模型以訓練第三預測模型,以將資料項與其重構之對應對之各者辨識為類似(例如,指示相對於經訓練「正常」無異常)。作為一實例,關於對應對之各者,模型子系統116可將回饋提供給第三預測模型,第三預測模型使用該回饋作為一參考來評估其對資料輸入與其重構是否或如何類似或不同之預測。第三預測模型可基於其評估更新其組態之一或多者(例如,ML模型C之一或多個層、ML模型C之一或多個權重或其他參數等)。例如,回饋可指示該集合之各資料項與其重構類似或不存在異常(例如,作為資料項與其重構之一比較之一結果,不應偵測到異常)。因而,關於訓練集,第三預測模型獲知(例如,在頻繁基礎上)源自一資料項之處理(藉由第一預測模型及第二預測模型之組合以產生重構)之該資料項與其重構之間的差異在處理其他資料項及其等重構(例如,並非訓練集之部分之資料項)時將被忽略或被賦予較低權重。與習知統計技術(例如,其等需要一程式設計員手動調整類似性臨限值)相比,第三預測模型經組態以自動調整將賦予特定類似性及差異之權重(若有) (例如,低或無權重賦予由訓練集之資料項及其等重構示範之常見差異)。以此方式,例如,第三預測模型產生更準確結果(例如,藉由經由前述訓練解決網路偏差)。
在一些實施例中,可將來自資料項集合之資料項(例如,對應於對其(等)訓練第一預測模型及第二預測模型之(若干)相同概念)或資料項之重構作為一比較集(例如,作為一對、一三元組等)提供給第三預測模型,其中第三預測模型可相互評估比較集之資料項或重構。第三預測模型可基於其評估更新其組態之一或多者。在一些實施例中,模型子系統116可將資料項集合之兩個資料項作為一比較集提供給第三預測模型以訓練第三預測模型,以將資料項辨識不同(或不類似)。在一些實施例中,模型子系統116可將資料項集合之一資料項及(資料項集合之)另一資料項之一重構作為一比較集提供給第三預測模型以訓練第三預測模型,以將資料項與其他資料項之重構辨識為不類似。作為一實例,關於兩個資料項或該對(包含資料項及其他資料項之重構),模型子系統116可將回饋提供給第三預測模型,第三預測模型使用回饋作為一參考來評估其對兩個資料輸入是否或如何類似或不同之預測。例如,回饋可指示兩個資料輸入不同(或不類似)。因而,關於(i)對應於相同概念之不同資料項或(ii)對應於相同概念之一資料項及另一資料項之重構,第三預測模型學習各對應資料輸入對之間的小差異。
在一個使用案例中,關於圖4,將一第一資料項(例如,來自對應於架構400之「正常」之一訓練集)及其重構(例如,由架構400之ML模型B產生)連同指示兩個輸入類似之回饋一起提供給架構400之ML模型C。作為回應,ML模型C可依據回饋評估其預測且隨時間推移學習以在第一資料項與其重構之間的差異在兩個其他資料輸入之間再次出現時忽略或將較低權重賦予此等差異(例如,藉由在ML模型C更新其組態期間取消強調此等差異)。另外,可將第一資料項及一第二資料項(例如,來自相同訓練集)連同指示兩個輸入不同或不類似之回饋一起提供給ML模型C。作為回應,ML模型C可依據回饋評估其預測且隨時間推移學習以在第一資料項與第二資料項之間的特定差異在兩個其他資料輸入之間再次出現時將較高權重賦予此等差異(例如,藉由在ML模型C更新其組態期間強調此等差異直至此等差異不包含兩個類似資料輸入之間的常見差異)。以此方式,例如,可自ML模型C訓練源自ML模型一資料項之處理(例如,產生資料項之一隱藏表示結合自隱藏表示產生重構)之網路偏差,但ML模型C仍可經訓練以辨識異常而不一定需要使用異常資料(例如,不對應於相同於對其訓練架構400之ML模型A及B之訓練集之概念之資料項)。
如所論述,在一些實施例中,當提供一資料項且該資料項不對應於對其(等)訓練第一預測模型及第二預測模型之組合之(若干)概念時,第一預測模型及第二預測模型之組合可嘗試產生該資料項之一重構,但鑑於該模型組合偏向於產生類似於對應於已知訓練集之(若干)概念之資料項之重構,該重構可能與該資料項具有足夠差異。作為一實例,關於圖5A,當「0」之輸入影像(例如,螢幕截圖502之頂部影像)提供給(圖4之)架構400之ML模型A時,架構400之ML模型B產生一非常類似重構(例如,螢幕截圖502之底部影像),因為對0及1之影像之一資料集訓練ML模型A及B。架構400之ML模型C基於其訓練輸出不存在異常之一指示。同樣地,當「1」之輸入影像(例如,螢幕截圖504之頂部影像)提供給ML模型A時,ML模型B產生一非常類似重構(例如,螢幕截圖504之底部影像),且ML模型C輸出不存在異常之一指示。
另一方面,關於圖5B,當「2」之一輸入影像(例如,螢幕截圖602之頂部影像)提供給(例如,圖4之)架構400之ML模型A時,架構400之ML模型B產生類似於「0」而非「2」之一重構,因為僅對0及1之影像之一資料集訓練ML模型A及B (例如,經重構「0」係ML模型B嘗試自其隱藏表示重繪輸入影像)。架構400之ML模型C基於其訓練輸出在「2」之輸入影像中存在一異常之一指示。同樣地,當「9」之一輸入影像(例如,螢幕截圖604之頂部影像)提供給ML模型A時,ML模型B產生類似於「1」而非「9」之一重構,因為僅對0及1之影像之一資料集訓練ML模型A及B (例如,經重構「1」係ML模型B試圖自其隱藏表示重繪輸入影像)。因而,架構400之ML模型C輸出在「9」之輸入影像中存在一異常之一指示。
在一些實施例中,一多模型架構包含第一預測模型、第二預測模型及第三預測模型,第一預測模型及第二預測模型分別具有圖1A之ML模型104a及104b之組態,且第三預測模型具有本文中所描述之圖之ML模型C之組態。在一個使用案例中,可對對應於(若干)相同概念(例如,對其(等)訓練第一預測模型及第二預測模型)之資料項訓練第三預測模型。另外或替代地,可對不對應於此等概念之其他資料項訓練第三預測模型。作為一實例,模型子系統116可將此等其他資料項(不對應於訓練相關聯概念)及其等各自對應重構提供給第三預測模型以將資料項與其重構之對應對之各者辨識為不同(或不類似) (例如,指示相對於經訓練「正常」之一異常)。作為一實例,關於對應對之各者,模型子系統116可將回饋提供給第三預測模型,第三預測模型使用回饋作為一參考來評估其對資料輸入與其重構是否或如何類似或不同之預測,其中回饋指示該集合之各資料項與其重構不同(或不類似)或存在一異常(例如,作為資料項與其重構之一比較之一結果,不應偵測到異常)。在一個案例中,關於圖4,將一第一資料項(例如,來自對應於架構400之「正常」之一訓練集)及其重構(例如,由架構400之ML模型B產生)連同指示兩個輸入類似之回饋一起提供給架構400之ML模型C。作為回應,ML模型C可依據回饋評估其預測且隨時間推移學習以在第一資料項與其重構之間的差異在兩個其他資料輸入之間再次出現時忽略或將較低權重賦予此等差異(例如,藉由在ML模型C更新其組態期間取消強調此等差異)。另外,可將一第二資料項(不對應於相同於對其訓練ML模型A及B之訓練集之概念)及其重構連同指示兩個輸入不同或不類似之回饋一起提供給ML模型C。作為回應,ML模型C可依據回饋評估其預測且隨時間推移學習以當第二資料項與其重構之間的特定差異在兩個其他資料輸入之間再次出現時將較高權重給予此等差異。
在一些實施例中,偵測子系統120可判定對應於一異常(或一未知分類/概念)之一資料項之一或多個部分,且引起經由一使用者介面呈現異常對應部分。在一些實施例中,關於由一多模型架構產生之一資料項及其重構,偵測子系統120可判定該資料項與該重構之間的一或多個差異係對應於對其(等)訓練該多模型架構之(若干)相同概念之資料項/重構對當中常見之差異。作為一實例,基於此判定,偵測子系統120可取消強調此等差異。作為另一實例,在對應於訓練相關聯概念之資料項/重構對當中出現一常見差異之頻率愈高,偵測子系統120可施加於該差異之取消強調愈高(例如,給予差異之權重愈低,在對應於訓練相關聯概念之資料項/重構對當中出現此差異之頻率愈高)。
另外且替代地,偵測子系統120可判定資料項與重構之間的一或多個差異係在對應於對其(等)訓練多模型架構之(若干)相同概念之資料項/重構對當中罕見之差異。作為一實例,基於此判定,偵測子系統120可強調此等差異。作為另一實例,在對應於訓練相關聯概念之資料項/重構對當中出現一罕見差異之頻率愈低,偵測子系統120可施加於該差異之強調愈高(例如,給予差異之權重愈高,在對應於訓練相關聯概念之資料項/重構對當中出現此差異之頻率愈低)。在一些實施例中,偵測子系統120可基於以下各者偵測資料項中之一異常:(i)經取消強調之差異,(ii)經強調之差異,(iii)施加於差異之取消強調或強調之量,或(iv)其他資訊。在一些實施例中,偵測子系統120可基於以下各者修改資料項之一呈現:(i)經取消強調之差異,(ii)經強調之差異,(iii)施加於差異之取消強調或強調之量,或(iv)其他資訊。作為一實例,偵測子系統120可引起取消強調資料項之一或多個部分(例如,取消強調此等部分達對應於取消強調量之一量,諸如增大或減小亮度、清晰度、對比度、或此等部分之其他屬性)。作為另一實例,偵測子系統120可引起強調資料項之一或多個部分(例如,強調此等部分達對應於強調量之一量)。
在一多模型架構包含第一預測模型、第二預測模型及第三預測模型(且第一預測模型、第二預測模型及第三預測模型分別具有本文中所描述之圖之ML模型A、B及C之組態)之一些實施例中,第三預測模型可輸出對應於一異常(或一未知分類/概念)之一資料項之一或多個部分之一指示。在一些實施例中,關於由多模型架構產生之一資料項及其重構,第三預測模型可學習忽略或將較低權重給予資料項/重構對(對應於對其(等)訓練多模型架構之(若干)相同概念)當中常見之差異(例如,基於本文中關於第三預測模型所描述之訓練)。在一個使用案例中,第三預測模型可自動減小其賦予一常見差異之權重,在對應於訓練相關聯概念之資料項/重構對當中出現該常見差異之頻率愈高。另外且替代地,第三預測模型可學習將較高權重給予資料項/重構對(對應於對其(等)訓練多模型架構之(若干)相同概念)當中罕見之差異(例如,基於本文中關於第三預測模型所描述之訓練)。在一個案例中,第三預測模型可自動增大其賦予一差異之權重,在對應於訓練相關聯概念之資料項/重構對當中出現該差異之頻率愈低。
在一些實施例中,第三預測模型可強調或取消強調一資料項之一或多個部分。在一些實施例中,第三預測模型可基於與對應於此等部分之差異相關聯之權重(例如,第三預測模型自動賦予兩個資料項(諸如資料項與其重構)之間的差異、來自對其訓練第一預測及第二預測之相同訓練集之不同資料項之間的差異等之權重)強調或取消強調資料項之此等部分。作為一實例,第三預測模型可基於與滿足一或多個權重臨限值(例如,超過一強調臨限值)之此等部分(或對應於此等部分之差異)相關聯之權重強調資料項之一或多個部分。作為一進一步實例,第三預測模型可對較高權重施加較大強調且對較低權重施加較小強調(例如,仍滿足權重臨限值)。作為另一實例,第三預測模型可基於與滿足一或多個權重臨限值(例如,小於一取消強調臨限值)之此等部分(或對應於此等部分之差異)相關聯之權重取消強調資料項之一或多個部分。作為一進一步實例,第三預測模型可對較低權重施加較大取消強調且對較高權重施加較小取消強調。在一些實施例中,第三預測模型可輸出經強調/取消強調部分之一指示(例如,呈一文件、影像、視訊或其他資料項之形式),其中經強調部分對應於一異常(或一未知分類/概念),由此指示存在一異常。
在一個使用案例中,關於圖6A至圖6C,(例如,圖4之)架構400之ML模型C可輸出64個大腦掃描影像之一或多個經強調/取消強調部分之一指示。圖6A至圖6C展示對應於一測試集之輸入大腦掃描影像之ML模型C之輸出之螢幕截圖。圖6A之螢幕截圖602展示當架構400之ML模型極少進行或未進行關於一資料項集合(例如,對應於一給定概念)之訓練時ML模型C之輸出。圖6B之螢幕截圖604展示當架構400之ML模型已進行關於該資料項集合之一些訓練(與螢幕截圖602相比,訓練量較大)時ML模型C之輸出。圖6C之螢幕截圖606展示當架構400之ML模型進行最大量之訓練(相對於對應於圖6A及圖6B之ML模型C之例項)時ML模型C之輸出。如由圖6C之影像輸出608及610所指示,對應於影像輸出608及610之輸入大腦掃描影像之各者具有彼大腦掃描影像之一個部分中之異常之特性(例如,如影像輸出608中所展示對應於大腦後部之增亮/白色部分及如影像輸出610中所展示之對應於大腦前部之增亮/白色部分)。如由圖6C之其他影像輸出所指示,ML模型C已預測其他大腦掃描影像未展示異常跡象(例如,相對於對應於一或若干給定概念之訓練集之「正常」)。
作為另一實例,關於圖6A,當架構400之ML模型尚未或極少對訓練集之資料項(例如,對應於一或若干給定概念)進行訓練時,ML模型尚未對什麼係「正常」進行充分訓練。因而,將難以(自圖6A之螢幕截圖602)觀察哪些大腦掃描影像具有相對於訓練集之「正常」異常之分類(例如,患有中風之大腦)。儘管ML模型C可能已強調或取消強調大腦掃描影像之特定部分,但此強調或取消強調並未如圖6C之螢幕截圖606中所展示之強調及取消強調般清楚。作為一進一步實例,關於圖6B,隨著繼續對訓練集之資料項訓練架構400之ML模型,變得更明瞭哪些大腦掃描影像具有相對於訓練集之「正常」異常之分類。與圖6A之螢幕截圖602相比,清楚的是ML模型C已對大腦掃描影像之大部分施加更多強調或更多取消強調。隨著繼續對訓練集訓練架構400之ML模型,ML模型C之輸出(對應於大腦掃描影像之測試集)最終變為由圖6之螢幕截圖606所展示者,其中自輸出明瞭測試集之哪些大腦掃描影像預測具有相對於訓練集之「正常」之異常或預測不具有相對於訓練集之「正常」之異常。
在一些實施例中,一第一預測模型(例如,圖4之ML模型A)可經組態以產生一資料項之一隱藏表示,且一第二預測模型(例如,圖4之ML模型B)可經組態以基於一資料項之一隱藏表示產生該資料項之一重構,其中可使用一辨別模型來訓練該第二預測模型。在一些實施例中,一第三預測模型(例如,圖4之ML模型C)可充當辨別模型來訓練第二預測模型,其中該第三預測模型可經組態以指示(i)兩個或更多個資料項(例如,輸入資料項與其對應重構)之間的類似性或差異,(ii)兩個資料項是否類似或不同,(iii)一資料項中是否存在一異常,(iv)一資料項是否具有對應於訓練集之「正常」之一分類(或概念),或(v)其他資訊。因此,在一些實施例中,可「端對端」同時訓練第一預測模型、第二預測模型及第三預測模型。作為一實例,關於圖4,ML模型A可經訓練以基於重構(例如,由ML模型B產生之資料108)產生更佳隱藏表示(例如,資料110),ML模型B可經訓練以基於ML模型C之輸出(例如,指示資料輸入類似或不同之資料402)產生更佳重構(例如,關於訓練集之「正常」,其目的係「欺騙」辨別性ML模型C),且ML模型C可基於其對架構400之輸入資料項(例如,資料106)之評估及輸入資料項之重構(例如,由ML模型B產生之資料108)進行訓練。
在一些實施例中,多個預測模型集可配置在一起以形成一預測模型集之一網路以促進概念或異常之辨識/偵測或執行一資料項之分類。在一些實施例中,預測模型集之各者可包含兩個或更多個預測模型(例如,本文中所描述之圖之ML模型A及B)、三個或更多個預測模型(例如,本文中所描述之圖之ML模型A、B及C)、或其他數目個預測模型。各預測模型集可將一資料項視作輸入(例如,其ML模型A之輸入),且提供該資料項之一重構(例如,其ML模型B之一輸出)或以下各者之一指示:(i)兩個或更多個資料項(例如,輸入資料項與其對應重構)之間的類似性或差異,(ii)兩個資料項是否類似或不同,(iii)一資料項中是否存在一異常,(iv)一資料項是否具有對應於訓練集之「正常」之一分類(或概念),或(v)其他資訊。在一些實施例中,各預測模型集可為其自身預測模型網路,其經組態以將一資料項辨識為屬於一分類子集之一或多者(或具有一概念子集之一或多者)或辨識為一異常或辨識為具有一異常(例如,不屬於分類或概念子集之一分類或一概念),而預測模型集之整體網路經組態以將該資料項辨識為屬於或具有整體分類/概念集之一或多者(例如,包含所有分類/概念子集)或辨識為相對於整體集之所有已知分類/概念之一異常或辨識為具有相對於整體集之所有已知分類/概念之一異常。此外,鑑於僅需要對僅對應於一分類/概念子集之一訓練集訓練各預測模型網路,可減少所需之總訓練量(例如,與嘗試訓練一個預測網路模型以準確地辨識整個/整體分類/概念集相比)。例如,在諸多情況下,隨著分類/概念(需要對其等訓練一預測模型)之數目增加,該預測模型需要訓練之量可指數地增長以維持相同位準之預測準確度。
作為一實例,關於圖7,架構700包含架構400a至400n,各架構具有其自身ML模型A、B及C集。儘管架構400a至400n之各者可具備相同輸入(例如,資料106),然其等各可提供一不同輸出(例如,輸出402a至402n)。在一個使用案例中,可對已知具有健康大腦(例如,先前經分類且確認為健康大腦)之大腦掃描影像之一訓練集訓練該等架構之一者(例如,架構400a),可對已知具有一或多種類型之腫瘤(例如,先前經分類且確認具有一特定類型之腫瘤)之大腦掃描影像之一訓練集訓練該等架構之另一者,可對已知具有中風之一或多個例項(例如,先前經分類且確認已患中風)之大腦掃描影像之一訓練集訓練該等架構之另一者,等等。當將一大腦掃描影像集作為輸入提供給整個架構700時,由架構400之各者處理大腦掃描影像之各者。若一大腦掃描影像係一健康大腦,則對健康大腦訓練之架構400將指示大腦掃描影像應被分類為一健康大腦。然而,因為對患病大腦(例如,腫瘤、中風等)訓練其他架構400,所以其他架構400之各者將指示相對於大腦掃描影像存在一異常。同樣地,若一大腦掃描影像係具有一特定類型之腫瘤之一大腦,則對具有彼類型之腫瘤之大腦訓練之結構400將指示大腦掃描影像應被分類為具有一腫瘤(或具有彼特定類型之腫瘤)。因為對其他分類/概念訓練其他架構400,所以其他架構400之各者將指示相對於大腦掃描影像存在一異常。以此方式,即使當一輸入資料項不對應於對其訓練個別架構400之一或多者之任何分類/概念時,整體架構700仍可(i)在對對應於該輸入資料項之分類/概念訓練架構400之至少一者之情況下準確地識別恰當分類,或(ii)累積地指示相對於該輸入資料項存在一異常。
在另一使用案例中,可對已知反映一個人躺下之加速器或其他感測器資料之一訓練集訓練架構之一者(例如,架構400a),可對已知反映一個人行走之加速器或其他感測器資料之一訓練集訓練架構之另一者,可對已知反映一個人跳躍之加速器或其他感測器資料之一訓練集訓練架構之另一者,可對已知反映一個人跌倒之加速器或其他感測器資料之一訓練集訓練架構之另一者,以此類推。當一加速器或其他感測器資料集作為輸入提供給整個架構700時,由架構400之各者處理加速器/感測器資料輸入之各者。若一加速器/感測器資料輸入(例如,來自由患者或其他個人穿戴之一可穿戴器件)反映一個人躺下(例如,且不反映其他訓練態樣),則對反映個人躺下之資料訓練之架構400將指示輸入應經分類以反映躺下。因為對不會反映躺下之其他態樣訓練其他架構400,所以其他架構400之各者將指示相對於輸入存在一異常。同樣地,若一加速器/感測器資料輸入(例如,來自由一患者或其他個人穿戴之一可穿戴器件)反映一個人跌倒(例如,且不反映其他訓練態樣),則對反映個人跌倒之資料訓練之架構400指示輸入應經分類以反映跌倒。因為對不會反映跌倒之其他態樣訓練其他架構400,所以其他架構400之各者將指示相對於輸入存在一異常。
實例流程圖
圖8及圖9係處理實現如上文詳細描述之系統之各種特徵及功能性之方法之操作之實例流程圖。下文所提出之各方法之處理操作意欲為闡釋性且非限制性。在一些實施例中,例如,可利用未描述之一或多個額外操作及/或可不利用所論述之一或多個操作來完成該等方法。另外,繪示(且下文描述)方法之處理操作之順序並非意欲為限制性。
在一些實施例中,該等方法可在一或多個處理器件(例如,一數位處理器、一類比處理器、經設計以處理資訊之一數位電路、經設計以處理資訊之一類比電路、一狀態機、及/或用於電子處理資訊之其他機構)中實施。處理器件可包含回應於電儲存於一電子儲存媒體上之指令而執行該等方法之一些或所有操作之一或多個器件。處理器件可包含透過硬體、韌體及/或軟體組態以專門經設計用於執行該等方法之操作之一或多者之一或多個器件。
圖8展示根據一或多項實施例之經由一多ML模型架構促進異常偵測之一方法之一流程圖800。在操作802中,可獲得對應於一概念之資料項。作為一實例,資料項可包含文件、音訊、影像、視訊、感測器資料記錄或其他資料項。此等資料項可包含來自一或多個資料庫(例如,訓練資料資料庫134)之訓練資料、即時串流資料或其他資料。根據一或多項實施例,可由相同於或類似於模型子系統116之一模型子系統執行操作802。
在操作804中,可將資料項提供給一第一機器學習模型以引起該第一機器學習模型自資料項產生資料項之隱藏表示。作為一實例,隱藏表示可包含資料項之壓縮表示(例如,有損、無損等)、具有小於其等對應資料項之資源大小之其他表示或其他隱藏表示。在一個使用案例中,第一機器學習模型可將輸入資料(例如,資料項)編碼為表示資料項之向量(例如,在一本徵空間中表示該資料項之本徵向量)。在一進一步使用案例中,第一機器學習模型可學習一或多種生成演算法以產生隱藏表示。可由第一機器學習模型基於對資料項之訓練、來自另一機器學習模型之回饋(例如,如本文中所描述)或來自其他源之回饋(例如,使用者提供之回饋)、或其他資料而學習生成演算法。根據一或多項實施例,可由相同於或類似於模型子系統116之一模型子系統執行操作804。
在操作806中,可將資料項之隱藏表示提供給一第二機器學習模型以引起該第二機器學習模型自資料項之隱藏表示產生資料項之重構。在一個使用案例中,第二機器學習模型可「解碼」輸入資料(例如,隱藏表示)以重構資料項之一版本。在一進一步使用案例中,第二機器學習模型可學習一或多種生成演算法以產生重構。可由第二機器學習模型基於對隱藏表示之訓練、來自另一機器學習模型之回饋(例如,經由生成對抗網路技術)或來自其他源之回饋(例如,使用者提供之回饋)、或其他資料而學習生成演算法。根據一或多項實施例,可由相同於或類似於模型子系統116之一模型子系統執行操作806。
在操作808中,可將資料項之重構提供給第一機器學習模型以引起第一機器學習模型依據資料項評估資料項之重構。第一機器學習模型可基於評估更新第一機器學習模型之一或多個組態(例如,表示產生相關組態)。作為一實例,第一機器學習模型可基於重構之評估調整第一機器學習模型之權重。例如,更新/調整可組態第一機器學習模型以依引起第二預測模型產生對應於隱藏表示之資料項之更類似重構之一方式改良其隱藏表示產生。作為一實例,第一預測模型可學習(或繼續學習)一或多種生成演算法以改良其隱藏表示產生(例如,藉由更新/調整生成演算法或此等演算法之參數)。根據一或多項實施例,可由相同於或類似於回饋子系統118之一回饋子系統執行操作808。
在操作810中,可將一第一資料項提供給第一機器學習模型以引起第一機器學習模型自第一資料項產生第一資料項之一隱藏表示。第一資料項可包含一文件、音訊、影像、視訊或其他資料項。第一資料項可包含來自一或多個資料庫(例如,訓練資料資料庫134)之訓練資料、即時串流資料或其他資料。作為一實例,第一機器學習模型可將輸入資料(例如,第一資料項)編碼為表示第一資料項之一或多個本徵向量(例如,在一本徵空間中表示第一資料項之本徵向量)。根據一或多項實施例,可由相同於或類似於模型子系統116之一模型子系統執行操作810。
在操作812中,可將第一資料項之隱藏表示提供給第二機器學習模型以引起第二機器學習模型自第一資料項之隱藏表示產生第一資料項之一重構。根據一或多項實施例,可由相同於或類似於模型子系統116之一模型子系統執行操作812。
在操作814中,可基於第一資料項與第一資料項之重構之間的差異偵測第一資料項中之一異常。根據一或多項實施例,可由相同於或類似於偵測子系統120之一偵測子系統執行操作814。
圖9展示根據一或多項實施例之經由一機器學習模型促進異常偵測之一方法之一流程圖900,該機器學習模型經訓練以評估一資料項與其ML模型導出重構之間的差異。如上文關於圖8所論述,一第一機器學習模型可自資料項產生資料項之隱藏表示(例如,對應於一概念),且一第二機器學習模型可自資料項之隱藏表示產生資料項之重構。第一機器學習模型可依據資料項評估重構,且第一機器學習模型可基於評估更新第一機器學習模型之一或多個組態(例如,表示產生相關組態)。例如,此更新可組態第一機器學習模型以依引起第二預測模型產生對應於隱藏表示之資料項之更類似重構之一方式改良其隱藏表示產生。
在操作902中,在此一更新之後,可獲得由第一機器學習模型產生之(資料項之)額外隱藏表示。作為一實例,額外隱藏表示可包含資料項之壓縮表示、具有小於其等對應資料項之資源大小之其他表示或其他隱藏表示。在一個使用案例中,第一機器學習模型可基於一或多種生成演算法將輸入資料(例如,資料項)編碼為表示資料項之向量(例如,在一本徵空間中表示資料項之本徵向量),第一機器學習模型自資料項(或其他資料項)之先前處理及其對與此處理之結果或此處理之其他態樣相關之回饋之評估學習該一或多種生成演算法。根據一或多項實施例,可由相同於或類似於模型子系統116之一模型子系統執行操作902。
在操作904中,可將資料項之額外隱藏表示提供給第二機器學習模型以引起第二機器學習模型自資料項之額外隱藏表示產生資料項之額外重構。在一個使用案例中,第二機器學習模型可「解碼」輸入資料(例如,隱藏表示)以基於一或多種生成演算法重構資料項之一版本,第二機器學習模型自隱藏表示之先前處理及其對與此處理之結果或此處理之其他態樣相關之回饋之評估學習該一或多種生成演算法。根據一或多項實施例,可由相同或類似於模型子系統116之一模型子系統執行操作904。
在操作906中,可將資料項之額外重構提供給第一機器學習模型以引起第一機器學習模型依據資料項評估資料項之額外重構。第一機器學習模型可基於評估更新第一機器學習模型之一或多個組態(例如,表示產生相關組態)。作為一實例,第一機器學習模型可基於額外重構之評估調整第一機器學習模型之權重。例如,更新/調整可組態第一機器學習模型以改良其隱藏表示產生(例如依引起第二預測模型產生對應於隱藏表示之資料項之更類似重構之一方式)。根據一或多項實施例,可由相同或類似於回饋子系統118之一回饋子系統執行操作906。
在操作908中,可將資料項、資料項之額外重構及給定參考回饋提供給一第三機器學習模型以引起基於資料項、資料項之額外重構及給定參考回饋訓練該第三機器學習模型,以產生該等資料項之各資料項與對應於該資料項之額外重構類似之一指示。作為一實例,提供給第三機器學習模型之給定參考回饋可包含資料項與額外重構類似之一指示。第三機器學習模型可基於類似性指示回饋處理及再處理一給定資料項及其對應重構且更新第三機器學習模型之一或多個組態(例如,在周期性或其他連續基礎上)至少直至第三機器學習模型自身產生給定資料項與其對應重構類似(或充分類似)之指示。例如,更新可組態第三機器學習模型以改良其偵測一資料項與其重構何時類似之準確性(且因此指示在該資料項中未偵測到異常) (例如,關於對應於用來訓練第三機器學習模型之資料項之一或多個給定概念)。根據一或多項實施例,可由相同或類似於回饋子系統118之一回饋子系統執行操作908。
在操作910中,將一第一資料項及第一資料項之一重構提供給第三機器學習模型以引起第三機器學習模型評估該資料項與該資料項之重構之間的差異。在一個使用案例中,作為其訓練之一結果,若例如在資料項中存在相對於一或多個給定概念之一異常,則第三機器學習模型產生指示資料項與資料項之重構不類似之一指示。另一方面,作為其訓練之一結果,若例如在資料項中不存在相對於給定概念之異常,則第三機器學習模型產生指示資料項與重構類似之一指示。根據一或多項實施例,可由相同或類似於模型子系統116之一模型子系統執行操作910。
在一些實施例中,圖1中所繪示之各種電腦及子系統包含經程式化以執行本文中所描述之功能之一或多個計算器件。計算器件可包含:一或多個電子儲存器(例如,(若干)預測資料庫132,其(等)可包含(若干)訓練資料資料庫134、(若干)模型資料庫136等或其他電儲存器);一或多個實體處理器,其(等)係用一或多個電腦程式指令程式化;及/或其他組件。計算器件可包含通信線路或埠以實現經由有線或無線技術(例如,以太網、光纖、同軸電纜、WiFi、藍芽、近場通信或其他技術)與一網路(例如,網路150)或其他計算平台交換資訊。計算器件可包含一起操作之複數個硬體、軟體及/或韌體組件。例如,計算器件可由一起操作為計算器件之計算平台之一雲端來實施。
電子儲存器可包含電儲存資訊之非暫時性儲存媒體。電子儲存器之電子儲存媒體可包含以下一者或兩者:(i)系統儲存器,其與伺服器或客戶端器件一體地(例如,實質上不可卸除)提供或(ii)可卸除儲存器,其經由例如埠(例如,USB埠、火線埠)或驅動器(例如,磁碟機等)可卸除地連接至伺服器或客戶端器件。電子儲存器可包含以下一或多者:光學可讀儲存媒體(例如,光碟等)、磁性可讀儲存媒體(例如,磁帶、磁性硬碟機、軟碟機等)、基於電荷之儲存媒體(例如,EEPROM、RAM等)、固態儲存媒體(例如,快閃隨身碟等)及/或其他電可讀儲存媒體。電子儲存器可包含一或多個虛擬儲存資源(例如,雲端儲存器、虛擬私人網路及/或其他虛擬儲存資源)。電子儲存器可儲存軟體演算法、由處理器判定之資訊、自伺服器獲得之資訊、自客戶端器件獲得之資訊或實現如本文中所描述之功能性之其他資訊。
處理器可經程式化以在計算器件中提供資訊處理能力。因而,處理器可包含以下一或多者:一數位處理器、一類比處理器、經設計以處理資訊之一數位電路、經設計以處理資訊之一類比電路、一狀態機、及/或用於電處理資訊之其他機構。在一些實施例中,處理器可包含複數個處理單元。此等處理單元可實體上定位於相同器件內,或處理器可表示協同操作之複數個器件之處理功能性。處理器可經程式化以執行電腦程式指令以執行本文中所描述之子系統116至120或其他子系統之功能。處理器可經程式化以藉由以下各者執行電腦程式指令:軟體;硬體;韌體;軟體、硬體或韌體之某一組合;及/或用於在處理器上組態處理能力之其他機構。
應明白,由本文中所描述之不同子系統116至120提供之功能性之描述用於闡釋性目的且並非意欲於限制,因為子系統116至120之任一者可提供多於或少於所描述之功能性。例如,可消除子系統116至120之一或多者,且可由子系統116至120之其他者提供一些或所有其功能性。作為另一實例,額外子系統可經程式化以執行本文中歸屬於子系統116至120之一者之一些或所有功能性。
儘管已出於圖解目的基於目前被視為最實用且較佳之實施例詳細描述本發明,但應理解,此細節僅僅用於彼目的且本發明係不限於所揭示實施例,相反,意欲於涵蓋隨附發明申請專利範圍之範疇內之修改及等效配置。例如,應理解,本發明預期,在可能範圍內,任何實施例之一或多個特徵可與任何其他實施例之一或多個特徵組合。
參考以下枚舉實施例將更佳地理解本發明技術: 1. 一種方法,其包括:獲得對應於一概念之資料項;將該等資料項提供給一第一模型以引起該第一模型自該等資料項產生該等資料項之隱藏表示;將該等資料項之該等隱藏表示提供給一第二模型以引起該第二模型自該等資料項之該等隱藏表示產生該等資料項之重構;及將該等資料項之該等重構提供給該第一模型,該第一模型基於該等資料項之該等重構更新該第一模型之一或多個組態。 2. 一種方法,其包括:將一資料項提供給一第一模型以引起該第一模型自該資料項產生該資料項之一隱藏表示;將該資料項之該隱藏表示提供給一第二模型以引起該第二模型自該資料項之該隱藏表示產生該資料項之一重構;基於該資料項與該資料項之該重構之間的差異偵測該資料項中之一異常。 3. 如實施例2之方法,其中實施例2中之第一模型係實施例1中之第一模型,且實施例2中之第二模型係實施例1中之第二模型,該方法進一步包括:在提供實施例1中之該等資料項之該等重構之後,執行實施例2中之操作。 4. 如實施例1至3中任一實施例之方法,其中未將該第一模型之輸出作為回饋提供給該第二模型。 5. 如實施例1至4中任一實施例之方法,其進一步包括:在提供該等資料項之該等重構之後:獲得對應於該概念之額外資料項;將該等額外資料項提供給該第一模型以引起該第一模型自該等額外資料項產生該等額外資料項之隱藏表示;將該等額外資料項之該等隱藏表示提供給該第二模型以引起該第二模型自該等額外資料項之該等隱藏表示產生該等額外資料項之重構;將該等額外資料項、該等額外資料項之該等重構及參考回饋提供給一第三模型以引起基於該等額外資料項、該等額外資料項之該等重構及該參考回饋訓練該第三模型,以產生該等額外資料項之各額外資料項與對應於該額外資料項之重構類似之一指示;及將該資料項及該資料項之該重構提供給該第三模型以引起該第三模型評估該資料項與該資料項之該重構之間的該等差異,該第三模型基於該資料項與該資料項之該重構之間的該等差異產生該資料項與該資料項之該重構不類似之一指示,其中偵測該異常包括基於由該第三模型產生之該指示偵測該資料項中之該異常。 6. 如實施例1至5中任一實施例之方法,其中該第一模型經組態以在該第一模型之該更新之後自該等資料項產生該等資料項之額外隱藏表示,該方法進一步包括:將該等資料項之該等額外隱藏表示提供給該第二模型以引起該第二模型自該等資料項之該等額外隱藏表示產生該等資料項之額外重構;及將該等資料項之該等額外重構提供給該第一模型以引起該第一模型依據該等資料項評估該等資料項之該等額外重構,該第一模型基於該第一模型對該等資料項之該等額外重構之評估進一步更新該第一模型之一或多個組態。 7. 如實施例6之方法,其進一步包括:將該等資料項、該等資料項之該等額外重構及參考回饋提供給一第三模型以引起基於該等資料項、該等資料項之該等額外重構及該參考回饋訓練該第三模型,以產生該等資料項之各資料項與對應於該資料項之額外重構類似之一指示;及將該資料項及該資料項之該重構提供給該第三模型以引起該第三模型評估該資料項與該資料項之該重構之間的該等差異,該第三模型基於該資料項與該資料項之該重構之間的該等差異產生該資料項與該資料項之該重構不類似之一指示,其中偵測該異常包括基於由該第三模型產生之該指示偵測該資料項中之該異常。 8. 如實施例7之方法,其中該第三模型產生該資料項之哪些部分與該資料項之該重構不類似之一或多個指示,且其中偵測該異常包括基於由該第三模型產生之該一或多個指示偵測該資料項中之該異常。 9. 如實施例7至8中任一實施例之方法,其中該第三模型產生該資料項之哪些部分與該資料項之該重構類似之一或多個指示,且其中偵測該異常包括基於由該第三模型產生之該一或多個指示偵測該資料項中之該異常。 10. 如實施例6至9中任一實施例之方法,其進一步包括:判定對使得該等對之各者包括該等資料項之一者及該等資料項之另一者之額外重構;將該等對提供給一第三模型以引起該第三模型相對於該等對之各者產生該對之該對應資料項與額外重構是否類似之一指示;將給定參考回饋提供給該第三模型以引起該第三模型依據該給定參考回饋評估該等所產生指示,該給定參考回饋指示該等對之各者之該對應資料項與額外重構不類似,該第三模型基於該第三模型對該等所產生指示之評估更新該第三模型之一或多個組態;及將該第一資料項及該第一資料項之該重構提供給該第三模型以引起該第三模型評估該第一資料項與該第一資料項之該重構之間的該等差異,該第三模型基於該第一資料項與該第一資料項之該重構之間的該等差異產生該第一資料項與該第一資料項之該重構不類似之一指示,其中偵測該異常包括基於由該第三模型產生之該指示偵測該第一資料項中之該異常。 11. 如實施例1至10中任一實施例之方法,其進一步包括:判定資料項之子集使得該等資料項子集之各者包括該等資料項之至少兩個資料項;將該等資料項子集提供給一第三模型以引起該第三模型相對於該等資料項子集之各者產生該資料項子集之該兩個資料項是否類似之一指示;將給定參考回饋提供給該第三模型以引起該第三模型依據該給定參考回饋評估該等所產生指示,該給定參考回饋指示該等資料項子集之各者之該兩個資料項不類似,該第三模型基於該第三模型對該等所產生指示之評估更新該第三模型之一或多個組態;及將該第一資料項及該第一資料項之該重構提供給該第三模型以引起該第三模型評估該第一資料項與該第一資料項之該重構之間的該等差異,該第三模型基於該第一資料項與該第一資料項之該重構之間的該等差異產生該第一資料項與該第一資料項之該重構不類似之一指示,其中偵測該異常包括基於由該第三模型產生之該指示偵測該第一資料項中之該異常。 12. 如實施例2至11中任一實施例之方法,其進一步包括:取消強調該資料項與該資料項之該重構之間的該等差異之一或多者,其中偵測該異常包括基於該一或多個經取消強調差異及該資料項與該資料項之該重構之間的該等差異之一或多個其他者偵測該資料項中之該異常。 13. 如實施例2至12中任一實施例之方法,其進一步包括:強調該資料項與該資料項之該重構之間的該等差異之一或多者,其中偵測該異常包括基於該一或多個經強調差異及該資料項與該資料項之該重構之間的該等差異之一或多個其他者偵測該資料項中之該異常。 14. 如實施例2至13之方法,其進一步包括:在提供該等資料項之該等重構之後將一第二資料項提供給該第一模型以引起該第一模型自該第二資料項產生該第二資料項之一隱藏表示;及將該第二資料項之該隱藏表示提供給該第二模型以引起該第二模型自該第二資料項之該隱藏表示產生該第二資料項之一重構,其中基於該第二資料項與該第二資料項之該重構之間的差異未偵測到該第二資料項中之該異常。 15. 如實施例1至14中任一實施例之方法,其中該等資料項包括文件、音訊、影像、視訊或感測器資料記錄。 16. 如實施例1至15中任一實施例之方法,其中該等資料項包括體積掃描、超音波影像、MRI影像或x射線影像。 17. 如實施例1至16中任一實施例之方法,其中該第一模型或該第二模型之至少一者包括一機器學習模型。 18. 如實施例1至17中任一實施例之方法,其中該第一模型或該第二模型之至少一者包括一神經網路。 19. 一種系統,其包括:一第一模型,其經組態以自資料項產生該等資料項之隱藏表示,該等資料項對應於一概念;一第二模型,其經組態以自該等資料項之該等隱藏表示產生該等資料項之重構;其中該第一模型經組態以:依據該等資料項評估該等資料項之該等重構;及基於該等資料項之該等重構之該評估更新該第一模型之一或多個組態;且其中在該第一模型之該更新之後,該第一模型經組態以自一資料項產生該資料項之一隱藏表示;且其中該第二模型經組態以自該資料項之該隱藏表示產生該資料項之一重構;及至少一個處理器,其經組態以基於該資料項與該資料項之該重構之間的差異偵測該資料項中之該異常。 20. 如實施例19之系統,其中在該第一模型之該更新之後,該第一模型經組態以:自該等資料項產生該等資料項之額外隱藏表示;其中該第二模型經組態以自該等資料項之該等額外隱藏表示產生該等資料項之額外重構;且其中該第一模型經組態以:依據該等資料項評估該等資料項之該等額外重構;及基於該等資料項之該等額外重構之該評估進一步更新該第一模型之一或多個組態。 21. 如實施例20之系統,其進一步包括:一第三模型,其經組態以:基於以下各者更新該第三模型之一或多個組態:(i)該等資料項,(ii)該等資料項之該等額外重構,及(iii)指示該等資料項之各資料項與對應於該資料項之額外重構類似之參考回饋;及基於該資料項與該資料項之該重構之間的差異產生該資料項與該資料項之該重構不類似之一指示;且其中偵測該異常包括基於由該第三模型產生之該指示偵測該資料項中之該異常。 22. 如實施例21之系統,其中該第三模型經組態以產生該資料項之哪些部分與該資料項之該重構不類似之一或多個指示,且其中偵測該異常包括基於由該第三模型產生之該一或多個指示偵測該資料項中之該異常。 23. 如實施例21之系統,其中該第三模型產生該資料項之哪些部分與該資料項之該重構類似之一或多個指示,且其中偵測該異常包括基於由該第三模型產生之該一或多個指示偵測該資料項中之該異常。 24. 如實施例19至23中任一實施例之系統,其中該第一模型或該第二模型之至少一者包括一機器學習模型。 25. 如實施例19至24中任一實施例之系統,其中該第一模型或該第二模型之至少一者包括一神經網路。 26. 一種儲存指令之有形非暫時性機器可讀媒體,該等指令在由一資料處理裝置執行時引起該資料處理裝置執行包括實施例1至18中任一實施例之彼等操作之操作。 27. 一種系統,其包括:一或多個處理器;及記憶體,其儲存指令,該等指令在由該等處理器執行時引起該等處理器實行包括實施例1至18中任一實施例之彼等操作之操作。
100‧‧‧系統 102‧‧‧架構 104a‧‧‧機器學習(ML)模型 104b‧‧‧機器學習(ML)模型 106‧‧‧資料 108‧‧‧資料 110‧‧‧資料 112‧‧‧伺服器 114a至114n‧‧‧客戶端器件 116‧‧‧模型子系統 118‧‧‧回饋子系統 120‧‧‧偵測子系統 132‧‧‧預測資料庫 134‧‧‧訓練資料資料庫 136‧‧‧模型資料庫 150‧‧‧網路 200‧‧‧架構 202‧‧‧輸入 204‧‧‧本徵向量 206‧‧‧輸出 302‧‧‧螢幕截圖 304‧‧‧螢幕截圖 306‧‧‧螢幕截圖 308‧‧‧螢幕截圖 310‧‧‧螢幕截圖 312‧‧‧螢幕截圖 314‧‧‧螢幕截圖 316‧‧‧螢幕截圖 400a至400n‧‧‧架構 402a至402n‧‧‧輸出 502‧‧‧螢幕截圖 504‧‧‧螢幕截圖 602‧‧‧螢幕截圖 604‧‧‧螢幕截圖 606‧‧‧螢幕截圖 608‧‧‧影像輸出 610‧‧‧影像輸出 700‧‧‧架構 800‧‧‧流程圖 802‧‧‧操作 804‧‧‧操作 806‧‧‧操作 808‧‧‧操作 810‧‧‧操作 812‧‧‧操作 814‧‧‧操作 900‧‧‧流程圖 902‧‧‧操作 904‧‧‧操作 906‧‧‧操作 908‧‧‧操作 910‧‧‧操作
圖1A至圖1B展示根據一或多項實施例之用於經由神經網路或其他預測模型促進辨識或偵測概念或異常之一系統。
圖2展示根據一或多項實施例之包含用於異常或概念偵測之兩個機器學習模型之一架構。
圖3A至圖3B展示根據一或多項實施例之關於圖2之一架構之輸入及輸出。
圖4展示根據一或多項實施例之包含用於異常或概念偵測之三個機器學習模型之一架構。
圖5A至圖5B展示根據一或多項實施例之關於圖4之一架構之輸入及輸出。
圖6A至圖6C展示根據一或多項實施例之多模型架構隨時間推移關於識別異常之進展。
圖7展示根據一或多項實施例之包含用於辨識或偵測概念或異常之機器學習模型之多個子系統之一架構。
圖8展示根據一或多項實施例之經由一多ML模型架構促進異常偵測之一方法之一流程圖。
圖9展示根據一或多項實施例之經由一機器學習模型促進異常偵測之一方法之一流程圖,該機器學習模型經訓練以評估一資料項與其ML模型導出重構之間的差異。
100‧‧‧系統
102‧‧‧架構
104a‧‧‧機器學習(ML)模型
104b‧‧‧機器學習(ML)模型
106‧‧‧資料
108‧‧‧資料
110‧‧‧資料
112‧‧‧伺服器
114a至114n‧‧‧客戶端器件
116‧‧‧模型子系統
118‧‧‧回饋子系統
120‧‧‧偵測子系統
132‧‧‧預測資料庫
134‧‧‧訓練資料資料庫
136‧‧‧模型資料庫
150‧‧‧網路

Claims (20)

  1. 一種經由一多神經網路(multi-neural-network)架構促進異常偵測(anomaly detection)之方法,該方法係由一電腦系統實施,該電腦系統包括執行電腦程式指令之一或多個處理器,該等電腦程式指令在被執行時執行該方法,該方法包括:獲得對應於一概念(concept)之資料項(data item);將該等資料項提供給一第一神經網路以引起該第一神經網路自該等資料項產生該等資料項之隱藏表示(hidden representations);將該等資料項之該等隱藏表示提供給一第二神經網路以引起該第二神經網路自該等資料項之該等隱藏表示產生該等資料項之重構(reconstructions);將該等資料項之該等重構作為參考回饋提供給該第一神經網路以引起該第一神經網路對(against)該等資料項評估(assess)該等資料項之該等重構,該第一神經網路基於該第一神經網路對該等資料項之該等重構之評估更新該第一神經網路之一或多個表示產生相關組態;在提供該等資料項之該等重構之後,執行以下操作:將一第一資料項提供給該第一神經網路以引起該第一神經網路自該第一資料項產生該第一資料項之一隱藏表示;將該第一資料項之該隱藏表示提供給該第二神經網路以引起該第二神經網路自該第一資料項之該隱藏表示產生該第一資料項之一重構;及基於該第一資料項與該第一資料項之該重構之間的差異偵測該第 一資料項中之一異常。
  2. 如請求項1之方法,其進一步包括:在提供該等資料項之該等重構之後,執行以下操作:將一第二資料項提供給該第一神經網路以引起該第一神經網路自該第二資料項產生該第二資料項之一隱藏表示;及將該第二資料項之該隱藏表示提供給該第二神經網路以引起該第二神經網路自該第二資料項之該隱藏表示產生該第二資料項之一重構,其中基於該第二資料項與該第二資料項之該重構之間的差異未偵測到該第二資料項中之異常。
  3. 如請求項1之方法,其中未將該第一神經網路之輸出作為參考回饋提供給該第二神經網路。
  4. 如請求項1之方法,其進一步包括:在提供該等資料項之該等重構之後,執行以下操作:獲得對應於該概念之額外資料項;將該等額外資料項提供給該第一神經網路以引起該第一神經網路自該等額外資料項產生該等額外資料項之隱藏表示;將該等額外資料項之該等隱藏表示提供給該第二神經網路以引起該第二神經網路自該等額外資料項之該等隱藏表示產生該等額外資料項之重構; 將該等額外資料項、該等額外資料項之該等重構及給定參考回饋提供給一第三神經網路以引起基於該等額外資料項、該等額外資料項之該等重構及該給定參考回饋訓練該第三神經網路,以產生該等額外資料項之各額外資料項與對應於該額外資料項之該重構類似之一指示;及將該第一資料項及該第一資料項之該重構提供給該第三神經網路以引起該第三神經網路評估該第一資料項與該第一資料項之該重構之間的該等差異,該第三神經網路基於該第一資料項與該第一資料項之該重構之間的該等差異產生該第一資料項與該第一資料項之該重構不類似之一指示,其中偵測該異常包括基於由該第三神經網路產生之該指示偵測該第一資料項中之該異常。
  5. 如請求項1之方法,其中該第一神經網路經組態以在該第一神經網路之該更新之後自該等資料項產生該等資料項之額外隱藏表示,該方法進一步包括:將該等資料項之該等額外隱藏表示提供給該第二神經網路以引起該第二神經網路自該等資料項之該等額外隱藏表示產生該等資料項之額外重構;及將該等資料項之該等額外重構作為參考回饋提供給該第一神經網路以引起該第一神經網路依據該等資料項評估該等資料項之該等額外重構,該第一神經網路基於該第一神經網路對該等資料項之該等額外重構之評估進一步更新該第一神經網路之一或多個表示產生相關組態。
  6. 如請求項5之方法,其進一步包括:將該等資料項、該等資料項之該等額外重構及給定參考回饋提供給一第三神經網路以引起基於該等資料項、該等資料項之該等額外重構及該給定參考回饋訓練該第三神經網路,以產生該等資料項之各資料項與對應於該資料項之該額外重構類似之一指示;及將該第一資料項及該第一資料項之該重構提供給該第三神經網路以引起該第三神經網路評估該第一資料項與該第一資料項之該重構之間的該等差異,該第三神經網路基於該第一資料項與該第一資料項之該重構之間的該等差異產生該第一資料項與該第一資料項之該重構不類似之一指示,其中偵測該異常包括基於由該第三神經網路產生之該指示偵測該第一資料項中之該異常。
  7. 如請求項6之方法,其中該第三神經網路產生該第一資料項之哪些部分與該第一資料項之該重構不類似之一或多個指示,且其中偵測該異常包括基於由該第三神經網路產生之該一或多個指示偵測該第一資料項中之該異常。
  8. 如請求項7之方法,其中該第三神經網路產生該第一資料項之哪些部分與該第一資料項之該重構類似之一或多個額外指示,且其中偵測該異常包括基於該一或多個指示及由該第三神經網路產生 之該一或多個額外指示偵測該第一資料項中之該異常。
  9. 如請求項5之方法,其進一步包括:判定對使得該等對之各者包括該等資料項之一者及該等資料項之另一者之額外重構;將該等對提供給一第三神經網路以引起該第三神經網路相對於該等對之各者產生該對之該對應資料項與額外重構是否類似之一指示;將給定參考回饋提供給該第三神經網路以引起該第三神經網路依據該給定參考回饋評估該等所產生指示,該給定參考回饋指示該等對之各者之該對應資料項與額外重構不類似,該第三神經網路基於該第三神經網路對該等所產生指示之評估更新該第三神經網路之一或多個組態;及將該第一資料項及該第一資料項之該重構提供給該第三神經網路以引起該第三神經網路評估該第一資料項與該第一資料項之該重構之間的該等差異,該第三神經網路基於該第一資料項與該第一資料項之該重構之間的該等差異產生該第一資料項與該第一資料項之該重構不類似之一指示,其中偵測該異常包括基於由該第三神經網路產生之該指示偵測該第一資料項中之該異常。
  10. 如請求項1之方法,其進一步包括:判定資料項之子集使得該等資料項子集之各者包括該等資料項之至少兩個資料項;將該等資料項子集提供給一第三神經網路以引起該第三神經網路相對於該等資料項子集之各者產生該資料項子集之該兩個資料項是否類似之 一指示;將給定參考回饋提供給該第三神經網路以引起該第三神經網路依據該給定參考回饋評估該等所產生指示,該給定參考回饋指示該等資料項子集之各者之該兩個資料項不類似,該第三神經網路基於該第三神經網路對該等所產生指示之評估更新該第三神經網路之一或多個組態;及將該第一資料項及該第一資料項之該重構提供給該第三神經網路以引起該第三神經網路評估該第一資料項與該第一資料項之該重構之間的該等差異,該第三神經網路基於該第一資料項與該第一資料項之該重構之間的該等差異產生該第一資料項與該第一資料項之該重構不類似之一指示,其中偵測該異常包括基於由該第三神經網路產生之該指示偵測該第一資料項中之該異常。
  11. 如請求項1之方法,其進一步包括:取消強調該第一資料項與該第一資料項之該重構之間的該等差異之一或多者,其中偵測該異常包括基於該一或多個經取消強調差異及該第一資料項與該第一資料項之該重構之間的該等差異之一或多個其他者偵測該第一資料項中之該異常。
  12. 如請求項1之方法,其進一步包括:強調該第一資料項與該第一資料項之該重構之間的該等差異之一或多者,其中偵測該異常包括基於該一或多個經強調差異及該第一資料項與 該第一資料項之該重構之間的該等差異之一或多個其他者偵測該第一資料項中之該異常。
  13. 如請求項1之方法,其進一步包括:取消強調該第一資料項與該第一資料項之該重構之間的該等差異之一或多者;及強調該第一資料項與該第一資料項之該重構之間的該等差異之一或多個其他者,其中偵測該異常包括基於該一或多個經取消強調差異及該一或多個經強調差異偵測該第一資料項中之該異常。
  14. 一種促進異常偵測之系統,該系統包括:一電腦系統,其包括執行電腦程式指令之一或多個處理器,該等電腦程式指令在被執行時引起該電腦系統:獲得對應於一概念之資料項;將該等資料項提供給一第一模型以引起該第一模型自該等資料項產生該等資料項之隱藏表示;將該等資料項之該等隱藏表示提供給一第二模型以引起該第二模型自該等資料項之該等隱藏表示產生該等資料項之重構;將該等資料項之該等重構作為參考回饋提供給該第一模型以引起該第一模型對該等資料項評估該等資料項之該等重構,該第一模型基於該第一模型對該等資料項之該等重構之評估更新該第一模型之一或多個表示產生相關組態(representation-generation-related configurations);在提供該等資料項之該等重構之後,執行以下操作:將一第一資料項提供給該第一模型以引起該第一模型自該第一資料項產生該第一資料項之一隱藏表示;將該第一資料項之該隱藏表示提供給該第二模型以引起該第二模型自該第一資料項之該隱藏表示產生該第一資料項之一重構;及基於該第一資料項與該第一資料項之該重構之間的差異偵測該第一資料項中之一異常。
  15. 如請求項14之系統,其中該第一模型經組態以在該第一模型之該更新之後自該等資料項產生該等資料項之額外隱藏表示,其中引起該電腦系統:將該等資料項之該等額外隱藏表示提供給該第二模型以引起該第二模型自該等資料項之該等額外隱藏表示產生該等資料項之額外重構;及將該等資料項之該等額外重構作為參考回饋提供給該第一模型以引起該第一模型依據該等資料項評估該等資料項之該等額外重構,該第一模型基於該第一模型對該等資料項之該等額外重構之評估進一步更新該第一模型之一或多個表示產生相關組態。
  16. 如請求項15之系統,其中引起該電腦系統:將該等資料項、該等資料項之該等額外重構及給定參考回饋提供給一第三模型以引起基於該等資料項、該等資料項之該等額外重構及該給定 參考回饋訓練該第三模型以產生該等資料項之各資料項與對應於該資料項之該額外重構類似之一指示;及將該第一資料項及該第一資料項之該重構提供給該第三模型以引起該第三模型評估該第一資料項與該第一資料項之該重構之間的該等差異,該第三模型基於該第一資料項與該第一資料項之該重構之間的該等差異產生該第一資料項與該第一資料項之該重構不類似之一指示,其中偵測該異常包括基於由該第三模型產生之該指示偵測該第一資料項中之該異常。
  17. 一種促進異常偵測之系統,該系統包括:一第一模型,其經組態以自資料項產生該等資料項之隱藏表示,該等資料項對應於一概念;一第二模型,其經組態以自該等資料項之該等隱藏表示產生該等資料項之重構;其中該第一模型經組態以:對該等資料項評估該等資料項之該等重構;及基於該等資料項之該等重構之該評估,更新該第一模型之一或多個表示產生相關組態;且其中在該第一模型之該更新之後,該第一模型經組態以自一第一資料項產生該第一資料項之一隱藏表示;且其中該第二模型經組態以自該第一資料項之該隱藏表示產生該第一資料項之一重構;及至少一個處理器,其經組態以基於該第一資料項與該第一資料項之 該重構之間的差異偵測該第一資料項中之一異常。
  18. 如請求項17之系統,其中在該第一模型之該更新之後,該第一模型經組態以:自該等資料項產生該等資料項之額外隱藏表示;其中該第二模型經組態以自該等資料項之該等額外隱藏表示產生該等資料項之額外重構;且其中該第一模型經組態以:依據該等資料項評估該等資料項之該等額外重構;及基於該等資料項之該等額外重構之該評估進一步更新該第一模型之一或多個表示產生相關組態。
  19. 如請求項18之系統,其進一步包括:一第三模型,其經組態以:基於以下各者更新該第三模型之一或多個組態:(i)該等資料項,(ii)該等資料項之該等額外重構,及(iii)指示該等資料項之各資料項與對應於該資料項之該額外重構類似之參考回饋;及基於該第一資料項與該第一資料項之該重構之間的差異產生該第一資料項與該第一資料項之該重構不類似之一指示;且其中偵測該異常包括基於由該第三模型產生之該指示偵測該第一資料項中之該異常。
  20. 如請求項19之系統,其中該第三模型經組態以產生該第一資料項之哪些部分與該第一資 料項之該重構不類似之一或多個指示,且其中偵測該異常包括基於由該第三模型產生之該一或多個指示偵測該第一資料項中之該異常。
TW107140790A 2017-11-17 2018-11-16 用於經由多預測模型架構之異常偵測之系統與方法 TWI709852B (zh)

Applications Claiming Priority (6)

Application Number Priority Date Filing Date Title
US201762587738P 2017-11-17 2017-11-17
US62/587,738 2017-11-17
US16/011,136 US20190156200A1 (en) 2017-11-17 2018-06-18 System and method for anomaly detection via a multi-prediction-model architecture
US16/011,136 2018-06-18
US16/029,747 US10121104B1 (en) 2017-11-17 2018-07-09 System and method for anomaly detection via a multi-prediction-model architecture
US16/029,747 2018-07-09

Publications (2)

Publication Number Publication Date
TW201923582A TW201923582A (zh) 2019-06-16
TWI709852B true TWI709852B (zh) 2020-11-11

Family

ID=63964051

Family Applications (1)

Application Number Title Priority Date Filing Date
TW107140790A TWI709852B (zh) 2017-11-17 2018-11-16 用於經由多預測模型架構之異常偵測之系統與方法

Country Status (5)

Country Link
US (2) US20190156200A1 (zh)
EP (1) EP3710999A4 (zh)
CN (1) CN111742332A (zh)
TW (1) TWI709852B (zh)
WO (1) WO2019099828A1 (zh)

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110163834B (zh) * 2018-05-14 2023-08-25 腾讯科技(深圳)有限公司 对象识别方法和装置及存储介质
US10748430B2 (en) * 2018-07-23 2020-08-18 Honeywell International Inc. Systems and methods for selective terrain deemphasis
US11538143B2 (en) * 2018-10-26 2022-12-27 Nec Corporation Fully convolutional transformer based generative adversarial networks
CN111861967B (zh) * 2019-04-18 2024-03-15 同方威视技术股份有限公司 用于检测辐射图像中的局部异常的网络、方法和装置
US11657269B2 (en) * 2019-05-23 2023-05-23 Salesforce.Com, Inc. Systems and methods for verification of discriminative models
US11165954B1 (en) * 2019-06-19 2021-11-02 Objectvideo Labs, Llc Scene-aware custom tuned video surveillance detection system
US11374952B1 (en) * 2019-09-27 2022-06-28 Amazon Technologies, Inc. Detecting anomalous events using autoencoders
US20210133594A1 (en) * 2019-10-30 2021-05-06 Dell Products L.P. Augmenting End-to-End Transaction Visibility Using Artificial Intelligence
US10733325B1 (en) 2019-11-15 2020-08-04 Capital One Services, Llc Securing user-entered text in-transit
TWI793391B (zh) * 2019-12-27 2023-02-21 廣達電腦股份有限公司 醫療影像辨識系統及醫療影像辨識方法
US11468294B2 (en) 2020-02-21 2022-10-11 Adobe Inc. Projecting images to a generative model based on gradient-free latent vector determination
TW202223834A (zh) * 2020-08-28 2022-06-16 加拿大商光譜優化股份有限公司 神經嵌入之攝影機影像視訊處理管道及神經網路訓練系統
EP3936877B1 (en) * 2021-01-22 2022-12-21 Rohde & Schwarz GmbH & Co. KG Measurement instrument, measurement system, and signal processing method
WO2022195657A1 (ja) * 2021-03-15 2022-09-22 日本電信電話株式会社 筋音抽出方法、筋音抽出装置及びプログラム
WO2023287921A1 (en) * 2021-07-13 2023-01-19 The Penn State Research Foundation Characterizing network scanners by clustering scanning profiles
US20240065609A1 (en) * 2022-08-24 2024-02-29 Taipei Medical University Methods and devices of generating predicted brain images
CN115834453B (zh) * 2023-02-14 2023-06-02 浙江德塔森特数据技术有限公司 手持协议检测终端的协议检测方法和手持协议检测终端
TWI823783B (zh) * 2023-02-22 2023-11-21 國立成功大學 視網膜狀態預測模型的建立方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI223171B (en) * 2001-06-05 2004-11-01 Hewlett Packard Co System for classifying files of non-textual subject data, method for categorizing files of non-textual data and method for identifying a class for data file at a classification node
TWI452477B (zh) * 2011-04-22 2014-09-11 Univ Nat Sun Yat Sen 以模糊相似度與k最近鄰居法為基礎之多標籤文件分類方法
US20150254555A1 (en) * 2014-03-04 2015-09-10 SignalSense, Inc. Classifying data with deep learning neural records incrementally refined through expert input
US20150254330A1 (en) * 2013-04-11 2015-09-10 Oracle International Corporation Knowledge-intensive data processing system
US20160034809A1 (en) * 2014-06-10 2016-02-04 Sightline Innovation Inc. System and method for network based application development and implementation
TW201636905A (zh) * 2015-01-22 2016-10-16 前進公司 神經網路及神經網路訓練的方法

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7027953B2 (en) * 2002-12-30 2006-04-11 Rsl Electronics Ltd. Method and system for diagnostics and prognostics of a mechanical system
EP3061063A4 (en) * 2013-10-22 2017-10-11 Eyenuk, Inc. Systems and methods for automated analysis of retinal images
US10832138B2 (en) * 2014-11-27 2020-11-10 Samsung Electronics Co., Ltd. Method and apparatus for extending neural network
US11080587B2 (en) * 2015-02-06 2021-08-03 Deepmind Technologies Limited Recurrent neural networks for data item generation
US10579923B2 (en) * 2015-09-15 2020-03-03 International Business Machines Corporation Learning of classification model
US10552727B2 (en) * 2015-12-15 2020-02-04 Deep Instinct Ltd. Methods and systems for data traffic analysis
US10891541B2 (en) * 2016-05-16 2021-01-12 Canon Kabushiki Kaisha Devices, systems, and methods for feature encoding
US20180197317A1 (en) * 2017-01-06 2018-07-12 General Electric Company Deep learning based acceleration for iterative tomographic reconstruction

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI223171B (en) * 2001-06-05 2004-11-01 Hewlett Packard Co System for classifying files of non-textual subject data, method for categorizing files of non-textual data and method for identifying a class for data file at a classification node
TWI452477B (zh) * 2011-04-22 2014-09-11 Univ Nat Sun Yat Sen 以模糊相似度與k最近鄰居法為基礎之多標籤文件分類方法
US20150254330A1 (en) * 2013-04-11 2015-09-10 Oracle International Corporation Knowledge-intensive data processing system
US20150254555A1 (en) * 2014-03-04 2015-09-10 SignalSense, Inc. Classifying data with deep learning neural records incrementally refined through expert input
US20160034809A1 (en) * 2014-06-10 2016-02-04 Sightline Innovation Inc. System and method for network based application development and implementation
TW201636905A (zh) * 2015-01-22 2016-10-16 前進公司 神經網路及神經網路訓練的方法

Also Published As

Publication number Publication date
WO2019099828A1 (en) 2019-05-23
US10121104B1 (en) 2018-11-06
EP3710999A4 (en) 2021-09-08
US20190156200A1 (en) 2019-05-23
TW201923582A (zh) 2019-06-16
EP3710999A1 (en) 2020-09-23
CN111742332A (zh) 2020-10-02

Similar Documents

Publication Publication Date Title
TWI709852B (zh) 用於經由多預測模型架構之異常偵測之系統與方法
Altaf et al. Going deep in medical image analysis: concepts, methods, challenges, and future directions
Achilles et al. Convolutional neural networks for real-time epileptic seizure detection
An et al. Medical image segmentation algorithm based on feedback mechanism CNN
Nayak et al. Firefly algorithm in biomedical and health care: advances, issues and challenges
Jiang et al. Context-aware mouse behavior recognition using hidden markov models
US10863912B2 (en) System and method for analyzing electroencephalogram signals
Rahman et al. ECG classification for detecting ECG arrhythmia empowered with deep learning approaches
CN107563997B (zh) 一种皮肤病诊断系统、构建方法、分类方法和诊断装置
Choi et al. Multimodal attention network for continuous-time emotion recognition using video and EEG signals
Chagas et al. A new approach for the detection of pneumonia in children using CXR images based on an real-time IoT system
Kramer et al. Reconstructing nonlinear dynamical systems from multi-modal time series
Samyoun et al. Stress detection via sensor translation
Nafiz et al. Automated Detection of COVID-19 Cough Sound using Mel-Spectrogram Images and Convolutional Neural Network
Rudnicka et al. Artificial Intelligence-Based Algorithms in Medical Image Scan Segmentation and Intelligent Visual Content Generation—A Concise Overview
KR101948701B1 (ko) 피검체의 뇌 구조를 기술하는 잠재 변수에 기반하여 상기 피검체의 뇌질환을 판정하는 방법 및 이를 이용한 장치
Zhang et al. Quantification of advanced dementia patients’ engagement in therapeutic sessions: An automatic video based approach using computer vision and machine learning
US20220391760A1 (en) Combining model outputs into a combined model output
Shu et al. Computational model of primary visual cortex combining visual attention for action recognition
Ngô et al. Deception detection by 2d-to-3d face reconstruction from videos
KR20200004939A (ko) 스마트 폰 기반의 홍채를 통한 건강 관리 방법 및 장치
Gyawali et al. Learning disentangled representation from 12-lead electrograms: application in localizing the origin of Ventricular Tachycardia
Guillermo et al. Data augmentation techniques in time series domain: a survey and taxonomy
US20240070440A1 (en) Multimodal representation learning
Hu et al. Personalized Heart Disease Detection via ECG Digital Twin Generation