TW202326510A - 持續的兩階段活動辨識 - Google Patents

持續的兩階段活動辨識 Download PDF

Info

Publication number
TW202326510A
TW202326510A TW111131647A TW111131647A TW202326510A TW 202326510 A TW202326510 A TW 202326510A TW 111131647 A TW111131647 A TW 111131647A TW 111131647 A TW111131647 A TW 111131647A TW 202326510 A TW202326510 A TW 202326510A
Authority
TW
Taiwan
Prior art keywords
predictive model
sequence data
state
data
activity state
Prior art date
Application number
TW111131647A
Other languages
English (en)
Inventor
藤迪言
韓君生
雷漢艾哈邁德 賽義德
拉什米 庫爾卡尼
Original Assignee
美商高通公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 美商高通公司 filed Critical 美商高通公司
Publication of TW202326510A publication Critical patent/TW202326510A/zh

Links

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01PMEASURING LINEAR OR ANGULAR SPEED, ACCELERATION, DECELERATION, OR SHOCK; INDICATING PRESENCE, ABSENCE, OR DIRECTION, OF MOVEMENT
    • G01P13/00Indicating or recording presence, absence, or direction, of movement
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01CMEASURING DISTANCES, LEVELS OR BEARINGS; SURVEYING; NAVIGATION; GYROSCOPIC INSTRUMENTS; PHOTOGRAMMETRY OR VIDEOGRAMMETRY
    • G01C21/00Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00
    • G01C21/20Instruments for performing navigational calculations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/20Movements or behaviour, e.g. gesture recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Remote Sensing (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Theoretical Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Medical Informatics (AREA)
  • Psychiatry (AREA)
  • Social Psychology (AREA)
  • Human Computer Interaction (AREA)
  • Databases & Information Systems (AREA)
  • Artificial Intelligence (AREA)
  • Automation & Control Theory (AREA)
  • Image Analysis (AREA)
  • Radar Systems Or Details Thereof (AREA)
  • Measurement And Recording Of Electrical Phenomena And Electrical Characteristics Of The Living Body (AREA)

Abstract

一種用於串流序列資料的節能狀態變化偵測和分類的方法包括以下步驟:經由第一預測模型從感測器接收序列資料。第一預測模型基於序列資料,決定活動狀態的變化。向第二預測傳輸活動狀態已經變化的指示。第二預測模型基於序列資料,決定更新的活動狀態。向第一預測模型發送更新的活動狀態,之後第二預測進入不活動狀態。

Description

持續的兩階段活動辨識
本專利申請案主張享受2021年8月31日提出申請的、名稱為「PERSISTENT TWO-STAGE ACTIVITY RECOGNITION」的美國專利申請案第17/463,451的優先權,該申請案的全部揭示內容以引用方式明確地併入本文。
大體而言,本案內容的各態樣係關於預測,更具體而言,本案內容的各態樣係關於活動辨識。
活動辨識是預測人或物體的運動的問題。活動辨識意欲從一系列觀察中偵測和分類人類的行為。對此種使用者活動上下文的理解具有廣泛的適用性,例如醫療保健、導航、通知和安全性態樣的用例。然而,許多應用涉及連續的觀察和分類。因此,此種活動辨識系統涉及大量的功率和記憶體消耗。當活動辨識應用於諸如智慧手機之類的行動設備環境時,該等成本更加嚴重。
本案內容分別在獨立請求項中闡述。在從屬請求項中描述了本案內容的一些態樣。
在本案內容的一個態樣,提供了一種用於節能狀態變化偵測和活動辨識的方法。該方法包括以下步驟:經由第一預測模型從感測器接收序列資料。該方法亦包括以下步驟:經由該第一預測模型,基於該序列資料來決定活動狀態的變化。另外,該方法包括以下步驟:向第二預測模型傳輸該活動狀態已經變化的指示,該第二預測模型基於該序列資料決定更新的活動狀態。
在本案內容的一個態樣,提供了一種用於節能狀態變化偵測和活動辨識的裝置。該裝置包括記憶體和耦合到該記憶體的一或多個處理器。該處理器被配置為經由第一預測模型從感測器接收序列資料。該處理器亦被配置為:經由該第一預測模型,基於該序列資料來決定活動狀態的變化。另外,該處理器被配置為:向第二預測模型傳輸該活動狀態已經變化的指示,該第二預測模型基於該序列資料決定更新的活動狀態。
在本案內容的一個態樣,提供了一種用於節能狀態變化偵測和活動辨識的裝置。該裝置包括:用於經由第一預測模型從感測器接收序列資料的構件。該裝置亦包括:用於經由該第一預測模型,基於該序列資料來決定活動狀態的變化的構件。另外,該裝置包括:用於向第二預測模型傳輸該活動狀態已經變化的指示的構件,該第二預測模型基於該序列資料決定更新的活動狀態。
在本案內容的一個態樣,提供了一種非暫時性電腦可讀取媒體。該電腦可讀取媒體上編碼有用於節能狀態變化偵測和活動辨識的程式碼。該程式碼由處理器執行,並且包括用於經由第一預測模型從感測器接收序列資料的代碼。該程式碼亦包括:用於經由該第一預測模型,基於該序列資料來決定活動狀態的變化的代碼。另外,該程式碼包括:用於向第二預測模型傳輸該活動狀態已經變化的指示的代碼,該第二預測模型基於該序列資料決定更新的活動狀態。
在本案內容的一個態樣,提供了一種用於節能狀態變化偵測和活動辨識的方法。該方法包括以下步驟:從感測器接收序列資料。該方法亦包括以下步驟:從第一預測模型接收指示活動狀態是否已經從先前活動狀態變化的狀態變化事件。另外,該方法包括以下步驟:回應於該狀態變化事件指示該活動狀態已經變化,處理該序列資料以決定該序列資料的分類。
在本案內容的一個態樣,提供了一種用於節能狀態變化偵測和活動辨識的裝置。該裝置包括記憶體和耦合到該記憶體的一或多個處理器。該處理器被配置為從感測器接收序列資料。該處理器被配置為從第一預測模型接收指示活動狀態是否已經從先前活動狀態變化的狀態變化事件。另外,該處理器被配置為:回應於該狀態變化事件指示該活動狀態已經變化,處理該序列資料以決定該序列資料的分類。
在本案內容的一個態樣,提供了一種用於節能狀態變化偵測和活動辨識的裝置。該裝置包括:用於從感測器接收序列資料的構件。該裝置亦包括:用於從第一預測模型接收指示活動狀態是否已經從先前活動狀態變化的狀態變化事件的構件。另外,該裝置包括:用於回應於該狀態變化事件指示該活動狀態已經變化,處理該序列資料以決定該序列資料的分類的構件。
在本案內容的一個態樣,提供了一種非暫時性電腦可讀取媒體。該電腦可讀取媒體上編碼有用於節能狀態變化偵測和活動辨識的程式碼。該程式碼由處理器執行,並且包括用於從感測器接收序列資料的代碼。該程式碼亦包括:用於從第一預測模型接收指示活動狀態是否已經從先前活動狀態變化的狀態變化事件的代碼。另外,該程式碼包括:用於回應於該狀態變化事件指示該活動狀態已經變化,處理該序列資料以決定該序列資料的分類的代碼。
上述內容相當廣泛地概述了根據本案內容的實例的特徵和技術優勢,以便更好地理解以下的詳細描述。將描述其他特徵和優點。所揭示的概念和具體實例可以容易地用作修改或設計其他結構以實現本案內容的相同目的的基礎。此種等效結構並不脫離所附請求項的保護範疇。當結合附圖考慮時,經由以下描述將更好地理解所揭示的概念的特徵(包括其組織和操作方法態樣)以及相關聯的優點。提供每個附圖僅用於說明和描述目的,其並不意欲作為對本發明的限制的定義。
下文結合附圖闡述的具體實施方式意欲作為對各種配置的描述,而不意欲表示可以實踐所描述的概念的唯一配置。為了對各種概念有一個透徹理解,具體實施方式包括一些特定的細節。但是,對於熟習此項技術者而言顯而易見的是,可以在不使用該等特定細節的情況下實現該等概念。在一些例子中,為了避免對於該等概念造成模糊,以方塊圖形式圖示公知的結構和元件。
基於該等教示,熟習此項技術者應當理解,本案內容的保護範疇意欲覆蓋本案內容的任何態樣,無論是獨立於本案內容的任何其他態樣實施還是結合本案內容的任何其他態樣來實施。例如,使用本文闡述的任意數量的態樣可以實現裝置或可以實現方法。此外,本案內容的保護範疇意欲覆蓋此種裝置或方法,此種裝置或方法可以經由使用其他結構、功能,或者除了所闡述的本案內容的各個態樣的結構和功能或不同於所闡述的本案內容的各個態樣的結構和功能來實現。應當理解的是,所揭示的揭示內容的任何態樣可以經由請求項的一或多個元素來體現。
本文所使用的「示例性的」一詞意味著「用作示例、實例或說明」。本文中描述為「示例性」的任何態樣不應被解釋為比其他態樣更佳或更具優勢。
儘管描述了特定的態樣,但是該等態樣的許多變化和排列亦落入本案內容的保護範疇內。儘管提及了較佳態樣的一些益處和優點,但本案內容的保護範疇並不意欲限於特定的好處、用途或目標。相反,本案內容的各態樣意欲廣泛地適用於不同的技術、系統配置、網路和協定,其中一些在附圖和較佳態樣的以下描述中以實例的方式圖示。具體實施方式和附圖僅是對本案內容的說明而非限制,本案內容的保護範疇由所附請求項及其均等物進行界定。
例如,諸如相機預覽、視訊檔案、音訊記錄、慣性量測單元(IMU)資料、雷達資料和WiFi資料之類的許多串流資料輸入源,提供具有大量時間相似度的序列資料或者按時間片序列組織的資料。亦即,此類輸入源的連續時間片中的許多資料並且在某些情況下大多數資料處於相同的分佈中,並且一小部分的時間片改變分佈,從而可以指示新的分類。因此,可能針對許多連續的時間片,花費大量資源來重複計算預測或分類,卻產生相同的結果。
為了提高能量效率並保持模型準確度,本案內容的各態樣針對於兩階段順序活動變化偵測和活動辨識系統。在一些態樣,狀態變化偵測元件可以整合到諸如智慧手機、健身追蹤器、物聯網路(IoT)設備或感測器之類的計算設備中。
另外,在一些態樣,預測模型可以為可能的推斷產生分數,並隨著時間累積該等分數。例如,預測模型可以是邏輯回歸模型。在一些態樣,亦可以採用提升學習方法。例如,增強的決策樹可以為實現提供高效的硬體友好模型。在一些實例中,多個弱學習器可以產生預測。每個弱學習器可以是一個決策樹。可以對每個弱學習器的預測進行加權並組合以產生強預測。在一些態樣,例如,推斷模型可以包括人工神經網路(例如,迴旋神經網路)。
圖1圖示晶片上系統(SOC)100的示例性實現,其可以包括被配置為根據本案內容的某些態樣來偵測和分類活動狀態變化的中央處理單元(CPU)102或多核CPU。變數(例如,神經信號和突觸權重)、與計算設備相關聯的系統參數(例如,具有權重的神經網路)、延遲、頻段資訊和任務資訊可以儲存在與神經處理單元(NPU)108相關聯的記憶體區塊中、儲存在與CPU 102相關聯的記憶體區塊中、儲存在與圖形處理單元(GPU)104相關聯的記憶體區塊中、儲存在與數位信號處理器(DSP)106相關聯的記憶體區塊中、儲存在記憶體區塊118中,或者可以分佈在多個區塊中。在CPU 102處執行的指令可以從與CPU 102相關聯的程式記憶體中載入,或者可以從記憶體區塊118中載入。
SOC 100亦可以包括為特定功能定製的其他處理區塊,例如GPU 104、DSP 106、連接區塊110(其可以包括第五代(5G)連接、第四代長期進化(4G LTE)連接、Wi-Fi連接、USB連接、藍芽連接等),以及可以例如偵測和辨識手勢的多媒體處理器112。在一種實現方式中,在CPU、DSP及/或GPU中實現NPU。SOC 100亦可以包括感測器處理器114、圖像信號處理器(ISP)116及/或導航模組120(其可以包括全球定位系統)。
SOC 100可以基於ARM指令集。在本案內容的一個態樣,載入到CPU 102中的指令可以包括:用於經由第一預測模型從感測器接收序列資料的代碼。載入到CPU 102中的指令亦可以包括:用於經由第一預測模型,基於序列資料來決定活動狀態的變化的代碼。另外,載入到CPU 102中的指令可以包括:用於向第二預測模型傳輸活動狀態已經變化的指示的代碼。第二預測模型基於序列資料來決定更新的活動狀態。
SOC 100可以基於ARM指令集。在本案內容的一個態樣,載入到CPU 102中的指令可以包括:用於從感測器接收序列資料的代碼。載入到CPU 102中的指令亦可以包括:用於從第一預測模型接收指示活動狀態是否已經從先前活動狀態變化的狀態變化事件的代碼。另外,載入到CPU 102中的指令可以包括:用於回應於指示活動狀態已經變化的狀態變化事件,處理序列資料以決定序列資料的分類的代碼。
深度學習架構可以經由以下方式來執行物體辨識任務:學習在每一層中以連續更高抽象級別表示輸入,從而構建輸入資料的有用特徵表示。經由此種方式,深度學習解決了傳統機器學習的主要瓶頸。在深度學習出現之前,用於物體辨識問題的機器學習方法嚴重依賴於人類工程特徵,可能與淺分類器相結合。例如,淺分類器可以是二分類線性分類器,其中可以將特徵向量分量的加權和與閾值進行比較,以預測輸入屬於何者分類。人類工程特徵可以是具有領域專業知識的工程師針對特定問題領域量身定製的範本或核心。相比之下,深度學習架構可以學習表示與人類工程師可能設計的特徵相似的特徵,但需要經由訓練。此外,深度網路可以學習表示和辨識人類可能沒有考慮過的新型特徵。
深度學習架構可以學習特徵的層次結構。例如,若呈現視覺資料,第一層可以學習辨識輸入串流中相對簡單的特徵,例如邊緣。在另一個實例中,若呈現聽覺資料,則第一層可以學習辨識特定頻率中的頻譜功率。第二層以第一層的輸出作為輸入,可以學習辨識特徵的組合(例如,視覺資料的簡單形狀或聽覺資料的聲音組合)。例如,更高層可以學習表示視覺資料中的複雜形狀,或者表示聽覺資料中的單詞。更高層可以學習辨識常見的視覺物體或口語短語。
當應用於具有自然分層結構的問題時,深度學習架構可能表現得特別好。例如,機動車輛的分類可以受益於首先學習辨識車輪、擋風玻璃和其他特徵。可以在更高層以不同的方式組合該等特徵,以辨識汽車、卡車和飛機。
神經網路可以被設計成具有多種連接模式。在前饋網路中,將資訊從較低層傳遞到較高層,給定層之每一者神經元與更高層中的神經元通訊。如前述,可以在前饋網路的連續層中建立分層表示。神經網路亦可以具有循環或回饋(亦稱為自頂向下)連接。在循環連接中,給定層中神經元的輸出可以傳送到同一層中的另一個神經元。循環架構可以有助於辨識跨越多於一個輸入資料區塊的模式,該等輸入資料區塊按順序遞送給神經網路。從給定層中的神經元到較低層中的神經元的連接稱為回饋(或自頂向下)連接。當對高級概念的辨識有助於區分輸入的特定低級特徵時,具有許多回饋連接的網路可以是有所幫助的。
神經網路的層之間的連接可以是全連接的或局部連接的。圖2A圖示全連接神經網路202的實例。在全連接神經網路202中,第一層中的神經元可以將其輸出傳送到第二層之每一者神經元,使得第二層之每一者神經元將接收來自第一層的每個神經元的輸入。圖2B圖示局部連接神經網路204的實例。在局部連接神經網路204中,第一層中的神經元可以連接到第二層中的有限數量的神經元。更一般地,局部連接神經網路204的局部連接層可以被配置為使得一個層之每一者神經元將具有相同或相似的連接模式,但連接強度可能具有不同的值(例如,210、212、214和216)。局部連接的連接模式可以在較高層中產生空間上不同的感受場,此情形是因為給定區域中的較高層神經元可以接收經由訓練調整到網路總輸入的受限部分的屬性的輸入。
局部連接的神經網路的一個實例是迴旋神經網路。圖2C圖示迴旋神經網路206的實例。迴旋神經網路206可以被配置為使得與第二層之每一者神經元的輸入相關聯的連接強度是共享的(例如,208)。迴旋神經網路可能非常適合於輸入的空間位置有意義的問題。
一種類型的迴旋神經網路是深度迴旋網路(DCN)。圖2D圖示DCN 200的詳細實例,該DCN 200被設計為從圖像擷取設備230(例如,車載攝像機)輸入的圖像226中辨識視覺特徵。可以對當前實例的DCN 200進行訓練,以辨識交通標誌和交通標誌上提供的數值。當然,可以針對其他任務來訓練DCN 200,例如辨識車道標記或辨識交通信號燈。
可以用監督學習來訓練DCN 200。在訓練期間,可以向DCN 200呈現圖像,例如限速標誌的圖像226,隨後可以計算前向傳遞以產生輸出222。DCN 200可以包括特徵提取部分和分類部分。在接收到圖像226之後,迴旋層232可以將迴旋核(未圖示)應用於圖像226,以產生第一組特徵圖218。作為一個實例,用於迴旋層232的迴旋核可以是5x5核,其產生28x28的特徵圖。在本實例中,因為在第一組特徵圖218中產生了四個不同的特徵圖,所以在迴旋層232處將四個不同的迴旋核應用於圖像226。迴旋核亦可以稱為濾波器或迴旋濾波器。
可以經由最大池化層(未圖示)對第一組特徵圖218進行二次取樣以產生第二組特徵圖220。最大池化層減小了第一組特徵圖218的大小。亦即,第二組特徵圖220的大小(例如,14x14)小於第一組特徵圖218的大小(例如,28x28)。減小的大小為後續層提供了類似的資訊,同時減少了記憶體消耗。可以經由一或多個後續迴旋層(未圖示)進一步迴旋第二組特徵圖220,以產生一組或多組後續的特徵圖(未圖示)。
在圖2D的實例中,對第二組特徵圖220進行迴旋以產生第一特徵向量224。此外,對第一特徵向量224進一步迴旋以產生第二特徵向量228。第二特徵向量228的每個特徵可以包括對應於圖像226的可能特徵的數值,例如「標誌」、「60」和「100」。softmax函數(未圖示)可以將第二特徵向量228中的數值轉換為概率。如此,DCN 200的輸出222是圖像226包括一或多個特徵的概率。
在本實例中,輸出222中「標誌」和「60」的概率高於輸出222的其他值(例如,「30」、「40」、「50」、「70」、「80」、「90」和「100」)的概率。在訓練之前,DCN 200產生的輸出222可能是不正確的。因此,可以計算輸出222和目標輸出之間的誤差。目標輸出是圖像226的基本事實(例如,「標誌」和「60」)。隨後可以調整DCN 200的權重,使得DCN 200的輸出222更接近於目標輸出。
為了調整權重,學習演算法可以計算權重的梯度向量。梯度可以指示在調整權重時誤差將增加或減少的量。在頂層,梯度可以直接對應於連接倒數第二層中啟用的神經元和輸出層中的神經元的權重值。在較低層中,梯度可以取決於權重的值和計算的較高層的誤差梯度。隨後可以調整權重以減少誤差。此種調整權重的方式可以稱為「反向傳播」,因為其涉及經由神經網路的「反向傳遞」。
在實踐中,可以在少量實例上計算權重的誤差梯度,使得計算的梯度接近真實的誤差梯度。此種近似方法可以稱為隨機梯度下降。可以重複隨機梯度下降,直到整個系統的可實現錯誤率停止下降或直到錯誤率達到目標水平為止。在學習之後,可以向DCN呈現新圖像(例如,圖像226的限速標誌),並且經由網路的前向傳遞可以產生被認為是DCN的推斷或預測的輸出222。
深度置信網路(DBN)是包含多層隱藏節點的概率模型。DBN可以用於提取訓練資料集的分層表示。可以經由堆疊受限玻爾茲曼機(RBM)層來獲得DBN。RBM是一種人工神經網路,其可以學習一組輸入的概率分佈。由於RBM可以在沒有關於每個輸入應歸入的類別資訊的情況下學習概率分佈,因此RBM通常用於無監督學習。使用混合的無監督和監督範式,可以以無監督方式訓練DBN的底部RBM並可以用作特徵提取器,並且可以以監督方式訓練頂部RBM(關於來自前一層的輸入和目標分類的聯合分佈)並可以用作分類器。
深度迴旋網路(DCN)是迴旋網路的網路,其配置有另外的池化層和正規化層。DCN在許多任務上皆取得了最先進的效能。DCN可以使用監督學習進行訓練,其中輸入和輸出目標對於許多實例皆是已知的,並用於經由使用梯度下降方法來修改網路的權重。
DCN可以是前饋網路。此外,如前述,在第一層中的神經元之間共享從DCN的第一層中的神經元到下一個更高層中的一組神經元的連接。DCN的前饋和共享連接可以用於快速處理。例如,與包含循環或回饋連接的類似大小的神經網路的計算負擔相比,DCN的計算負擔可能小得多。
可以認為迴旋網路的每一層的處理是空間不變的範本或基礎投影。若首先將輸入分解為多個通道(例如,彩色圖像的紅色、綠色和藍色通道),則可以認為在該輸入上訓練的迴旋網路是三維的,沿著圖像的軸有兩個空間維度,並且第三維用於擷取顏色資訊。可以考慮迴旋連接的輸出以在後續層中形成特徵圖,其中特徵圖(例如,220)的每個元素接收來自前一層中的一系列神經元(例如,特徵圖218)以及來自多個通道中的每一個通道的輸入。可以用非線性進一步處理(例如,校正,max(0, x))特徵圖中的值。可以進一步對來自相鄰神經元的值進行池化(其對應於下取樣),並且可以提供額外的局部不變性和降維。亦可以經由特徵圖中神經元之間的橫向抑制來應用正規化(其對應於白化)。
隨著更多標注資料點變得可用或隨著計算能力增加,深度學習架構的效能可以增加。通常使用比十五年前典型研究人員可用的計算資源多數千倍的計算資源,來訓練現代深度神經網路。新的架構和訓練範式可能進一步提升深度學習的效能。校正後的線性單元可以減少稱為梯度消失的訓練問題。新的訓練技術可以減少過度擬合,從而使更大的模型能夠實現更好的泛化。封裝技術可以抽象給定感受場中的資料,並進一步提高整體效能。
例如,如前述,諸如慣性量測單元(IMU)資料、相機預覽、視訊檔案、音訊記錄、雷達資料和WiFi資料之類的許多串流資料輸入源,提供具有大量時間相似度的序列資料。亦即,此類輸入源的連續資料點的許多資料並且在某些情況下大多數資料處於相同的分佈中,並且小數量的資料點改變分佈,從而可以指示新的分類。因此,可能針對許多連續的資料點,花費大量資源來重複計算分類,卻產生相同的結果。為了解決該等和其他挑戰,本案內容的各態樣涉及兩階段順序活動變化偵測和分類。
圖3是圖示根據本案內容的各態樣用於節能狀態變化偵測和分類的示例性系統300的方塊圖。如圖3中所示,示例性系統300可以包括第一階段302、第二階段304、客戶端應用程式306和感測器單元308。儘管將第一階段302、第二階段304、客戶端應用程式306和感測器單元308圖示為單獨的單元,但此情形僅僅是一個實例,以便於解釋。相反,例如,第一階段302、第二階段304、感測器單元308和客戶端應用程式306中的一或多個可以包括在諸如智慧手機之類的行動設備中。
可以經由預測模型來實現第一階段302。在一些態樣,可以將第一階段302建模為瑪律可夫決策過程。第一階段302可以被配置為從感測器單元308接收序列資料串流。感測器單元308可以包括慣性量測單元(IMU)、麥克風、照相機和其他感測器中的一或多個。例如,客戶端應用程式306可以是智慧手機導航應用程式或健康追蹤應用程式。與第二階段304相比,第一階段302可以是低功率和低複雜度的階段。第一階段302可以被配置為始終保持開啟,從而可以連續地接收感測器資料。此外,第一階段302可以連續地監測感測器資料以偵測序列資料中的活動變化。
第二階段304可以被配置為基於感測器資料,產生活動狀態的預測或預測推斷。可以經由預測模型來實現第二階段304。在一些態樣,第二階段304可以被配置為貝氏網路,並且可以提供概率活動上下文。例如,可以用例如DSP或GPU來處理第二階段304。第二階段304可以保持在關閉狀態或低功率狀態,直到第一階段302偵測到活動狀態的變化。亦即,第一階段302可以基於感測器資料來預測活動狀態(例如,步行、跑步、站立)是否已經變化。若第一階段302決定活動狀態已經變化,則第一階段302向第二階段304發送信號(例如,活動狀態變化事件),作為第二階段304喚醒並計算活動的推斷或分類的觸發。第二階段304可以向第一階段302發送狀態更新,因此第一階段302可以繼續監測感測器資料,以決定活動狀態是否從更新的活動狀態變化。在一些態樣,第二階段304亦可以向客戶端報告更新的活動分類。在將更新的活動狀態發送到第一階段302之後,第二階段304可以返回到關閉狀態或低功率狀態。
如所描述的,當沒有偵測到當前活動狀態的變化時,經由第二階段304連續計算活動上下文結果是不必要的。在示例性系統300中,使用第一階段302的順序偵測可以以更少的取樣(低延時)進行操作和執行,以達到預期的相同水平的偵測錯誤。此外,順序偵測有益地提供了一種簡單的機制,以經由累積對數概度比的閾值參數(λ)來權衡誤警率和偵測延時。
經由使用第一階段302應用順序活動變化偵測,可以減少誤警。當錯誤地指示活動狀態變化時,會發生誤警。例如,當活動狀態是站立時,但連續的感測器資料表明被追蹤的物體(例如,人)暫時坐立不安,使用一次性方法,可以認為活動狀態已經變化。因此,僅使用對應於坐立不安的資料,當活動狀態實際上沒有變化時,第一階段302可能錯誤地向第二階段304發出計算分類的信號。此舉可能導致過多的能量消耗。因此,代替追蹤所有可能的活動變化事件,可以計算和聚合表示偏離當前活動狀態的置信度的對數概度比函數。可以經由下式提供對數概度比函數: (1) (2) 其中 CumLLR t 是時間 t的累積對數概度比, CumLLR t -1是時間 t-1的累積對數概度比,λ是可以調整以滿足誤警/延時權衡的閾值參數, x t 是d維特徵向量,並且 是表示小於、大於或等於的運算元。
然而,在某些態樣,在順序偵測程序中使用的分類條件密度可能無法存取。此外,估計兩個密度函數(例如, p current activity( x t )、 p all other activities( x t ))隨後分別取該比率的對數,可能效率低下。一種更高效的方法可以是直接估計對數密度比函數,避免在取單個分佈尾部附近的兩個密度估計量之比時產生的誤差。可以使用如下所示的加法模型,直接估計對數概度比函數: (3) 其中 f m (∙)是弱學習器函數, α m 是與每個弱學習器函數相關的權重, M是弱學習器的數量。弱學習器是諸如一級決策樹之類的模型,其效能比猜測稍好。經由聚合多個弱學習器的結果,可以提升或改良模型的效能。增強決策樹提供了高效的硬體友好型實現,以及直接的準確性/大小權衡(增加/減少學習器的數量)。
在一些態樣,可以使用增強決策樹方法聚合特徵來改良特徵計算: (4) 其中 是每個決策樹的特徵選擇器。在一些態樣,對數概度比估計器可以是邏輯回歸模型或更複雜的神經網路參數化。
此外,可以經由隨著時間 t聚合對數概度比來改良特徵計算。然而,不是在每個時槽皆計算每個特徵並饋送到組合學習器中,而是可以如下所示地計算每個時槽的特徵子集: (5) 其中 S t 是在時間 t選擇的特徵子集。在一些態樣,可以經由隨機取樣或其他選擇策略來選擇該子集。因為特徵 x t 具有隨著時間的強相關性,所以可以執行特徵的稀疏子選擇,而不是一個接一個地選擇並計算每個特徵的預測。經由特徵時間分解來近似聚合的對數概度比統計,可以實現計算節省。
圖4和圖5是分別圖示根據本案內容的各態樣用於狀態變化偵測和分類的示例性架構的圖。參考圖4,圖示狀態變化偵測區塊(亦稱為第一階段)302的示例性架構。狀態變化偵測區塊302的示例性架構可以在輸入404處接收序列資料,例如經由一或多個感測器402(例如,圖1中所示的感測器114)。在一些態樣,輸入404可以包括用於臨時儲存由感測器402提供的序列資料的緩衝器。感測器402可以是一組慣性量測單元(IMU)感測器、麥克風、照相機、其他序列資料輸入,或者其組合。
序列資料亦可以經由預處理區塊406來進行預處理。例如,若序列資料包括IMU資料,則可能需要調整原始資料以考慮偏差(例如,加速度計偏差),或者安排或重新格式化資料以進行評估。可以將序列資料提供給特徵提取區塊408。
特徵提取區塊408可以從序列資料中提取一組特徵。在一些態樣,可以實現特徵提取區塊408以經由主成分分析、偏最小二乘法、其他降維技術等等來提取序列資料的特徵。在其他態樣,特徵提取區塊408可以實現為自編碼器。此外,在一些態樣,特徵提取區塊408可以實現為迴旋神經網路(例如,圖2C的迴旋神經網路206)。所提取的序列資料的特徵可以提供給預測區塊410。預測區塊410可以將提取的特徵與對應於一或多個活動狀態的模型參數414(例如,活動模式1模型參數、活動模式2模型參數、活動模式3模型參數或活動模式4模型參數)進行比較,以產生活動是否發生變化的預測推斷。例如,預測區塊410可以實現為決策樹,並且可以在每個時間步進計算式1的對數概度比函數。每個決策樹可以計算活動(例如,坐立不安、步行或騎自行車(腳踏車))的概率。在一些態樣,可以如式3中所示,估計對數概度比函數。
接下來,可以將計算的預測推斷提供給變化偵測區塊412。變化偵測區塊412可以將預測推斷與閾值參數λ進行比較,可以根據誤警和延時之間的權衡來調整閾值參數λ。例如,若預測推斷小於閾值參數,則可以決定狀態沒有變化。另一態樣,例如,若預測推斷高於閾值,則可以偵測到狀態變化。變化偵測區塊412可以輸出變化指示,該變化指示可以被傳輸到活動狀態分類區塊(亦稱為第二階段)304。
參考圖5,活動狀態分類區塊304亦可以被配置為經由輸入404來接收序列資料。可以經由一或多個感測器402(例如,圖1中所示的感測器114)來提供序列資料。感測器402可以是一組慣性量測單元(IMU)感測器、麥克風、照相機、其他序列資料輸入,或者其組合。此外,活動狀態分類區塊304可以從狀態變化偵測區塊302接收變化指示。然而,活動狀態分類區塊304可以保持在關閉或不活動狀態或低功率狀態,例如用於節省電力。活動狀態分類區塊304可以從變化偵測區塊412接收變化指示。若變化指示指出活動狀態沒有變化,則活動狀態分類區塊304可以保持在不活動或低功率狀態。
在另一態樣,若變化指示指出已偵測到狀態變化,則可以將活動狀態分類區塊304控制為活動狀態以恢復對序列資料的處理。活動狀態分類區塊304可以獲取序列資料,可以經由預處理區塊406對該序列資料進行預處理(例如,資料分割或格式化)。預測區塊520可以提取序列資料的特徵,並且基於一組模型參數524產生當前活動狀態(例如,坐立不安、步行、跑步、騎自行車)的預測。隨後,可以將預測提供給分類區塊522以產生當前時間步進的活動的分類。分類區塊522可以將分類提供給狀態變化偵測區塊302,以用於決定下一時間步進的序列資料是否指示從當前活動狀態的變化。在一些態樣,在提供分類之後,分類區塊522可以返回到不活動或低功率狀態。
圖6是圖示根據本案內容的各態樣的串流序列資料的節能狀態變化偵測和分類的方法600的流程圖。在方塊602中,方法600經由第一預測模型從感測器接收序列資料。例如,如參考圖5所描述的,第一階段502可以被配置為從感測器508接收序列資料串流。該等感測器可以是慣性量測單元(IMU)。在一些態樣,亦可以包括來自其他感測器(例如,麥克風或相機)的資料。
在方塊604處,方法600經由第一預測模型,基於序列資料決定活動狀態的變化。如參考圖5所描述的,第一階段502可以基於感測器資料來預測活動狀態(例如,步行、跑步、站立)是否已經變化。在一些態樣,基於累積對數概度比函數來決定活動狀態變化。例如,若累積對數概度比大於可調閾值參數,則可以決定活動狀態的變化。可以調整閾值參數以權衡誤警和計算速度。
在方塊606處,方法600向第二預測模型傳輸活動狀態已經變化的指示。第二預測模型基於序列資料來決定更新的活動狀態。例如,如所描述的,若第一階段502在方塊510中決定活動狀態已經變化,則第一階段502向第二階段504發送信號以恢復計算。第二階段504可以基於指示更新的活動狀態的序列資料來計算推斷。第二階段504可以向第一階段502發送狀態更新,這樣第一階段502可以繼續監測感測器資料以決定活動狀態是否從更新的活動狀態變化。在一些態樣,第二階段504亦可以向客戶端報告更新的活動分類。在將更新的活動狀態發送到第一階段502之後,第二階段504可以返回關閉狀態或低功率狀態。
圖7是圖示根據本案內容的各態樣的串流序列資料的節能狀態變化偵測和分類的方法700的流程圖。在方塊702中,方法700從感測器接收序列資料。如參考圖5所描述的,活動狀態分類區塊304亦可以被配置為經由輸入404接收序列資料。可以經由一或多個感測器402(例如,圖1中所示的感測器114)提供序列資料。感測器402可以是一組慣性量測單元(IMU)感測器、麥克風、照相機、其他序列資料輸入,或者其組合。
在方塊704處,方法700從第一預測模型接收狀態變化事件,該狀態變化事件指示活動狀態是否已經從先前的活動狀態變化。如參考圖5所描述的,活動狀態分類區塊304可以從狀態變化偵測區塊302接收變化指示。
在方塊706處,方法700回應於狀態變化事件指示活動狀態已經變化,對序列資料進行處理以決定序列資料的分類。例如,如參考圖5所描述的,若變化指示指出已偵測到狀態變化,則可以將活動狀態分類區塊304控制為活動狀態以恢復對序列資料的處理。活動狀態分類區塊304可以獲取序列資料,可以經由預處理區塊406對該序列資料進行預處理(例如,資料分割或格式化)。預測區塊520可以提取序列資料的特徵,並且基於一組模型參數來產生當前活動狀態(例如,坐立不安、步行、跑步、騎自行車)的預測。隨後可以將預測提供給分類區塊522,以產生當前時間步進的活動的分類。分類區塊522可以將分類提供給狀態變化偵測區塊302,以用於決定下一個時間步進的序列資料是否指示從當前活動狀態的變化。
在另一態樣,若變化指示指出活動狀態沒有變化,則活動狀態分類區塊304可以保持在不活動或低功率狀態。亦即,因為變化指示指出活動狀態沒有變化,所以可以跳過對當前時間段的序列資料分類的計算。替代地,活動狀態分類區塊304可以將當前時間的序列資料的分類設置為等於前一時間段的活動狀態。在一些態樣,在提供分類之後,分類區塊522可以返回到不活動或低功率狀態。
在一些態樣,例如,接收構件、決定構件、處理構件及/或傳輸構件包括被配置為執行所述的功能的CPU 102、與CPU 102相關聯的程式記憶體、專用記憶體區塊118,及/或路由連接處理單元216。在其他配置中,前述的構件可以是被配置為執行前述構件所述的功能的任何模組或任何裝置。
在以下編號的條款中提供了實施實例。 1、一種方法,包括以下步驟: 經由第一預測模型從感測器接收序列資料; 經由該第一預測模型,基於該序列資料來決定活動狀態的變化;及 向第二預測模型傳輸該活動狀態已經變化的指示,該第二預測模型基於該序列資料來決定更新的活動狀態。 2、根據條款1之方法,其中該第一預測模型連續地預測該活動狀態是否已經變化,並且該第二預測模型在接收到該活動狀態變化的指示之前是不活動的。 3、根據條款1或2之方法,其中該序列資料包括慣性量測單元(IMU)感測器資料、全球導航衛星系統(GNSS)資料、連接性資料、音訊資料、圖像資料、氣壓資料、環境光感測器資料,或接近感測器資料中的一項或多項。 4、根據條款1-3中的任何一項之方法,其中該第一預測模型基於累積對數概度比函數來決定該活動狀態的變化。 5、根據條款1-4中的任何一項之方法,其中當該累積對數概度比函數大於閾值參數時,該活動狀態發生變化。 6、根據條款1-5中的任何一項之方法,其中該閾值參數是可調節的,以實現錯誤事件率和偵測延時之間的權衡。 7、根據條款1-6中的任何一項之方法,其中經由將測試取樣輸入到該累積對數概度比函數的估計器中,來計算該累積對數概度比函數。 8、根據條款1-7中的任何一項之方法,其中該第二預測模型回應於該活動狀態已經變化的指示,處理該序列資料以提取該序列資料的特徵,並且基於所提取的該序列資料的特徵來決定該更新的活動狀態。 9、根據條款1-8中的任何一項之方法,其中該第二預測模型將該更新的活動狀態提供給該第一預測模型,並且該第一預測模型基於該更新的活動狀態來決定該活動狀態的變化。 10、一種方法,包括以下步驟: 從感測器接收序列資料; 從第一預測模型接收指示活動狀態是否已經從先前活動狀態變化的狀態變化事件;及 回應於該狀態變化事件指示該活動狀態已經變化,處理該序列資料以決定該序列資料的分類。 11、根據條款10之方法,亦包括以下步驟: 回應於該狀態變化事件指示該活動狀態沒有變化,跳過用於決定該序列資料的分類的對該序列資料的處理。 12、根據條款10或11之方法,亦包括以下步驟: 向該第一預測模型傳輸該分類,該第一預測模型使用該分類來計算下一個狀態變化事件。 13、根據條款10-12中的任何一項之方法,亦包括以下步驟:回應於該狀態變化事件指示該活動狀態沒有變化,將當前時間段的該序列資料的分類設置為該先前活動狀態。 14、一種裝置,包括: 記憶體;及 耦合到該記憶體的至少一個處理器,該至少一個處理器被配置為: 經由第一預測模型從感測器接收序列資料; 經由該第一預測模型,基於該序列資料來決定活動狀態的變化;及 向第二預測模型傳輸該活動狀態已經變化的指示,該第二預測模型基於該序列資料來決定更新的活動狀態。 15、根據條款14之裝置,其中該至少一個處理器進一步被配置為:經由該第一預測模型,連續地預測該活動狀態是否已經變化,並且其中該第二預測模型在接收到該活動狀態變化的指示之前是不活動的。 16、根據條款14或15之裝置,其中該序列資料包括慣性量測單元(IMU)感測器資料、全球導航衛星系統(GNSS)資料、連接性資料、音訊資料、圖像資料、氣壓資料、環境光感測器資料,或接近感測器資料中的一項或多項。 17、根據條款14-16中的任何一項之裝置,其中該至少一個處理器進一步被配置為:經由該第一預測模型,基於累積對數概度比函數來決定該活動狀態的變化。 18、根據條款14-17中的任何一項之裝置,其中當該累積對數概度比函數大於閾值參數時,該活動狀態發生變化。 19、根據條款14-18中的任何一項之裝置,其中該閾值參數是可調節的,以實現錯誤事件率和偵測延時之間的權衡。 20、根據條款14-19中的任何一項之裝置,其中該至少一個處理器進一步被配置為: 經由該第二預測模型,接收該活動狀態已經變化的指示; 處理該序列資料以提取該序列資料的特徵;及 基於所提取的該序列資料的特徵來決定該更新的活動狀態。 21、根據條款14-20中的任何一項之裝置,其中該至少一個處理器進一步被配置為: 將該更新的活動狀態作為回饋提供給該第一預測模型;及 將該第二預測模型返回到不活動狀態。 22、根據條款14-21中的任何一項之裝置,其中該第一預測模型接收該更新的活動狀態作為來自該第二預測模型的回饋。 23、一種裝置,包括: 記憶體;及 耦合到該記憶體的至少一個處理器,該至少一個處理器被配置為: 從感測器接收序列資料; 從第一預測模型接收指示活動狀態是否已經從先前活動狀態變化的狀態變化事件;及 回應於該狀態變化事件指示該活動狀態已經變化,處理該序列資料以決定該序列資料的分類。 24、根據條款23之裝置,其中該至少一個處理器進一步被配置為:回應於該狀態變化事件指示該活動狀態沒有變化,跳過用於決定該序列資料的分類的對該序列資料的處理。 25、根據條款23或24之裝置,其中該至少一個處理器進一步被配置為:回應於該狀態變化事件指示該活動狀態沒有變化,將當前時間段的該序列資料的分類設置為該先前活動狀態。 26、根據條款23-25中的任何一項之裝置,其中該至少一個處理器進一步被配置為:向該第一預測模型傳輸該分類,該第一預測模型使用該分類來計算下一個狀態變化事件。 27、一種裝置,包括: 用於經由第一預測模型從感測器接收序列資料的構件; 用於經由該第一預測模型,基於該序列資料來決定活動狀態的變化的構件;及 用於向第二預測模型傳輸該活動狀態已經變化的指示的構件,該第二預測模型基於該序列資料來決定更新的活動狀態。 28、根據條款27之裝置,亦包括:用於經由該第一預測模型連續地預測該活動狀態是否已經變化的構件,並且該第二預測模型在接收到該活動狀態變化的指示之前是不活動的。 29、根據條款27或28之裝置,其中該序列資料包括慣性量測單元(IMU)感測器資料、全球導航衛星系統(GNSS)資料、連接性資料、音訊資料、圖像資料、氣壓資料、環境光感測器資料,或接近感測器資料中的一項或多項。 30、根據條款27-29中的任何一項之裝置,其中該第一預測模型基於累積對數概度比函數來決定該活動狀態的變化。 31、根據條款27-30中的任何一項之裝置,其中當該累積對數概度比函數大於閾值參數時,該活動狀態發生變化。 32、根據條款27-31中的任何一項之裝置,其中該閾值參數是可調節的,以實現錯誤事件率和偵測延時之間的權衡。 33、根據條款27-32中的任何一項之裝置,亦包括:用於經由將測試取樣輸入到該累積對數概度比函數的估計器中,來計算該累積對數概度比函數的構件。 34、根據條款27-32中的任何一項之裝置,亦包括:用於基於該更新的活動狀態,選擇該累積對數概度比函數的構件。 35、根據條款27-34中的任何一項之裝置,亦包括:用於經由該第一預測模型,接收該更新的活動狀態作為來自該第二預測模型的回饋的構件。 36、一種裝置,包括: 用於從感測器接收序列資料的構件; 用於從第一預測模型接收指示活動狀態是否已經從先前活動狀態變化的狀態變化事件的構件;及 用於回應於該狀態變化事件指示該活動狀態已經變化,處理該序列資料以決定該序列資料的分類的構件。 37、根據條款36之裝置,亦包括:用於回應於該狀態變化事件指示該活動狀態沒有變化,跳過用於決定該序列資料的分類的對該序列資料的處理的構件。 38、根據條款36或37之裝置,亦包括:用於向該第一預測模型傳輸該分類的構件,該第一預測模型使用該分類來計算下一個狀態變化事件。 39、根據條款36-38中的任何一項之裝置,亦包括:用於回應於該狀態變化事件指示該活動狀態沒有變化,將當前時間段的該序列資料的分類設置為該先前活動狀態的構件。 40、一種其上編碼有程式碼的非暫時性電腦可讀取媒體,該程式碼由處理器執行並且包括: 用於經由第一預測模型從感測器接收序列資料的程式碼; 用於經由該第一預測模型,基於該序列資料來決定活動狀態的變化的程式碼;及 用於向第二預測模型傳輸該活動狀態已經變化的指示的程式碼,該第二預測模型基於該序列資料來決定更新的活動狀態。 41、根據條款40之非暫時性電腦可讀取媒體,亦包括:用於經由該第一預測模型連續地預測該活動狀態是否已經變化的程式碼,並且其中該第二預測模型在接收到該活動狀態變化的指示之前是不活動的。 42、根據條款40或41之非暫時性電腦可讀取媒體,其中該序列資料包括慣性量測單元(IMU)感測器資料、全球導航衛星系統(GNSS)資料、連接性資料、音訊資料、圖像資料、氣壓資料、環境光感測器資料,或接近感測器資料中的一項或多項。 43、根據條款40-42中的任何一項之非暫時性電腦可讀取媒體,亦包括:用於經由該第一預測模型,基於累積對數概度比函數來決定該活動狀態的變化的程式碼。 44、根據條款40-43中的任何一項之非暫時性電腦可讀取媒體,其中當該累積對數概度比函數大於閾值參數時,該活動狀態發生變化。 45、根據條款40-44中的任何一項之非暫時性電腦可讀取媒體,其中該閾值參數是可調節的,以實現錯誤事件率和偵測延時之間的權衡。 46、根據條款40-45中的任何一項之非暫時性電腦可讀取媒體,亦包括:用於經由將測試取樣輸入到該累積對數概度比函數的估計器中,來計算該累積對數概度比函數的程式碼。 47、根據條款40-45中的任何一項之非暫時性電腦可讀取媒體,亦包括:用於基於該更新的活動狀態,選擇該累積對數概度比函數的程式碼。 48、根據條款40-47中的任何一項之非暫時性電腦可讀取媒體,亦包括:用於經由該第一預測模型,接收該更新的活動狀態作為來自該第二預測模型的回饋的程式碼。 49、一種其上編碼有程式碼的非暫時性電腦可讀取媒體,該程式碼由處理器執行並且包括: 用於從感測器接收序列資料的程式碼; 用於從第一預測模型接收指示活動狀態是否已經從先前活動狀態變化的狀態變化事件的程式碼;及 用於回應於該狀態變化事件指示該活動狀態已經變化,處理該序列資料以決定該序列資料的分類的程式碼。 50、根據條款49之非暫時性電腦可讀取媒體,亦包括: 用於回應於該狀態變化事件指示該活動狀態沒有變化,跳過用於決定該序列資料的分類的對該序列資料的處理的程式碼。 51、根據條款49或50之非暫時性電腦可讀取媒體,亦包括:用於回應於該狀態變化事件指示該活動狀態沒有變化,將當前時間段的該序列資料的分類設置為該先前活動狀態的程式碼。 52、根據條款49-51中的任何一項之非暫時性電腦可讀取媒體,亦包括:用於向該第一預測模型傳輸該分類的程式碼,該第一預測模型使用該分類來計算下一個狀態變化事件。
上文所描述的方法的各種操作,可以由能夠執行相應功能的任何適當構件來執行。該等構件可以包括各種硬體及/或軟體元件及/或模組,其包括但不限於:電路、特殊應用積體電路(ASIC)或者處理器。通常,在附圖中圖示有操作的地方,該等操作可以具有類似地進行編號的相應配對的功能構件元件。
如所使用的,術語「決定」涵蓋很多種動作。例如,「決定」可以包括計算、運算、處理、推導、研究、查詢(例如,查詢表、資料庫或其他資料結構)、斷定等等。此外,「決定」可以包括接收(例如,接收資訊)、存取(例如,存取記憶體中的資料)等等。此外,「決定」可以包括解析、選定、選擇、建立等等。
如所使用的,代表一個列表項「中的至少一個」的短語是指該等項的任意組合,其包括單一成員。舉例而言,「a、b或c中的至少一個」意欲覆蓋:a、b、c、a-b、a-c、b-c和a-b-c。
用於執行所述功能的通用處理器、數位信號處理器(DSP)、特殊應用積體電路(ASIC)、現場可程式設計閘陣列(FPGA)或其他可程式設計邏輯設備(PLD)、個別閘門或者電晶體邏輯、個別硬體元件或者其任意組合,可以實現或執行結合本案內容描述的各種說明性的邏輯區塊、模組和電路。通用處理器可以是微處理器,或者,該處理器亦可以是任何商業可用處理器、控制器、微控制器或者狀態機。處理器亦可以實現為計算設備的組合,例如,DSP和微處理器的組合、複數個微處理器、與DSP核心結合的一或多個微處理器,或者任何其他此種配置。
結合本案內容描述的方法或過程的步驟可以直接體現在硬體中、由處理器執行的軟體模組中或兩者的組合中。軟體模組可以常駐在本領域已知的任何形式的儲存媒體中。可以使用的儲存媒體的一些實例包括隨機存取記憶體(RAM)、唯讀記憶體(ROM)、快閃記憶體、可抹除可程式設計唯讀記憶體(EPROM)、電子可抹除可程式設計唯讀記憶體(EEPROM)、暫存器、硬碟、抽取式磁碟、CD-ROM等。軟體模組可以包括單個指令或者多個指令,並且可以分佈在幾個不同的程式碼片段上、分佈在不同的程式之中,以及分佈在多個儲存媒體之中。儲存媒體可以耦合至處理器,使得處理器可以從該儲存媒體讀取資訊和向該儲存媒體寫入資訊。或者,該儲存媒體亦可以是處理器的一部分。
所揭示的方法包括用於實現所描述方法的一或多個步驟或動作。在不脫離本發明保護範疇的基礎上,該等方法步驟及/或動作可以相互交換。換言之,除非指定特定順序的步驟或動作,否則在不脫離請求項保護範疇的基礎上,可以修改特定步驟及/或動作的順序及/或使用。
所描述的功能可以利用硬體、軟體、韌體或者其任意組合來實現。當使用硬體實現時,一種示例性硬體配置可以包括設備中的處理系統。該處理系統可以使用匯流排架構來實現。根據該處理系統的具體應用和整體設計約束,匯流排可以包括任意數量的相互連接匯流排和橋接。匯流排可以將包括處理器、機器可讀取媒體和匯流排介面的各種電路連結在一起。匯流排介面可以用於經由匯流排,將網路配接器等等連接到處理系統。網路配接器可以用於實現信號處理功能。對於某些態樣,亦可以將使用者介面(例如,鍵盤、顯示器、滑鼠、操縱桿等等)連接到匯流排。匯流排亦連結諸如定時源、周邊設備、電壓調節器、電源管理電路等等之類的各種其他電路,其中該等電路是本領域所公知的,因此沒有做任何進一步的描述。
處理器可以負責管理匯流排和通用處理,其包括執行儲存在機器可讀取媒體上的軟體。處理器可以使用一或多個通用處理器及/或特殊用途處理器來實現。實例包括微處理器、微控制器、DSP處理器和能夠執行軟體的其他電路系統。軟體應當被廣義地解釋為表示指令、資料或者其任意組合等等,無論其被稱為軟體、韌體、中間軟體、微代碼、硬體描述語言還是其他術語。舉例而言,機器可讀取媒體可以包括隨機存取記憶體(RAM)、快閃記憶體、唯讀記憶體(ROM)、可程式設計唯讀記憶體(PROM)、可抹除可程式設計唯讀記憶體(EPROM)、電子可抹除可程式設計唯讀記憶體(EEPROM)、暫存器、磁碟、光碟、硬碟或者任何其他適當的儲存媒體,或者其任意組合。機器可讀取媒體可以用電腦程式產品來體現。電腦程式產品可以包括封裝材料。
在硬體實現中,機器可讀取媒體可以是與處理器分離的處理系統的一部分。然而,如熟習此項技術者將容易理解的,機器可讀取媒體或者其任何部分可以在處理系統之外。舉例而言,機器可讀取媒體可以包括傳輸線、用資料調制的載波波形及/或與設備分離的電腦產品,所有該等皆可由處理器經由匯流排介面來存取。替代地或者另外地,機器可讀取媒體或者其任何部分可以是處理器的組成部分,例如,該情況可以是具有快取記憶體及/或通用暫存器檔案。儘管可以將所論述的各種元件描述為具有特定的位置,例如本端元件,但其亦可以以各種方式進行配置,例如某些元件被配置為分散式計算系統的一部分。
處理系統可以被配置為通用處理系統,其具有提供處理器功能的一或多個微處理器和提供機器可讀取媒體的至少一部分的外部記憶體,所有該等皆經由外部匯流排架構與其他支援電路系統連接在一起。或者,處理系統可以包括一或多個神經形態處理器,用於實現所描述的神經元模型和神經系統模型。作為另一種選擇,處理系統可以用處理器、匯流排介面、使用者介面、支援電路系統和機器可讀取媒體的至少一部分整合到單個晶片中的特殊應用積體電路(ASIC)來實現,或者使用一或多個現場可程式設計閘陣列(FPGA)、可程式設計邏輯設備(PLD)、控制器、狀態機、閘控邏輯、個別硬體元件或者任何其他適當的電路系統,或者可以執行貫穿本案內容描述的各種功能的電路的任意組合來實現。熟習此項技術者應當認識到,如何根據具體的應用和對整體系統所施加的整體設計約束條件,最好地實現該處理系統的所描述功能。
機器可讀取媒體可以包括多個軟體模組。該等軟體模組包括指令,當指令由處理器執行時,使得處理系統執行各種功能。軟體模組可以包括傳輸模組和接收模組。每一個軟體模組可以位於單個儲存設備中,亦可以分佈在多個儲存設備之中。舉例而言,當觸發事件發生時,可以將軟體模組從硬碟裝載到RAM中。在軟體模組的執行期間,處理器可以將該等指令中的一些裝載到快取記憶體中,以增加存取速度。隨後,可以將一或多個快取列裝載到用於由處理器執行的通用暫存器檔案中。當代表下文的軟體模組的功能時,應當理解的是,在執行來自該軟體模組的指令時,由處理器實現該功能。此外,應當理解的是,本案內容的各態樣導致處理器、電腦、機器或實現該等態樣的其他系統的功能的改良。
當使用軟體來實現時,可以將該等功能儲存在電腦可讀取媒體上或者作為一或多個指令或代碼經由電腦可讀取媒體進行傳輸。電腦可讀取媒體包括電腦儲存媒體和通訊媒體,其中通訊媒體包括促進從一個地方向另一個地方傳送電腦程式的任何媒體。儲存媒體可以是電腦能夠存取的任何可用媒體。舉例而言但非做出限制,此種電腦可讀取媒體可以包括RAM、ROM、EEPROM、CD-ROM或其他光碟儲存、磁碟儲存或其他磁儲存設備,或者能夠用於攜帶或儲存具有指令或資料結構形式的期望的程式碼並能夠由電腦進行存取的任何其他媒體。此外,可以將任何連接適當地稱作電腦可讀取媒體。例如,若軟體是使用同軸電纜、光纖電纜、雙絞線、數位用戶線路(DSL)或者諸如紅外線(IR)、無線電和微波之類的無線技術,從網站、伺服器或其他遠端源傳輸的,則該同軸電纜、光纖電纜、雙絞線、DSL或者諸如紅外線、無線電和微波之類的無線技術包括在該媒體的定義中。如所使用的,磁碟和光碟包括壓縮光碟(CD)、鐳射光碟、光碟、數位多功能光碟(DVD)、軟碟和藍光®光碟,其中磁碟通常磁性地複製資料,而光碟則用鐳射來光學地複製資料。因此,在一些態樣,電腦可讀取媒體可以包括非暫時性電腦可讀取媒體(例如,有形媒體)。此外,對於其他態樣而言,電腦可讀取媒體可以包括暫時性電腦可讀取媒體(例如,信號)。上述的組合亦應當包括在電腦可讀取媒體的保護範疇之內。
因此,某些態樣可以包括用於執行本文所提供的操作的電腦程式產品。例如,該電腦程式產品可以包括其上儲存有(及/或編碼有)指令的電腦可讀取媒體,該等指令可由一或多個處理器執行,以執行所描述的操作。對於某些態樣,電腦程式產品可以包括封裝材料。
此外,應當理解的是,用於執行本文所述方法和技術的模組及/或其他適當構件可以經由使用者終端及/或基地站依須求地進行下載及/或獲得。例如,此種設備可以耦合至伺服器,以便促進實現用於傳送執行所描述方法的構件。或者,所描述的各種方法可以經由儲存構件(例如,RAM、ROM、諸如壓縮光碟(CD)或軟碟之類的實體儲存媒體等等)來提供,使得使用者終端及/或基地站將儲存構件耦接至或提供給該設備之後,可以獲得各種方法。此外,亦可以利用向設備提供所描述方法和技術的任何其他適當技術。
應當理解的是,本發明並不受限於上文說明的精確配置和元件。在不脫離本發明的保護範疇的基礎上,可以對前述方法和裝置的排列、操作和細節做出各種修改、改變和變化。
30:值 50:值 60:值 70:值 80:值 90:值 100:SOC 102:CPU 104:GPU 106:DSP 108:神經處理單元(NPU) 110:連接區塊 112:多媒體處理器 114:感測器處理器 116:圖像信號處理器(ISP) 118:專用記憶體區塊 120:導航模組 200:DCN 202:全連接神經網路 204:局部連接神經網路 206:迴旋神經網路 208:連接強度 210:連接強度 212:連接強度 214:連接強度 216:連接強度 218:第一組特徵圖 220:第二組特徵圖 222:輸出 224:第一特徵向量 226:圖像 228:第二特徵向量 230:圖像擷取設備 232:迴旋層 300:系統 302:第一階段 304:第二階段 306:客戶端應用程式 308:感測器單元 402:感測器 404:輸入 406:預處理區塊 408:特徵提取區塊 410:預測區塊 412:變化偵測區塊 414:模型參數 520:預測區塊 522:分類區塊 524:模型參數 600:方法 602:方塊 604:方塊 606:方塊 700:方法 702:方塊 704:方塊 706:方塊
當與附圖結合使用時,從下文所述的詳細描述中,本案內容的特徵、性質和優點可以變得更加顯而易見,在附圖中,相同的元件符號自始至終對應地辨識。
圖1圖示根據本案內容的某些態樣包括通用處理器的晶片上系統(SOC)的示例性實現。
圖2A、圖2B和圖2C是圖示根據本案內容的各態樣的神經網路的圖。
圖2D是圖示根據本案內容的各態樣的示例性深度迴旋網路(DCN)的圖。
圖3是圖示根據本案內容的各態樣用於節能狀態變化偵測和分類的示例性系統的方塊圖。
圖4和圖5是圖示根據本案內容的各態樣用於狀態變化偵測和分類的示例性架構的圖。
圖6和圖7是圖示根據本案內容的各態樣串流序列資料的節能狀態變化偵測和分類的方法的流程圖。
國內寄存資訊(請依寄存機構、日期、號碼順序註記) 無 國外寄存資訊(請依寄存國家、機構、日期、號碼順序註記) 無
300:系統
302:第一階段
304:第二階段
306:客戶端應用程式
308:感測器單元

Claims (26)

  1. 一種方法,包括以下步驟: 經由一第一預測模型,從一感測器接收序列資料; 經由該第一預測模型,基於該序列資料來決定一活動狀態的一變化;及 向一第二預測模型傳輸對該活動狀態已經變化的一指示,該第二預測模型基於該序列資料來決定一更新的活動狀態。
  2. 根據請求項1之方法,其中該第一預測模型連續地預測該活動狀態是否已經變化,並且該第二預測模型在接收到對該活動狀態變化的該指示之前是不活動的。
  3. 根據請求項1之方法,其中該序列資料包括以下各項中的一項或多項:慣性量測單元(IMU)感測器資料、全球導航衛星系統(GNSS)資料、連接性資料、音訊資料、圖像資料、氣壓資料、環境光感測器資料,或接近感測器資料。
  4. 根據請求項1之方法,其中該第一預測模型基於一累積對數概度比函數來決定該活動狀態的該變化。
  5. 根據請求項4之方法,其中當該累積對數概度比函數大於一閾值參數時,該活動狀態發生變化。
  6. 根據請求項5之方法,其中該閾值參數是可調節的,以實現一錯誤事件率和一偵測延時之間的一權衡。
  7. 根據請求項4之方法,其中該累積對數概度比函數是經由將一測試取樣輸入到該累積對數概度比函數的一估計器中來計算的。
  8. 根據請求項1之方法,其中該第二預測模型回應於對該活動狀態已經變化的該指示,處理該序列資料以提取該序列資料的特徵,並且基於所提取的該序列資料的該等特徵來決定該更新的活動狀態。
  9. 根據請求項8之方法,其中該第二預測模型將該更新的活動狀態提供給該第一預測模型,並且該第一預測模型基於該更新的活動狀態來決定該活動狀態的該變化。
  10. 一種方法,包括以下步驟: 從一感測器接收序列資料; 從一第一預測模型接收一狀態變化事件,該狀態變化事件指示一活動狀態是否已經從一先前活動狀態變化;及 回應於該狀態變化事件指示該活動狀態已經變化,處理該序列資料以決定該序列資料的一分類。
  11. 根據請求項10之方法,亦包括以下步驟:回應於該狀態變化事件指示該活動狀態沒有變化,跳過用於決定該序列資料的該分類的對該序列資料的處理。
  12. 根據請求項10之方法,亦包括以下步驟:向該第一預測模型傳輸該分類,該第一預測模型使用該分類來計算一下一個狀態變化事件。
  13. 根據請求項10之方法,亦包括以下步驟:回應於該狀態變化事件指示該活動狀態沒有變化,將一當前時間段的該序列資料的該分類設置為該先前活動狀態。
  14. 一種裝置,包括: 一記憶體;及 耦合到該記憶體的至少一個處理器,該至少一個處理器被配置為: 經由一第一預測模型,從一感測器接收序列資料; 經由該第一預測模型,基於該序列資料來決定一活動狀態的一變化;及 向一第二預測模型傳輸對該活動狀態已經變化的一指示,該第二預測模型基於該序列資料決定一更新的活動狀態。
  15. 根據請求項14之裝置,其中該至少一個處理器進一步被配置為經由該第一預測模型,連續地預測該活動狀態是否已經變化,並且其中該第二預測模型在接收到對該活動狀態變化的該指示之前是不活動的。
  16. 根據請求項14之裝置,其中該序列資料包括以下各項中的一項或多項:慣性量測單元(IMU)感測器資料、全球導航衛星系統(GNSS)資料、連接性資料、音訊資料、圖像資料、氣壓資料、環境光感測器資料,或接近感測器資料。
  17. 根據請求項14之裝置,其中該至少一個處理器進一步被配置為經由該第一預測模型,基於一累積對數概度比函數來決定該活動狀態的該變化。
  18. 根據請求項17之裝置,其中當該累積對數概度比函數大於一閾值參數時,該活動狀態發生變化。
  19. 根據請求項18之裝置,其中該閾值參數是可調節的,以實現一錯誤事件率和一偵測延時之間的一權衡。
  20. 根據請求項14之裝置,其中該至少一個處理器進一步被配置為: 經由該第二預測模型,接收對該活動狀態已經變化的該指示; 處理該序列資料以提取該序列資料的特徵;及 基於所提取的該序列資料的該等特徵來決定該更新的活動狀態。
  21. 根據請求項20之裝置,其中該至少一個處理器進一步被配置為: 將該更新的活動狀態作為回饋提供給該第一預測模型;及 將該第二預測模型返回到一不活動狀態。
  22. 根據請求項21之裝置,其中該第一預測模型接收該更新的活動狀態作為來自該第二預測模型的回饋。
  23. 一種裝置,包括: 一記憶體;及 耦合到該記憶體的至少一個處理器,該至少一個處理器被配置為: 從一感測器接收序列資料; 從一第一預測模型接收一狀態變化事件,該狀態變化事件指示一活動狀態是否已經從一先前活動狀態變化;及 回應於該狀態變化事件指示該活動狀態已經變化,處理該序列資料以決定該序列資料的一分類。
  24. 根據請求項23之裝置,其中該至少一個處理器進一步被配置為:回應於該狀態變化事件指示該活動狀態沒有變化,跳過用於決定該序列資料的該分類的對該序列資料的處理。
  25. 根據請求項24之裝置,其中該至少一個處理器進一步被配置為:回應於該狀態變化事件指示該活動狀態沒有變化,將一當前時間段的該序列資料的該分類設置為該先前活動狀態。
  26. 根據請求項23之裝置,其中該至少一個處理器進一步被配置為:向該第一預測模型傳輸該分類,該第一預測模型使用該分類來計算一下一個狀態變化事件。
TW111131647A 2021-08-31 2022-08-23 持續的兩階段活動辨識 TW202326510A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US17/463,451 2021-08-31
US17/463,451 US11927601B2 (en) 2021-08-31 2021-08-31 Persistent two-stage activity recognition

Publications (1)

Publication Number Publication Date
TW202326510A true TW202326510A (zh) 2023-07-01

Family

ID=83360916

Family Applications (1)

Application Number Title Priority Date Filing Date
TW111131647A TW202326510A (zh) 2021-08-31 2022-08-23 持續的兩階段活動辨識

Country Status (4)

Country Link
US (1) US11927601B2 (zh)
CN (1) CN117859040A (zh)
TW (1) TW202326510A (zh)
WO (1) WO2023034065A1 (zh)

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140038674A1 (en) * 2012-08-01 2014-02-06 Samsung Electronics Co., Ltd. Two-phase power-efficient activity recognition system for mobile devices
US9853997B2 (en) * 2014-04-14 2017-12-26 Drexel University Multi-channel change-point malware detection
WO2018035460A1 (en) * 2016-08-18 2018-02-22 Robert Bosch Gmbh High security motion sensor
US10937173B2 (en) * 2018-11-15 2021-03-02 Qualcomm Incorporated Predicting subject body poses and subject movement intent using probabilistic generative models
US10784899B2 (en) * 2019-01-23 2020-09-22 Nxp Usa, Inc. Method and apparatus for determining scaling factors in fixed-point decoder

Also Published As

Publication number Publication date
US11927601B2 (en) 2024-03-12
US20230065124A1 (en) 2023-03-02
CN117859040A (zh) 2024-04-09
WO2023034065A1 (en) 2023-03-09

Similar Documents

Publication Publication Date Title
US10902615B2 (en) Hybrid and self-aware long-term object tracking
US10332028B2 (en) Method for improving performance of a trained machine learning model
US10275719B2 (en) Hyper-parameter selection for deep convolutional networks
US10740654B2 (en) Failure detection for a neural network object tracker
KR102595399B1 (ko) 미지의 클래스들의 검출 및 미지의 클래스들에 대한 분류기들의 초기화
US11334789B2 (en) Feature selection for retraining classifiers
US11423323B2 (en) Generating a sparse feature vector for classification
US20160283864A1 (en) Sequential image sampling and storage of fine-tuned features
US20190354865A1 (en) Variance propagation for quantization
WO2018084941A1 (en) Temporal difference estimation in an artificial neural network
US20220121949A1 (en) Personalized neural network pruning
WO2019109290A1 (en) Context set and context fusion
US20220159278A1 (en) Skip convolutions for efficient video processing
US20240013521A1 (en) Sequence processing for a dataset with frame dropping
TW202326510A (zh) 持續的兩階段活動辨識
WO2022198437A1 (en) State change detection for resuming classification of sequential sensor data on embedded systems
WO2023178467A1 (en) Energy-efficient anomaly detection and inference on embedded systems
EP4396531A1 (en) Persistent two-stage activity recognition
US20240078800A1 (en) Meta-pre-training with augmentations to generalize neural network processing for domain adaptation
US20230419087A1 (en) Adapters for quantization