TWI763215B - 篩選用於預測生理狀態的特徵的電子裝置和方法 - Google Patents
篩選用於預測生理狀態的特徵的電子裝置和方法 Download PDFInfo
- Publication number
- TWI763215B TWI763215B TW109146620A TW109146620A TWI763215B TW I763215 B TWI763215 B TW I763215B TW 109146620 A TW109146620 A TW 109146620A TW 109146620 A TW109146620 A TW 109146620A TW I763215 B TWI763215 B TW I763215B
- Authority
- TW
- Taiwan
- Prior art keywords
- feature
- features
- model
- subsets
- module
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/70—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/30—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61B—DIAGNOSIS; SURGERY; IDENTIFICATION
- A61B5/00—Measuring for diagnostic purposes; Identification of persons
- A61B5/72—Signal processing specially adapted for physiological signals or for diagnostic purposes
- A61B5/7271—Specific aspects of physiological measurement analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/20—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/50—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for simulation or modelling of medical disorders
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H10/00—ICT specially adapted for the handling or processing of patient-related medical or healthcare data
- G16H10/40—ICT specially adapted for the handling or processing of patient-related medical or healthcare data for data related to laboratory analysis, e.g. patient specimen analysis
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H10/00—ICT specially adapted for the handling or processing of patient-related medical or healthcare data
- G16H10/60—ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Public Health (AREA)
- Data Mining & Analysis (AREA)
- Biomedical Technology (AREA)
- Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Epidemiology (AREA)
- Primary Health Care (AREA)
- Databases & Information Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Theoretical Computer Science (AREA)
- Signal Processing (AREA)
- Animal Behavior & Ethology (AREA)
- Veterinary Medicine (AREA)
- Surgery (AREA)
- Molecular Biology (AREA)
- Heart & Thoracic Surgery (AREA)
- Physiology (AREA)
- Psychiatry (AREA)
- Biophysics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Measuring And Recording Apparatus For Diagnosis (AREA)
- Measurement Of The Respiration, Hearing Ability, Form, And Blood Characteristics Of Living Organisms (AREA)
Abstract
提出一種篩選用於預測生理狀態的特徵的電子裝置和方法。方法包含:取得對應於多個特徵的多個生理資料;基於第一模型而根據多個生理資料產生多個特徵的多個第一子集合,其中多個第一子集合分別對應於多個生理資料;根據多個第一子集合以從多個特徵中選出第一特徵,計算對應於多個特徵中的第二特徵與第一特徵的第一關係指標,並且根據第一關係指標而選擇第二特徵與作為第一特徵的共伴特徵;以及輸出第一特徵和共伴特徵。
Description
本發明是有關於一種篩選用於預測生理狀態的特徵的電子裝置和方法。
利用抽血取得受測者的多個代謝體指標,從而由醫生根據多個代謝體指標來判斷受測者的生理狀態的方法,為逐漸發展的重要醫療技術。以判斷受測者的肥胖程度為例,習知技術可使用身體質量指數(body mass index,BMI)來判斷受測者的肥胖程度,但身體質量指數的計算僅考慮到受測者的體重和身高,而無法考慮到受測者的代謝狀況。
人體產生的代謝體的種類繁多,並且每一個代謝體與不同的生理狀態之間的相關性也不同。因此,若能發展出能篩選出與特定生理狀態高度相關的代謝體的方法,將可輔助醫生更準確地監控受測者的生理狀態。
本發明提供一種篩選用於預測生理狀態的特徵的電子裝置和方法,可從多個特徵中篩選出與特定生理狀態顯著地相關的特徵。
本發明的一種篩選用於預測生理狀態的特徵的電子裝置,包含處理器、儲存媒體以及收發器。儲存媒體儲存多個模組。處理器耦接儲存媒體和收發器,並且存取和執行多個模組,其中多個模組包含資料收集模組、訓練模組、運算模組以及輸出模組。資料收集模組通過收發器取得對應於多個特徵的多個生理資料。訓練模組基於第一模型而根據多個生理資料產生多個特徵的多個第一子集合,其中多個第一子集合分別對應於多個生理資料。運算模組根據多個第一子集合以從多個特徵中選出第一特徵,計算對應於多個特徵中的第二特徵與第一特徵的第一關係指標,並且根據第一關係指標而選擇第二特徵與作為第一特徵的共伴特徵。輸出模組通過收發器輸出第一特徵和共伴特徵。
在本發明的一實施例中,上述的訓練模組基於第二模型而根據多個生理資料產生多個特徵的多個第二子集合,其中多個第二子集合分別對應於多個生理資料;以及運算模組根據多個第一子集合和多個第二子集合以從多個特徵中多個特徵中選出第一特徵。
在本發明的一實施例中,上述的運算模組計算多個第一子集合中的第一特徵的第一數量,並且計算多個第二子集合中的第一特徵的第二數量;以及運算模組根據第一數量和第二數量以從多個特徵中多個特徵中選出第一特徵。
在本發明的一實施例中,上述的運算模組根據第一數量、對應於第一模型的第一權重、第二數量以及對應於第二模型的第二權重以計算第一特徵的第一分數;以及運算模組響應於第一分數大於第一閾值而從多個特徵中多個特徵中選出第一特徵。
在本發明的一實施例中,上述的運算模組根據第一數量、對應於第一模型的第一權重、第二數量以及對應於第二模型的第二權重以計算第一特徵的第一分數;運算模組計算多個第一子集合中的第三特徵的第三數量,並且計算多個第二子集合中的第三特徵的第四數量;運算模組根據第三數量、第一權重、第四數量以及第二權重以計算第三特徵的第二分數;以及運算模組響應於第一分數大於第二分數而從第一特徵和第三特徵中選擇第一特徵。
在本發明的一實施例中,上述的運算模組取得多個第一子集合中的每一者中的第一特徵的第一數量以產生第一向量;運算模組取得多個第一子集合中的每一者中的第二特徵的第二數量以產生第二向量;以及運算模組根據第一向量和第二向量計算第一關係指標。
在本發明的一實施例中,上述的運算模組響應於第一關係指標大於第二閾值而選擇第二特徵以作為第一特徵的共伴特徵。
在本發明的一實施例中,上述的運算模組計算對應於多個特徵中的第三特徵與第四特徵的第二關係指標;以及運算模組響應於第一關係指標大於第二關係指標而選擇第二特徵以作為第一特徵的共伴特徵。
在本發明的一實施例中,上述的訓練模組根據多個生理資料、第一特徵以及共伴特徵訓練生理狀態的至少一第一預測模型,並且計算對應於至少一第一預測模型的至少一第一效能指標;訓練模組隨機地從多個特徵中挑選第三特徵和第四特徵,其中第三特徵和第四特徵中的任一者與第一特徵和第二特徵中的任一者相異;訓練模組根據多個生理資料、第三特徵以及第四特徵訓練生理狀態的至少一第二預測模型,並且計算至少一第二預測模型的至少一第二效能指標;運算模組響應於至少一第一效能指標大於至少一第二效能指標而判斷第一特徵和共伴特徵為可用的;以及輸出模組響應於第一特徵和共伴特徵為可用的而輸出第一特徵和共伴特徵。
在本發明的一實施例中,上述的多個特徵分別對應於人體的多種代謝物。
在本發明的一實施例中,上述的資料收集模組通過收發器接收生理資料集合,並且根據自助重抽法以將生理資料集合區分為分別對應於多個生理資料的多個訓練資料和多個測試資料;訓練模組根據多個訓練資料產生多個第一子集合;訓練模組根據多個訓練資料產生至少一第一預測模型;以及訓練模組根據多個測試資料計算至少一第一效能指標。
在本發明的一實施例中,上述的第一模型或第二模型關聯於下列的其中之一:隨機森林演算法、邏輯式迴歸以及支持向量機。
在本發明的一實施例中,上述的第一模型基於下列的其中之一產生多個第一子集合:逐步挑選法以及特徵重要性。
本發明的一種篩選用於預測生理狀態的特徵的方法,包含:取得對應於多個特徵的多個生理資料;基於第一模型而根據多個生理資料產生多個特徵的多個第一子集合,其中多個第一子集合分別對應於多個生理資料;根據多個第一子集合以從多個特徵中選出第一特徵,計算對應於多個特徵中的第二特徵與第一特徵的第一關係指標,並且根據第一關係指標而選擇第二特徵與作為第一特徵的共伴特徵;以及輸出第一特徵和共伴特徵。
基於上述,本發明可選出能顯著地影響受測者的生理狀態的預測結果的特徵,並選出與所述特徵相對應的共伴特徵。本發明可輸出所述特徵與所述共伴特徵以供使用者參考。舉例來說,假設使用者為醫生,則使用者可僅參考本發明輸出的代謝體與共伴代謝體即可判斷受測者的肥胖程度,而不需將心力耗費在分析與肥胖程度毫不相關的代謝體。
為了使本發明之內容可以被更容易明瞭,以下特舉實施例作為本發明確實能夠據以實施的範例。另外,凡可能之處,在圖式及實施方式中使用相同標號的元件/構件/步驟,係代表相同或類似部件。
圖1根據本發明的一實施例繪示一種篩選用於預測生理狀態的特徵的電子裝置100的示意圖。電子裝置100可包含處理器110、儲存媒體120以及收發器130。
處理器110例如是中央處理單元(central processing unit,CPU),或是其他可程式化之一般用途或特殊用途的微控制單元(micro control unit,MCU)、微處理器(microprocessor)、數位信號處理器(digital signal processor,DSP)、可程式化控制器、特殊應用積體電路(application specific integrated circuit,ASIC)、圖形處理器(graphics processing unit,GPU)、影像訊號處理器(image signal processor,ISP)、影像處理單元(image processing unit,IPU)、算數邏輯單元(arithmetic logic unit,ALU)、複雜可程式邏輯裝置(complex programmable logic device,CPLD)、現場可程式化邏輯閘陣列(field programmable gate array,FPGA)或其他類似元件或上述元件的組合。處理器110可耦接至儲存媒體120以及收發器130,並且存取和執行儲存於儲存媒體120中的多個模組和各種應用程式。
儲存媒體120例如是任何型態的固定式或可移動式的隨機存取記憶體(random access memory,RAM)、唯讀記憶體(read-only memory,ROM)、快閃記憶體(flash memory)、硬碟(hard disk drive,HDD)、固態硬碟(solid state drive,SSD)或類似元件或上述元件的組合,而用於儲存可由處理器OOO執行的多個模組或各種應用程式。在本實施例中,儲存媒體120可儲存包含資料收集模組121、訓練模組122、運算模組123以及輸出模組124等多個模組,其功能將於後續說明。
收發器130以無線或有線的方式傳送及接收訊號。收發器130還可以執行例如低噪聲放大、阻抗匹配、混頻、向上或向下頻率轉換、濾波、放大以及類似的操作。
圖2根據本發明的一實施例繪示篩選用於預測生理狀態的特徵的方法的流程圖,其中所述方法可由如圖1所示的電子裝置100實施。
在步驟S201中,資料收集模組121可通過收發器130接收受測者的生理資料集合。生理資料集合可包含分別對應於K個特徵的K個特徵值,其中K個特徵(分別為特徵
、
、…、
)可分別對應於人體的K種代謝物(metabolic)。K可為任意的正整數。
在步驟S202中,資料收集模組121可將生理資料集合區分為對應於K個特徵的N筆生理資料,其中N可為任意的正整數。具體來說,資料收集模組121可根據自助重抽法(bootstrap)將生理資料集合區分為N筆生理資料,其中N筆生理資料中的每一者可包含訓練資料和測試資料。換句話說,資料收集模組121可將生理資料集合區分為分別對應於N筆生理資料的N筆訓練資料和N筆測試資料。
在一實施例中,資料收集模組121可將生理資料集合區分為對應於K個特徵的單一筆生理資料,其中所述生理資料可包含訓練資料和測試資料。具體來說,資料收集模組121可根據K折交叉驗證(k-fold cross-validation)將生理資料集合區分為訓練資料和測試資料,從而產生生理資料。
在步驟S203中,訓練模組122可基於第一模型而根據N筆訓練資料產生K個特徵的N個子集合
,其中N個子集合
可分別對應於N筆訓練資料。第一模型可經配置以根據一筆訓練資料而從K個特徵中選出顯著影響特定生理狀態(例如:肥胖程度)的一或多個特徵,其中所述一或多個特徵即為K個特徵的子集合
。據此,N筆訓練資料共可產生K個特徵的N個子集合
,分別為子集合
、
、…、
。
類似地,訓練模組122可基於第二模型而根據N筆訓練資料產生K個特徵的N個子集合
,其中N個子集合
可分別對應於N筆訓練資料。第二模型可經配置以根據一筆訓練資料而從K個特徵中選出顯著影響特定生理狀態(例如:肥胖程度)的一或多個特徵,其中所述一或多個特徵即為K個特徵的子集合
。據此,N筆訓練資料共可產生K個特徵的N個子集合
,分別為子集合
、
、…、
。
類似地,訓練模組122可基於第三模型而根據N筆訓練資料產生K個特徵的N個子集合
,其中N個子集合
可分別對應於N筆訓練資料。第三模型可經配置以根據一筆訓練資料而從K個特徵中選出顯著影響特定生理狀態(例如:肥胖程度)的一或多個特徵,其中所述一或多個特徵即為K個特徵的子集合
。據此,N筆訓練資料共可產生K個特徵的N個子集合
,分別為子集合
、
、…、
。
步驟S203所採用的模型的數量M可由使用者根據需求而定義。雖然本實施例中的M等於3(即:採用第一模型、第二模型和第三模型等3個模型),但本發明不限於此。舉例來說,M可為大於1的任意的正整數。
在一實施例中,第一模型(或第二模型、第三模型)可對應於隨機森林演算法(random forest,RF)、邏輯式迴歸(logistic regression)或支持向量機(support vector machine,SVM),本發明不限於此。第一模型(或第二模型、第三模型)例如可使用逐步挑選法(stepwise)或特徵重要性(feature importance)以從K個特徵中選出顯著影響特定生理狀態的一或多個特徵。舉例來說,第一模型可基於P值(P-value)或赤池訊息準則(Akaike information criterion,AIC)而使用逐步挑選法以從K個特徵中選出一或多個特徵。不同的模型可採用相同或相異的演算法。舉例來說,第一模型、第二模型以及第三模型可採用相同或相異的演算法。
在步驟S204中,運算模組123可取得對應於第一模型的N個子集合
(分別為子集合
、
、…、
)、對應於第二模型的N個子集合
(分別為子集合
、
、…、
)以及對應於第三模型的N個子集合
(分別為子集合
、
、…、
)。
假設運算模組123欲計算K個特徵中的特徵
的分數
,運算模組123可根據公式(1)計算N個子集合
中的特徵
的數量
,其中
為N個子集合
中的第i個子集合
中的特徵
的數量(
可為0或1)。
…(1)
舉例來說,假設生理資料的總數為3(N=3)且特徵的總數為5(K=5),則運算模組123可根據公式(1)產生如下所示的表1、表2和表3,其中表1對應於第一模型、表2對應於第二模型並且表3對應於第三模型。以表1的特徵
為例,對應於特徵
的數量
=
。
表1
表2
表3
特徵 | 第一模型的第1次統計結果 | 第一模型的第2次統計結果 | 第一模型的第3次統計結果 |
特徵 | 1 | 1 | 0 |
特徵 | 1 | 0 | 0 |
特徵 | 0 | 0 | 1 |
特徵 | 0 | 0 | 1 |
特徵 | 0 | 1 | 0 |
特徵 | 第二模型的第1次統計結果 | 第二模型的第2次統計結果 | 第二模型的第3次統計結果 |
特徵 | 1 | 1 | 0 |
特徵 | 1 | 0 | 0 |
特徵 | 1 | 1 | 0 |
特徵 | 0 | 1 | 0 |
特徵 | 0 | 0 | 1 |
特徵 | 第三模型的第1次統計結果 | 第三模型的第2次統計結果 | 第三模型的第3次統計結果 |
特徵 | 1 | 1 | 0 |
特徵 | 0 | 1 | 0 |
特徵 | 0 | 0 | 1 |
特徵 | 1 | 0 | 0 |
特徵 | 1 | 1 | 0 |
舉例來說,假設N=3,運算模組123可基於公式(2)而根據表1、表2和表3產生如下所示的表4,其中數量
和比率
對應於第一模型,數量
和比率
對應於第二模型,並且數量
和比率
對應於第三模型。
表4
特徵 | 數量 | 數量 | 數量 | 比率 | 比率 | 比率 |
特徵 | 2 | 2 | 2 | 2/3 | 2/3 | 2/3 |
特徵 | 1 | 1 | 1 | 1/3 | 1/3 | 1/3 |
特徵 | 1 | 2 | 1 | 1/3 | 2/3 | 1/3 |
特徵 | 1 | 1 | 1 | 1/3 | 1/3 | 1/3 |
特徵 | 1 | 1 | 2 | 1/3 | 1/3 | 2/3 |
在取得比率
後,運算模組123可根據公式(3)計算出對應於特徵
的分數
,其中
為與第m個模型相對應的權重,並且
為與特徵
和第m個模型相對應的比率。舉例來說,對應於第一模型、第二模型以及第三模型的權重可分別為權重
、權重
以及權重
。舉另一例來說,對應於第一模型、第二模型以及第三模型的權重可分別為權重
、權重
以及權重
。
…(3)
舉例來說,假設權重
、權重
以及權重
,則運算模組123可根據基於公式(3)而根據表4產生如下所示的表5。
表5
特徵 | 比率 | 比率 | 比率 | 分數 |
特徵 | 2/3 | 2/3 | 2/3 | 2/3 |
特徵 | 1/3 | 1/3 | 1/3 | 1/3 |
特徵 | 1/3 | 2/3 | 1/3 | 4/9 |
特徵 | 1/3 | 1/3 | 1/3 | 1/3 |
特徵 | 1/3 | 1/3 | 2/3 | 4/9 |
在一實施例中,閾值m1可關聯於特徵
在K個特徵中的分數排名。舉例來說,閾值m1可指示將K個特徵中具有前幾高分數的特徵作為受選特徵。以表5為例,運算模組123可根據閾值m1而從特徵
~特徵
中選出具有最高分數的特徵
作為受選特徵。換句話說,運算模組123可響應於分數
大於分數
、分數
、分數
以及分數
而從特徵
~特徵
選出對應於分數
的特徵
作為受選特徵。
在步驟S207中,運算模組123可計算K個特徵中的每一者與其他特徵之間的關係指標(relation index)。具體來說,運算模組123可取得分別對應於K個特徵的K個向量,並且從K個向量中選出兩個向量以計算所述兩個向量之間的關係指標。
若運算模組123欲計算K個特徵中的特徵
和特徵
之間的關係指標,運算模組123可根據N個子集合
中的特徵
的數量產生如公式(4)所示的向量
,並可根據N個子集合
中的特徵
的數量產生如公式(5)所示的向量
,其中
為N個子集合
中的第i個子集合
中的特徵
的數量,並且
為N個子集合
中的第i個子集合
中的特徵
的數量。接著,運算模組123可根據向量
以及向量
計算特徵
和特徵
之間的關係指標,其中所述關係指標對應於第m個模型。上述的關係指標例如是關聯於皮爾遜相關係數(Pearson coefficient of correlation,PCC),但本發明不限於此。
…(4)
…(5)
舉例來說,運算模組123可基於公式(4)和公式(5)而根據表1、2和3產生如下所示的表6。表6包含對應於K個特徵(K=5)和M個模型(M=3)的M*K個向量。每一個向量可包含分別對應於N筆訓練資料的N個元素(N=3)。
表6
特徵 | 向量 | 向量 | 向量 |
特徵 | |||
特徵 | |||
特徵 | |||
特徵 | |||
特徵 |
運算模組123可計算對應於至少二特徵的關係指標。舉例來說,若所述至少二特徵僅包含兩個特徵,則運算模組123可基於公式(6)計算兩個特徵(例如:特徵
和
)之間的關係指標
,其中
為向量
和向量
的相關係數,其中
為與第m個模型相對應的權重。舉另一例來說,若所述至少二特徵超過兩個特徵,則運算模組123可基於變異數分析(analysis of variance,ANOVA)檢定計算所述至少二特徵的P值以作為關係指標。
…(6)
在一實施例中,對應於第一模型、第二模型以及第三模型的權重可分別為權重
、權重
以及權重
。在一實施例中,對應於第一模型、第二模型以及第三模型的權重可分別為權重
、權重
以及權重
。舉例來說,若權重
、權重
以及權重
,則運算模組123可基於公式(6)而根據表6的向量產生表7。
表7
特徵對 | 對應第一模型的相關係數 | 對應第二模型的相關係數 | 對應第三模型的相關係數 | 關係指標RI |
1/2 | ||||
-1/3 | ||||
0 | ||||
1/6 | ||||
-1/6 | ||||
-1/2 | ||||
-1/6 | ||||
1/3 | ||||
-5/6 | ||||
-1/6 |
在一實施例中,閾值m2可關聯於一特徵對在
個特徵對中的關係指標排名。舉例來說,閾值m2可指示將
個特徵對中具有前幾高關係指標的特徵對作為受選特徵對。以表7為例,運算模組123可根據閾值m2而從10個特徵對中選出具有最高關係指標的特徵對
作為受選特徵對。換句話說,運算模組123可響應於關係指標
大於關係指標
、
、
、
、
、
、
、
和
而從表7的10個特徵對中選擇特徵對
作為受選特徵對。
在一實施例中,運算模組123可響應於關係指標
超過閾值m2而將特徵對
選為受選特徵對。以表7為例,假設閾值m2等於1/4,則運算模組123可響應於關係指標
大於1/4而選擇特徵對
作為受選特徵對,但受選特徵對不限於一對。
在執行完步驟S206和步驟S208以分別取得受選特徵和受選特徵對後,在步驟S209中,運算模組123可從受選特徵對中取得與受選特徵相對應的特徵以作為共伴特徵(accompanied feature)。舉例來說,在決定特徵
為受選特徵並且特徵對
為受選特徵對後,運算模組123可從特徵對
中選出與特徵
相對應的特徵
以作為特徵
的共伴特徵。
在一實施例中,共伴特徵可由專業人士根據經驗而從K個特徵中選出與受選特徵相對應的特徵以作為共伴特徵。
在步驟S210中,輸出模組124可通過收發器130輸出受選特徵和共伴特徵。在一實施例中,運算模組123可判斷受選特徵和共伴特徵是否為可用的。若受選特徵和共伴特徵為可用的,則輸出模組124可輸出受選特徵和共伴特徵。若受選特徵和共伴特徵為不可用的,則輸出模組124可不輸出受選特徵和共伴特徵。圖3根據本發明的一實施例繪示判斷受選特徵和共伴特徵是否可用的方法的流程圖。
在步驟S301中,運算模組123取得受選特徵和對應於受選特徵的共伴特徵。
在步驟S302中,訓練模組122可從N筆訓練資料中取得與受選特徵和共伴特徵相對應的部分以訓練用於預測生理狀態的至少一第一預測模型。至少一第一預測模型可對應於隨機森林演算法、邏輯式迴歸或支持向量機,本發明不限於此。
在步驟S303中,訓練模組122可從N筆測試資料中取得與受選特徵和共伴特徵相對應的部分以計算對應於至少一第一預測模型的至少一第一效能指標。至少一第一效能指標可對應於混淆矩陣(confusion matrix)中的參數,諸如準確度(accuracy,ACC)、精密度(precision)、召回率(recall rate)、偽陽性(false positive,FP)或F1分數等。
在步驟S304中,訓練模組122可從K個特徵中選出兩個隨機特徵,其中所述兩個隨機特徵中的任一者與所述受選特徵和所述共伴特徵中的任一者相異。接著,訓練模組122可從N筆訓練資料中取得與所述兩個隨機特徵相對應的部分以訓練用於預測生理狀態的至少一第二預測模型。至少一第二預測模型可對應於隨機森林演算法、邏輯式迴歸或支持向量機,本發明不限於此。在一實施例中,訓練模組122可從K個特徵中選出與受選特徵和共伴特徵的數量相對應的多個隨機特徵,藉以訓練至少一第二預測模型。舉例來說,若運算模組123在步驟S301中取得的受選特徵和共伴特徵的總數為4,則訓練模組122可從K個特徵中選出4個隨機特徵以訓練至少一第二預測模型。
在步驟S305中,訓練模組122可從N筆測試資料中取得與所述兩個隨機特徵(或與受選特徵和共伴特徵的數量相對應的多個隨機特徵)相對應的部分以計算對應於至少一第二預測模型的至少一第二效能指標。至少一第二效能指標可對應於混淆矩陣中的參數,諸如準確度、精密度、召回率、偽陽性或F1分數等。
在步驟S306中,運算模組123可判斷至少一第一效能指標是否大於至少一第二效能指標。若至少一第一效能指標大於至少一第二效能指標,則進入步驟S307。若至少一第一效能指標小於或等於至少一第二效能指標,則進入步驟S308。
在步驟S307中,運算模組123可判斷受選特徵和共伴特徵為可用的。在步驟S308中,運算模組123可判斷受選特徵和共伴特徵為不可用的。
圖4根據本發明的另一實施例繪示一種篩選用於預測生理狀態的特徵的方法的流程圖,其中所述方法可由如圖1所示的電子裝置100實施。在步驟S401中,取得對應於多個特徵的多個生理資料。在步驟S402中,基於第一模型而根據多個生理資料產生多個特徵的多個第一子集合,其中多個第一子集合分別對應於多個生理資料。在步驟S403中,根據多個第一子集合以從多個特徵中選出第一特徵,計算對應於多個特徵中的第二特徵與第一特徵的第一關係指標,並且根據第一關係指標而選擇第二特徵與作為第一特徵的共伴特徵。在步驟S404中,輸出第一特徵和共伴特徵。
綜上所述,本發明可利用多種不同的模型以從多個特徵中選出顯著地影響生理特徵的預測結果的特徵,並可根據所述特徵與其他特徵之間的關係指標選出對應於所述特徵的共伴特徵。依此方法選出的共伴特徵也可顯著地影響生理特徵的預測結果。在取得至少一特徵以及對應的至少一共伴特徵後,本發明可根據至少一特徵與至少一共伴特徵訓練預測模型,並計算預測模型的效能指標。若效能指標顯示至少一特徵與至少一共伴特徵可顯著地影響預測模型對生理特徵的預測結果,則本發明可輸出至少一特徵與至少一共伴特徵以供使用者參考。
100:電子裝置
110:處理器
120:儲存媒體
121:資料收集模組
122:訓練模組
123:運算模組
124:輸出模組
130:收發器
S201、S202、S203、S204、S205、S206、S207、S208、S209、S210、S301、S302、S303、S304、S305、S306、S307、S308、S401、S402、S403、S404:步驟
圖1根據本發明的一實施例繪示一種篩選用於預測生理狀態的特徵的電子裝置的示意圖。
圖2根據本發明的一實施例繪示篩選用於預測生理狀態的特徵的方法的流程圖。
圖3根據本發明的一實施例繪示判斷受選特徵和共伴特徵是否可用的方法的流程圖。
圖4根據本發明的另一實施例繪示一種篩選用於預測生理狀態的特徵的方法的流程圖。
S401、S402、S403、S404:步驟
Claims (14)
- 一種篩選用於預測生理狀態的特徵的電子裝置,包括:收發器;儲存媒體,儲存多個模組;以及處理器,耦接所述儲存媒體和所述收發器,並且存取和執行所述多個模組,其中所述多個模組包括:資料收集模組,通過所述收發器取得對應於多個特徵的多個生理資料;訓練模組,基於第一模型而根據所述多個生理資料產生所述多個特徵的多個第一子集合,其中所述多個第一子集合分別對應於所述多個生理資料,其中所述第一模型關聯於隨機森林演算法、邏輯式迴歸以及支持向量機的其中之一;運算模組,根據所述多個第一子集合以從所述多個特徵中選出第一特徵,計算對應於所述多個特徵中的第二特徵與所述第一特徵的第一關係指標,並且根據所述第一關係指標而選擇所述第二特徵與作為所述第一特徵的共伴特徵;以及輸出模組,通過所述收發器輸出所述第一特徵和所述共伴特徵。
- 如請求項1所述的電子裝置,其中所述訓練模組基於第二模型而根據所述多個生理資料產生所述多個特徵的多個第二子集合,其中所述多個第二子集合分別對 應於所述多個生理資料;以及所述運算模組根據所述多個第一子集合和所述多個第二子集合以從所述多個特徵中所述多個特徵中選出所述第一特徵。
- 如請求項2所述的電子裝置,其中所述運算模組計算所述多個第一子集合中的所述第一特徵的第一數量,並且計算所述多個第二子集合中的所述第一特徵的第二數量;以及所述運算模組根據所述第一數量和所述第二數量以從所述多個特徵中所述多個特徵中選出所述第一特徵。
- 如請求項3所述的電子裝置,其中所述運算模組根據所述第一數量、對應於所述第一模型的第一權重、所述第二數量以及對應於所述第二模型的第二權重以計算所述第一特徵的第一分數;以及所述運算模組響應於所述第一分數大於第一閾值而從所述多個特徵中所述多個特徵中選出所述第一特徵。
- 如請求項3所述的電子裝置,其中所述運算模組根據所述第一數量、對應於所述第一模型的第一權重、所述第二數量以及對應於所述第二模型的第二權重以計算所述第一特徵的第一分數;所述運算模組計算所述多個第一子集合中的第三特徵的第三數量,並且計算所述多個第二子集合中的所述第三特徵的第四數量; 所述運算模組根據所述第三數量、所述第一權重、所述第四數量以及所述第二權重以計算所述第三特徵的第二分數;以及所述運算模組響應於所述第一分數大於所述第二分數而從所述第一特徵和所述第三特徵中選擇所述第一特徵。
- 如請求項2所述的電子裝置,其中所述運算模組取得所述多個第一子集合中的每一者中的所述第一特徵的第一數量以產生第一向量;所述運算模組取得所述多個第一子集合中的所述每一者中的所述第二特徵的第二數量以產生第二向量;以及所述運算模組根據所述第一向量和所述第二向量計算所述第一關係指標。
- 如請求項1所述的電子裝置,其中所述運算模組響應於所述第一關係指標大於第二閾值而選擇所述第二特徵以作為所述第一特徵的所述共伴特徵。
- 如請求項1所述的電子裝置,其中所述運算模組計算對應於所述多個特徵中的第三特徵與第四特徵的第二關係指標;以及所述運算模組響應於所述第一關係指標大於所述第二關係指標而選擇所述第二特徵以作為所述第一特徵的所述共伴特徵。
- 如請求項1所述的電子裝置,其中所述訓練模組根據所述多個生理資料、所述第一特徵以及所述共伴特徵訓練所述生理狀態的至少一第一預測模型,並且計算 對應於所述至少一第一預測模型的至少一第一效能指標;所述訓練模組隨機地從所述多個特徵中挑選第三特徵和第四特徵,其中所述第三特徵和所述第四特徵中的任一者與所述第一特徵和所述第二特徵中的任一者相異;所述訓練模組根據所述多個生理資料、所述第三特徵以及所述第四特徵訓練所述生理狀態的至少一第二預測模型,並且計算所述至少一第二預測模型的至少一第二效能指標;所述運算模組響應於所述至少一第一效能指標大於所述至少一第二效能指標而判斷所述第一特徵和所述共伴特徵為可用的;以及所述輸出模組響應於所述第一特徵和所述共伴特徵為可用的而輸出所述第一特徵和所述共伴特徵。
- 如請求項1所述的電子裝置,其中所述多個特徵分別對應於人體的多種代謝物。
- 如請求項9所述的電子裝置,其中所述資料收集模組通過所述收發器接收生理資料集合,並且根據自助重抽法以將生理資料集合區分為分別對應於所述多個生理資料的多個訓練資料和多個測試資料;所述訓練模組根據所述多個訓練資料產生所述多個第一子集合;所述訓練模組根據所述多個訓練資料產生所述至少一第一預測模型;以及 所述訓練模組根據所述多個測試資料計算所述至少一第一效能指標。
- 如請求項2所述的電子裝置,其中所述第二模型關聯於下列的其中之一:隨機森林演算法、邏輯式迴歸以及支持向量機。
- 如請求項12所述的電子裝置,其中所述第一模型基於下列的其中之一產生所述多個第一子集合:逐步挑選法以及特徵重要性。
- 一種篩選用於預測生理狀態的特徵的方法,包括:取得對應於多個特徵的多個生理資料;基於第一模型而根據所述多個生理資料產生所述多個特徵的多個第一子集合,其中所述多個第一子集合分別對應於所述多個生理資料,其中所述第一模型關聯於隨機森林演算法、邏輯式迴歸以及支持向量機的其中之一;根據所述多個第一子集合以從所述多個特徵中選出第一特徵,計算對應於所述多個特徵中的第二特徵與所述第一特徵的第一關係指標,並且根據所述第一關係指標而選擇所述第二特徵與作為所述第一特徵的共伴特徵;以及輸出所述第一特徵和所述共伴特徵。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW109146620A TWI763215B (zh) | 2020-12-29 | 2020-12-29 | 篩選用於預測生理狀態的特徵的電子裝置和方法 |
US17/233,577 US20220208382A1 (en) | 2020-12-29 | 2021-04-19 | Electronic device and method for screening features for predicting physiological state |
EP21175249.8A EP4024407A1 (en) | 2020-12-29 | 2021-05-21 | Electronic device and method for screening features for predicting physiological state |
CN202110695287.4A CN114694838A (zh) | 2020-12-29 | 2021-06-03 | 筛选用于预测生理状态的特征的电子装置和方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW109146620A TWI763215B (zh) | 2020-12-29 | 2020-12-29 | 篩選用於預測生理狀態的特徵的電子裝置和方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
TWI763215B true TWI763215B (zh) | 2022-05-01 |
TW202226269A TW202226269A (zh) | 2022-07-01 |
Family
ID=76059723
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW109146620A TWI763215B (zh) | 2020-12-29 | 2020-12-29 | 篩選用於預測生理狀態的特徵的電子裝置和方法 |
Country Status (4)
Country | Link |
---|---|
US (1) | US20220208382A1 (zh) |
EP (1) | EP4024407A1 (zh) |
CN (1) | CN114694838A (zh) |
TW (1) | TWI763215B (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103761451A (zh) * | 2014-01-02 | 2014-04-30 | 中国科学院数学与系统科学研究院 | 基于生物医学大数据的生物标记物组合识别方法和系统 |
CN104271033A (zh) * | 2012-05-03 | 2015-01-07 | 曼迪奥研究有限公司 | 一种评价胃肠癌风险的方法和系统 |
CN104573410A (zh) * | 2015-01-20 | 2015-04-29 | 合肥工业大学 | 基于分子子网与随机森林分类器的癌症化疗敏感性预测方法 |
CN106250715A (zh) * | 2016-09-28 | 2016-12-21 | 湖南老码信息科技有限责任公司 | 一种基于增量式神经网络模型的慢性咽喉炎预测方法和预测系统 |
US20200342587A1 (en) * | 2019-04-25 | 2020-10-29 | International Business Machines Corporation | Intelligent classification of regions of interest of an organism from multispectral video streams using perfusion models |
US20200357120A1 (en) * | 2018-01-25 | 2020-11-12 | The Asan Foundation | Method and apparatus for predicting brain disease change through machine learning and program for the same |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019195638A1 (en) * | 2018-04-04 | 2019-10-10 | Human Longevity, Inc. | Systems and methods for measuring obesity using metabolome analysis |
US20200194126A1 (en) * | 2018-12-17 | 2020-06-18 | The Regents Of The University Of California | Systems and methods for profiling and classifying health-related features |
-
2020
- 2020-12-29 TW TW109146620A patent/TWI763215B/zh active
-
2021
- 2021-04-19 US US17/233,577 patent/US20220208382A1/en active Pending
- 2021-05-21 EP EP21175249.8A patent/EP4024407A1/en active Pending
- 2021-06-03 CN CN202110695287.4A patent/CN114694838A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104271033A (zh) * | 2012-05-03 | 2015-01-07 | 曼迪奥研究有限公司 | 一种评价胃肠癌风险的方法和系统 |
CN103761451A (zh) * | 2014-01-02 | 2014-04-30 | 中国科学院数学与系统科学研究院 | 基于生物医学大数据的生物标记物组合识别方法和系统 |
CN104573410A (zh) * | 2015-01-20 | 2015-04-29 | 合肥工业大学 | 基于分子子网与随机森林分类器的癌症化疗敏感性预测方法 |
CN106250715A (zh) * | 2016-09-28 | 2016-12-21 | 湖南老码信息科技有限责任公司 | 一种基于增量式神经网络模型的慢性咽喉炎预测方法和预测系统 |
US20200357120A1 (en) * | 2018-01-25 | 2020-11-12 | The Asan Foundation | Method and apparatus for predicting brain disease change through machine learning and program for the same |
US20200342587A1 (en) * | 2019-04-25 | 2020-10-29 | International Business Machines Corporation | Intelligent classification of regions of interest of an organism from multispectral video streams using perfusion models |
Also Published As
Publication number | Publication date |
---|---|
EP4024407A1 (en) | 2022-07-06 |
TW202226269A (zh) | 2022-07-01 |
US20220208382A1 (en) | 2022-06-30 |
CN114694838A (zh) | 2022-07-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Xie et al. | Autoscore: a machine learning–based automatic clinical score generator and its application to mortality prediction using electronic health records | |
JP2021529061A (ja) | 画像処理方法、電子機器及び記憶媒体 | |
DeVore et al. | Comprehensive evaluation of fetal cardiac ventricular widths and ratios using a 24‐segment speckle tracking technique | |
WO2020027213A1 (ja) | 認知症リスクの提示システムおよび方法 | |
CN112819045A (zh) | 用于用户生理状态分类的方法、装置、电子设备及介质 | |
JP6193225B2 (ja) | 肝線維症検出装置および検出システム | |
Bai et al. | Using machine learning for the early prediction of sepsis-associated ARDS in the ICU and identification of clinical phenotypes with differential responses to treatment | |
TWI763215B (zh) | 篩選用於預測生理狀態的特徵的電子裝置和方法 | |
Gemmar | An interpretable mortality prediction model for COVID-19 patients–alternative approach | |
Jung et al. | Disease-course adapting machine learning prognostication models in elderly patients critically ill with COVID-19: multicenter cohort study with external validation | |
CN111739599A (zh) | 一种教学病历生成方法和装置 | |
TWI790479B (zh) | 生理狀態評估方法與生理狀態評估裝置 | |
TWI768624B (zh) | 預測冠狀動脈的阻塞的電子裝置和方法 | |
Becker-Pennrich et al. | Comparing supervised machine learning algorithms for the prediction of partial arterial pressure of oxygen during craniotomy | |
TWM605545U (zh) | 慢性病的風險評估裝置 | |
Heitz et al. | WRSE-a non-parametric weighted-resolution ensemble for predicting individual survival distributions in the ICU | |
Peterson | A simple aggregation rule for penalized regression coefficients after multiple imputation | |
US11844633B2 (en) | Feature identifying method and electronic device | |
Nguyen et al. | The use of probabilistic graphical models in pediatric sepsis: a feasibility and scoping review | |
Włodarczyk et al. | Szczepa nski | |
US20240144056A1 (en) | Method and computing device of establishing prediction model for predicting probability of subject experiencing white coat effect | |
Wu et al. | Predicting length of stay in intensive care unit using ensemble learning methods | |
TWI683223B (zh) | 篩選資料的方法和裝置 | |
CN117912700A (zh) | 肾透析预测方法、装置、设备以及存储介质 | |
Lyon et al. | Automated development of clinical prediction models enables real-time risk stratification with exemplar application to hypoxic-ischaemic encephalopathy |