TWI715250B - 特徵識別方法與電子裝置

Info

Abstract

Description

Claims

TWI715250B

Publication number: TWI715250B
Application number: TW108137534A
Authority: TW
Inventors: 李俊賢; 蔡宗憲; 陳亮恭; 陳震寰; 鄭浩民
Original assignee: 宏碁股份有限公司; 國立陽明大學
Priority date: 2019-10-17
Filing date: 2019-10-17
Publication date: 2021-01-01
Also published as: US11844633B2; US20210113158A1; TW202117744A

特徵識別方法與電子裝置。所述方法包括：獲得受測者在一日內的多個時間點被量測的多個生理資訊；分別轉換此些生理資訊為多個相關特徵；根據前述多個相關特徵建立多個第一風險預測模型，並根據此些第一風險預測模型從前述多個相關特徵中識別至少一第一相關特徵；根據所述第一相關特徵建立多個第二風險預測模型，並根據此些第二風險預測模型從所述第一相關特徵中識別具有預測特定疾病的能力的至少一第二相關特徵；以及輸出所述第二相關特徵。

特徵識別方法與電子裝置

本發明是有關於一種特徵識別方法與電子裝置。

一般來說，目前醫學界是使用包括佛萊明風險分數(Framingham risk score)在內的風險預測方程式來預測心血管疾病的患病機率。然而，使用此些風險預測方程式的方法通常只使用單一一次對受測者測量而獲得的收縮壓與舒張壓，其並沒有考慮到如何綜合一天內在多個不同時間點量測而獲得的多個收縮壓與多個舒張壓來進行判斷。

因此，如何利用根據受測者在24小時內的多個血壓資訊進行判斷以輔助醫生判定受測者發生或是死於心血管疾病之風險，是本領域技術人員欲解決的問題之一。此外，除了考量血壓資訊外，也可以同時考量生理與抽血等資訊，來協助診斷風險大小，因此，若從受測者在24小時內的多個血壓資中得到具有預測特定疾病的能力的特徵，對於判斷風險大小上有一定的助益，且能有利於醫生精準地及有效地判斷心血管疾病的患病風險。

本發明提供的特徵識別方法與電子裝置可以從受測者在一日(24小時)內不同時間點測量而獲得的生理資訊(例如，血壓資訊)中找到具有預測特定疾病的能力的特徵。

本發明提出一種特徵識別方法，用於一電子裝置，所述方法包括：獲得分別在一日內的多個時間點對受測者進行量測所獲得的多個生理資訊；轉換所述多個生理資訊為分別對應於所述多個生理資訊的多個相關特徵；根據所述多個相關特徵建立多個第一風險預測模型，並根據所述多個第一風險預測模型從所述多個相關特徵中識別至少一第一相關特徵；根據所述第一相關特徵建立多個第二風險預測模型，並根據所述多個第二風險預測模型從所述第一相關特徵中識別具有預測特定疾病的能力的至少一第二相關特徵；以及輸出所述第二相關特徵。

本發明提出一種電子裝置，其包括一處理器用以執行下述運作：獲得分別在一日內的多個時間點對受測者進行量測所獲得的多個生理資訊；轉換所述多個生理資訊為分別對應於所述多個生理資訊的多個相關特徵；根據所述多個相關特徵建立多個第一風險預測模型，並根據所述多個第一風險預測模型從所述多個相關特徵中識別至少一第一相關特徵；根據所述第一相關特徵建立多個第二風險預測模型，並根據所述多個第二風險預測模型從所述第一相關特徵中識別具有預測特定疾病的能力的至少一第二相關特徵；以及輸出所述第二相關特徵。

基於上述，本發明的特徵識別方法與電子裝置是依據受測者在一日(24小時)內不同時間點測量而獲得的生理資訊(例如，血壓資訊)，從生理資訊中找到具有預測特定疾病的能力的特徵，而此些特徵可以用來協助醫生作特定疾病的風險的判斷依據，也可以作為其他後續的模型訓練或醫療研究。

現將詳細參考本發明之示範性實施例，在附圖中說明所述示範性實施例之實例。另外，凡可能之處，在圖式及實施方式中使用相同標號的元件/構件代表相同或類似部分。

本發明所提出的特徵識別方法適用於電子裝置。電子裝置包括處理器、輸入輸出電路以及儲存電路。其中，輸入輸出電路以及儲存電路分別耦接至處理器。電子裝置例如是桌上型電腦、伺服器、手機、平板電腦、筆記型電腦等電子行動裝置，在此不設限。

處理器可以是中央處理器（Central Processing Unit，CPU），或是其他可程式化之一般用途或特殊用途的微處理器（Microprocessor）、數位信號處理器（Digital Signal Processor，DSP）、可程式化控制器、特殊應用積體電路（Application Specific Integrated Circuit，ASIC）或其他類似元件或上述元件的組合。

輸入輸出電路例如是用於從電子裝置外部或其他來源取得相關資料的輸入介面或電路。此外，輸入輸出電路也可以將電子裝置產生的資料傳送給其他電子裝置的輸出介面或電路，在此並不設限。

儲存電路可以是任何型態的固定或可移動隨機存取記憶體（random access memory，RAM）、唯讀記憶體（read-only memory，ROM）、快閃記憶體（flash memory）或類似元件或上述元件的組合。

在本範例實施例中，電子裝置的儲存電路中儲存有多個程式碼片段，在上述程式碼片段被安裝後，會由處理器來執行。例如，儲存電路中包括多個模組，藉由這些模組來分別執行應用於電子裝置的各個運作，其中各模組是由一或多個程式碼片段所組成。然而本發明不限於此，電子裝置的各個運作也可以是使用其他硬體形式的方式來實現。

圖1是依照本發明的一實施例所繪示的特徵識別方法的流程圖。

請參照圖1，在步驟S101中，處理器獲得分別在一日內的多個時間點對受測者進行量測所獲得的多個生理資訊。在本實施例中，生理資訊例如是受測者的血壓，然而本發明並不限於此。在其他實施例中，生理資訊也可以是其他種類的生理資訊。以下的範例以血壓進行說明。

在步驟S103中，處理器執行特徵工程以分別對前述的多個生理資訊轉換為多個轉換後特徵。更詳細來說，在獲得受測者的血壓資料後，可以執行特徵工程以獲得血壓資料的統計量(即，前述的轉換後特徵)。統計量可以是血壓資料的平均數、斜率或震盪幅度等，在此不作限制。

之後，在步驟S105中，處理器根據線性轉換演算法以及非線性轉換演算法的至少其中之一分別將前述多個轉換後特徵轉換為多個相關特徵。在此，線性轉換演算法例如是先計算每個受測者一日內所量測到的多個收縮壓的平均收縮壓，並將多個受測者的平均收縮壓進行標準化。更詳細來說，請參照表1：

	平均收縮壓	標準化的平均收縮壓	平均收縮壓取log	平均收縮壓取平方	平均收縮壓開根號	標準化的平均收縮壓取平方
受測者U1	120	-0.058	4.787	14400	10.954	0.003
受測者U2	125	0.669	4.828	15625	11.180	0.447
受測者U3	119	-0.204	4.779	14161	10.909	0.041
受測者U4	128	1.105	4.852	16384	11.318	1.221
受測者U5	110	-1.512	4.700	12100	10.488	2.287

表1

以表1為例，假設目前有受測者U1~U5。在表1的第二行可以看到，受測者U1~U5在一日內的平均收縮壓分別為120、125、119、128以及110。在線性轉換方法中，處理器可以先計算受測者U1~U5的整體的平均收縮壓，其值為120.4。此外，處理器還可以計算受測者U1~U5的標準差，其值為6.8775。以受測者U1為例，標準化後數值(即，標準化的平均收縮壓)為

= -0.058。而其他受測者U2~U5的標準化的平均收縮壓亦可以由上述方式得出，在此不再贅述。各個受測者的標準化的平均收縮壓如表1的第三行所示。

此外，非線性轉換演算法例如是對平均收縮壓取log(結果如表1第四行所示)、對平均收縮壓取平方(結果如表1第五行所示)或對平均收縮壓開根號(結果如表1第六行所示)。

特別是，在步驟S105中，處理器也可以同時根據線性轉換演算法以及非線性轉換演算法兩者分別將前述多個轉換後特徵轉換為多個相關特徵。例如，可以先使用線性轉換演算法獲得各個受測者的標準化的平均收縮壓，之後再使用非線性轉換演算法對各個受測者的標準化的平均收縮壓取平方，結果如表1的第7行所示。然而，本發明並不用於限定線性轉換演算法、非線性轉換演算法以及前述兩者結合使用時的實際計算方式。

在獲得多個相關特徵後，在步驟S107中，處理器根據前述多個相關特徵建立多個第一風險預測模型，並根據此些第一風險預測模型從前述多個相關特徵中識別至少一第一相關特徵。

圖2A與圖2B是依照本發明的一實施例所繪示的步驟S107的詳細流程圖。

請同時參照圖2A與圖2B，在步驟S201中，處理器會將前述多個相關特徵區分為第一訓練資料以及第一預測資料。例如，如圖2B所示，在步驟S201中，處理器可以使用不重複切分訓練/預測資料的方法20a及/或可重複抽取訓練/預測資料的方法20b來區分第一訓練資料以及第一預測資料。不重複切分訓練/預測資料的方法20a例如是K-fold CV演算法，可重複抽取訓練/預測資料的方法20b例如是Bootstrap演算法，但本發明並不在此限。

在步驟S203中，處理器會根據第一訓練資料建立分別對應於多個演算法的多個第一風險預測模型。如圖2B所示，步驟S203例如使用第一訓練資料建立模型21a~21c。模型21a例如是結合多種分類器方法(例如Random Survival Forest)的模型。模型21b例如是使用傳統統計方法(例如Cox proportional hazard)的模型。模型21c例如是使用其他方法(例如，Survival SVM)所產生的模型。

之後，在步驟S205中，處理器會根據前述多個第一風險預測模型從前述多個相關特徵中識別至少一顯著特徵。需說明的是，顯著特徵可以讓前述模型21a~21c擁有較高的預測準確度。如圖2B所示，步驟S205例如使用逐步放入/剔除增益方法22a(例如，Stepwise (P-value/AIC)的方法)或者根據多分類器選擇的次數/影響力/權重判斷的方法22b(例如，特徵的重要性或被選擇的次數)從多個相關特徵中識別出顯著特徵。如何使用逐步放入/剔除增益方法22a或者根據多分類器選擇的次數/影響力/權重判斷的方法22b識別出特徵可以由習知技術所得知，在此不再贅述。

在識別出顯著特徵後，在步驟S206a中，處理器會記錄模型21a~21c挑選的顯著特徵。此外，如圖2B的步驟S206b所示，前述的步驟S201至步驟206a會反覆地被執行以重複多次模型的建立與挑選顯著特徵，而此重複執行的過程例如可以執行一定的預設次數。

之後，在步驟S207中，處理器會獲得每一個顯著特徵被每一個第一風險預測模型挑選的挑選資訊。在此，挑選資訊例如是被選擇到的次數及/或比率。以表二為例：

表二

如表二所示，假設目前有血壓特徵F1~F5。假設模型21a~21c在執行步驟S201至步驟S206a兩次且模型21a~21c所選到的顯著特徵如表二所示。在表二中，有被選到的血壓特徵是以 “1”表示，而沒有被選到的血壓特徵是以 “0”表示)。

之後，處理器會根據各模型所選到的血壓特徵，計算特徵F1~F5被每個模型所選到的次數與比率。如下表三所示：

血壓特徵	模型21a選到的次數	模型21b選到的次數	模型21c 選到的次數	模型21a選到的比率	模型21b選到的比率	模型21c選到的比率	排名指標
F1	2	2	2	1.0	1.0	1.0	1
F2	1	1	0	0.5	0.5	0.0	1/3
F3	0	2	0	0.0	1.0	0.0	1/3
F4	0	0	1	0.0	0.0	0.5	1/6
F5	1	0	1	0.5	0.0	0.5	1/3

表三

以特徵F1為例，由於模型21a在執行重複兩次的步驟S201至步驟S206a中皆有選到血壓特徵F1，因此可以在表三中將血壓特徵F1被模型21a選到的次數記錄為 “2”。且由於兩次的選擇中血壓特徵F1皆有被模型21a選到，因此可以將血壓特徵F1被模型21a選到的比率記錄為 “1” (即，2/2) 。而其他的血壓特徵被模型21a~21c挑選到的次數與比率可以是以類似前述的方式所得出，在此不再贅述。

此外，在步驟S209中，處理器會根據分別對應於前述多個第一風險預測模型的多個第一權重以及前述的挑選資訊，計算分別對應於顯著特徵的至少一排名指標。假設可以對每個模型設定一個權重(即，前述的第一權重)，並根據所設定的權重與挑選資訊來計算每個顯著特徵的分數(即，排名指標)。舉例來說，假設模型21a~21c的權重皆為

，處理器例如可以使用此權重與每個模型選到的比率計算血壓特徵F1的排名指標，其值為1(即， 1 *

+ 1 *

)。而其他的血壓特徵的排名指標可以是以類似前述的方式所得出，在此不再贅述。特別是，本發明並不用於限定模型21a~21c所對應的權重的值。在一實施例中，模型21a的權重可以是0，模型21b的權重可以是0且模型21c的權重可以是1。

之後，在步驟S211中，處理器會設定第一門檻值，並且在步驟S213中根據前述的排名指標以及第一門檻值，從顯著特徵中識別第一相關特徵。更詳細來說，假設第一門檻值為

，處理器可以挑選排名指標大於

的血壓特徵F1、F2、F3、F5作為前述的第一相關特徵。特別是，本發明並不用於限定第一門檻值的數值。

請再次參照圖1，在執行完步驟S107後，在步驟S109中，處理器會根據第一相關特徵建立多個第二風險預測模型，並根據此些第二風險預測模型從第一相關特徵中識別具有預測特定疾病的能力的至少一第二相關特徵。最後在步驟S111中，處理器可以輸出第二相關特徵以作為後續的應用的輸入(例如，用於其他模型的訓練或其他應用)。特別是，前述步驟S109的詳細流程可以由圖3A與圖3B進行描述。

圖3A與圖3B是依照本發明的一實施例所繪示的步驟S109的詳細流程圖。

請同時參照圖3A與圖3B，在步驟S301中，處理器會將前述的第一相關特徵區分為第二訓練資料以及第二預測資料。將相關特徵區分為訓練資料與預測資料的方法可以類似於步驟S201所使用的方法，故在此不再贅述。之後，在步驟S303中，處理器根據第二訓練資料建立多個第二風險預測模型。

更詳細來說，請參照圖3B，步驟S303是利用佛萊明(Framingham)心血管疾病風險預測方法(以下簡稱，佛萊明法)來建立風險預測模型。一般來說，佛萊明法是使用受測者在診間量測的生理指標(例如，收縮壓)搭配額外生理特徵(例如，年齡、總/高密度膽固醇、有無抽菸及/或有無糖尿病等)來建立風險預測模型。而步驟S303主要建立多個模型，此些模型會包括傳統使用由佛萊明法建立的特定風險預測模型。此外，前述模型還會從第二訓練資料中提取至少一相關特徵，使用此相關特徵產生用於佛萊明法的生理指標並使用此生理指標搭配額外生理特徵建立風險預測模型。最後可以依據前述特定風險預測模型的預測能力，從步驟S303所建立的其他風險預測模型中挑選具有預測能力大於特定風險預測模型的預測能力的風險預測模型。

例如，步驟S303又可以包括步驟S3029~步驟S3037。在步驟S3029中，處理器會使用佛萊明法作為驗證方法。在步驟S3030中，處理器獲得在診間對受測者進行單一次量測所獲得的生理資訊所對應的第三生理指標。也就是說，步驟S3030中獲得的第三生理指標是用於建立傳統的風險預測模型(即，前述的特定風險預測模型)。此外，步驟S3031會使用特定方法產生的特徵組合產生用於建立風險預測模型的生理指標。步驟S3031又可以分為步驟S3033與步驟S3035。在步驟S3033中，處理器會從前述第二訓練資料中選擇僅一個相關特徵(亦稱為，第三相關特徵)作為用於建立風險預測模型的第一生理指標。前述的第三相關特徵可以是一日中的平均收縮壓取log或其他的相關特徵，在此不作限制。而在步驟S3035中，處理器會從前述第二訓練資料中選擇多個相關特徵(亦稱為，第四相關特徵)，並根據此些第四相關特徵的組合產生第二生理指標。而步驟S3035的詳細執行過程請容後詳述。

之後，在步驟S3037中，處理器會根據第一生理指標以及額外生理特徵建立第二風險預測模型中的一模型、根據第二生理指標以及額外生理特徵建立第二風險預測模型中的另一模型，以及根據第三生理指標以及額外生理特徵建立第二風險預測模型中的特定風險預測模型。也就是說，處理器會分別使用步驟S3030、步驟S3033以及步驟S3035中所產生的生理指標搭配額外生理特徵來建立多個第二風險預測模型。

在建立多個第二風險預測模型後，在步驟S305中，處理器會計算每一個第二風險預測模型的多個預測能力量值。更詳細來說，風險預測模型的預測能力量值可以是藉由預測能力量值C-index、AIC或BIC等方式來計算。以C-index為例，C-index是用於衡量風險預測模型與實際觀察結果的一致性，其數值介於0至1。例如：有一風險預測模型預測三位受測者的心血管風險值分別為1、2與3(在此，數值愈大代表愈容易得心血管疾病)，而假設受測者實際於觀察期間內得到心血管疾病的時間分別為5年、3年與1年。對於第一位與第二位受測者來說，由於第二位受測者的風險值較高，其與第二位受測者較快得到心血管疾病的實際情況兩者是一致的。因此，對於三位受測者比較結果，兩兩比較總共有3種組合，在此範例中，由於符合一致性的組合有三種，因此C-index可記為 “1”。基於此方式，可以獲得第二每一個第二風險預測模型的預測能力量值。此外，如圖3B的步驟S306所示，處理器會重複多次模型建立與計算模型的預測能力量值。也就是說，步驟S303~S305可以重複多次(即，多個輪迴)，並且每執行一次就可以獲得每一個模型的預測能力量值。以下表四為例：

重複次序	使用步驟S3030的生理指標所建立的風險預測模型的C-index	使用步驟S3033的生理指標所建立的風險預測模型的C-index	使用步驟S3035的生理指標所建立的風險預測模型的C-index
第1次	0.70	0.65	0.75
第2次	0.75	0.70	0.80

表四

在表四的範例中，假設「使用步驟S3030的生理指標所建立的風險預測模型」是使用診間對受測者進行單一次量測所獲得的生理資訊所對應的生理指標所建立的模型，假設「使用步驟S3033的生理指標所建立的風險預測模型」是僅使用血壓特徵F1產生的生理指標所建立的模型，且「使用步驟S3035的生理指標所建立的風險預測模型」是使用排名指標為前四大的血壓特徵F1、F2、F3、F5所產生的生理指標所建立的模型。處理器在參照佛萊明法分別建立前述三個模型後，例如可以重複執行步驟S303、S305兩個輪迴以獲得每一個模型在每次輪迴中所計算出的C-index。如表五所示，「使用步驟S3030的生理指標所建立的風險預測模型的C-index」在第一次輪迴後獲得值為 “0.70”的C-index且在第二次輪迴後獲得值為 “0.75”的C-index。而其他模型在每次輪迴所獲得的C-index可以記載如表四，在此不再贅述。

之後，在步驟S307中，處理器會根據多個第二權重以及前述多個預測能力量值，計算分別對應於前述多個第二風險預測模型的多個綜合指標。例如，以延續表四的表五為例：

	使用步驟S3030的生理指標所建立的風險預測模型	使用步驟S3033的生理指標所建立的風險預測模型	使用步驟S3035的生理指標所建立的風險預測模型
綜合指標	0.725	0.675	0.775

表五

例如，處理器可以設定每次獲得的C-index的權重為0.5，再計算上述三個模型的綜合指標。以「使用步驟S3030的生理指標所建立的風險預測模型的C-index」為例，其綜合指標的值為0.725 (即，(0.70*0.5)+(0.75*0.5))。而表五中其他模型的綜合指標可以是以相類似的方式計算出，在此不再贅述。

之後，在步驟S309中，處理器會將第二風險預測模型中的特定風險預測模型的第一綜合指標定義為第二門檻值。也就是說，處理器會將「使用步驟S3030的生理指標所建立的風險預測模型」的綜合指標定義為第二門檻值。特別是，「使用步驟S3030的生理指標所建立的風險預測模型」即是傳統使用診間對受測者進行單一次量測所獲得的生理指標所建立的風險預測模型，而當一風險預測模型的綜合指標大於前述的第二門檻值時，即代表該風險預測模型的預測能力會優於使用傳統方法建立的風險預測模型。

在定義第二門檻值後，在步驟S311中，處理器會根據前述多個綜合指標以及第二門檻值，從前述多個第二風險預測模型中識別第三風險預測模型，並將用於建立此第三風險預測模型的相關特徵識別為第二相關特徵。詳細來說，在表五的範例中，處理器會選擇「使用步驟S3030的生理指標所建立的風險預測模型的C-index」的綜合指標的值(即，0.725)作為第二門檻值，並且從剩餘的兩個模型中識別出具有綜合指標大於第二門檻值的「使用步驟S3035的生理指標所建立的風險預測模型」作為前述的第三風險預測模型，並將建立此第三風險預測模型的相關特徵識別為前述的第二相關特徵。

特別是，雖然本發明的預測能力量值是以C-index為例進行說明，但本發明不限於此。在其他實施例中，可以將C-index換成AIC或BIC。在此情況下，前述步驟S311則是選擇具有綜合指標低於第二門檻值的模型為前述的第三風險預測模型。

此外，圖4是依照本發明的一實施例所繪示的步驟S3035的詳細流程圖。

請參照圖4，在步驟S401中，處理器會獲得多個第四相關特徵的組合。例如，在一實施例中，處理器會從第二訓練資料中選擇多個第四相關特徵，而此些第四相關特徵被每一個第一風險預測模型挑選的挑選資訊(即，次數及/或比率)是大於第二訓練資料中其他的相關特徵。舉例來說，可以使用如表三的方式計算每個血壓特徵被模型挑選到的次數及/或比率，進而獲得每個血壓特徵的排名指標，並挑選排名指標為最大的四個血壓特徵作為第四相關特徵，並以此四個第四相關特徵作為第四相關特徵的組合。

此外，在另一實施例中，當處理器藉由前述方式從第二訓練資料中選擇第四相關特徵後，處理器還可以根據此些第四相關特徵產生至少一特徵交互項，並將所選擇的第四相關特徵以及所產生的特徵交互項一同作為第四相關特徵的組合。特別是，特徵交互項可以是第四相關特徵中任意兩個相關特徵的乘積。以血壓特徵F1~F5為例，假設處理器選擇血壓特徵F1、F2、F3、F5作為第四相關特徵，處理器還會將前述血壓特徵F1、F2、F3、F5中任意兩個血壓特徵相乘以產生六個特徵交互項，最後將血壓特徵F1、F2、F3、F5以及所產生的六個特徵交互項作為第四相關特徵的組合。

或者，在另一實施例中，處理器會根據生理資訊(例如，血壓)的類型(例如，收縮壓、舒張壓、心率)與前述第二訓練資料中的相關特徵的計算方式(例如，平均與最高/低、標準差與變動幅度、驟升斜率與不同時間區間差值等)對所述第二訓練資料中的相關特徵進行歸類以獲得多個類別，之後將每個類別中具有最大的排名指標的相關特徵識別為前述的多個第四相關特徵，並以此四個第四相關特徵作為第四相關特徵的組合。舉例來說，如下表六所示：

血壓特徵	實際特徵名稱	特徵排名指標	血壓類型	計算方式	類型標記	各類排序
F1	平均收縮壓取log	1	收縮壓	平均與最高/低	1	1
F2	睡眠至晨間的舒張壓驟升斜率取平方	1/3	舒張壓	驟升斜率與不同時間區間差異量	2	1
F3	整日舒張壓的標準差開根號	1/3	舒張壓	標準差與變動幅度	3	1
F5	睡眠時的最低收縮壓	1/3	收縮壓	平均與最高/低	1	2

表六

如表六所示，若一個血壓特徵的血壓類型與血壓特徵的計算方式相同於另一個血壓特徵的血壓類型與血壓特徵的計算方式時，則此兩個血壓特徵可以歸類為同一類。例如，血壓特徵F1與血壓特徵F5的血壓類型皆為「收縮壓」且血壓特徵F1與血壓特徵F5的計算方式皆為「平均與最高/低」，則血壓特徵F1與血壓特徵F5兩者會被歸類為同一類，表六中以類型標記 “1”來標記血壓特徵F1與血壓特徵F5屬於同一類。此外，由於剩餘的血壓特徵F2與血壓特徵F3的血壓類型與計算方式並不完全相同，且血壓特徵F2與血壓特徵F3的血壓類型與計算方式也並不完全相同於血壓特徵F1與血壓特徵F5，故處理器會單獨將血壓特徵F2歸為一類(以類型標記 “2”來標記)以及單獨將血壓特徵F5歸為一類(以類型標記 “3”來標記)。之後，處理器會從每個類別中挑選具有最大的排名指標的相關特徵。在本範例中，處理器會從類型標記為“1”的類別中挑選血壓特徵F1、從類型標記為“2”的類別中挑選血壓特徵F2以及從類型標記為“3”的類別中挑選血壓特徵F3，並將血壓特徵F1~F3識別為前述的多個第四相關特徵，並以此三個第四相關特徵作為第四相關特徵的組合。

或者，在另一實施例中，處理器也可以使用主成分分析（Principal components analysis，PCA）從第二訓練資料中選擇第四相關特徵，並根據第四相關特徵產生第四相關特徵的組合。如何使用主成分分析來進行挑選可以由習知技術所得知，在此不再贅述。

之後，在步驟S403中，處理器會產生對應於前述多個第四相關特徵的組合的風險值。例如，處理器會利用Coxph演算法來計算前述多個第四相關特徵的組合的風險值。風險值利如是患病的風險、機率及/或時間。

在獲得風險值後，在步驟S405中，處理器會根據此風險值產生第二生理指標。例如，在一實施例中，處理器會直接使用風險值作為第二生理指標。或者，在另一實施例中，處理器也可以將標準化後的風險值作為第二生理指標。

綜上所述，本發明的特徵識別方法與電子裝置是依據受測者在一日(24小時)內不同時間點測量而獲得的生理資訊(例如，血壓資訊)，從生理資訊中找到具有預測特定疾病的能力的特徵，而此些特徵可以用來協助醫生作特定疾病的風險的判斷依據，也可以作為其他後續的模型訓練或醫療研究。特別是，本發明是利用長時間的生理資訊進行分析，於考慮眾多相關特徵中，根據統計與機器學習方法獲得具有預測特定疾病的能力的特徵，且此特徵會比傳統的方法(例如，佛萊明法)具有較佳的預測結果，代表能提升患病風險的預估準確度，並協助減少醫學上誤判的可能性。在血壓的範例中，未來患有心血管疾病之病患，除了監控收縮壓與舒張壓過高或過低為異常之外，亦可以此特徵為重要因子，作二次確認異常與否，增加判定正確的可信度，藉此免於延誤接受相關治療的時機。

S101~S111、S201~S213、S206a、S206b、S301~S311、S3029~S3037、S401~S405:步驟

20a:不重複切分訓練/預測資料的方法

20b:可重複抽取訓練/預測資料的方法

21a~21c:模型

22a:逐步放入/剔除增益方法

22b:多分類器選擇的次數/影響力/權重判斷的方法

圖1是依照本發明的一實施例所繪示的特徵識別方法的流程圖。圖2A與圖2B是依照本發明的一實施例所繪示的步驟S107的詳細流程圖。圖3A與圖3B是依照本發明的一實施例所繪示的步驟S109的詳細流程圖。圖4是依照本發明的一實施例所繪示的步驟S3035的詳細流程圖。

S101~S111:步驟

模型21a的第1次結果

模型21a的第2次結果

模型21b的第1次結果

模型21b的第2次結果

模型21c的第1次結果

模型21c的第2次結果

一種特徵識別方法，用於一電子裝置，所述方法包括：獲得分別在一日內的多個時間點對受測者進行量測所獲得的多個生理資訊；轉換所述多個生理資訊為分別對應於所述多個生理資訊的多個相關特徵；根據所述多個相關特徵建立多個第一風險預測模型，並根據所述多個第一風險預測模型從所述多個相關特徵中識別至少一第一相關特徵；根據所述第一相關特徵建立多個第二風險預測模型，並根據所述多個第二風險預測模型從所述第一相關特徵中識別具有預測特定疾病的能力的至少一第二相關特徵；以及輸出所述多個相關特徵中的所述第二相關特徵。
如申請專利範圍第1項所述的特徵識別方法，其中轉換所述多個生理資訊為分別對應於所述多個生理資訊的所述多個相關特徵的步驟包括：執行特徵工程以分別對所述多個生理資訊轉換為多個轉換後特徵；以及根據線性轉換演算法以及非線性轉換演算法的至少其中之一分別將所述多個轉換後特徵轉換為所述多個相關特徵。
如申請專利範圍第1項所述的特徵識別方法，其中根據所述多個相關特徵建立所述多個第一風險預測模型，並根據所述多個第一風險預測模型從所述多個相關特徵中識別所述第一相關特徵的步驟包括：將所述多個相關特徵區分為第一訓練資料以及第一預測資料；根據所述第一訓練資料建立分別對應於多個演算法的所述多個第一風險預測模型；以及根據所述多個第一風險預測模型從所述多個相關特徵中識別至少一顯著特徵。
如申請專利範圍第3項所述的特徵識別方法，更包括：獲得每一所述顯著特徵被每一所述多個第一風險預測模型挑選的挑選資訊；根據分別對應於所述多個第一風險預測模型的多個第一權重以及所述挑選資訊，計算分別對應於所述顯著特徵的至少一排名指標；以及根據所述排名指標以及第一門檻值，從所述顯著特徵中識別所述第一相關特徵。
如申請專利範圍第1項所述的特徵識別方法，其中根據所述第一相關特徵建立所述多個第二風險預測模型，並根據所述多個第二風險預測模型從所述第一相關特徵中識別具有預測特定疾病的能力的所述第二相關特徵的步驟包括：將所述第一相關特徵區分為第二訓練資料以及第二預測資料；根據所述第二訓練資料建立所述多個第二風險預測模型；計算每一所述多個第二風險預測模型的多個預測能力量值；根據多個第二權重以及所述多個預測能力量值，計算分別對應於所述多個第二風險預測模型的多個綜合指標；以及將所述多個第二風險預測模型中的特定風險預測模型的第一綜合指標定義為第二門檻值，並根據所述多個綜合指標以及所述第二門檻值，從所述多個第二風險預測模型中識別第三風險預測模型，並將用於建立所述第三風險預測模型的相關特徵識別為所述第二相關特徵。
如申請專利範圍第5項所述的特徵識別方法，其中根據所述第二訓練資料建立所述多個第二風險預測模型的步驟包括：從所述第二訓練資料中選擇僅一個第三相關特徵作為第一生理指標，並根據所述第一生理指標以及額外生理特徵建立所述多個第二風險預測模型的其中之一；從所述第二訓練資料中選擇多個第四相關特徵，根據所述多個第四相關特徵的組合產生第二生理指標，並根據所述第二生理指標以及所述額外生理特徵建立所述多個第二風險預測模型的其中之一；以及根據對所述受測者進行單一次量測所獲得的生理資訊所對應的第三生理指標以及所述額外生理特徵建立所述特定風險預測模型。
如申請專利範圍第6項所述的特徵識別方法，其中從所述第二訓練資料中選擇所述多個第四相關特徵，根據所述多個第四相關特徵的組合產生所述第二生理指標的步驟包括：從所述第二訓練資料中選擇所述多個第四相關特徵，其中所述多個第四相關特徵被每一所述多個第一風險預測模型挑選的挑選資訊大於所述第二訓練資料中其他的相關特徵。
如申請專利範圍第6項所述的特徵識別方法，其中從所述第二訓練資料中選擇所述多個第四相關特徵，根據所述多個第四相關特徵的組合產生所述第二生理指標的步驟包括：從所述第二訓練資料中選擇所述多個第四相關特徵，根據所述多個第四相關特徵產生至少一特徵交互項，並根據所述多個第四相關特徵以及所述特徵交互項產生所述多個特徵的組合。
如申請專利範圍第6項所述的特徵識別方法，其中從所述第二訓練資料中選擇所述多個第四相關特徵，根據所述多個第四相關特徵的組合產生所述第二生理指標的步驟包括：根據所述生理資訊的類型與所述第二訓練資料中的相關特徵的計算方式對所述第二訓練資料中的相關特徵進行歸類以獲得多個類別；以及將每一所述多個類別中具有最大的排名指標的相關特徵識別為所述多個第四相關特徵。
如申請專利範圍第6項所述的特徵識別方法，其中從所述第二訓練資料中選擇所述多個第四相關特徵，根據所述多個第四相關特徵的組合產生所述第二生理指標的步驟包括：使用主成分分析(Principal components analysis，PCA)從所述第二訓練資料中選擇所述多個第四相關特徵。
如申請專利範圍第6項所述的特徵識別方法，其中根據所述多個第四相關特徵的組合產生第二生理指標的步驟包括：產生對應於所述多個第四相關特徵的組合的一風險值；以及根據所述風險值產生所述第二生理指標。
一種電子裝置，包括：處理器，其中所述處理器獲得分別在一日內的多個時間點對受測者進行量測所獲得的多個生理資訊，所述處理器轉換所述多個生理資訊為分別對應於所述多個生理資訊的多個相關特徵，所述處理器根據所述多個相關特徵建立多個第一風險預測模型，並根據所述多個第一風險預測模型從所述多個相關特徵中識別至少一第一相關特徵，所述處理器根據所述第一相關特徵建立多個第二風險預測模型，並根據所述多個第二風險預測模型從所述第一相關特徵中識別具有預測特定疾病的能力的至少一第二相關特徵，所述處理器輸出所述多個相關特徵中的所述第二相關特徵。