TWI774964B - 患病機率預測方法與電子裝置 - Google Patents

患病機率預測方法與電子裝置 Download PDF

Info

Publication number
TWI774964B
TWI774964B TW108121317A TW108121317A TWI774964B TW I774964 B TWI774964 B TW I774964B TW 108121317 A TW108121317 A TW 108121317A TW 108121317 A TW108121317 A TW 108121317A TW I774964 B TWI774964 B TW I774964B
Authority
TW
Taiwan
Prior art keywords
disease
variables
paths
path
diseases
Prior art date
Application number
TW108121317A
Other languages
English (en)
Other versions
TW202101478A (zh
Inventor
陳陪蓉
蔡宗憲
陳亮恭
彭莉甯
Original Assignee
宏碁股份有限公司
國立陽明大學
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 宏碁股份有限公司, 國立陽明大學 filed Critical 宏碁股份有限公司
Priority to TW108121317A priority Critical patent/TWI774964B/zh
Priority to US16/667,930 priority patent/US20200402659A1/en
Priority to EP19210546.8A priority patent/EP3754664A1/en
Publication of TW202101478A publication Critical patent/TW202101478A/zh
Application granted granted Critical
Publication of TWI774964B publication Critical patent/TWI774964B/zh

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/60ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Public Health (AREA)
  • Data Mining & Analysis (AREA)
  • Biomedical Technology (AREA)
  • Primary Health Care (AREA)
  • Epidemiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Pathology (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Medical Treatment And Welfare Office Work (AREA)
  • Measuring And Recording Apparatus For Diagnosis (AREA)

Abstract

患病機率預測方法與電子裝置。所述方法包括:決定路徑長度;從罹患特定疾病的病史資料中獲得符合路徑長度的第一路徑;從第一路徑中獲得與特定疾病正相關的第二路徑;對第二路徑進行篩選以獲得第三路徑,並根據第三路徑建立預測模型;以及將欲被預測的路徑輸入至預測模型並輸出罹患特定疾病的機率。

Description

患病機率預測方法與電子裝置
本發明是有關於一種患病機率預測方法與電子裝置。
一般來說,醫生可以透過看診經驗,判斷在出現什麼疾病之後容易罹患某特定疾病。以失智症為例,在罹患糖尿病之後較容易發生失智。然而,目前多是單一疾病之風險研究,並沒有一套有效的方法可以得知在依序罹患了哪些疾病之後較容易罹患某一特定疾病。
本發明提供一種患病機率預測方法與電子裝置,可以用於根據患者所罹患的疾病的順序,計算該患者罹患某一特定疾病的比例或機率等資訊。
本發明提出一種患病機率預測方法,用於一電子裝置,所述方法包括:決定一路徑長度,其中所述路徑長度為一疾病的數量;根據所述路徑長度,從罹患一特定疾病的多個病史資料中獲得符合所述路徑長度的多個第一路徑,其中所述第一路徑是由罹患所述特定疾病之前所依序罹患的其他疾病所構成;根據所述多個第一路徑,從所述多個第一路徑中獲得與所述特定疾病正相關的多個第二路徑;對所述多個第二路徑進行篩選以獲得多個第三路徑,並根據所述多個第三路徑建立一預測模型;以及將一欲被預測的路徑輸入至所述預測模型並輸出所述欲被預測的路徑罹患所述特定疾病的一機率,其中所述欲被預測的路徑是由多個疾病所構成。
本發明提出一種電子裝置,包括:儲存電路與處理器。儲存電路記錄多個模組。處理器存取並執行所述多個模組以執行下述運作:決定一路徑長度,其中所述路徑長度為一疾病的數量;根據所述路徑長度,從罹患一特定疾病的多個病史資料中獲得符合所述路徑長度的多個第一路徑,其中所述第一路徑是由罹患所述特定疾病之前所依序罹患的其他疾病所構成;根據所述多個第一路徑,從所述多個第一路徑中獲得與所述特定疾病正相關的多個第二路徑;對所述多個第二路徑進行篩選以獲得多個第三路徑,並根據所述多個第三路徑建立一預測模型;以及將一欲被預測的路徑輸入至所述預測模型並輸出所述欲被預測的路徑罹患所述特定疾病的一機率,其中所述欲被預測的路徑是由多個疾病所構成。
基於上述,本發明的患病機率預測方法與電子裝置可從病史資料中找出罹患某一特定疾病(例如,失智症)之前所罹患的疾病的順序(亦稱為,路徑)。有這些路徑的人會比沒有這些路徑的人有更高的機率在未來會得到前述的特定疾病。此外,本發明的患病機率預測方法可以進一步使用前述的路徑,計算罹患特定疾病的比例或機率等資訊。
為讓本發明的上述特徵和優點能更明顯易懂,下文特舉實施例,並配合所附圖式作詳細說明如下。
現將詳細參考本發明之示範性實施例,在附圖中說明所述示範性實施例之實例。另外,凡可能之處,在圖式及實施方式中使用相同標號的元件/構件代表相同或類似部分。
圖1是依照本發明的一實施例所繪示的電子裝置的方塊圖。
請參照圖1,電子裝置100包括處理器20、輸入輸出電路22以及儲存電路24。其中,輸入輸出電路22以及儲存電路24分別耦接至處理器20。電子裝置100例如是桌上型電腦、伺服器、手機、平板電腦、筆記型電腦等電子行動裝置,在此不設限。
處理器20可以是中央處理器(Central Processing Unit,CPU),或是其他可程式化之一般用途或特殊用途的微處理器(Microprocessor)、數位信號處理器(Digital Signal Processor,DSP)、可程式化控制器、特殊應用積體電路(Application Specific Integrated Circuit,ASIC)或其他類似元件或上述元件的組合。
輸入輸出電路22例如是用於從電子裝置100外部或其他來源取得相關資料的輸入介面或電路。此外,輸入輸出電路22也可以將電子裝置100產生的資料傳送給其他電子裝置的輸出介面或電路,在此並不設限。
儲存電路24可以是任何型態的固定或可移動隨機存取記憶體(random access memory,RAM)、唯讀記憶體(read-only memory,ROM)、快閃記憶體(flash memory)或類似元件或上述元件的組合。
在本範例實施例中,電子裝置100的儲存電路24中儲存有多個程式碼片段,在上述程式碼片段被安裝後,會由處理器20來執行。例如,儲存電路24中包括多個模組,藉由這些模組來分別執行應用於電子裝置100的患病機率預測方法的各個運作,其中各模組是由一或多個程式碼片段所組成。然而本發明不限於此,電子裝置100的各個運作也可以是使用其他硬體形式的方式來實現。
需注意的是,失智症的病人在診斷出失智症之前,先前所罹患的其他疾病之順序(亦稱為,路徑)可能與未來的失智症有關。本發明的患病機率預測方法可以找出這些疾病的順序,並提供醫生輔助預防治療失智症之資訊,作為評估失智風險之工具。例如,醫生可以得知在依序罹患了哪些疾病之後較易失智,失智症比例或機率多少等等。
特別是,本發明是以失智症為例,但本發明不限於此。在其他實施例中,本發明的患病機率預測方法亦可適用到預測失智症以外的其他疾病。例如,巴金森氏症或其他的疾病,在此並不作限制。以下以失智症為例進行說明。
圖2是依照本發明的一實施例所繪示的使用病史資料篩選出用於預測失智症的路徑的方法流程圖。在本範例實施例中,「路徑」的定義如下:一個由數個不同疾病有順序地排列的組合,所述順序符合疾病最早發生(或最早診斷被診斷出的)時間之排序。「路徑長度」的定義如下:前述路徑中疾病的數量。簡單來說,路徑可以是一病患所依序罹患(或被診斷出)的疾病,而路徑的長度即為該病患所罹患的疾病的數量。
請參照圖2,首先,處理器20需執行病史資料處理的步驟(步驟S201)以將病史資料轉換成前述的路徑的資料。
詳細來說,處理器20需依據需求決定一個路徑長度。之後,處理器20可以根據此路徑長度,從罹患失智症的多個病史資料中獲得符合該路徑長度的多個路徑(以下稱為,第一路徑)。更詳細來說,針對資料中每個人,取其罹患失智症之前的病史資料,之後對病史中每個疾病,取最早發生時間(或最早診斷時間)進行疾病排序。從每個人的疾病排序序列中,取得所有符合前述路徑長度之疾病順序,並且保持疾病相對先後排序。將資料中出現過的所有路徑取出。
以下舉例說明前述的病史資料處理的步驟。
[步驟S201的範例]
假設某甲在失智症之前的診斷病史為:A->B->C->A->D->C。其中,前述的A、B、C與D分別為彼此互不相同的疾病,而診斷病史可以是某甲的就診記錄。在藉由輸入輸出電路22取得診斷病史後,處理器20可以先以每個疾病最早被診斷出的時間做排序,得到疾病排序序列:A->B->C->D。假設先前所決定的路徑長度為3。處理器20可以從前述的疾病排序序列中取出路徑長度為3(即,由3個疾病組成)之組合並且保持疾病間相對之排序,藉此得到以下路徑:A->B->C、A->B->D、 A->C->D、B->C->D共4個路徑。
假設從所有病患的資料取得之所有路徑(即,前述的第一路徑)如下:A->B->C、 A->B->D、A->C->D、B->C->D與B->A->C。以這些路徑作為特徵,將某甲的疾病排序序列轉成路徑資料如下表1:
  A->B->C A->B->D A->C->D B->C->D B->A->C
某甲 1 1 1 1 0
表1
類似地,可以將每一個病患的資料以前述的方式獲得長度為3的路徑,並將每一個病患的路徑資料分別記錄至表1中。
請再次參照圖2,接著,處理器20會執行找出正相關路徑的步驟(步驟S203)。例如,處理器20會根據前述的多個第一路徑,從第一路徑中獲得與失智症正相關的多個路徑(亦稱為,第二路徑)。更詳細來說,處理器20可以使用機器學習方法或是統計方法對前述表1中每個路徑個別進行計算,以決定一路徑與失智症是正相關或是負相關。例如,對前述表1中每一行的值進行加總,並將總合大於一門檻值的路徑識別為正相關的路徑,將總合非大於前述門檻值的路徑識別為負相關的路徑。處理器20可以保留正相關的路徑,刪除負相關路徑。特別是,一個具有正相關的路徑的病患會比起沒有具有正相關的路徑的病患有更高的機會罹患失智症。
在執行完步驟S203後,處理器20執行路徑篩選的步驟(步驟S205),藉此對前述的正相關的路徑(即,第二路徑)進行篩選以從中獲得多個路徑(亦稱為,第三路徑)。處理器20可以根據此些第三路徑建立預測模型。特別是,此步驟主要是根據預測失智症的效能高低篩選前述的第二路徑以從第二路徑中找出預測能力較佳之第三路徑。
圖3是依照本發明的一實施例所繪示的路徑篩選的方法流程圖。
請參照圖3,前述的步驟S205又可以細分為步驟S301~S305。更詳細來說,在執行步驟S205的過程中,處理器20會藉由特徵工程產生變數(步驟S301)。例如,處理器20可以根據前述的多個第二路徑產生對應於多個模式(pattern)的多個變數。
更詳細來說,步驟S301是對第二路徑中的每一個路徑,從中取出一部份或全部的疾病並據此產生新的變數。特別是,依據取疾病的位置、疾病的順序與疾病的數量做排列組合,產生新變數可有多種不同的模式(pattern)。
在此定義V(Count, Position, Order)為新變數之模式。其中,「Count」代表從一路徑取疾病之數量,最少為1,最多為該路徑長度。「Position」代表取一疾病的方式是否保留該疾病在原路徑中之位置的特徵,其值可為「保留位置(Preserve Position,以下稱PP)」或是「忽略位置(Ignore Position,以下稱IP)」。「Order」代表取疾病的方式是否保留疾病的先後順序,其值可為「保流順序(Preserve Order,以下稱為PO)」或是「不計順序(Ignore Order,以下稱為IO)」。特別是,當疾病數量為「1」時,順序是無意義,「Order」欄位值可以設為「X」。
以路徑長度3為例,新變數可以如下述模式(1)~模式(7)。
V(1, PP, X) …………………………………………模式(1)
V(1, IP, X) ………………………………………….模式(2)
V(2, PP, PO) …………………….………………….模式(3)
V(2, PP, IO) ………………….……………………..模式(4)
V(2, IP, PO) ………………….……………………..模式(5)
V(2, IP, IO) ……………………..…………………..模式(6)
V(3, X, IO)  ……………….….……………………模式(7)
需注意的是,以一路徑來說,由於數量為「3」時位置無意義,故「Position」欄位之值為X,且此時「Order」欄位為「PO」時即代表原路徑,因此模式「V(3, X, PO)」不計為新變數。
在本實施例中,處理器20會對所有第二路徑進行上述特徵工程,得到所有新變數,再將每個人的路徑資料,轉成新變數資料。特別是,在一實施例中,處理器20可以預先建立一張對照表,此對照表用以記錄路徑與變數之間的對應關係。處理器20可以根據前述的第二路徑以及對照表產生對應於前述多個模式的多個變數。
轉換路徑資料為新變數資料的步驟如下:對某一新變數X,如果某病患的路徑資料中,存在至少一路徑可以透過上述流程產生X,則此病患的新變數資料中,X欄位值=1,否則=0。
以下舉一路徑為例說明特徵工程產生新變數之流程以及轉換成路徑資料之流程。
[步驟S301的範例]
假設某一長度為3的路徑為:A->B->C。因為路徑長度為3,在步驟S301中,新變數是從3個疾病中取一部份或全部的疾病(即,最少取1個疾病,最多可取3個疾病)以從前述的模式(1)~模式(7)中獲得多個新變數。
對於模式V(1, PP, X)來說,可以得到新變數:A_1、B_2以及C_3 。其中,底線後的數字代表疾病在路徑中的位置。
對於模式V(1, IP, X)來說,可以得到新變數:A、B與C。
對於模式V(2, PP, PO) 來說,可以得到新變數:A->B_1與B->C_2。其中,「->」代表順序。以變數「A->B_1」為例,其代表罹患疾病的順序為先A再B,並且A在一路徑中是位在第一個的位置。再例如,以變數「B->C_2」為例,其代表罹患疾病的順序為先B再C,並且B在一路徑中是位在第二個的位置。
對於模式V(2, PP, IO) 來說,可以得到新變數:A&B_1&2、A&C _1&3與 B&C_2&3。以變數「A&B_1&2」為例,其代表罹患疾病包括A與B(順序不限),並且此兩個疾病在一路徑中是位在第一個與第二個位置。換句話說,此範例代表在一路徑中,從第一個位置開始可以是先A再B或先B再A。再例如,以變數「A&C_1&3」為例,其代表罹患疾病包括A與C(順序不限),並且此兩個疾病在一路徑中是位在第一個與第三個位置。換句話說,在一路徑中,這兩個位置(即,第一個與第三個位置)可以是先A再C或先C再A。其他的變數可以以此類推,在此不再贅述。
對於模式V(2, IP, PO) 來說,可以得到新變數:A->B與 B->C。以變數「A->B」為例,其代表罹患疾病依序為A與B,但A與B在一路徑中的位置並沒有限制。再例如,以變數「B->C」為例,其代表罹患疾病依序為B與C,但B與C在一路徑中的位置並沒有限制。其他的變數可以以此類推,在此不再贅述。
對於模式V(2, IP, IO) 來說,可以得到新變數:A&B、A&C與B&C。以變數「A&B」為例,其代表罹患疾病包括A與B(順序不限),且A與B在路徑中的位置並沒有限制。再例如,以變數「A&C」為例,其代表罹患疾病包括A與C(順序不限),且A與C在一路徑中的位置並沒有限制。其他的變數可以以此類推,在此不再贅述。
對於模式V(3, X, IO) 來說,可以得到新變數:A&B&C。以變數「A&B&C」為例,其代表罹患疾病包括A、B與C(順序不限),且A、B與C在路徑中的位置並沒有限制。
藉由上述的模式(1)至模式(7),總共可以得到17個新變數。
在一範例中,如果某乙的路徑資料中有此路徑A->B->C(欄位值=1),則某乙上述17個新變數之值會被設為「1」。在另一範例中,如果某丙的路徑資料中,A->B->C欄位=0且A->B->G欄位=1,則因為路徑A->B->G也可以產生A、B、A->B、 A&B等新變數,所以某丙這幾個與A、B相關的新變數的值也會被設為「1」。
請再次參照圖3,在執行完步驟S301後,處理器20會執行使用多模型篩選變數的步驟(步驟S303)。更詳細來說,處理器20會使用多個模型對前述步驟S301產生的多個變數進行篩選以從此些變數中獲得多個最佳變數。
圖4是依照本發明的一實施例所繪示的多模型篩選變數的方法流程圖。
請參照圖4,前述的步驟S303又可以細分為步驟S401~S405。
請參照圖4,在執行多模型篩選變數的步驟中,首先處理器20會決定多個機器學習演算法與多個變數輸入模式,並根據所決定出的機器學習演算法與變數輸入模式進行排列組合以產生多個模型。之後,處理器20可以將前述步驟S301所產生的多個變數輸入至步驟S401所產生的模型以獲得篩選後變數(步驟S401)。
變數輸入模式是指變數如何被輸入至機器學習模型。可為一次放入所有變數而建立一個機器學習模型(亦稱為,One-model)並使用此模型之輸出;或是依照原變數之變數模式(亦稱為,By-pattern),建立多個模型,最後將多個模型之輸出結果進行聯集操作。
以下以隨機森林演算法與羅吉斯回歸演算法為例進行說明。處理器20會產生如下表二中機器學習方法與變數輸入模式之組合:
模型編號 機器學習方法 變數輸入模式 模型數量
M01 隨機森林 One-model 1
M02 隨機森林 By-pattern 7
M03 羅吉斯回歸 One-model 1
M04 羅吉斯回歸 By-pattern 7
表二
詳細來說,在步驟S401產生模型的步驟中,處理器20可以使用機器學習演算法分別對前述的模式(1)~模式(7)中建立模型(亦稱為,第一模型)。請參照表二,在產生第一模型的過程中,處理器20可以使用隨機森林演算法分別對前述的模式(1)~模式(7)建立模型以產生七個模型(即,表二中的模型M02)。再例如,處理器20還可以使用羅吉斯回歸演算法分別對前述的模式(1)~模式(7)建立模型以產生七個模型(即,表二中的模型M04)。
此外,在步驟S401產生模型的步驟中,處理器20可以使用機器學習演算法產生對應於前述的模式(1)~模式(7)的一模型(亦稱為,第二模型)。請參照表二,在產生第二模型的過程中,處理器20可以使用隨機森林演算法對前述的模式(1)~模式(7)建立一個模型(即,表二中的模型M01)。此外,處理器20還會使用羅吉斯回歸演算法對前述的模式(1)~模式(7)建立模型以產生一個模型(即,表二中的模型M03)。
在獲得前述的第一模型與第二模型後,處理器20可以將步驟S301所獲得的多個變數輸入至前述的每一個第一模型(例如,模型M02中的七個模型或模型M04中的七個模型)以獲得每一個模型所輸出的篩選後變數(亦稱為,第一篩選後變數)。換句話說,以模型M02的七個模型為例,篩選後變數共有七組的變數。之後,處理器20會對此七組篩選後變數執行聯集操作以獲得一組篩選後變數(亦稱為,第二篩選後變數)。類似地,以模型M04的七個模型為例,篩選後變數共有七組的變數。之後,處理器20會對此七組篩選後變數執行聯集操作以獲得一組篩選後變數。
此外,處理器20還會將步驟S301所獲得的多個變數輸入至前述的第二模型以獲得篩選後變數(亦稱為,第三篩選後變數)。例如,以模型M01的模型為例,由於模型M01僅包括一個模型,篩選後變數僅有一組的變數。類似地,以模型M03的模型為例,由於模型M03僅包括一個模型,篩選後變數僅有一組的變數。
之後,處理器20會使用多個第三模型分別對前述的篩選後變數(例如,第二篩選後變數以及第三篩選後變數)執行一效能預測(步驟S403)以從其中選擇預測準確率較佳者作為「最佳變數」(步驟S405)。
以前述的模型M01~M04為例,經過前述的步驟S401後可以得到4組篩選後變數。在對各組篩選後變數執行效能預測的步驟中,處理器20會對每一組篩選後變數,使用多個機器學習方法,建立多個模型,每個模型得到一個預測效能(例如:預測準確率)。將這些預測效能用統計的方式(例如:取平均值、取最大值,等等)計算出一個代表該組篩選後變數的效能。之後,在選取最佳變數的過程中,處理器20會比較各組篩選後變數的預測效能,並且選擇最佳者(例如,預測效能最高者)做為最佳變數。
請再次參照圖3,在執行完步驟S303後,處理器20會將前述的多個最佳變數還原成對應於前述的多個最佳變數的路徑(亦稱為,第三路徑)(步驟S305)。例如,處理器20會根據前述在步驟S301中所使用的對照表將最佳變數還原成對應於最佳變數的第三路徑。
在獲得第三路徑後,處理器20可以根據此些第三路徑建立預測模型。之後,在進行失智症的風險評估時,處理器20可以將一欲被預測的路徑輸入至預測模型並輸出前述欲被預測的路徑罹患特定疾病的一機率。其中,前述欲被預測的路徑是由多個疾病所構成,且此些疾病的數量例如是相同於先前步驟S201中所決定的路徑長度。
一失智症的風險評估範例可以如下:
在得到欲被預測的路徑之後,處理器20例如使用歷史資料,計算欲被預測的路徑罹患失智症的比例,以及欲被預測的路徑在群體失智患者佔所有失智患者之比例等等風險資訊,並根據前述資訊建立路徑與失智症風險資訊對照表。之後,給定任何一人的病史資料,轉換成路徑資料後,即可使用此對照表,評估病患的風險。以下表三為路徑與風險對照表之示意圖:
路徑 路徑之失智症比例 路徑失智症患者佔總體比例
暈眩症→焦慮症→失智症 52% 4.3%
冠心病→中風→失智症 58% 2.8%
表三
另一失智症的風險評估範例可以如下:
處理器20可以在前述的步驟S401後對各組篩選後變數建立預測模型,取最佳變數之預測模型做為產生失智症機率或預測標籤等風險指標之最佳模型。之後,當給定任何一人的病史時,處理器20可以在轉換成路徑資料後,進一步將路徑轉換成最佳變數,再利用最佳模型計算出失智症風險指標(例如,機率或標籤)。
圖5是依照本發明的一實施例所繪示的患病機率預測方法的流程圖。
請參照圖5,在步驟S501中,處理器20決定一路徑長度,其中此路徑長度為疾病的數量。在步驟S503中,處理器20根據前述的路徑長度,從罹患特定疾病的多個病史資料中獲得符合前述路徑長度的多個第一路徑,其中第一路徑是由罹患特定疾病之前所依序罹患的其他疾病所構成。在步驟S505中,處理器20根據前述多個第一路徑,從第一路徑中獲得與特定疾病正相關的多個第二路徑。在步驟S507中,處理器20對前述的第二路徑進行篩選以獲得多個第三路徑,並根據第三路徑建立一預測模型。最後在步驟S509中,處理器20將欲被預測的路徑輸入至預測模型並輸出所述欲被預測的路徑罹患特定疾病的機率,其中欲被預測的路徑是由多個疾病所構成。
綜上所述,本發明的患病機率預測方法與電子裝置可從病史資料中找出罹患某一特定疾病(例如,失智症)之前所罹患的疾病的順序(亦稱為,路徑)。有這些路徑的人會比沒有這些路徑的人有更高的機率在未來會得到前述的特定疾病。此外,本發明的患病機率預測方法可以進一步使用前述的路徑,計算罹患特定疾病的比例或機率等資訊。
雖然本發明已以實施例揭露如上,然其並非用以限定本發明,任何所屬技術領域中具有通常知識者,在不脫離本發明的精神和範圍內,當可作些許的更動與潤飾,故本發明的保護範圍當視後附的申請專利範圍所界定者為準。
100:電子裝置 20:處理器 22:輸入輸出電路 24:儲存電路 S201~S205、S301~S305、S401~S405、S501~S509:步驟
圖1是依照本發明的一實施例所繪示的電子裝置的方塊圖。 圖2是依照本發明的一實施例所繪示的使用病史資料篩選出用於預測失智症的路徑的方法流程圖。 圖3是依照本發明的一實施例所繪示的路徑篩選的方法流程圖。 圖4是依照本發明的一實施例所繪示的多模型篩選變數的方法流程圖。 圖5是依照本發明的一實施例所繪示的患病機率預測方法的流程圖。
S501~509:步驟

Claims (10)

  1. 一種患病機率預測方法,用於一電子裝置,所述方法包括:基於先前疾病的數量,根據所述先前疾病的疾病排序順序,從罹患一特定疾病的多個病史資料中獲得多個第一路徑,其中所述先前疾病的時間早於所述特定疾病的時間,且所述疾病排序順序是根據所述先前疾病的最早發生時間或最早診斷時間對所述先前疾病進行排序並保持所述先前疾病的相對先後排序而取得;從所述多個第一路徑中獲得與所述特定疾病正相關的多個第二路徑,其中每一個所述第二路徑的一值大於一門檻值;根據預測能力,對所述第二路徑進行篩選,以獲得多個第三路徑;根據所述多個第三路徑建立一預測模型;將一欲被預測的路徑輸入至所述預測模型;以及根據所述預測模型以及所述欲被預測的路徑的多個疾病的欲被預測的疾病排序順序,輸出所述欲被預測的路徑罹患所述特定疾病的一機率。
  2. 如申請專利範圍第1項所述的患病機率預測方法,其中對所述多個第二路徑進行篩選以獲得所述多個第三路徑的步驟包括:根據所述多個第二路徑產生對應於多個模式(pattern)的多個 變數;使用多個模型對所述多個變數進行篩選以從所述多個變數中獲得多個最佳變數;以及將所述多個最佳變數還原成對應於所述多個最佳變數的所述多個第三路徑。
  3. 如申請專利範圍第2項所述的患病機率預測方法,其中所述多個模式相關於所述多個第二路徑中的每一個第二路徑中一疾病的位置、一疾病的順序以及一疾病的數量的排列組合。
  4. 如申請專利範圍第2項所述的患病機率預測方法,其中使用所述多個模型對所述多個變數進行篩選以從所述多個變數中獲得所述多個最佳變數的步驟包括:決定一機器學習演算法;決定多個變數輸入模式;以及根據所決定出的所述機器學習演算法與所述多個變數輸入模式產生所述多個模型。
  5. 如申請專利範圍第4項所述的患病機率預測方法,其中根據所決定出的所述機器學習演算法與所述多個變數輸入模式產生所述多個模型的步驟包括:使用所述機器學習演算法對所述多個模式分別建立多個第一模型;以及使用所述機器學習演算法對所述多個模式建立一第二模型。
  6. 如申請專利範圍第5項所述的患病機率預測方法,其中使用所述多個模型對所述多個變數進行篩選以從所述多個變數中獲得所述多個最佳變數的步驟包括:將所述多個變數輸入至所述多個第一模型以獲得所述多個模型中的每一個第一模型所輸出的一第一篩選後變數,並對所述多個模型中的每一個第一模型所輸出的所述第一篩選後變數執行一聯集操作以獲得一第二篩選後變數;將所述多個變數輸入至所述第二模型以獲得一第三篩選後變數;以及使用多個第三模型分別對所述第二篩選後變數以及所述第三篩選後變數執行一效能預測以從所述第二篩選後變數以及所述第三篩選後變數中選擇預測準確率較佳者作為所述多個最佳變數。
  7. 如申請專利範圍第4項所述的患病機率預測方法,其中所述多個機器學習演算法包括隨機森林演算法以及羅吉斯回歸演算法。
  8. 如申請專利範圍第2項所述的患病機率預測方法,其中根據所述多個第二路徑產生對應於所述多個模式的所述多個變數的步驟包括:根據所述多個第二路徑以及一對照表產生對應於所述多個模式的所述多個變數。
  9. 如申請專利範圍第8項所述的患病機率預測方法,其中將所述多個最佳變數還原成對應於所述多個最佳變數的所述多個第三路徑的步驟包括:根據所述對照表將所述多個最佳變數還原成對應於所述多個最佳變數的所述多個第三路徑。
  10. 一種電子裝置,包括:一儲存電路,記錄多個模組;以及一處理器,存取並執行所述多個模組以執行下述運作:基於先前疾病的數量,根據所述先前疾病的疾病排序順序,從罹患一特定疾病的多個病史資料中獲得具有相同於所述路徑長度的長度的多個第一路徑,其中所述先前疾病的時間早於所述特定疾病的時間,且所述疾病排序順序是根據所述先前疾病的最早發生時間或最早診斷時間對所述先前疾病進行排序並保持所述先前疾病的相對先後排序而取得;從所述多個第一路徑中獲得與所述特定疾病正相關的多個第二路徑,其中每一個所述第二路徑的一值大於一門檻值,根據預測能力,對所述第二路徑進行篩選,以獲得多個第三路徑;根據所述多個第三路徑建立一預測模型;將一欲被預測的路徑輸入至所述預測模型;以及根據所述預測模型以及所述欲被預測的路徑的多個疾病的欲 被預測的疾病排序順序,輸出所述欲被預測的路徑罹患所述特定疾病的一機率。
TW108121317A 2019-06-19 2019-06-19 患病機率預測方法與電子裝置 TWI774964B (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
TW108121317A TWI774964B (zh) 2019-06-19 2019-06-19 患病機率預測方法與電子裝置
US16/667,930 US20200402659A1 (en) 2019-06-19 2019-10-30 Disease suffering probability prediction method and electronic apparatus
EP19210546.8A EP3754664A1 (en) 2019-06-19 2019-11-21 Disease suffering probability prediction method and electronic apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
TW108121317A TWI774964B (zh) 2019-06-19 2019-06-19 患病機率預測方法與電子裝置

Publications (2)

Publication Number Publication Date
TW202101478A TW202101478A (zh) 2021-01-01
TWI774964B true TWI774964B (zh) 2022-08-21

Family

ID=68840877

Family Applications (1)

Application Number Title Priority Date Filing Date
TW108121317A TWI774964B (zh) 2019-06-19 2019-06-19 患病機率預測方法與電子裝置

Country Status (3)

Country Link
US (1) US20200402659A1 (zh)
EP (1) EP3754664A1 (zh)
TW (1) TWI774964B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI845343B (zh) * 2023-06-13 2024-06-11 國泰人壽保險股份有限公司 罹患疾病機率預測系統及罹患疾病機率預測方法

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115691826A (zh) * 2020-12-29 2023-02-03 医渡云(北京)技术有限公司 根据密接图谱确定疫情传播路径方法、装置、设备和介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080183454A1 (en) * 2007-01-31 2008-07-31 Harvard University Disease diagnoses-bases disease prediction
US20160232324A1 (en) * 2013-09-20 2016-08-11 Georgia Tech Research Corporation Systems And Methods For Disease Progression Modeling
US20190108915A1 (en) * 2017-10-05 2019-04-11 Iquity, Inc. Disease monitoring from insurance claims data

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106778014B (zh) * 2016-12-29 2020-06-16 浙江大学 一种基于循环神经网络的患病风险预测建模方法
WO2018124831A1 (ko) * 2016-12-30 2018-07-05 서울대학교 산학협력단 대사이상 질환의 질병 위험도를 예측하는 장치 및 방법

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080183454A1 (en) * 2007-01-31 2008-07-31 Harvard University Disease diagnoses-bases disease prediction
US20160232324A1 (en) * 2013-09-20 2016-08-11 Georgia Tech Research Corporation Systems And Methods For Disease Progression Modeling
US20190108915A1 (en) * 2017-10-05 2019-04-11 Iquity, Inc. Disease monitoring from insurance claims data

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI845343B (zh) * 2023-06-13 2024-06-11 國泰人壽保險股份有限公司 罹患疾病機率預測系統及罹患疾病機率預測方法

Also Published As

Publication number Publication date
EP3754664A1 (en) 2020-12-23
TW202101478A (zh) 2021-01-01
US20200402659A1 (en) 2020-12-24

Similar Documents

Publication Publication Date Title
US20190065663A1 (en) Progression analytics system
Yan et al. Selecting critical clinical features for heart diseases diagnosis with a real-coded genetic algorithm
JP6421421B2 (ja) 注釈情報付与プログラム及び情報処理装置
TWI774964B (zh) 患病機率預測方法與電子裝置
Sarra et al. Enhanced accuracy for heart disease prediction using artificial neural network
CN110473636B (zh) 基于深度学习的智能医嘱推荐方法及系统
CN111783830A (zh) 基于oct的视网膜分类方法、装置、计算机设备及存储介质
Dubey et al. Using machine learning for healthcare treatment planning
Paradis The distribution of branch lengths in phylogenetic trees
KR102127449B1 (ko) 생존율 예측 모델 생성 방법, 장치 및 컴퓨터 프로그램
Alotaibi et al. Stroke in-patients' transfer to the ICU using ensemble based model
Isasa et al. Effect of incorporating metadata to the generation of synthetic time series in a healthcare context
CN106202847B (zh) 一种就诊预测方法
US20090112533A1 (en) Method for simplifying a mathematical model by clustering data
Sreedevi et al. A threshold genetic algorithm for diagnosis of diabetes using minkowski distance method
CN109993338B (zh) 一种链路预测方法及装置
KR20130104883A (ko) 관상동맥석회화 수준 변화 예측장치 및 예측방법
Li et al. Monitoring individuals with irregular semiparametric longitudinal behaviour
CN112349412B (zh) 患病机率预测方法与电子装置
US20210043327A1 (en) Computing device, portable device and computer-implemented method for predicting major adverse cardiovascular events
CN114822849A (zh) 基于数字孪生的数据监测方法、装置、设备和存储介质
CN110390999B (zh) 一种临床数据的值域计算方法、装置、可读介质及电子设备
CN113704697A (zh) 基于多元回归模型的医疗数据缺失处理方法、装置及设备
US20210265058A1 (en) Training data processing method and electronic device
CN112016979A (zh) 用户分群方法、装置、设备和计算机可读存储介质

Legal Events

Date Code Title Description
GD4A Issue of patent certificate for granted invention patent