TWI818203B

TWI818203B - 基於病患病情的分類模型建立方法

Info

Publication number: TWI818203B
Application number: TW109136920A
Authority: TW
Inventors: 陳彥斌; 陳怡穎; 賴飛羆; 黃建華
Original assignee: 國立臺灣大學醫學院附設醫院
Priority date: 2020-10-23
Filing date: 2020-10-23
Publication date: 2023-10-11
Also published as: TW202217849A

Abstract

一種基於病患病情的分類模型建立方法，藉由一電腦裝置實施，該電腦裝置儲存有多筆分別相關於多位不同病患的樣本資料，並對於每一樣本資料，根據該樣本資料的一生理資料、一主訴資料，及至少一病史資料產生一相關於該生理資料、該主訴資料，及該至少一病史資料的輸入數據，且利用一分類模型產生一相關於該輸入數據的輸出結果，並根據該輸入數據及所有輸出結果的其中一者利用一相似度判別模型判斷該輸入數據及該等輸出結果的其中該者之對應關係以判斷是否需要調整該分類模型，當判斷出不需要調整時確認該分類模型為基於病患病情的分類模型。

Description

基於病患病情的分類模型建立方法

本發明是有關於一種適用於醫療的數據處理方法，特別是指一種根據病患病情產生輸出結果的分類模型的建立方法。

隨著科技演進，在醫療業界位於第一線面對病患的醫師從以往透過望聞問切的方式搭配自身經驗判斷病患所罹患的疾病並給予相對應的處方及治療行為，演變為透過各種科技器材判斷病患所罹患的疾病並給予相關的治療，例如以往醫師就病患口頭描述自身感覺搭配專業理學檢查判斷病患是否罹患肺部疾病，到之後醫師可以透過病患所拍攝的胸部X光片，判斷病患可能罹患的肺部疾病，例如肺結核、肺炎、肺氣腫等等，而現在則是醫師與資訊業者可以利用卷積神經網路(convolutional neural networks，CNN)建立自胸部X光片判斷肺部疾病的影像辨識模型，進而透過影像辨識模型直接判斷X光片中所具有的疾病。

雖然目前醫師已經可以透過各種資訊科技的協助判斷病患的病情，不過醫師在直接面對病患時，仍是需要根據自己的經驗進行統整歸納並給予處方，詳細地說，醫師看診時仍舊需要根據病患描述自我身體感覺，並根據理學檢查結果及相關於病患的生理訊號(體溫、血壓、心跳…)、影像、及體液檢驗結果推論病患的可能病情，例如一名病患表示在陽光下工作一段時間後頭暈想吐，同時醫師測量到體溫偏高超過40度以及觀察到病患明顯無流汗時，則醫師可能會將病患分類為中暑病症，並給予病患中暑一類病症對應的輸液及冷卻療法。然而在病症鑑別過程中，需要依靠醫師醫療經驗的豐富程度，因此不同的醫師可能會對患者的病情做出不一樣的鑑別，如此將可能耽誤給予病患最佳治療的黃金時機，因此在醫界與資訊業界不斷努力研發嶄新技術以達到快速地根據病患的病症狀況進行鑑別分類。

因此，本發明的目的，即在提供一種能夠針對病患病情快速進行分類之基於病患病情的分類模型建立方法。

於是，本發明基於病患病情的分類模型建立方法，藉由一電腦裝置來實施，該電腦裝置包含一儲存模組及一電連接該儲存模組的處理模組，該儲存模組儲存有一用以對病患病情進行分類的分類模型、一用以判別該分類模型之輸出的相似度判別模型，及多筆分別相關於多位不同病患的樣本資料，每一樣本資料包括一相關於該樣本資料所相關之病患的生理表徵的生理資料、一包括該樣本資料所相關之病患的一敘述自身感覺文字資訊的主訴資料，及至少一包括該樣本資料所相關之病患過去患病歷程的病史資料，該基於病患病情的分類方法包含一步驟(A)、一步驟(B)、一步驟(C)、一步驟(D)、一步驟(E)。

在該步驟(A)中，對於每一樣本資料，根據該樣本資料的該生理資料、該主訴資料，及該至少一病史資料，產生一相關於該生理資料、該主訴資料，及該至少一病史資料的輸入數據。

在該步驟(B)中，對於每一輸入數據，根據該輸入數據利用該分類模型產生一相關於該輸入數據的輸出結果。

在該步驟(C)中，對於每一輸入數據，根據該輸入數據及該步驟(B)所產生的所有輸出結果的其中一者，利用該相似度判別模型判斷該輸入數據及該等輸出結果的其中該者之對應關係，以判斷是否需要調整該分類模型。

在該步驟(D)中，當判斷出需要調整該分類模型時，調整該分類模型並重複進行該步驟(B)。

在該步驟(E)中，當判斷出不需要調整該分類模型時，確認該分類模型為基於病患病情的分類模型。

本發明的功效在於：藉由該電腦裝置根據該等樣本資料產生多筆分別對應該等樣本資料的輸入數據，再利用該分類模型產生多個分別對應該等輸入數據的輸出結果，以根據每一輸入數據及該等輸出結果中的其中一者之相似程度判斷是否需要調整該分類模型，藉此，當判斷不需調整該分類模型，亦即該分類模型建立完成時，能夠利用該分類模型對病患病情進行快速分類。

在本發明被詳細描述之前，應當注意在以下的說明內容中，類似的元件是以相同的編號來表示。

參閱圖1、圖2，本發明基於病患病情的分類模型建立方法的一第一實施例，藉由如圖2所示的一電腦裝置7來實施，該電腦裝置7由一操作者所持有，並包含一儲存模組71及一電連接該儲存模組71的處理模組72，在此，該電腦裝置7是例如個人電腦、雲端伺服器、超級電腦，或其他類似裝置任一。

該儲存模組71儲存有一用以對病患病情進行分類的分類模型，例如關於疾病的轉譯器的雙向編碼描述(bidirectional encoder representations from transformers- Disease, BERT - Disease)、一用以判別該分類模型之輸出的相似度判別模型，例如轉譯器的雙向編碼描述判別器(bidirectional encoder representations from transformers - Discriminator, BERT - Discriminator)、一用以將一具有固定結構的結構化(structural)資料轉換為一向量的第一神經網路，例如一全連接神經網路(fully connected neural network)、一用以將該結構化資料轉換為另一向量的第二神經網路，例如另一全連接神經網路、一用以將一不具有固定結構的非結構化(unstructured)資料轉換為該結構化資料的前處理語言模型，例如基於多語言案例的轉譯器的雙向編碼描述(bidirectional encoder representations from transformers – base – multilingual - cased, bert – base – multilingual - cased)，及多筆分別相關於多位不同病患的樣本資料，每一樣本資料包括一相關於該樣本資料所相關之病患的生理表徵且屬於結構化資料的生理資料、一包括該樣本資料所相關之病患的一敘述自身感覺文字資訊且屬於非結構化資料的主訴資料，及多筆包括該樣本資料所相關之病患過去患病歷程且屬於非結構化資料的病史資料，其中，該生理資料包括例如該樣本資料所相關之病患的身高、體重、年齡、性別、舒張壓、收縮壓、血氧值、體溫等數值，具有固定結構代表每一樣本資料的該生理資料都會有如前述的身高、體重、年齡、性別、舒張壓、收縮壓、血氧值、體溫等數值，例如第一位病患的生理資料記載身高180公分、體重80公斤、年齡30歲、性別男性、舒張壓80毫米汞柱、收縮壓120毫米汞柱、血氧值100、體溫37度，而第二位病患的生理資料記載有身高150公分、體重50公斤、年齡28歲、性別女性、舒張壓100毫米汞柱、收縮壓130毫米汞柱、血氧值99、體溫36度等相同格式的內容。該主訴資料包括例如該樣本資料所相關之病患敘述自己本身感覺頭痛、噁心、想吐、疲倦等內容，該等病史資料包括例如該樣本資料所相關之病患過去曾罹患肺炎、骨折等紀錄，不具有固定結構代表每一樣本資料的該主訴資料的內容結構並不會一致，例如第一位病患的主訴資料記載第一位病患感覺頭痛，但第二位病患的主訴資料記載第二位病患感覺胸悶。類似地，該等病史資料不具有固定結構代表對應不同病患的該等病史資料的內容記載方式並不會一致。該前處理語言模型、該分類模型，及該相似度判別模型係根據語言模型(例如自然語言處理中基於深度雙向Transformer的語言模型預訓練策略)而建立，在此範例中的該前處理語言模型是轉譯器的雙向編碼描述(Bidirectional Encoder Representations from Transformers, BERT)，其建立過程詳細記載於Wolf T, Debut L, Sanh V, Chaumond J, Delangue C, Moi A等人所撰寫的論文Huggingface’s transformers: State-of-the-art natural language processing中，該分類模型的建立過程詳細記載於Devlin J, Chang M-W, Lee K, Toutanova K.等人所撰寫的論文Bert: Pre-training of deep bidirectional transformers for language understanding中，而該相似度判別模型的建立過程詳細記載於R Devon Hjelm, Alex Fedorov, Samuel Lavoie-Marchildon, Karan Grewal, Phil Bachman, Adam Trischler, Yoshua Bengio 等人所撰寫的論文 Learning deep representations by mutual information estimation and maximization中。

參閱圖1，本發明基於病患病情的分類模型建立方法的該第一實施例，用以建立、訓練並調整基於病患病情的該分類模型，並包含一步驟1、一步驟2、一步驟3、一步驟4，及一步驟5。以下將詳細說明在該第一實施例中，該處理模組72如何建立、訓練並調整基於病患病情的該分類模型。

參閱圖1、圖2、圖3，在該步驟1中，對於每一樣本資料，該處理模組72根據該樣本資料的該生理資料、該主訴資料，及該等病史資料，產生一相關於該生理資料、該主訴資料，及該等病史資料的輸入數據。以下以一子步驟11、一子步驟12、一子步驟13、一子步驟14，及一子步驟15更詳細說明在該步驟1中，該處理模組72如何根據該樣本資料的該生理資料、該主訴資料，及該等病史資料產生該輸入數據。

在該子步驟11中，對於每一樣本資料，該處理模組72根據該樣本資料的該生理資料，利用該第一神經網路產生一相關於該生理資料的生理向量。

在該子步驟12中，對於每一樣本資料，該處理模組72根據該樣本資料的該主訴資料及該等病史資料，利用該前處理語言模型產生一相關於該主訴資料且屬於結構化資料的主訴轉換資料及多筆相關於該等病史資料且屬於結構化資料的病史轉換資料。

在該子步驟13中，對於每一樣本資料，該處理模組72將該樣本資料中的該等病史轉換資料取平均以產生一病史平均資料。

在該子步驟14中，對於每一樣本資料，該處理模組72根據對應該樣本資料的該主訴轉換資料及該病史平均資料，利用該第二神經網路產生一相關於該主訴資料的主訴向量，及一相關於該病史平均資料的病史向量。

需要注意的是，在該第一實施例中，每一樣本資料包括多筆病史資料，對於每一樣本資料，該處理模組72根據該等病史資料利用該前處理語言模型產生該等病史轉換資料，並將該等病史轉換資料取平均以產生該病史平均資料，再利用該第二神經網路產生相關於該病史平均資料的該病史向量，但在其他實施方式中，每一樣本資料亦可僅包括一筆病史資料，而在該子步驟12中，該處理模組72是根據該病史資料利用該前處理語言模型產生一筆對應該病史資料的病史轉換資料，之後直接進行該步驟14，根據該病史轉換資料利用該第二神經網路產生相關於該病史轉換資料的該病史向量。

在該子步驟15中，對於每一樣本資料，該處理模組72根據對應該樣本資料的該生理向量、該主訴向量，及該病史向量，產生包括該生理向量、該主訴向量，及該病史向量的該輸入數據。

當該處理模組72不斷根據該儲存模組71所儲存的所有樣本資料，進行該子步驟11、該子步驟12、該子步驟13、該子步驟14，及該子步驟15，即可由該處理模組72產生多筆分別相關於該等樣本資料的輸入數據，其中，該處理模組72是根據以下公式產生該等輸入數據：

其中，為該等輸入數據之集合，為該等輸入數據之其中一者，為該等輸入數據的數量，為的該生理向量，為的該主訴向量，為的該病史向量，為該第一神經網路，為該第二神經網路，為該前處理語言模型，為對應的該生理資料，為對應的該主訴資料，為對應的該等病史資料，為該等病史資料的數量。

值得一提的是，在該第一實施例，是根據每一樣本資料中相關於文字資訊的該生理資料、該主訴資料，及該等病史資料產生該輸入數據，但在其他實施方式中，每一樣本資料亦可還包括一相關於該樣本資料所相關之病患之患病部位的病情影像資料，例如電腦斷層掃描影像，利用例如基於影像案例的特徵擷取器殘差網路Residual Network (ResNet)產生一相關於該病情影像資料的影像向量，並根據對應該樣本資料的該生理向量、該主訴向量、該病史向量，及該影像向量，產生包括該生理向量、該主訴向量、該病史向量，及該影像向量的該輸入數據，或是在其他實施方式中，每一樣本資料包括該生理資料、該主訴資料，及該等病史資料，該處理模組72利用該前處理語言模型產生該生理轉換資料、該主訴轉換資料，及該等病史轉換資料，再分別利用該第一神經網路及該第二神經網路產生該生理向量、該主訴向量，及分別對應該等病史轉換資料的該等病史向量，之後再產生包括該生理向量、該主訴向量，及該等病史向量的該輸入數據。

再次參閱圖1、圖2，在該步驟2中，對於每一輸入數據，該處理模組72根據該輸入數據利用該分類模型產生一相關於該輸入數據的輸出結果。其中，藉由該處理模組72不斷地根據每一筆輸入數據產生相關於該輸入數據的該輸出結果，藉此，即可由該處理模組72產生多筆分別相關於該等輸入數據的輸出結果。

參閱圖1、圖2、圖4，在該步驟3中，對於每一輸入數據，該處理模組72根據該輸入數據及該步驟2所產生的所有輸出結果的其中一者，利用該相似度判別模型判斷該輸入數據及該等輸出結果的其中該者之對應關係，以判斷是否需要調整該分類模型。以下以一子步驟31、一子步驟32、一子步驟33，及一子步驟34，更詳細說明在該步驟3中，該處理模組72如何判斷是否需要調整該分類模型。

在該子步驟31中，對於每一輸入數據，該處理模組72根據該輸入數據及該步驟2所產生的所有輸出結果的其中一者，利用該相似度判別模型產生一相關於該等輸出結果之其中該者是否對應該輸入數據的第一判別值。

在該子步驟32中，該處理模組72判斷一藉由該操作者的輸入操作所產生的輸入訊號指示出進行一第一操作模式及一第二操作模式之其中一者，當判斷出該輸入訊號指示出進行該第一操作模式，進行該子步驟33，另一方面，當判斷出該輸入訊號指示出進行該第二操作模式，進行該子步驟34。詳細地說，該操作者根據該輸入數據及該等輸出結果之其中該者判斷該等輸出結果之其中該者是否對應該輸入數據，當該操作者判斷出該等輸出結果之其中該者對應該輸入數據時，該處理模組72根據該操作者的輸入操作，產生指示出進入該第一操作模式的該輸入訊號，另一方面，當該操作者判斷出該等輸出結果之其中該者並不對應該輸入數據時，該處理模組72根據該操作者的輸入操作，產生指示出進入該第二操作模式的該輸入訊號。

在該子步驟33中，該處理模組72判斷該第一判別值是否大於一第一閾值。當判斷出該第一判別值小於等於該第一閾值時，判斷需要調整該分類模型並進行該步驟4，另一方面，當判斷出該第一判別值大於該第一閾值時，判斷不需要調整該分類模型並進行該步驟5。舉例來說，該第一判別值是一筆數值範圍在0至1間的小數，而該第一閾值是一筆預設值，例如0.8，該第一操作模式代表該等輸出結果之其中該者對應該輸入數據，而判斷出該第一判別值小於等於該第一閾值則代表，該相似度判別模型無法判斷出該輸入數據對應該分類模型根據該輸入數據所產生的該輸出結果，因此需要調整該分類模型。相反地，判斷出該第一判別值大於該第一閾值則代表，該相似度判別模型能夠判斷出該輸入數據對應該分類模型根據該輸入數據所產生的該輸出結果，因此不需要調整該分類模型。

在該子步驟34中，該處理模組72判斷該第一判別值是否小於一第二閾值。當判斷出該第一判別值大於等於該第二閾值時，判斷需要調整該分類模型並進行該步驟4，另一方面，當判斷出該第一判別值小於該第二閾值時，判斷不需要調整該分類模型並進行該步驟5。詳細地說，該第二閾值是類似於該第一閾值的一筆預設值，例如0.2，該第二操作模式代表該等輸出結果之其中該者並不對應該輸入數據，而判斷出該第一判別值不小於該第二閾值則代表，該相似度判別模型無法判斷出該輸入數據並不對應該等輸出結果之其中該者，因此需要調整該分類模型。另一方面，當判斷出該第一判別值小於該第二閾值則代表，該相似度判別模型能夠判斷出該輸入數據並不對應該等輸出結果之其中該者，因此並不需要調整該分類模型。

值得一提的是，在該第一實施例中，該處理模組72是根據以下公式判斷是否需要調整該分類模型：

其中，為交叉熵損失函數，代表該相似度判別模型的損失函數，當達到最小值時，該處理模組72判斷不需調整該分類模型，並將該分類模型作為基於病患病情的該分類模型，為該第一判別值，ε為該等輸出結果之其中一者，m為該等輸入數據之其中一者，為該相似度判別模型。在該第一實施例中，當該處理模組72能夠藉由該相似度判別模型分辨出該等輸出結果之其中該者是否對應該輸入數據時，該交叉熵損失函數將達到最小值。

再次參閱圖1、圖2，在該步驟4中，該處理模組72藉由最優化方法，例如反向傳播梯度下降的方式調整該分類模型並重回該步驟2。

在該步驟5中，該處理模組72將該分類模型作為基於病患病情的該分類模型。

參閱圖2，進一步地，本發明基於病患病情的分類模型建立方法的一第二實施例是由一類似於圖2所示的電腦裝置7來實施，其相異之處在於：該儲存模組71中還儲存有一用以判別所接收的一未知輸出結果是否可辨識的判別器，其中，該判別器為一生成對抗網路(Generative Adversarial Network, GAN)中的一判別神經網路(Discriminator neural network)，其建立方式詳細記載於Goodfellow I, Pouget-Abadie J, Mirza M, Xu B, Warde-Farley D, Ozair S等人所撰寫的論文Generative adversarial nets中，由於本發明的特徵並不在於熟知此技藝者所已知的如何建立該判別器的方式，為了簡潔，故在此省略建立該判別器的相關細節。

參閱圖2、圖5，及圖6，本發明基於病患病情的分類模型建立方法的該第二實施例類似於該第一實施例，包含該步驟1、該步驟2、該步驟3、該步驟4，及該步驟5，其相異之處在於：在該第二實施例中，該步驟3後還包含一步驟6，用以優化該分類模型。在該步驟6中，該另一處理模組72根據該步驟2所產生的所有輸出結果，利用該判別器判斷是否需要調整該分類模型。以下將以一子步驟61及一子步驟62詳細說明該另一處理模組72如何根據該判別器判斷是否需要調整該分類模型。

在該子步驟61中，該另一處理模組72根據該步驟2所產生的所有輸出結果，隨機產生多個不同於該等輸出結果且基於統計分布模式(例如卜瓦松分布Poisson distribution)的虛擬輸出結果。

參閱圖7，在該子步驟62中，該另一處理模組72自該步驟2所產生的所有輸出結果及該等虛擬輸出結果中選取該未知輸出結果，並利用該判別器判斷該未知輸出結果是否屬於該等輸出結果或該等虛擬輸出結果，以判斷是否需要調整該分類模型。以下將以一個次步驟621及一個次步驟622詳細說明該另一處理模組72如何利用該判別器判斷該未知輸出結果是否屬於該等輸出結果或該等虛擬輸出結果。

在該次步驟621中，該另一處理模組72根據該未知輸出結果，利用該判別器產生一相關於判斷該未知輸出結果是否屬於該等輸出結果或該等虛擬輸出結果的第二判別值。

在該次步驟622中，該另一處理模組72判斷該第二判別值是否大於一第三閾值或小於一第四閾值。當判斷出該第二判別值大於該第三閾值或小於該第四閾值時，判斷需要調整該分類模型並進行該步驟4，當判斷出該第二判別值小於等於該第三閾值且大於等於該第四閾值時，判斷不需要調整該分類模型並進行該步驟5。舉例而言，該第二判別值類似於該第一判別值，是一筆數值範圍在0至1之間的小數，該第三閾值及該第四閾值分別為兩筆預設值，例如0.9和0.15，該另一處理模組72判斷出該第二判別值大於該第三閾值代表該另一處理模組72判斷出該未知輸出結果屬於該等分類結果，而該另一處理模組72判斷出該第二判別值小於該第四閾值代表該另一處理模組72判斷出該未知輸出結果屬於該等虛擬輸出結果，當判斷出該第二判別值大於該第三閾值或小於該第四閾值時，代表該另一處理模組72透過該判別器能夠清楚區分該等輸出結果及該等虛擬輸出結果，因此能夠判斷出該未知輸出結果屬於該等輸出結果或該等虛擬輸出結果其中一者，進而需要調整該分類模型，另一方面，當判斷出該第二判別值小於等於該第三閾值且大於等於該第四閾值時，代表該另一處理模組72透過該判別器並無法清楚區分該等輸出結果及該等虛擬輸出結果，使得該另一處理模組72無法根據該判別器判斷該未知輸出結果屬於該等輸出結果或該等虛擬輸出結果其中一者，因而不需調整該分類模型。

值得一提的是，在該第二實施例中，該另一處理模組72是根據以下公式判斷是否需要調整該分類模型：

其中，為該相似度判別模型及該判別器的損失函數，當損失函數達到最小值時，該另一處理模組72判斷不需調整該分類模型，並將該分類模型作為基於病患病情的該分類模型，為交叉熵損失函數，代表該相似度判別模型的損失函數，為該第一判別值，ε為該等輸出結果之其中一者，m為該等輸入數據之其中一者，為該相似度判別模型，EDisease為該等輸出結果的集合，代表每次選取到該等輸出結果之其中該者的機率。而在該第二實施例中，當該另一處理模組72能夠藉由該相似度判別模型分辨出該等分類結果之其中該者是否對應該輸入數據時，該交叉熵損失函數將達到最小值。

另外需要注意的是，在該第二實施例中，是先進行該步驟3再進行該步驟6，但在其他實施方式中，該另一處理模組72是可以同時進行該步驟3及該步驟6，或是先進行該步驟6再進行該步驟3。

綜上所述，本發明基於病患病情的分類模型建立方法，藉由該處理模組72根據該等樣本資料產生分別對應該等樣本資料的該等輸入數據，並根據該等輸入數據利用該分類模型產生該等分類結果，再分別根據每一輸入數據及該等輸出結果的其中一者利用該相似度判別模型，以及根據該等輸出結果利用該判別器判斷是否需要調整該分類模型，藉此，當該分類模型已調整完畢時，醫師在接收到一相關於一名新病患病情的未知資料時，可以利用該前處理語言模型、該第一神經網路、該第二神經網路，及該分類模型迅速地產生對應該未知資料的一目標輸出結果，再根據該目標輸出結果自其他相似的輸出結果中了解其他相似的輸出結果所對應的該等病患所獲得的處置治療及疾病相關資訊，並給予該名新病患類似的處置治療及疾病之相關建議，得以迅速地利用大規模過去醫療經驗給予相對應的診斷及治療建議，故確實能達成本發明的目的。

惟以上所述者，僅為本發明的實施例而已，當不能以此限定本發明實施的範圍，凡是依本發明申請專利範圍及專利說明書內容所作的簡單的等效變化與修飾，皆仍屬本發明專利涵蓋的範圍內。

1~6:步驟 11~15:子步驟 31~34:子步驟 61~62:子步驟 621~622:次步驟 7:電腦裝置 71:儲存模組 72:處理模組

本發明的其他的特徵及功效，將於參照圖式的實施方式中清楚地呈現，其中：圖1是一流程圖，說明本發明基於病患病情的分類模型建立方法的一第一實施例；圖2是一方塊圖，說明實施本發明基於病患病情的分類模型建立方法之該第一實施例的一電腦裝置；圖3是一流程圖，輔助說明該第一實施例中之一步驟1的子步驟；圖4是一流程圖，輔助說明該第一實施例中之一步驟3的子步驟；圖5是一流程圖，說明本發明基於病患病情的分類模型建立方法的一第二實施例；圖6是一流程圖，輔助說明該第二實施例中之一步驟6的子步驟；及圖7是一流程圖，輔助說明該第二實施例中之一子步驟62的次步驟。

1~5:步驟

Claims

一種基於病患病情的分類模型建立方法，藉由一電腦裝置來實施，該電腦裝置包含一儲存模組及一電連接該儲存模組的處理模組，該儲存模組儲存有一用以對病患病情進行分類的分類模型、一用以判別該分類模型之輸出的相似度判別模型，及多筆分別相關於多位不同病患的樣本資料，每一樣本資料包括一相關於該樣本資料所相關之病患的生理表徵的生理資料、一包括該樣本資料所相關之病患的一敘述自身感覺文字資訊的主訴資料、至少一包括該樣本資料所相關之病患的一過去患病歷程文字資訊的病史資料、一用以將一結構化資料轉換為一向量的第一神經網路、一用以將該結構化資料轉換為另一向量的第二神經網路，及一用以將一非結構化資料轉換為一結構化資料的前處理語言模型，每一樣本資料包括一筆病史資料，每一樣本資料包括的該生理資料屬於結構化資料，且每一樣本資料包括的該主訴資料及該病史資料屬於非結構化資料，該基於病患病情的分類模型建立方法包含以下步驟：(A)對於每一樣本資料，根據該樣本資料的該生理資料、該主訴資料，及該至少一病史資料，產生一相關於該生理資料、該主訴資料，及該至少一病史資料的輸入數據，該步驟(A)包括以下子步驟：(A-1)對於每一樣本資料，根據該樣本資料的該生理資料，利用該第一神經網路產生一相關於該生理資料的生理向量， (A-2)對於每一樣本資料，根據該樣本資料的該主訴資料及該病史資料，利用該前處理語言模型產生一相關於該主訴資料且屬於結構化資料的主訴轉換資料及一相關於該病史資料且屬於結構化資料的病史轉換資料，(A-3)對於每一樣本資料，根據對應該樣本資料的該主訴轉換資料及該病史轉換資料，利用該第二神經網路產生一相關於該主訴資料的主訴向量，及一相關於該病史轉換資料的病史向量，及(A-4)對於每一樣本資料，根據對應該樣本資料的該生理向量、該主訴向量，及該病史向量，產生一包括該生理向量、該主訴向量，及該病史向量的輸入數據；(B)對於每一輸入數據，根據該輸入數據利用該分類模型產生一相關於該輸入數據的輸出結果；(C)對於每一輸入數據，根據該輸入數據及該步驟(B)所產生的所有輸出結果的其中一者，利用該相似度判別模型判斷該輸入數據及該等輸出結果的其中該者之對應關係，以判斷是否需要調整該分類模型；(D)當判斷出需要調整該分類模型時，調整該分類模型並重複進行該步驟(B)；及(E)當判斷出不需要調整該分類模型時，確認該分類模型為基於病患病情的分類模型。
如請求項1所述的基於病患病情的分類模型建立方法，其中，該前處理語言模型、該分類模型，及該相似度判別模型係根據自然語言處理中基於深度雙向Transformer的語言模型預訓練策略而建立。
如請求項1所述的基於病患病情的分類模型建立方法，其中，該步驟(C)包含以下子步驟：(C-1)對於每一輸入數據，根據該輸入數據及該步驟(B)所產生的所有輸出結果的其中一者，利用該相似度判別模型產生一相關於該等輸出結果之其中該者是否對應該輸入數據的第一判別值；(C-2)判斷一藉由該電腦裝置的操作者的一輸入操作所產生的輸入訊號指示出進行一第一操作模式或一第二操作模式；(C-3)當判斷出該輸入訊號指示出進行該第一操作模式時，判斷該第一判別值是否大於一第一閾值，以判斷是否需要調整該分類模型；(C-4)當判斷出該第一判別值大於該第一閾值時，判斷不需要調整該分類模型；(C-5)當判斷出該第一判別值小於等於該第一閾值時，判斷需要調整該分類模型；(C-6)當判斷出該輸入訊號指示出進行該第二操作模式時，判斷該第一判別值是否小於一第二閾值，以判斷是否需要調整該分類模型；(C-7)當判斷出該第一判別值小於該第二閾值時，判斷不需要調整該分類模型；及(C-8)當判斷出該第一判別值大於等於該第二閾值時，判斷需要調整該分類模型。
如請求項1所述的基於病患病情的分類模型建立方法，在該步驟(B)後還包含以下步驟：(F)根據該步驟(B)所產生的所有輸出結果，利用該儲存模組所儲存的一用以判別所接收的一未知輸出結果是否可辨識的判別器判斷是否需要調整該分類模型。
如請求項4所述的基於病患病情的分類模型建立方法，其中，該步驟(F)包括以下子步驟：(F-1)根據該步驟(B)所產生的所有輸出結果，隨機產生多個不同於該等輸出結果的虛擬輸出結果；及(F-2)自該步驟(B)所產生的所有輸出結果及該等虛擬輸出結果中選取該未知輸出結果，並利用該判別器判斷該未知輸出結果是否屬於該等輸出結果或該等虛擬輸出結果，以判斷是否需要調整該分類模型。
如請求項5所述的基於病患病情的分類模型建立方法，其中，該步驟(F-2)包括以下子步驟：(F-2-1)根據該未知輸出結果，利用該判別器產生一相關於判斷該未知輸出結果是否屬於該等輸出結果或該等虛擬輸出結果的第二判別值；(F-2-2)判斷該第二判別值是否大於一第三閾值或小於一第四閾值；(F-2-3)當判斷出該第二判別值大於該第三閾值或小於該第四閾值時，判斷該未知輸出結果屬於該等輸出結果或該等虛擬輸出結果之其中一者，以判斷需要調整該分類模型；及 (F-2-4)當判斷出該第二判別值小於等於該第三閾值且大於等於該第四閾值時，判斷該未知輸出結果不屬於該等輸出結果或該等虛擬輸出結果之其中一者，以判斷不需要調整該分類模型。
如請求項1所述的基於病患病情的分類模型建立方法，其中，該判別器為一生成對抗網路中的一判別神經網路。