TWI511072B - 病理資料處理裝置以及方法 - Google Patents
病理資料處理裝置以及方法 Download PDFInfo
- Publication number
- TWI511072B TWI511072B TW103104212A TW103104212A TWI511072B TW I511072 B TWI511072 B TW I511072B TW 103104212 A TW103104212 A TW 103104212A TW 103104212 A TW103104212 A TW 103104212A TW I511072 B TWI511072 B TW I511072B
- Authority
- TW
- Taiwan
- Prior art keywords
- column vector
- random
- feature
- value
- rows
- Prior art date
Links
Landscapes
- Measuring And Recording Apparatus For Diagnosis (AREA)
- Medical Treatment And Welfare Office Work (AREA)
Description
本發明係關於一種病理資料處理裝置,特別係關於判斷病患相似度之病理資料處理裝置。
目前在醫療決策判斷系統上,一般會利用歷史的病例資料庫作為參考的依據,在一些醫療決策判斷系統上會利用病患之間的相似度作為參考。然而,由於歷史病例資料中的病患數量和病徵的數量都非常的龐大,為了計算兩兩病患之間相似度,需要耗費相當多的時間和成本。此外,一旦歷史病例資料的病人和病徵有更新,又需要再重新繁瑣的計算。
本發明提供一種病理資料處理裝置,用以處理具有一第一病患之複數第一病徵以及一第二病患之複數第二病徵之一病理資料。病理資料處理裝置包括一資料擷取單元、一儲存單元、一資料處理模組以及一判斷單元。資料擷取單元根據上述病理資料產生一特徵矩陣,其中上述特徵矩陣包括一第一列向量以及一第二列向量分別對應至上述第一病患以及上述第二病患,上述第一列向量以及上述第二列向量具有複數行分別對應至複數病徵,上述第一列向量中對應上述第一病徵之行以及上述第二列向量中對應上述第二病徵之行的數值設為
一第一值,上述第一列向量中未對應上述第一病徵之行以及上述第二列向量中未對應上述第二病徵之行的數值設為一第二值。儲存單元儲存複數隨機排列組合。資料處理模組根據上述隨機排列組合將上述第一列向量中各行之數值隨機排列以產生複數第一隨機列向量,並根據各上述第一隨機列向量中具有上述第一值之最小行產生一第一特徵列向量,以及根據上述隨機排列組合對上述第二列向量中各行之數值隨機排列以產生複數第二隨機列向量,並根據各上述第二隨機列向量中具有上述第一值之最小行產生一第二特徵列向量。判斷單元比較上述第一特徵列向量與上述第二特徵列向量各行之值,並根據比較結果決定上述第一病患以及上述第二病患之一相似度。
在一些實施例中,上述第一特徵列向量與上述第
二特徵列向量的行數相同,而上述相似度為上述第一特徵列向量與上述第二特徵列向量在相同行具有相同值之數量除以上述第一特徵列向量所具有的行數。
在一些實施例中,各上述隨機排列組合用以儲存
不重複之1至M的數值,M為上述特徵矩陣所具有的行數,而上述資料處理模組則依據上述隨機排列組合之數值將上述第一列向量中對應行的之值取出並依序排列於上述第一隨機列向量之各行,以及依據上述隨機排列組合之數值將上述第二列向量中對應行的之值取出並依序排列於上述第二隨機列向量之各行。
在一些實施例中,上述資料處理模組判斷各上述
第一隨機列向量中具有上述第一值之最小行並依序儲存於一
第一特徵列向量之各行,以及判斷各上述第二隨機列向量中具有上述第一值之最小行並依序儲存於一第二特徵列向量之各行。
在一些實施例中,上述資料處理模組更包括一第
一子處理單元以及一第二處理單元,其中上述第一子處理單元用以根據上述隨機排列組合產生上述第一隨機列向量,以及根據上述第一隨機列向量產生上述第一特徵列向量,而上述第二子處理單元用以根據上述隨機排列組合產生上述第二隨機列向量,以及根據上述第二隨機列向量產生上述第二特徵列向量。
在一些實施例中,上述第一值為1而上述第二值為
0。在一些實施例中,上述病徵可分別對應至國際疾病分類的各診斷碼,例如ICD-9,但並不局限於ICD-9。
本發明更提供了一種病理資料處理方法,適用具
有一第一病患之複數第一病徵以及一第二病患之複數第二病徵之一病理資料。上述病理資料處理方法的步驟包括如下:根據上述病理資料產生一特徵矩陣,其中上述特徵矩陣包括一第一列向量以及一第二列向量分別對應至上述第一病患以及上述第二病患,上述第一列向量以及上述第二列向量具有複數行分別對應至複數病徵;將上述第一列向量中對應上述第一病徵之行以及上述第二列向量中對應上述第二病徵之行的數值設為一第一值;將上述第一列向量中未對應上述第一病徵之行以及上述第二列向量中未對應上述第二病徵之行的數值設為一第二值;根據複數隨機排列組合將上述第一列向量中各行之數
值隨機排列以產生複數第一隨機列向量;根據上述隨機排列組合對上述第二列向量中各行之數值隨機排列以產生複數第二隨機列向量;根據各上述第一隨機列向量中具有上述第一值之最小行產生一第一特徵列向量;根據各上述第二隨機列向量中具有上述第一值之最小行產生一第二特徵列向量;以及比較上述第一特徵列向量與上述第二特徵列向量各行之值,並根據比較結果決定上述第一病患以及上述第二病患之一相似度。
在一些實施例中,上述第一特徵列向量與上述第
二特徵列向量的行數相同,而上述相似度為上述第一特徵列向量與上述第二特徵列向量在相同行具有相同值之數量除以上述第一特徵列向量所具有的行數。
在一些實施例中,各上述隨機排列組合用以儲存
不重複之1至M的數值,M為上述特徵矩陣所具有的行數。上述病理資料處理方法的步驟更包括如下:依據上述隨機排列組合之數值將上述第一列向量中對應行的之值取出並依序排列於上述第一隨機列向量之各行;以及依據上述隨機排列組合之數值將上述第二列向量中對應行的之值取出並依序排列於上述第二隨機列向量之各行。
在一些實施例中,上述病理資料處理方法的步驟
更包括如下:判斷各上述第一隨機列向量中具有上述第一值之最小行並依序儲存於一第一特徵列向量之各行;以及判斷各上述第二隨機列向量中具有上述第一值之最小行並依序儲存於一第二特徵列向量之各行。
在一些實施例中,上述病理資料處理方法更包括:
藉由第一子處理單元以根據上述隨機排列組合產生上述第一隨機列向量,以及根據上述第一隨機列向量產生上述第一特徵列向量;以及一第二子處理單元以根據上述隨機排列組合產生上述第二隨機列向量,以及根據上述第二隨機列向量產生上述第二特徵列向量。
在一些實施例中,上述病理資料處理方法之上述
第一值為1而上述第二值為0。在一些實施例中,上述病徵分別對應至國際疾病分類的各診斷碼。
100‧‧‧病理資料處理裝置
110‧‧‧資料擷取單元
120‧‧‧資料處理模組
120-1、120-2、120-3、120-N‧‧‧子處理單元
130‧‧‧儲存單元
140‧‧‧判斷單元
CA
‧‧‧列向量
RA-1
~RA-4
、RB-1
~RB-4
、RC-1
~RC-4
、RD-1
~RD-4
‧‧‧隨機列向量
由閱讀以下詳細說明及配合所附圖式之舉例,可更完整地了解本發明所揭露,如下:第1圖係顯示根據本發明一實施例所述之病理資料處理裝置之方塊圖。
第2A圖係顯示根據本發明一實施例所述之特徵矩陣。
第2B以及2C圖係顯示根據本發明一實施例根據隨機排列組合產生隨機列向量之示意圖。
第3A圖係顯示根據本發明一實施例之對應於病患A之隨機列向量。
第3B圖係顯示根據本發明一實施例之對應於病患B之隨機列向量。
第3C圖係顯示根據本發明一實施例之對應於病患C之隨機列向量。
第3D圖係顯示根據本發明一實施例之對應於病患D之隨機列向量。
第4圖係為根據本發明第1圖所示之病理資料處理裝置之一方法實施例之流程圖。
以下所述以特定方式表達顯示於圖示中之實施例或例子。但應了解該實施例或例子並非用以限制。任何本發明實施例的替換以及修改,以及本發明原則之任何進一步應用,對於本發明領域具有通常技術者能參考本發明說明書內容而完成。實施例中之參數會重複使用,但即使是使用相同的參數,仍非規定該特性於一實施例可適用於另一實施例。
第1圖係顯示根據本發明一實施例所述之病理資料處理裝置之方塊圖。病理資料處理裝置100包括資料擷取單元110、資料處理模組120、儲存單元130以及判斷單元140。資料擷取單元110用以從外部的病患歷史資料庫等擷取病理資料,並根據該些病理資料產生表示病患與病徵之對應關係的特徵矩陣,其中特徵矩陣之每一列向量表示一位病患,各行表示一種病徵,而特徵矩陣中儲存1或0的值。舉例來說,若特徵矩陣為M×N的矩陣,則表示有M種病徵以及N個病患,而當第n個病患具有第m種病徵時,資料擷取單元110則將第n行之第m列之值設置為1,而當第n個病患不具有第m種病徵時,則將第n行之第m列之值設置為0,其中n為小於等於N的正整數,而m為小於等於M的正整數。在一些實施例中,病徵的分類可根據國際疾病分類ICD-9診斷碼作分類,意即M為14025。
在一實施例中,資料處理模組120具有複數個子處理單元120-1~120-N用以平行處理各個病患之資料(即,所對
應之列向量)。在一些實施例中亦可以單一處理單元的多核心來完成平行處理。當資料處理模組120接收到特徵矩陣後,將各病患所對應之列向量分別處理。舉例來說,子處理單元120-1用以處理對應第一病患之列向量,而子處理單元120-2用以處理對應第二病患之列向量,以此類推。
然而,由於實際上病患和病徵的數量非常龐大,
為了求得實際的相似情形必須逐一比對,非常耗費時間,因此為了簡化計算資料處理模組120更對資料擷取單元110所產生的特徵矩陣作降維計算。詳細來說,子處理單元120-1~120-N根據儲存單元130所儲存的隨機排列組合將第1~N病患之列向量重新排組合,並分別產生K組隨機列向量。詳細來說,儲存單元130所儲存的隨機排列組合可具有K組(P1
、P2
、...、PK
),各組分別為1到M的排列組合,用以將各個病患的列向量中對應行的值依序重新排列以產生隨機列向量。因此,子處理單元120-1依據隨機排列組合P1
、P2
、...、PK
對第1病患之列向量重新排列分別產生隨機列向量R1-1
、R1-2
、...、R1-K
,並判斷各隨機列向量R1-1
、R1-2
、...、R1-K
具有數值”1”的最小行以產生特徵列向量S1
。舉例來說,若隨機列向量R1-1
為[0,0,1,0,...],則第1病患之特徵列向量S1
的第一行即為3,若隨機列向量R1-2
為[0,1,0,0,...],則第1病患之特徵列向量S1
的第二行即為2,以此類推。由於有K組隨機列向量,因此特徵列向量S1
會具有K行。相似地,子處理單元120-2依據隨機排列組合P1
、P2
、...、PK
對第2病患之列向量重新排列分別產生隨機列向量R2-1
、R2-2
、...、R2-K
,並判斷各隨機列向量R2-1
、R2-2
、...、R2-K
具有
數值”1”的最小行以產生特徵列向量S2
,其他子處理單元120-3~120-N則以此類推。接著,子處理單元120-1~120-N將特徵列向量S1
~SN
傳送至判斷單元140。
判斷單元140在接收到對應至各病患1~N之特徵
列向量S1
~SN
後,比較各特徵列向量S1
~SN
各行(K行)之值,來決定各病患的病徵相似度。詳細來說,兩病患之間的相似度定義為兩對應的特徵列向量在相同行具有相同值的行數除以總行數,換句話說,假設病患1、2之特徵列向量S1
、S2
在第X1
、X2
、...、Xi
行(總共i行)的值相同,則病患1、2之相似度則為i/K,其餘各病患之間的相似度亦同。在一些實施例中,判斷單元140更將各病患間的相似度結果輸出至醫療決策系統上作為訓練資料。
為了方便說明上述實施例中,皆使用列向量來作
運算的操作,然而本發明並非限制於此,亦可用行向量,或是其他可表示數列的形式來完成。另外,由於各病患的列向量的行數固定(病徵種類數固定),本發明之K組隨機列向量可預先被計算並儲存於儲存單元130中,並重複地使用在各病患的列向量排列,因此大幅地降低了在作資料降維時重新產生隨機排列組合的計算時間和成本。
以下配合圖示對於本發明的病理資料處理裝置100的操作方式作進一步的說明。為了簡化說明以下4個病患A~D以及8種病徵I1
~I8
的病理資料作為舉例。如下表1:
其中,表格中「V」符號係表示該病患具有該病徵。
第2A圖係顯示當資料擷取單元110擷取到如表1所
示之病理資料後所產生可表示病患與病徵之對應關係的8×4特徵矩陣。上述病理資料為舉一實施例為例,本發明並非限制其格式或內容,任何具有病患與病徵之對應關係的病理資料皆可應用於本發明中。如第2A圖所示,特徵矩陣之第1~4列向量分別對應病患A~D,列向量中各行的值係表示該病患是否具有該病徵。舉例來說,由於病患A具有病徵I1
、I3
、I7
、I8
,因此特徵矩陣第1列第1、3、7、8行的值為1,而第2、4、5、6行的值為0。
一般來說,為了病患兩兩之間的相似情形須逐一
比對各二列向量中各行的值,以判斷各二列向量在相同行上同時具有值為1之數量,而其相似度即為該數量除以該二列向量中至少有一列向量為1的行的數量。例如,當計算病患A(第1列)與病患B(第2列)的相似度時,則對第1、2列各行的數值作比較,判斷第1列向量與第2列向量在相同行上同時具有值為
1之行的數量,在此例子中,第1列向量與第2列向量在第8行具有相同數值1(即,皆有相同病徵I8
),因此在相同行具有相同值之行(第8行)的數量為1。接著判斷第1列向量與第2列向量中至少有一列向量為1的行的數量,在此例子中的數量為7(第1~4以及6~8行)。因此,可計算出病患A(第1列)與病患B(第2列)的相似度即為1/7。由於二列向量在相同行上同時具有值為0並不具有相似的意義,例如,第1列向量與第2列向量皆在第5行上的值為0。因此,在相似度的計算中,可單一計入該二列向量中至少有一列向量為1的行的數量。然而實際應用上,由於病徵的數量非常多,例如在ICD-9的分類下即有14025種,而病患的數量亦非常多,當需取得各個病患之間的相似度時,這樣一一比對計算的方式,非常耗費時間成本。
為了簡化以加速相似度的計算,在第2A圖的特徵
矩陣的例子中,儲存單元130所儲存的隨機排列組合亦可具有K組(P1
、P2
、...、PK
),各組分別為1到8的排列組合。K的值可隨著使用者的設計來決定,當使用者欲產生較為精確的結果,則可選用較為大的K值,另一方面,當使用者欲快速取得較為粗略的結果,則可選用較為小的K值。然而為了簡化,以下以K=4作為例子說明,換句話說,儲存單元130所儲存的隨機排列組合P1
、P2
、P3
、P4
四組,可如下表2:
接著,資料處理模組120根據對資料擷取單元110所產生的特徵矩陣作降維計算。首先,子處理單元120-1~120-4根據儲存單元130所儲存的隨機排列組合P1
、P2
、P3
、P4
將第A~D病患之列向量重新排列組合,並分別產生4組隨機列向量。在子處理單元120-1中,子處理單元120-1依據隨機排列組合P1
、P2
、P3
、P4
所指示的行值依序排入隨機列向量RA-1
、RA-2
、RA-3
、RA-4
各行中。如第2B圖所示,子處理單元120-1根據列向量CA
以及隨機排列組合P1
產生隨機列向量RA-1
,其中列向量CA
表示病患A之列向量,其根據隨機排列組合P1
將列向量CA
第2行的值排入隨機列向量RA-1
第1行、將列向量CA
第7行的值排入隨機列向量RA-1
第2行、將列向量CA
第1行的值排入隨機列向量RA-1
第3行、將列向量CA
第5行的值排入隨機列向量RA-1
第4行、將列向量CA
第4行的值排入隨機列向量RA-1
第5行、將列向量CA
第8行的值排入隨機列向量RA-1
第6行、將列向量CA
第6行的值排入隨機列向量RA-1
第7行、將列向量CA
第3行的值排入隨機列向量RA-1
第8行。子處理單元120-1依據隨機排列組合P1
依序取出列向量CA
對應行的值,接著從隨機列向量RA-1
第1行依序排列至第8行。相同地,如第2C圖所示,子處理單元120-1根據列向量CA
以及隨機排列組合P2
產生隨機列向量RA-2
,其中列向量CA
表示病患A之列向量,其根據隨機排列組合P2
將列向量CA
第5行的值排入隨機列向量RA-2
第1行、將列向量CA
第3行的值排入隨機列向量RA-2
第2行、將列向量CA
第4行的值排入隨機列向量RA-2
第3行、將列向量CA
第7行的值排入隨機列向量RA-2
第4行、將列向量CA
第6行的值排入隨機列向量RA-2
第5行、將列向量CA
第8行的值排入隨機列向量RA-2
第6行、將列向量CA
第2行的值排入隨機列向量RA-2
第7行、將列向量CA
第1行的值排入隨機列向量RA-2
第8行。其餘隨機列向量RA-3
、RA-4
以此類推。此外,病患B~D列向量亦同於上述方式,分別由子處理單元120-2~120-4根據隨機排列組合P1
、P2
、P3
、P4
產生所對應的隨機列向量RB-1
~RB-4
、RC-1
~RC-4
以及RD-1
~RD-4
,在此不多加贅述。
經過上述處理後,子處理單元120-1~120-4可分別
取得對應病患A~D的隨機列向量RA-1
~RA-4
、RB-1
~RB-4
、RC-1
~RC-4
以及RD-1
~RD-4
,如第3A~3D圖所示。接著,子處理單元120-1~120-4分別判斷各隨機列向量隨機列向量RA-1
~RA-4
、RB-1
~RB-4
、RC-1
~RC-4
以及RD-1
~RD-4
具有數值”1”的最小行以產生特徵列向量S1
、S2
、S3
、S4
。關於病患A的特徵列向量S1
,子處理單元120-1判斷隨機列向量隨機列向量RA-1
~RA-4
具有數值”1”的最小行依序為第2行、第2行、第1行以及第1行,如第3A圖的標示,因此可得特徵列向量S1
為[2,2,1,1]T
。關於病患B的特徵列向量S2
,子處理單元120-2判斷隨機列向量隨機列向量RB-1
~RB-4
具有數值”1”的最小行依序為第1行、第3行、第3行以及第1行,如第3B圖的標示,因此可得特徵列向量S2
為[1,3,3,1]T
。關於病患C的特徵列向量S3
,子處理單元120-3判斷隨機列向量隨機列向量RC-1
~RC-4
具有數值”1”的最小行依序為第1行、第2行、第1行以及第2行,如第3C圖的標示,因此可得特徵列向量S3
為[1,2,1,2]T
。關於病患D的特徵列向量S4
,
子處理單元120-4判斷隨機列向量隨機列向量RD-1
~RD-4
具有數值”1”的最小行依序為第3行、第1行、第1行以及第2行,如第3D圖的標示,因此可得特徵列向量S4
為[3,1,1,2]T
。接著,子處理單元120-1~120-4將特徵列向量S1
~S4
傳送至判斷單元140。
判斷單元140在接收到對應至各病患A~D之特徵
列向量S1
~S4
後,比較各特徵列向量S1
~S4
各行之值,來決定各病患的病徵相似度。詳細來說,當判斷病患A與病患B的相似度的情況下,判斷單元140比對特徵列向量S1
為[2,2,1,1]T
與特徵列向量S2
為[1,3,3,1]T
在相同行具有相同值的行數,判斷單元140則判斷特徵列向量S1
為S2
與在單一1行(第4行)具有相同的值,因此輸出病患A與病患B的相似度為1/4,即在相同行具有相同值的行數(1行)除以總行數(4行)。相同地,當判斷病患C與病患D的相似度的情況下,判斷單元140比對特徵列向量S3
為[1,2,1,2]T
與特徵列向量S4
為[3,1,1,2]T
在相同行具有相同值的行數,判斷單元140則可判斷特徵列向量S1
為S2
與在2行(第3、4行)具有相同的值,因此輸出病患C與病患D的相似度為2/4,即在相同行具有相同值的行數(2行)除以總行數(4行)。以此類推,判斷單元140則可取得各病患A~D兩兩之間的相似度,一共六組相似度可用以提供至醫療決策系統上作為訓練資料。
第4圖係為根據本發明第1圖所示之病理資料處理
裝置之一方法實施例之流程圖。在步驟S402中,資料擷取單元110用以從外部的病患歷史資料庫等擷取病理資料,並根據該
些病理資料產生表示病患與病徵之對應關係的特徵矩陣。
接著,於步驟S404中,資料處理模組120的子處理
單元120-1~120-N從資料擷取單元110所產生的特徵矩陣分別取得病患1~N所對應的列向量。
於步驟S406中,子處理單元120-1~120-N根據儲
存單元130所儲存的K組隨機排列組合分別將各個病患1~N的列向量中對應行的值依序重新排列,並對特徵矩陣的各個列向量分別產生K組隨機列向量。
於步驟S408中,各子處理單元120-1~120-N判斷
各列向量所對應的各隨機列向量中具有數值”1”的最小行,並對應地產生各特徵列向量S1
~SN
。
最後於步驟S410中,判斷單元140比較各特徵列向
量S1
~SN
各行之值,取得各兩個對應的特徵列向量S1
~SN
在相同行具有相同值的行數,並將該行數除以總行數以取得相似度。
本發明病理資料處理裝置,或特定型態或其部份,
可以以程式碼的型態存在。程式碼可以包含於實體媒體,如軟碟、光碟片、硬碟、或是任何其他機器可讀取(如電腦可讀取)儲存媒體,亦或不限於外在形式之電腦程式產品,其中,當程式碼被機器,如電腦載入且執行時,此機器變成用以參與本發明之裝置。程式碼也可以透過一些傳送媒體,如電線或電纜、光纖、或是任何傳輸型態進行傳送,其中,當程式碼被機器,如電腦接收、載入且執行時,此機器變成用以參與本發明之裝置。當在一般用途處理單元實作時,程式碼結合處理單元提供
一操作類似於應用特定邏輯電路之獨特裝置。
本領域具通常知識者得以理解本發明之各方面可被具
體化為一系統、一方法或電腦程式產品。因此,本發明之各方面可由一完整的(entirely)硬體、一完整的軟體(包含韌體、常駐軟體、微式碼(micro-code))、或一軟體硬體整合的形式以實施之,其可統稱為電路、模組或系統。再者,本發明之各方面可由電腦程式產品的形式實施之,其可由一或多個電腦可讀媒體而實施之,電腦可讀媒體具有電腦可讀式程式碼。
本發明實施例可以利用一或多個電腦可讀式媒體
的任意組合。電腦可讀式媒體可以係一電腦可讀式訊號媒體或一電腦可讀式儲存媒體。一電腦可讀式儲存媒體可以例如是,但不侷限為一電子、磁性、光學、電磁、紅外線或半導體系統、設備、裝置或前述之任何適當組合。電腦可讀式儲存媒體之更具體之例子(並非列出所有例子)可包含以下元件:具有一或多個線路之電性連接線、一可攜式電腦磁片、一硬碟、一隨機存取記憶體(RAM)、一唯讀式記憶體(ROM)、一可抹除可編程唯讀記憶體(EPEOM或Flash memory)、一光纖、一可攜式唯讀記憶光碟(CD-ROM)、一光學儲存裝置、一磁性儲存裝置或前述之任何適當組合。於本文中,一電腦可讀儲存媒體可為任何有形媒體,其所包含或儲存之程式可供指令執行系統、設備或裝置等所使用或與之相關。
本發明實施例可以利用一電腦儲存式訊號媒體,
而電腦儲存式訊號媒體可包含具有嵌入電腦可讀式程式碼之一傳播資料訊號,例如,在基帶中或為部份載波之傳播資料訊號。這種傳播資料訊號可採取各種形式,包括但不限制於電磁、光學、或任意適當之組合。電腦儲存式訊號媒體可以非為電腦可讀式儲存媒體,而為任何可以通訊、傳輸、或傳送程式以供使用或與一指令執行系統、設備或裝置連結之電腦可讀式媒體。
本發明實施例可以利用嵌入於一電腦可讀式媒體
之電腦程式,並被任何適當的媒體進行傳送,適當的媒體包括但不侷限於無線、有線、光纖電纜、RF等或上述任意適當的組合。
本發明實施例可以利用電腦程式碼以實現本案發
明各方面之操作。電腦程式碼可透過撰寫一或多種程式語言之任意組合來編寫,包括一物體導向程式語言,像是Java、Smalltalk、C++或傳統之程序導向之程式語言,像是C程式語言或類似於其之程式語言。程式碼可作為一獨立的軟體封裝而被完全地執行於使用者電腦、部分地執行於使用者電腦、部分地在使用者電腦上執行及部分的在遠端電腦或完全在遠端電腦或伺服器上執行。在後者情況中,遠端電腦可經由任何形式之網路,包括區域網路(LAN)、廣域網路(WAN),以連接至使用者電腦,或可連接至外部電腦(例如,透過使用網路服無提供者之網際網路)。
下文參考根據本發明實施方式的方法、裝置(系統)
和電腦程式產品的流程圖圖示和/或方塊圖描述了本發明的各個方面。應當理解,流程圖圖示和/或方塊圖的每個區塊的組合都可以透過電腦程式指令以實作之。此些電腦程式指令可透過一通用電腦的一處理器、專用電腦、或其他可編程資料處理裝置,使電腦或其他可編程資料處理裝置創建用於實現流程圖和/或方塊圖中一個或多個區塊的功能/動作。
這些電腦程式指令亦可被儲存於一電腦可讀式媒
體,而電腦可讀式媒體可引導電腦、其他可編程資料處理裝置、或其他設備以特定的方式運作,使得儲存在電腦可讀式媒體中的指令產生包括實現流程圖和/或方塊圖的一個或多個區塊中所指定的功能/動作之指令的製品。
電腦程式指令亦可被加載並執行於一電腦、其他
可編程資料處理裝置、或其他設備,且於電腦、其他可編程資料處理裝置、或其它裝備上執行一系列的操作步驟,以產生一電腦實作程序,使指令可被執行於電腦、其他可編程資料處理裝置,藉此以實現流程圖和/或方塊圖的一個或多個區塊中所指定的功能/動作。
上述的段落說明了本發明多種樣態。顯然,本發
明可藉由多種方法來完成,而在所揭露的實施例中任何特定的結構或是功能僅用以表示較為典型的情況。本技術領域具有通常技術者可了解本發明所揭露的各種樣態,並單獨地或彼此結
合地實施本發明。
本發明雖已敘述較佳之實施例如上,但因了解上
述所揭露並非用以限制本發明實施例。任何在本領域熟悉此技藝者,在不脫離本發明之精神和範圍內,可以廣義之方式作適當的更動和替換。因此,本發明之範圍應由後述請求項以及其等校實施方式定義以及保護。
100‧‧‧病理資料處理裝置
110‧‧‧資料擷取單元
120‧‧‧資料處理模組
120-1、120-2、120-3、120-N‧‧‧子處理單元
130‧‧‧儲存單元
140‧‧‧判斷單元
Claims (14)
- 一種病理資料處理裝置,用以處理具有一第一病患之複數第一病徵以及一第二病患之複數第二病徵之一病理資料,包括:一資料擷取單元,根據上述病理資料產生一特徵矩陣,其中上述特徵矩陣包括一第一列向量以及一第二列向量分別對應至上述第一病患以及上述第二病患,上述第一列向量以及上述第二列向量具有複數行分別對應至複數病徵,上述第一列向量中對應上述第一病徵之行以及上述第二列向量中對應上述第二病徵之行的數值設為一第一值,上述第一列向量中未對應上述第一病徵之行以及上述第二列向量中未對應上述第二病徵之行的數值設為一第二值;一儲存單元,儲存複數隨機排列組合;一資料處理模組,根據上述隨機排列組合將上述第一列向量中各行之數值隨機排列以產生複數第一隨機列向量,並根據各上述第一隨機列向量中具有上述第一值之最小行產生一第一特徵列向量,以及根據上述隨機排列組合對上述第二列向量中各行之數值隨機排列以產生複數第二隨機列向量,並根據各上述第二隨機列向量中具有上述第一值之最小行產生一第二特徵列向量;以及一判斷單元,比較上述第一特徵列向量與上述第二特徵列向量各行之值,並根據比較結果決定上述第一病患以及上述第二病患之一相似度。
- 如申請專利範圍第1項所述之病理資料處理裝置,其中, 上述第一特徵列向量與上述第二特徵列向量的行數相同,而上述相似度為上述第一特徵列向量與上述第二特徵列向量在相同行具有相同值之數量除以上述第一特徵列向量所具有的行數。
- 如申請專利範圍第1項所述之病理資料處理裝置,其中,各上述隨機排列組合用以儲存不重複之1至M的數值,M為上述特徵矩陣所具有的行數,而上述資料處理模組則依據上述隨機排列組合之數值將上述第一列向量中對應行的之值取出並依序排列於上述第一隨機列向量之各行,以及依據上述隨機排列組合之數值將上述第二列向量中對應行的之值取出並依序排列於上述第二隨機列向量之各行。
- 如申請專利範圍第3項所述之病理資料處理裝置,上述資料處理模組判斷各上述第一隨機列向量中具有上述第一值之最小行並依序儲存於一第一特徵列向量之各行,以及判斷各上述第二隨機列向量中具有上述第一值之最小行並依序儲存於一第二特徵列向量之各行。
- 如申請專利範圍第1項所述之病理資料處理裝置,其中,上述資料處理模組更包括一第一子處理單元以及一第二處理單元,其中上述第一子處理單元用以根據上述隨機排列組合產生上述第一隨機列向量,以及根據上述第一隨機列向量產生上述第一特徵列向量,而上述第二子處理單元用以根據上述隨機排列組合產生上述第二隨機列向量,以及根據上述第二隨機列向量產生上述第二特徵列向量。
- 如申請專利範圍第1項所述之病理資料處理裝置,其中,上述第一值為1而上述第二值為0。
- 如申請專利範圍第1項所述之病理資料處理裝置,其中,上述病徵分別對應至國際疾病分類的各診斷碼。
- 一種病理資料處理方法,適用具有一第一病患之複數第一病徵以及一第二病患之複數第二病徵之一病理資料,而上述病理資料處理方法包括:根據上述病理資料產生一特徵矩陣,其中上述特徵矩陣包括一第一列向量以及一第二列向量分別對應至上述第一病患以及上述第二病患,上述第一列向量以及上述第二列向量具有複數行分別對應至複數病徵;將上述第一列向量中對應上述第一病徵之行以及上述第二列向量中對應上述第二病徵之行的數值設為一第一值;將上述第一列向量中未對應上述第一病徵之行以及上述第二列向量中未對應上述第二病徵之行的數值設為一第二值;根據複數隨機排列組合將上述第一列向量中各行之數值隨機排列以產生複數第一隨機列向量;根據上述隨機排列組合對上述第二列向量中各行之數值隨機排列以產生複數第二隨機列向量;根據各上述第一隨機列向量中具有上述第一值之最小行產生一第一特徵列向量;根據各上述第二隨機列向量中具有上述第一值之最小行產生一第二特徵列向量;以及 比較上述第一特徵列向量與上述第二特徵列向量各行之值,並根據比較結果決定上述第一病患以及上述第二病患之一相似度。
- 如申請專利範圍第8項所述之病理資料處理方法,其中,上述第一特徵列向量與上述第二特徵列向量的行數相同,而上述相似度為上述第一特徵列向量與上述第二特徵列向量在相同行具有相同值之數量除以上述第一特徵列向量所具有的行數。
- 如申請專利範圍第8項所述之病理資料處理方法,其中,各上述隨機排列組合用以儲存不重複之1至M的數值,M為上述特徵矩陣所具有的行數,而上述病理資料處理方法更包括:依據上述隨機排列組合之數值將上述第一列向量中對應行的之值取出並依序排列於上述第一隨機列向量之各行;以及依據上述隨機排列組合之數值將上述第二列向量中對應行的之值取出並依序排列於上述第二隨機列向量之各行。
- 如申請專利範圍第10項所述之病理資料處理方法,更包括:判斷各上述第一隨機列向量中具有上述第一值之最小行並依序儲存於一第一特徵列向量之各行;以及判斷各上述第二隨機列向量中具有上述第一值之最小行並依序儲存於一第二特徵列向量之各行。
- 如申請專利範圍第8項所述之病理資料處理方法,更包括: 藉由第一子處理單元以根據上述隨機排列組合產生上述第一隨機列向量,以及根據上述第一隨機列向量產生上述第一特徵列向量;以及一第二子處理單元以根據上述隨機排列組合產生上述第二隨機列向量,以及根據上述第二隨機列向量產生上述第二特徵列向量。
- 如申請專利範圍第8項所述之病理資料處理方法,其中,上述第一值為1而上述第二值為0。
- 如申請專利範圍第8項所述之病理資料處理方法,其中,上述病徵分別對應至國際疾病分類的各診斷碼。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW103104212A TWI511072B (zh) | 2014-02-10 | 2014-02-10 | 病理資料處理裝置以及方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW103104212A TWI511072B (zh) | 2014-02-10 | 2014-02-10 | 病理資料處理裝置以及方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
TW201531994A TW201531994A (zh) | 2015-08-16 |
TWI511072B true TWI511072B (zh) | 2015-12-01 |
Family
ID=54343156
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW103104212A TWI511072B (zh) | 2014-02-10 | 2014-02-10 | 病理資料處理裝置以及方法 |
Country Status (1)
Country | Link |
---|---|
TW (1) | TWI511072B (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2006052516A1 (en) * | 2004-11-03 | 2006-05-18 | Siemens Medical Solutions Usa, Inc. | System and method for a contiguous support vector machine |
TW201108019A (en) * | 2009-08-21 | 2011-03-01 | Mingdao University | A system for analyzing and screening disease related genes using microarray database |
WO2012154216A1 (en) * | 2011-05-06 | 2012-11-15 | Sti Medical Systems, Llc | Diagnosis support system providing guidance to a user by automated retrieval of similar cancer images with user feedback |
TW201300081A (zh) * | 2011-06-17 | 2013-01-01 | Ind Tech Res Inst | 生理參數指標運算系統、方法、記錄媒體及電腦程式產品 |
CN103324852A (zh) * | 2013-06-25 | 2013-09-25 | 上海交通大学 | 基于特征匹配的四模态医学影像诊断系统 |
CN102193995B (zh) * | 2011-04-26 | 2014-05-28 | 深圳市迅雷网络技术有限公司 | 一种建立多媒体数据索引、检索的方法及装置 |
-
2014
- 2014-02-10 TW TW103104212A patent/TWI511072B/zh active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2006052516A1 (en) * | 2004-11-03 | 2006-05-18 | Siemens Medical Solutions Usa, Inc. | System and method for a contiguous support vector machine |
TW201108019A (en) * | 2009-08-21 | 2011-03-01 | Mingdao University | A system for analyzing and screening disease related genes using microarray database |
CN102193995B (zh) * | 2011-04-26 | 2014-05-28 | 深圳市迅雷网络技术有限公司 | 一种建立多媒体数据索引、检索的方法及装置 |
WO2012154216A1 (en) * | 2011-05-06 | 2012-11-15 | Sti Medical Systems, Llc | Diagnosis support system providing guidance to a user by automated retrieval of similar cancer images with user feedback |
TW201300081A (zh) * | 2011-06-17 | 2013-01-01 | Ind Tech Res Inst | 生理參數指標運算系統、方法、記錄媒體及電腦程式產品 |
CN103324852A (zh) * | 2013-06-25 | 2013-09-25 | 上海交通大学 | 基于特征匹配的四模态医学影像诊断系统 |
Also Published As
Publication number | Publication date |
---|---|
TW201531994A (zh) | 2015-08-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6974398B2 (ja) | ランダムなデジタル値を生成する装置及び方法 | |
US11372929B2 (en) | Sorting an array consisting of a large number of elements | |
Lin et al. | 1xn pattern for pruning convolutional neural networks | |
CN104471552A (zh) | 用于处置状态机引擎所接收的数据的方法及系统 | |
Kaplan et al. | RASSA: resistive prealignment accelerator for approximate DNA long read mapping | |
CN106687993A (zh) | 用于图像数据分类的设备和方法 | |
US10942736B2 (en) | Method for min-max computation in associative memory | |
JP2023007193A (ja) | 機械学習装置、異常検知装置及び異常検知方法 | |
CN105074799B (zh) | 哈希值生成装置 | |
TWI511072B (zh) | 病理資料處理裝置以及方法 | |
Jhang | Voting and ensemble schemes based on CNN models for photo-based gender prediction | |
JP7438544B2 (ja) | ニューラルネットワーク処理装置、コンピュータプログラム、ニューラルネットワーク製造方法、ニューラルネットワークデータの製造方法、ニューラルネットワーク利用装置、及びニューラルネットワーク小規模化方法 | |
Solomko et al. | Study of carry optimization while adding binary numbers in the rademacher number-theoretic basis | |
CN108958702B (zh) | 一种排序网络、排序方法及排序装置 | |
US20200327650A1 (en) | Computer architecture for emulating an irregular lattice correlithm object generator in a correlithm object processing system | |
JP2009199439A (ja) | マージソート処理方法、マージソート処理装置、及びマージソート処理プログラム | |
US9507899B2 (en) | System and method for register transfer level autointegration using spread sheet and computer readable recording medium thereof | |
EP3269042B1 (en) | Data reduction method and apparatus | |
Asokan et al. | Burrows wheeler transform based test vector compression for digital circuits | |
US11010159B2 (en) | Bit processing involving bit-level permutation instructions or operations | |
US20170346503A1 (en) | Lossless Compression Method for Graph Traversal | |
CN115560966B (zh) | 增强稀疏滤波融合电机关键部件微弱故障诊断方法和系统 | |
WO2016201822A1 (zh) | 一种数据重排方法、装置及存储介质 | |
JP4820433B2 (ja) | 画像情報検索装置及びプログラム | |
WO2020039522A1 (ja) | 情報処理装置、情報処理方法及びプログラム |