TWI811598B - 智慧化影像診斷報告轉譯方法 - Google Patents
智慧化影像診斷報告轉譯方法 Download PDFInfo
- Publication number
- TWI811598B TWI811598B TW109145052A TW109145052A TWI811598B TW I811598 B TWI811598 B TW I811598B TW 109145052 A TW109145052 A TW 109145052A TW 109145052 A TW109145052 A TW 109145052A TW I811598 B TWI811598 B TW I811598B
- Authority
- TW
- Taiwan
- Prior art keywords
- words
- report
- image
- standardized
- word
- Prior art date
Links
- 238000003745 diagnosis Methods 0.000 title claims abstract description 88
- 238000000034 method Methods 0.000 title claims abstract description 39
- 238000013519 translation Methods 0.000 title claims abstract description 32
- 238000012549 training Methods 0.000 claims abstract description 35
- 238000006243 chemical reaction Methods 0.000 claims abstract description 34
- 238000003384 imaging method Methods 0.000 claims description 36
- 238000001914 filtration Methods 0.000 claims description 28
- 238000010191 image analysis Methods 0.000 claims description 11
- 238000010801 machine learning Methods 0.000 claims description 9
- 238000013528 artificial neural network Methods 0.000 claims description 6
- 238000004364 calculation method Methods 0.000 claims description 5
- 239000013074 reference sample Substances 0.000 claims description 2
- 230000001174 ascending effect Effects 0.000 claims 1
- 238000012216 screening Methods 0.000 abstract description 11
- 238000012545 processing Methods 0.000 description 13
- 238000004458 analytical method Methods 0.000 description 9
- 201000010099 disease Diseases 0.000 description 8
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 8
- 238000002591 computed tomography Methods 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 4
- 230000001575 pathological effect Effects 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 238000013170 computed tomography imaging Methods 0.000 description 2
- 238000002059 diagnostic imaging Methods 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 230000004089 microcirculation Effects 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000017531 blood circulation Effects 0.000 description 1
- 238000009534 blood test Methods 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 238000010219 correlation analysis Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 239000005337 ground glass Substances 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 210000004072 lung Anatomy 0.000 description 1
- 238000002595 magnetic resonance imaging Methods 0.000 description 1
- 210000004088 microvessel Anatomy 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 230000007170 pathology Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000001373 regressive effect Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 238000005096 rolling process Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 230000006641 stabilisation Effects 0.000 description 1
- 238000011105 stabilization Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 208000024891 symptom Diseases 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Landscapes
- Medical Treatment And Welfare Office Work (AREA)
- Machine Translation (AREA)
Abstract
一種智慧化影像診斷報告轉譯方法,包含:執行一訓練影像輸入步驟;執行一文字符號篩選步驟,擷取該複數訓練影像診斷報告上之文字符號資訊;執行一格式標準化步驟,並產生一標準化診斷報告格式;執行一欲轉換影像輸入步驟及執行一標準化轉換步驟,將該欲轉換文字符號資訊與該標準化診斷報告格式進行比對,得到一標準化診斷轉換報告。
Description
本發明係關於一種智慧化影像診斷報告轉譯方法,尤其是一種利用紙本診斷報告影像再透過影像辨識擷取文字資訊,並利用神經網路學習方式將傳紙本診斷報告轉換成標準數位格式的智慧化影像診斷報告轉譯方法。
習知技術中華民國專利申請號100130595係有關於一種電腦化全自動人體甲襞微循環分析系統,用於擷取病理數據以提供醫師診斷時之依據,其包含:一微循環影像序列輸入裝置;一活體晃動穩定化裝置;一於空間域及時間域進行影像處理之甲襞微血管辨識裝置;一微循環靜態、動態病理特徵分析及病理數據產生裝置;及一三維立體視覺動態血流呈現平台。
習知技術中華民國專利號594532係在提供一種處理各種不同資料格式與資料來源的一種醫學資料系統以及應用該系統,以有效地將一病患所有分散於各醫院或是各科室之病歷資料完整地整合傳輸於一使用端上之方法。
習知技術中華民國專利號I687938提供了一種建立一電子病歷的方法,包括以下步骤:將一紙本病歷轉換為一電子圖像,將該電子圖像儲存在一資料庫中,在一第一手持裝置中開啟該電子圖像,以形成具有一圖層的一電子病
歷圖像,使得一使用者在該電子病歷圖像上進一步輸入一文字、手寫一文字、繪畫一圖案、或貼上一數位媒體檔案,以建入一醫療資訊,以及將該電子病歷圖像儲存在該資料庫中。
其中,該專利(I687938)說明書0120段記載:「該電子病歷系統可設置有一分析模組,該分析模組用於辨識在該電子病歷圖像上的該圖層上手寫的該文字及推算該文字的一文字意義,使該電子病歷系統可直接讀取在該電子病歷圖像的該圖層上手寫的該文字的文字意義。該辨識可以是通過比對的方法來進行,該比對的方法可以包括將該手寫的文字與一字元庫中的多個字元進行比對。該分析模組可以是在一使用者在手持裝置的一觸控面板上手寫一文字的過程中,對該文字進行比對,並且推算該文字的一文字意義,以比對和記錄每個手寫的文字所代表的字面意義。該分析模組也可以是在當需要獲取該電子病歷圖像的該圖層上的所有手寫的文字時,對該電子病歷圖像的該圖層上的文字進行比對和推算該文字的一文字意義。該分析模組可以是通過以二維陣列讀取每一手寫的文字的影像中的行和列,並轉換為至少一獨立的字元矩陣,將該字元矩陣與一字元庫中的多個字元進行比對,從而推算出該手寫的文字所對應的一文字意義,使得該電子病歷圖像的該圖層上的手寫文字雖然是以手寫的筆跡原樣示出,但是可被該電子病歷系統讀取和選取。若被比對的文字是由多個字母串連成一單字的語言(例如:英語、拉丁語、德語、意大利語等)時,則進行比對的該字元是該語言中的字母。若被比對的文字是由部首和部件或其它方式形成(例如:中文、韓文等),則進行比對的該字元是該文字本身,若被比對的文字是阿拉伯數字時,則進行比對的該字元是一數字,若被比對的文字是標點符號(例如:“,”、“。”、“,”、“.”等),則進行比對的該字元是該文字本身。第6圖中的該電子病歷
圖像的該圖層上手寫的文字是以英語‘Disease’作為舉例,則被比對為‘D’、‘i’、‘s’、‘e’、‘a’、‘s’、‘e’。若該電子病歷圖像的該圖層上手寫的文字是“疾病”,則被比對為‘疾’以及‘病’。若該電子病歷圖像的該圖層上手寫的文字是“123.4”,則被比對為‘1’、‘2’、‘3’、‘.’以及‘4’」。據此,先前技術已述明「如何將影像格式轉換後取得文字格式」,本發明所屬技術領域中具有通常知識者,由本發明說明書及先前技術說明書,即可理解如何將影像格式轉換後取得文字格式,可據以實現。例如,將影像格式“疾病”轉換後取得文字格式‘疾’以及‘病’。
另,該專利(I687938)說明書0116段記載:「該電子病歷系統可設置有一手寫模組、一加密模組、一分析模組以及一搜尋模組。該電子病歷系統中的該手寫模組存取該電子圖像,開啟該電子圖像,以形成具有一圖層的一電子病歷圖像,使得一使用者(例如:病患、護理師、醫師、藥劑師等)可通過該觸控面板編輯該電子病歷圖像的該圖層,以在該電子病歷圖像的該圖層上進一步輸入一文字、手寫一文字、繪畫一圖案或貼上一數位媒體檔案等,以建立一電子病歷。該電子病歷可以多於或等於一頁的該電子病歷圖像,該電子病歷圖像可以是病歷表、病歷表續頁、檢驗結果、同意書處方箋、抽血單、醫檢單或欠款單等,該手寫模組可設定為自動即時上傳該電子病歷和/或該電子病歷的該電子病歷圖像至該伺服器中,以即時更新該伺服器中的該電子病歷」。據此,先前技術已述明「如何將各單字依序填入該標準化診斷轉換報告中」,本發明所屬技術領域中具有通常知識者,由本發明說明書及先前技術說明書,即可理解如何將各單字依序填入該標準化診斷轉換報告中,可據以實現。例如,使用者可通過該觸控面板編輯該電子病歷圖像的該圖層,以在該電子病歷圖像的該圖層上進一步輸入一文字、手寫一文字、繪畫一圖案或貼上一數位媒體檔案等至相對應欄位。
惟,上述習知技術中,均未揭露針對書面診斷報告上的文字內容進行解譯及分析,並藉由神經網路學習方式將書面診斷報告內容重新轉譯及轉換成數位標準化格式的功能,以方便作為數位化標準格式之紀錄以及診斷報告閱讀者能更容易理解診斷報告的內容,因此習知技術有必要加以改良。
本發明之一目的在提供一種智慧化影像診斷報告轉譯方法及其系統,藉由影像辨識方式來轉譯紙本診斷報告之內容,並將該內容過濾篩選。
本發明之另一目的在提供一種智慧化影像診斷報告轉譯方法及其系統,藉由神經網路學習方式將紙本診斷報告之內容轉譯成標準結構化格式。
本發明之再一目的在提供一種智慧化影像診斷報告轉譯方法及其系統,將紙本診斷報告之內容轉譯成標準結構化之數位診斷報告。
本發明之再一目的在提供一種智慧化影像診斷報告轉譯方法及其系統,直接將診斷結果轉譯成標準結構化之數位診斷報告。
為達成上述及其他目的,本發明之智慧化影像診斷報告轉譯方法,包含:執行一訓練影像輸入步驟,提供複數訓練影像診斷報告;執行一文字符號篩選步驟,擷取該複數訓練影像診斷報告上之文字符號資訊,並將文字符號資訊進行句子分詞並取得複數初始詞彙;執行一格式標準化步驟,將該複數初始詞彙進行特徵分類及格式化,並產生一標準化診斷報告格式;執行一欲轉換影像輸入步驟,輸入一欲轉換診斷報告之影像,將該欲轉換診斷報告之影像進行一資訊擷取步驟,取得一欲轉換文字符號資訊;及執行一標準化轉換步驟,將該欲轉
換文字符號資訊與該標準化診斷報告格式進行比對,得到一標準化診斷轉換報告。
為達成上述及其他目的,本發明之智慧化影像診斷報告轉譯系統,包含:一影像擷取模組,用以擷取複數訓練影像診斷報告並產生複數訓練目標影像;一影像分析模組,用以分析該複數訓練目標影像並產生一文字符號資料庫;一文字符號處理模組,將該文字符號資料庫進行分析並產生複數初始詞彙;一標準化格式產生模組,將該複數初始詞彙轉換成一標準化診斷報告格式;及一診斷報告轉換模組,將一欲轉換診斷報告之影像透過與該標準化診斷報告格式比對分析,產生一標準化診斷轉換報告。
在本發明的一些實施例中,其中,該文字符號篩選步驟另包含一詞彙過濾及排序步驟,該詞彙過濾及排序步驟係對該複數初始詞彙過濾掉不需要的文字、符號及數字,並將過濾後的詞彙進行詞彙頻率計算及詞彙排序。
在本發明的一些實施例中,其中,該詞彙過濾及排序步驟另包含一關鍵詞彙篩選步驟,藉由提供一關鍵詞彙資料表,將該詞彙過濾及排序步驟過濾後的詞彙與該關鍵詞彙資料表進行比對後,從中篩選出複數關鍵詞彙。
在本發明的一些實施例中,其中,在該文字符號篩選步驟後,另包含一權重調整步驟,藉由提供一權重調整資料表,將該複數關鍵詞彙依據該權重調整資料表將各關鍵詞彙進行分類並分別給予權重調整。
在本發明的一些實施例中,其中,該文字符號處理模組另包含一詞彙過濾及排序單元,用以對該文字符號資料進行篩選及排序。
在本發明的一些實施例中,其中,該文字符號處理模組另包含一關鍵詞彙篩選單元,該關鍵詞彙篩選單元係用以透過一關鍵詞彙資料表進行比對後,從篩選及排序後之該文字符號資料中篩選出複數關鍵詞彙。
在本發明的一些實施例中,其中,該文字符號處理模組另包含一權重調整單元,該權重調整單元依照詞彙的重要性進行權重調整。
在本發明的一些實施例中,其中,該診斷報告轉換模組另包含一快速轉換介面單元,該快速轉換介面單元提供使用者輸入診斷結果,並藉由該快速轉換介面單元將診斷結果轉換輸出成一標準化診斷轉換報告。
S0:訓練影像輸入步驟
S1:文字符號篩選步驟
S10:詞彙過濾及排序步驟
S101:關鍵詞彙篩選步驟
S11:權重調整步驟
S2:格式標準化步驟
S3:欲轉換影像輸入步驟
S30:資訊擷取步驟
S4:標準化轉換步驟
10:影像擷取模組
20:影像分析模組
30:文字符號處理模組
31:詞彙過濾及排序單元
32:關鍵詞彙篩選單元
33:權重調整單元
40:標準化格式產生模組
50:診斷報告轉換模組
51:快速轉換介面單元
DR:欲轉換診斷報告
SR:標準化診斷轉換報告
SF:標準化診斷報告格式
圖1為本發明之智慧化影像診斷報告轉譯方法之一實施例流程圖;圖2為本發明之智慧化影像診斷報告轉譯方法之另一實施例流程圖;圖3為本發明之智慧化影像診斷報告轉譯方法之另一實施例流程圖;圖4為本發明之智慧化影像診斷報告轉譯方法之另一實施例流程圖;圖5為本發明之智慧化影像診斷報告轉譯系統之一系統架構示意圖;圖6為本發明之智慧化影像診斷報告轉譯系統之另一實施例系統架構圖。
圖1為本發明之智慧化影像診斷報告轉譯方法之一實施例流程圖,請參考圖1。本發明之智慧化影像診斷報告轉譯方法,包含:執行一訓練影像輸入步驟S0,提供複數訓練影像診斷報告,該複數訓練影像診斷報告係由傳統
紙本診斷報告經由掃描、翻拍或其他影像擷取方式取得紙本診斷報告之影像檔案,如核磁共振(Magnetic Resonance Imaging,MRI)或電腦斷層(Computed Tomography,CT)等影像診斷報告。
執行一文字符號篩選步驟S1,擷取該複數訓練影像診斷報告上之文字符號資訊,並將文字符號資訊進行句子分詞並取得複數初始詞彙。由於這些紙本影像診斷報告紀錄著每位醫師對於不同患者的診斷內容,而每位醫生書寫的格式不同,因此每份影像診斷報告之內容毫無規則可言,因此,透過該訓練影像輸入步驟S0將影像診斷報告之內容轉換成影像檔資料,有助於分析報告內容,在該文字符號篩選步驟S1中,將該複數訓練影像診斷報告之影像內容進行句子、單字及符號等影像分析辨識,可以將影像資料再轉成數位文字、符號資料,方便電腦、軟體程式讀取,也就是從紙本報告上之文字轉成影像格式再轉成數位文字格式資料。
執行一格式標準化步驟S2,將該複數初始詞彙進行特徵分類及格式化,並產生一標準化診斷報告格式SF。在該格式標準化步驟S2中,將該複數初始詞彙進行名詞特徵分類,如:病理、患部、患部部位、顯影及變化等,並給予一格式化模型,該格式化模型可依需求制定,本發明不加以限制,並將所有從該訓練影像輸入步驟S0中所提供複數訓練影像診斷報告所得之各複數初始詞彙及該格式化模型進行機器學習,透過如神經網路訓練方式產生該標準化診斷報告格式SF,該標準化診斷報告格式SF係用以作為後續影像診斷報告文件之轉檔參考樣本。
執行一欲轉換影像輸入步驟S3,輸入一欲轉換診斷報告DR之影像,將該欲轉換診斷報告DR之影像進行一資訊擷取步驟S30,取得一欲轉換文字
符號資訊,該資訊擷取步驟S30係用以將該欲轉換診斷報告DR之影像內容進行句子、單字及符號等影像分析,並將分析後之內容進行辨識,將影像格式轉換後取得文字格式,以作為後續比對轉換之用。
及執行一標準化轉換步驟S4,將該欲轉換文字符號資訊與該標準化診斷報告格式SF進行比對,得到一標準化診斷轉換報告SR。在該標準化轉換步驟S4中,將該欲轉換文字符號資訊依據該標準化診斷報告格式SF將各單字依序填入該標準化診斷轉換報告SR中,使其成為易於閱讀與電腦讀取的診斷報告,如放射科醫師或其他醫師想要檢視診斷報告,醫院的病歷系統便會讀取標準結構化診斷報告檔案供醫師閱讀,可以避免因位不同醫師因為填寫診斷報告的用字習慣不同,而導致後續相關人員讀取診斷報告時的不便之處。
圖2為本發明之智慧化影像診斷報告轉譯方法之另一實施例流程圖,請參考圖2。較佳地,該文字符號篩選步驟S1另包含一詞彙過濾及排序步驟S10,該詞彙過濾及排序步驟S10係對該複數初始詞彙過濾掉不需要的文字、符號及數字,並將過濾後的詞彙進行詞彙頻率計算及詞彙排序,其中,詞彙頻率計算係計算同一詞彙出現的次數,並將各詞彙依出次數頻率高低依序排列,更有利於影像診斷報告之格式標準化參考,此步驟主要是要萃取出單一字詞(OneGram)、二字詞(BiGram)與三字詞(TriGram),並透過詞頻排序,最後由挑選出可用字詞。
圖3為本發明之智慧化影像診斷報告轉譯方法之另一實施例流程圖,請參考圖3。較佳地,該詞彙過濾及排序步驟S10包另包含一關鍵詞彙篩選步驟S101,藉由提供一關鍵詞彙資料表,將該詞彙過濾及排序步驟S10過濾後的詞彙與該關鍵詞彙資料表進行比對後,從中篩選出複數關鍵詞彙,其中,該關鍵詞彙資料表係由出現次數超過一門檻值且非贅詞之詞彙,再與一詞彙篩選表比對過濾篩選而得出,其中,該門檻值較佳可透過滾動式機器學習,根據驗證準確率
而調整,例如參考格式標準化步驟S2的結果,該門檻值初始較佳設定為3~7,在本實施例中該門檻值為5,該門檻值的設定可以提高該複數關鍵詞彙的精準度,所謂贅詞係如:it,a,is等詞彙,該詞彙篩選表係事先由專業人士提供之詞彙表。
圖4為本發明之智慧化影像診斷報告轉譯方法之另一實施例流程圖,請參考圖4。較佳地,在該文字符號篩選步驟S1後,另包含一權重調整步驟S11,藉由提供一權重調整資料表,將該複數關鍵詞彙依據該權重調整資料表將各關鍵詞彙進行分類並分別給予權重調整,在經由機器學習後,相關聯之詞彙中,藉由詞彙的關聯性能得到較佳的權重,假設有一該文字符號篩選步驟S1篩選出之詞彙集T={t1,t2,....,tn}與一該權重調整資料表所列之詞彙集R={r1,r2,....,rm},則組合有n*m組,組合的集合設為C={c1,c2,....,c(m*n)},其中c代表任一t與r的組合c={t,r}。若其中tn與rm一起出現的次數表示為f,當一句子取出k個詞彙,ti T,0<ik,則:
步驟1.計算詞彙集詞彙總次數F。
步驟2.從C找出含有ti的c與對應的f。
步驟3.對每一個r,找出所有含r的c,並加總對應的f/F設為s。
步驟4.則依據s,排序r,挑出r,當作預測結果。
舉例來說:若A、Y、Z是在該文字符號篩選步驟S1篩選出之詞彙,B、C、X是該權重調整資料表所列之詞彙,而(A,B)一起出現5次,(A,X)一起出現3次,(Y,B)一起出現2次,(Z,C)一起出現8次,假設總詞彙集筆數為100,其中,總詞彙集是指在該文字符號篩選步驟S1篩選出之詞彙與該權重調整資料表所列之詞彙在訓練資料中一起出現的筆數,則(A,B)詞彙集的權重為0.05,占總詞彙集出現筆數100筆的比例為5/100,同理,(A,X)詞彙集的權重為0.03,(Y,B)詞彙集的
權重為0.02,(Z,C)詞彙集的權重為0.08,如此,若有一筆測試資料找出A,則B會被優先考慮當最後預測結果,從另一角度說明,若有一筆測試資料找出A、Y與Z,則B可得到權值為(0.05+0.02=0.07),C可得到權值為0.08,X可得到權值為0.03,所以最後C會被優先考慮當最後預測結果,也就是作為標準格式化中的詞彙,依此產生出更具方便性及實用性之標準化診斷報告格式SF,隨著資料漸進式的增加,系統會透過此格式化方式進行機器學習,依據總詞彙出現次數比例持續動態調整權重,產生前述之該標準化診斷報告格式SF,使該標準化診斷報告格式SF更趨於正確。
圖5為本發明之智慧化影像診斷報告轉譯系統之一系統架構示意圖,請參考圖5。本發明之智慧化影像診斷報告轉譯系統,包含:一影像擷取模組10、一影像分析模組20、一文字符號處理模組30、一標準化格式產生模組40及一診斷報告轉換模組50,該影像擷取模組10用以擷取複數訓練影像診斷報告並產生複數訓練目標影像,該複數訓練影像診斷報告可以透過影像掃瞄方式取得複數訓練目標影像,該複數訓練目標影像即為診斷報告之影像檔。
該影像分析模組20係用以分析該複數訓練目標影像並產生一文字符號資料庫,該文字符號資料庫儲存有該複數訓練目標影像內的文字資料,該影像分析模組20即將文字影像轉換成純文字格式,以利後續分析使用。
該文字符號處理模組30係將該文字符號資料庫進行分析並產生複數初始詞彙,其中,該複數初始詞彙係由該文字符號處理模組30將該文字符號資料庫中之句子、單字及符號等進行解譯處理。
該標準化格式產生模組40係將該複數初始詞彙轉換成一標準化診斷報告格式SF,該標準化格式產生模組40將所有所得之各複數初始詞彙及一
格式化模型進行機器學習,透過如神經網路訓練方式產生一標準化診斷報告格式SF,該標準化診斷報告格式SF可依據實際需求進行格式的調整與修正,使其作為之後紙本之傳統影像診斷報告轉檔成電子化診斷報告的參考依據。
該診斷報告轉換模組50係將一欲轉換診斷報告DR之影像透過與該標準化診斷報告格式SF比對分析,產生一標準化診斷轉換報告SR,由於該標準化診斷報告格式SF乃依據先前之影像診斷報告透過機器學習訓練而產生之數位標準診斷報告格式SF,該診斷報告轉換模組50可將輸入之該欲轉換診斷報告DR之影像,分析其內容後並依據該標準化診斷報告格式SF將其轉換成一標準化診斷轉換報告SR。
圖6為本發明之智慧化影像診斷報告轉譯系統之另一實施例系統架構圖,請參考圖6。較佳地,該文字符號處理模組30另包含一詞彙過濾及排序單元31,用以對該文字符號資料進行篩選及排序。該文字符號處理模組係針對該複數初始詞彙過濾掉不需要的文字、符號及數字,並將過濾後的詞彙進行詞彙頻率計算及詞彙排序。
請續參考圖6。較佳地,該文字符號處理模組30另包含一關鍵詞彙篩選單元32,該關鍵詞彙篩選單元32係用以透過一關鍵詞彙資料表進行比對後,從篩選及排序後之該文字符號資料中篩選出複數關鍵詞彙。其中,該關鍵詞彙資料表包含專有名詞如:(Symptoms:ground glass opacity)、(Organ:Lung)、(Position:LUL)、(Progressive:regressive change)及(Enhancement:Early Enhanced)。
請續參考圖6。較佳地,該文字符號處理模組30另包含一權重調整單元33,該權重調整單元依照詞彙的重要性進行權重調整,產生出更具方便性及實用性之標準化診斷報告格式SF。
請續參考圖6。較佳地,該診斷報告轉換模組另包含一快速轉換介面單元51,該快速轉換介面單元51提供使用者輸入診斷結果,並藉由該快速轉換介面單元51將診斷結果轉換輸出成一標準化診斷轉換報告SR。其中,該快速轉換介面單元51在本實施例中,為一雲端介面系統,例如可提供放射科醫師在撰寫影像診斷報告時,可以登錄至該雲端介面系統,透過以點選模式或選單選取等方式,快速、輕鬆的完成一份CT影像診斷報告,而此CT影像診斷報告就是以標準化診斷報告格式SF所建立的影像診斷報告,而若是放射科醫師或主治醫師想要檢視診斷報告,該雲端介面系統便會讀取標準化診斷報告檔案,並以網頁介面方式顯示該份診斷報告。
綜上所述,本發明透過利用傳統醫學影像診斷報告逐一檢視、解析,由於醫學影像診斷報告皆由醫師以自然語言撰寫而成,內容多為英文單詞與醫學專業詞彙組成的簡單句或複合句,再由多個句子結構成一段落,具體描述或說明其透過影像檢視的發現。本發明可將醫院中存放許久,無法被再次利用的歷史診斷報告資料,轉換為電腦資訊系統可精準識別、讀取、處理與利用,並可在不同資訊系統之間相互交換的標準結構化診斷報告。因此,本發明之智慧化影像診斷報告轉譯系統讀取許多傳統非結構化的CT診斷報告,做為人工智慧機器學習的訓練資料集,並通過資訊擷取(Information Retrieval)技術,由報告內文產出詞彙特徵值與詞彙頻率等資訊,接著運用機器學習方法將取得的關鍵字詞彙特徵值進行訓練,確認關鍵字出現的關聯性及百分比,再與內文進行關聯性分析,最後由領域專家、專科醫師提供專業判斷與建議,進而歸納定義出該類疾病的標準結構化CT診斷報告格式,之後系統便可將未訓練的非結構化CT放射診斷報告,進行資訊擷取,並與標準結構化CT診斷報告格式進行比對,自動轉譯出標準結構化格式的CT診斷報告。
以上所述之實施例僅係為說明本發明之技術思想及特徵,其目的在使熟習此項技藝之人士均能了解本發明之內容並據以實施,當不能以此限定本發明之專利範圍,凡依本發明之精神及說明書內容所作之均等變化或修飾,皆應涵蓋於本發明專利範圍內。
S0:訓練影像輸入步驟
S1:文字符號篩選步驟
S2:格式標準化步驟
S3:欲轉換影像輸入步驟
S4:標準化轉換步驟
Claims (7)
- 一種智慧化影像診斷報告轉譯方法,包含:影像擷取複數紙本診斷報告,得到複數影像檔案,以提供複數訓練影像診斷報告;擷取該複數訓練影像診斷報告之文字符號資訊,並將該文字符號資訊進行句子、單字或符號之影像分析辨識,以取得複數初始詞彙,其中,對該複數初始詞彙過濾掉不需要的文字、符號或數字,並將過濾後的詞彙進行詞彙頻率計算及詞彙排序,計算同一詞彙出現的次數,並將各詞彙依出次數頻率高低依序排列,再將過濾後的詞彙與一關鍵詞彙資料表進行比對,篩選出複數關鍵詞彙,其中,該關鍵詞彙資料表由出現次數超過一門檻值且非贅詞之詞彙組成,將該複數關鍵詞彙依據一權重調整資料表,將各關鍵詞彙進行分類並分別給予權重調整,再將該複數關鍵詞彙依據一權重調整資料表將各關鍵詞彙進行分類並分別給予權重調整之權重調整步驟包含:將該些複數初始詞彙集合成一複數初始詞彙詞彙集,組合該權重調整資料表所列之一權重調整資料表詞彙集,得到一組合集合;計算該複數初始詞彙詞彙集及該權重調整資料表詞彙集之詞彙總次數;從該組合集合找出含有該複數初始詞彙詞彙集中的詞彙的組合,且找出對應出現的次數;對每一個該權重調整資料表詞彙集中的詞彙,找出所有含有該 權重調整資料表詞彙集中的詞彙的組合,並加總對應的;依據 ,排序該權重調整資料表詞彙集中的詞彙,挑出該權重調整資料 表詞彙集中的詞彙,完成權重調整,以當作預測結果;將該複數初始詞彙進行特徵分類,並給予一格式化模型,產生一標準化診斷報告格式; 輸入一欲轉換診斷報告之影像,將該欲轉換診斷報告之影像內容進行句子、單字或符號之影像分析,並將分析後之內容進行辨識,將影像格式轉換後取得一欲轉換文字符號資訊;將該欲轉換文字符號資訊與該標準化診斷報告格式進行比對,將該欲轉換文字符號資訊依據該標準化診斷報告格式,將各單字填入該標準化診斷轉換報告,得到一標準化診斷轉換報告。
- 如請求項1所述之智慧化影像診斷報告轉譯方法,其中,將該複數初始詞彙進行特徵分類並給予該格式化模型產生該標準化診斷報告格式之步驟,另包含:將該複數初始詞彙及該格式化模型進行神經網路訓練之機器學習,以產生該標準化診斷報告格式。
- 如請求項2所述之智慧化影像診斷報告轉譯方法,其中,將該複數初始詞彙進行特徵分類並給予該格式化模型產生該標準化診斷報告格式之步驟,另包含:將該標準化診斷報告格式作為後續影像診斷報告文件之轉檔參考樣本。
- 如請求項1所述之智慧化影像診斷報告轉譯方法,其中,擷取該複數訓練影像診斷報告之文字符號資訊並將該文字符號資訊進行句子、單字或符號之影像分析辨識以取得複數初始詞彙之步驟,另包含:對該複數初始詞彙過濾掉不需要的文字、符號或數字,並將過濾後的詞彙進行詞彙頻率計算及詞彙排序,計算同一詞彙出現的次數,並將各詞彙依出次數頻率高低依序排列。
- 如請求項4所述之智慧化影像診斷報告轉譯方法,其中,擷取該複數訓練影像診斷報告之文字符號資訊並將該文字符號資訊進行句子、單字或符號之影像分析辨識以取得複數初始詞彙之步驟,另包含:萃取出單一字詞、二字詞或三字詞,以進行詞彙頻率計算及詞彙排序。
- 如請求項1所述之智慧化影像診斷報告轉譯方法,其中,該關鍵詞彙資料表包含有複數專有名詞。
- 如請求項1所述之智慧化影像診斷報告轉譯方法,其中,另包含:提供一雲端介面系統,讀取並顯示該標準化診斷報告。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW109145052A TWI811598B (zh) | 2020-12-18 | 2020-12-18 | 智慧化影像診斷報告轉譯方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW109145052A TWI811598B (zh) | 2020-12-18 | 2020-12-18 | 智慧化影像診斷報告轉譯方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
TW202226260A TW202226260A (zh) | 2022-07-01 |
TWI811598B true TWI811598B (zh) | 2023-08-11 |
Family
ID=83437076
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW109145052A TWI811598B (zh) | 2020-12-18 | 2020-12-18 | 智慧化影像診斷報告轉譯方法 |
Country Status (1)
Country | Link |
---|---|
TW (1) | TWI811598B (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109961830A (zh) * | 2019-03-29 | 2019-07-02 | 舟山昊楹网络科技有限公司 | 一种医学影像信息管理系统及其管理方法 |
US10504626B2 (en) * | 2013-03-15 | 2019-12-10 | II Robert G. Hayter | Method for searching a text (or alphanumeric string) database, restructuring and parsing text data (or alphanumeric string), creation/application of a natural language processing engine, and the creation/application of an automated analyzer for the creation of medical reports |
CN111696640A (zh) * | 2020-06-12 | 2020-09-22 | 上海联影医疗科技有限公司 | 自动获取病历模板的方法、装置和存储介质 |
CN111768820A (zh) * | 2020-06-04 | 2020-10-13 | 上海森亿医疗科技有限公司 | 纸质病历数字化及目标检测模型训练方法、装置、存储介质 |
-
2020
- 2020-12-18 TW TW109145052A patent/TWI811598B/zh active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10504626B2 (en) * | 2013-03-15 | 2019-12-10 | II Robert G. Hayter | Method for searching a text (or alphanumeric string) database, restructuring and parsing text data (or alphanumeric string), creation/application of a natural language processing engine, and the creation/application of an automated analyzer for the creation of medical reports |
CN109961830A (zh) * | 2019-03-29 | 2019-07-02 | 舟山昊楹网络科技有限公司 | 一种医学影像信息管理系统及其管理方法 |
CN111768820A (zh) * | 2020-06-04 | 2020-10-13 | 上海森亿医疗科技有限公司 | 纸质病历数字化及目标检测模型训练方法、装置、存储介质 |
CN111696640A (zh) * | 2020-06-12 | 2020-09-22 | 上海联影医疗科技有限公司 | 自动获取病历模板的方法、装置和存储介质 |
Also Published As
Publication number | Publication date |
---|---|
TW202226260A (zh) | 2022-07-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111316281B (zh) | 基于机器学习的自然语言情境中数值数据的语义分类方法以及系统 | |
US10628476B2 (en) | Information processing apparatus, information processing method, information processing system, and storage medium | |
JP7392120B2 (ja) | 自然言語処理を使用する病理報告内の自動化された情報の抽出及び改良 | |
JP5952835B2 (ja) | 撮像プロトコルの更新及び/又はリコメンダ | |
CN112712879B (zh) | 医学影像报告的信息提取方法、装置、设备及存储介质 | |
JP2021007031A (ja) | 電子診療レコードからの医学的状態および事実の自動的特定および抽出 | |
JP5744182B2 (ja) | 放射線ディスクリプタを用いた報告ビューア | |
US11244755B1 (en) | Automatic generation of medical imaging reports based on fine grained finding labels | |
CN102428469B (zh) | 用于检索和查看医疗图像的装置 | |
RU2686627C1 (ru) | Автоматическое создание ориентированной на показатели продольной области для просмотра показателей пациента | |
US20140052444A1 (en) | System and methods for matching an utterance to a template hierarchy | |
JP2017509946A (ja) | コンテキスト依存医学データ入力システム | |
JP5837745B2 (ja) | 医用レポート作成支援装置 | |
CN115516571A (zh) | 一种影像学研究报告生成系统 | |
US20150347521A1 (en) | Systems and methods for relation extraction for chinese clinical documents | |
CN112541066B (zh) | 基于文本结构化的医技报告检测方法及相关设备 | |
US20190057503A1 (en) | Learning data generation support apparatus, operation method of learning data generation support apparatus, and learning data generation support program | |
US11763081B2 (en) | Extracting fine grain labels from medical imaging reports | |
CN115083550B (zh) | 基于多源信息的病人相似度分类方法 | |
CN103262070A (zh) | 解剖结构中病变的图片报告示意图的生成 | |
WO2021157718A1 (ja) | 文書作成支援装置、文書作成支援方法及びプログラム | |
JP7420914B2 (ja) | 情報処理装置、情報処理方法及び情報処理プログラム | |
JP3765801B2 (ja) | 対訳表現抽出装置、対訳表現抽出方法、および対訳表現抽出プログラム | |
CN112699669B (zh) | 流行病学调查报告的自然语言处理方法、装置及存储介质 | |
CN113343680A (zh) | 一种基于多类型病历文本的结构化信息提取方法 |