TWI809639B - 資料封裝系統 - Google Patents
資料封裝系統 Download PDFInfo
- Publication number
- TWI809639B TWI809639B TW110149759A TW110149759A TWI809639B TW I809639 B TWI809639 B TW I809639B TW 110149759 A TW110149759 A TW 110149759A TW 110149759 A TW110149759 A TW 110149759A TW I809639 B TWI809639 B TW I809639B
- Authority
- TW
- Taiwan
- Prior art keywords
- message
- messages
- built
- data
- output
- Prior art date
Links
Abstract
一種資料封裝系統,用以解決習知在每次運用資料庫的資料時需經繁瑣的資料篩選與除錯的問題。係包含一預建資料庫及一電腦,該預建資料庫包含一預建資料集,該預建資料集包含多個預建訊息;該電腦包含一資訊選擇模組、一資訊擷取模組及一資訊封裝模組;該資訊選擇模組用於獲取多個目標訊息;該資料擷取模組具有一關聯關係,藉由該關聯關係轉換該多個預建訊息為該多個目標訊息以獲取一輸出資料集;該資訊封裝模組用於將該輸出資料集形成一資料封包。
Description
本發明係關於一種資料封裝系統,尤其是一種可將零散資料轉換為特定資料結構的資料封裝系統。
習知技術中,若想運用已建立資料庫中的一個或多個資料集(例如是資料表)中的多個訊息(可為具有特定的欄與列的訊息)時,在每一次運用這些資料或訊息時,特別是每次需要的資料不同時,必須由使用者經過一連串的特定程序,例如經過篩選去除不需要的訊息,再將需要的訊息依所要運用的目標格式進行轉換、排列、填入等作業,才能獲取所需的目標訊息,因而需要耗費大量的時間;特別是若使用者下一次還要再運用同一特定資料庫的資訊時(特別是產生不同的資料時),仍必續再次的重複上述繁瑣耗時的作業流程。此外,這樣的過程中亦常因人為因素(例如粗分或分心)而出錯,造成資訊的轉換與運用缺乏效率。
有鑑於此,習知的資料運用方法確實仍有改善之必要。
為解決上述問題,本發明的目的是提供一種資料封裝系統,透過該資料封裝系統執行一資料封裝程序,可有效率且精確獲取具有符合目的之標準化訊息的目標資料集。
本發明的次一目的是提供一種資料封裝系統,可透過資料擷取模組中的去除重複邏輯將不需要的重複資料/訊息去除,以避免因重複資料造成的錯誤問題。
本發明的又一目的是提供一種資料封裝系統,可透過資料擷取模組中的錯誤判斷邏輯,判斷由關聯關係所產生的訊息是否錯誤,並產生對應的補正訊息或提示訊息,藉以補正預建訊息中的錯誤或提示預建訊息中的錯誤。
本發明全文所記載的元件及構件使用「一」或「一個」之量詞,僅是為了方便使用且提供本發明範圍的通常意義;於本發明中應被解讀為包括一個或至少一個,且單一的概念也包括複數的情況,除非其明顯意指其他意思。
本發明全文所述「耦接」用語,包含電性及/或訊號地直接或間接連接,係本領域中具有通常知識者可以依據使用需求予以選擇者。
本發明全文所述之「電腦(Computer)」,係指具備特定功能且以硬體或硬體與軟體實現的各式資料處理裝置,特別是具有一處理器以處理分析資訊及/或產生對應控制資訊,例如:伺服器、虛擬機器、桌上型電腦、筆記型電腦、平板電腦或智慧型手機等,係本發明所屬技術領域中具有通常知識者可以理解。
本發明全文所述之「字元」,係至少包含單一文字(可為中文字、英文字或其他語言文字)、單一數字、單一符號。
本發明的資料封裝系統,包含:一預建資料庫,包含至少一預建資料集,該預建資料集包含可存取的多個預建訊息;及一電腦,耦接該預建資料庫,並包含一資訊選擇模組、一資訊擷取模組及一資訊封裝模組;其中,該資訊選擇模組包含至少一目標資料集目錄,該目標資料集目錄包含至
少一目標資料集態樣,該至少一目標資料集態樣係可對應至少一目標資料集,該至少一目標資料集係具有多個目標訊息;其中,該資訊擷取模組用於產生並執行一資料擷取指令,該資料擷取指令係具有一關聯關係,該關聯關係定義為該多個預建訊息與該多個目標訊息之間的轉換關係;藉由該關聯關係轉換該多個預建訊息為該多個目標訊息以獲取一輸出資料集,該輸出資料集具有多個輸出訊息,各該輸出訊息係為各該多個目標訊息經該關聯關係自對應的該多個預建訊息轉換的一輸出結果;其中,該資訊封裝模組用於將該輸出資料集依一預定封裝格式輸出以形成一資料封包,該資料封包中具有可供存取的多個封包訊息,各該封包訊息與該多個輸出訊息中對應的一個關聯。
據此,本發明的資料封裝系統,可將該多個預建訊息轉換為具有目標訊息及/或自定義訊息的該輸出資料集及獲得對應的該資料封包,可達成快速且自動化地自該預建資料集中獲取所需訊息的功效。
其中,該資訊選擇模組可另包含一自定義訊息目錄,該自定義訊息目錄包含至少一自定義訊息;該關聯關係定義為該多個預建訊息與該多個目標訊息及該至少一自定義訊息之間的轉換關係;藉由該關聯關係轉換該多個預建訊息為該多個目標訊息及該至少一自定義訊息以獲取一輸出資料集,該輸出資料集具有多個輸出訊息,各該輸出訊息係為各該多個目標訊息及該至少一自定義訊息經該關聯關係自對應的該多個預建訊息轉換的一輸出結果;其中,該資訊封裝模組用於將該輸出資料集依一預定封裝格式輸出以形成一資料封包,該資料封包中具有可供存取的多個封包訊息,各該封包訊息與該多個輸出訊息中對應的一個關聯。如此,透過該自定義訊息目錄及對應的該自訂義訊息的產生,可輸出更多元的感興趣訊息,並同樣可達成快速且自動化地自該預建資料集中獲取所需訊息的功效。
其中,該多個目標訊息中的每一個可與該多個預建訊息中的至
少一個有一第一轉換關聯,且各該目標訊息的該第一轉換關聯係不同,該關聯關係為該第一轉換關聯。如此,透過該關聯關係中的該第一轉換關聯,可自該預建資料集中對應所需的該預建訊息,並將所對應的該預建訊息轉換為該目標訊息,可達成快速且自動化篩選出所需訊息並將其轉換的功效。
其中,該自定義訊息中的每一個可與該多個預建訊息中的至少一個有一第二轉換關聯,且各該自定義訊息的該第二轉換關聯係不同,該關聯關係具有該第一轉換關聯及該二轉換關聯。如此,透過該關聯關係中的該第一轉換關聯與該第二轉換關聯,可自該預建資料集中對應所需的該預建訊息,並將所對應的該預建訊息分別轉換為該目標訊息與該自定義訊息,可達成快速且自動化篩選出所需訊息並將其轉換的功效。
其中,該自定義訊息中的每一個可與該多個預建訊息中的至少一個有一第二轉換關聯,且各該自定義訊息的該第二轉換關聯係不同,該關聯關係具有該第一轉換關聯及該二轉換關聯。如此,透過該關聯關係中的該第一轉換關聯與該第二轉換關聯,可自該預建資料集中對應所需的該預建訊息,並將所對應的該預建訊息分別轉換為該目標訊息與該自定義訊息,可達成快速且自動化篩選出所需訊息並將其轉換的功效。
其中,該關聯關係可以是運用對應的該預建訊息的一來源、一標籤、一獨特識別碼及/或對應的該預建訊息中的全部或部分字元的至少一方式,以定義該多個預建訊息與該多個目標訊息之間的轉換關係。如此,透過該關聯關係對應該預建訊息的方式,可達成快速且自動化篩選出所需訊息並將其轉換的功效。
其中,該資料擷取模組可另包含一去除重複邏輯,在符合該關聯關係的該多個預建訊息有多個關聯訊息的一情況中,該去除重複邏輯係為根據該多個關聯訊息及/或與該多個關聯訊息所關聯的其他訊息所定義的一
去除重複判斷條件,以自該多個關聯訊息中獲取符合該去除重複判斷條件的一關聯訊息。如此,透過該去除重複邏輯可將不需要的重複訊息去除,以避免因重複訊息造成的錯誤問題。
其中,該資料擷取模組可另包含一錯誤判斷邏輯,該錯誤判斷邏輯具有一錯誤判斷條件;該錯誤判斷條件係根據該預建訊息及/或該輸出訊息中之字元組成或字串長度以判斷該預建訊息及/或該輸出訊息是否為一錯誤訊息。如此,透過該錯誤判斷條件,具有找出錯誤訊息的功效。
其中,該錯誤判斷邏輯可另具有一補正條件;該補正條件係為根據該多個預建訊息中的至少一者且有別於該錯誤訊息所對應的該多個預建訊息中的至少一者所定義的一補正訊息,以用於在該錯誤判斷條件判斷有該錯誤訊息的情況下,產生該補正訊息。如此,透過該補正條件,可將錯誤訊息修正為補正訊息,並藉此可避面後續形成資料封包時或運用該資料封包時,因前述錯誤訊息造成資料封包的產生或運用發生錯誤的問題。
其中,該錯誤判斷邏輯可另具有一提示條件;該提示條件是根據該錯誤訊息所對應的該輸出訊息的一訊息格式所產生具有一預定義的字元或字串的一提示訊息,以在該錯誤判斷條件判斷有該錯誤訊息的情況下,產生該提示訊息;其中,該提示訊息的一訊息格式符合該輸出訊息的該訊息格式。如此,透過該提示條件,可將錯誤訊息轉換為提示訊息,並藉由該提示訊息符合對應的該輸出訊息的訊息格式,可使具有該提示訊息的該輸出訊息可順利形成對應的一封包訊息,並於後續應用該封包訊息時,可顯示該提示訊息以提醒使用者具有錯誤訊息的情形。
1:資料庫
10,10a,10b:預建資料集
11:預建訊息
2:電腦
3:資訊選擇模組
30:目標資料集目錄
31:目標資料集態樣
32:目標資料集
33:目標訊息
34:自定義訊息目錄
35:自定義訊息
4:資訊擷取模組
40:輸出資料集
41:輸出訊息
5:資訊封裝模組
〔第1圖〕本發明一較佳實施例的系統方塊圖。
〔第2圖〕本發明預建資料集與預建訊息的一資料結構範例示意圖。
〔第3圖〕本發明目標資料集目錄與目標資料集態樣的一實施範例示意圖。
〔第4圖〕本發明目標資料集與目標訊息的一資料結構範例示意圖。
〔第5圖〕本發明自定義訊息目錄與自定義訊息的一實施範例示意圖。
〔第6圖〕本發明中預設訊息轉換為輸出訊息的一資料結構範例示意圖。
為讓本發明之上述及其他目的、特徵及優點能更明顯易懂,下文特舉本發明之較佳實施例,並配合所附圖式作詳細說明;此外,在不同圖式中標示相同符號者視為相同,會省略其說明。
請參照第1圖所示,其係本發明資料封裝系統的一較佳實施例,係包含一預建資料庫1、一電腦2、一資訊選擇模組3、一資訊擷取模組4及一資訊封裝模組5。該電腦2耦接該預建資料庫1,並透過該資訊選擇模組3、該資訊擷取模組4及該資訊封裝模組5以執行一資料封裝程序。
請參照第2圖所示,該預建資料庫1包含至少一預建資料集(Pre-established Data Set)10,該預建資料集10包含可存取(Accessible)的多個預建訊息(Pre-established Message)11。詳言之,所述資料集(Data Set)可以是一資料表(Data Table)的型態,較佳是指物件導向資料結構化的資料表,在所述資料表結構中,可由特定行/欄與特定列定義一特定位置的訊息(Message)/資訊(Information);或者,該資料集可以是資料檔(Data File)的型態,該資料檔(例如是WindowsTM作業系統中副檔名為.txt的一純文字檔)內的訊息可透過字元位置的方式特定;或者,上述訊息亦可具有對應標籤(Tag)或獨特辨識碼(UID,Unique Identifier),以作為資料檢索或
關連的應用;又或者,上述訊息本身所組成的全部或部分字元亦可作為資料檢索或關連的應用。應注意的是,所述預建訊息11亦可以是包含多個訊息的一個單維度或多維度的訊息矩陣。
該電腦2耦接該預建資料庫1,並包含該資訊選擇模組3、該資訊擷取模組4及該資訊封裝模組5,以進行一資料封裝程序。其中,該資訊選擇模組3、該資訊擷取模組4及該資訊封裝模組5係可透過硬體裝置及軟體功能所共同實現;特別地,該資訊選擇模組3、該資訊擷取模組4及該資訊封裝模組5亦可透過該電腦2執行一預建封裝程式而產生。較佳地,該預建資料庫1係建立於該電腦2中的一儲存裝置,藉此該電腦2與該資料庫1係可在離線環境中進行該資料封裝程序。
該資訊選擇模組3係用於提供至少一目標資料集目錄30(Target Data Set Catagory),如第3圖示意的一範例,該目標資料集目錄30包含至少一目標資料集態樣(Target Data Set Form)31;該目標資料集目錄30可以是一下拉式選單,且具有n個目標資料集態樣31(所述「n個」係表示「多個」)。該目標資料集態樣31係可對應至少一目標資料集(Target Data Set)32,該目標資料集32係具有多個目標訊息(Target Message)33;如第4圖所示,以具有m×n個目標訊息33為例,其中,該目標訊息33的配置方式亦可為單一列或單一行(未顯示)。詳言之,該多個目標訊息33可被定義為一矩陣資料結構,不同的目標資料集態樣31具有不同的目標資料集32,且不同的目標資料集32的矩陣資料結構的尺寸、元素(訊息)定義及元素(訊息)排列所形成的整體內容是不同的。
詳言之,藉由以上資料結構的配置,在從該目標資料集目錄30中選擇一個目標資料集態樣31的情況中,所選擇的該目標資料集態樣31中的該多個目標訊息33可被確定。其中,該多個目標訊息33中的每一個與該
多個預建訊息11中的至少一個有一第一轉換關聯。在一些範例中,部分的該多個目標訊息33的該第一轉換關聯可以相同;較佳地,各該目標訊息33的該第一轉換關聯係不同。舉例而言,若一個轉換條件(一第一轉換關聯)是作為一數值的一預建訊息11的0.5倍,對應的目標訊息33的數值即為該預建訊息11的數值的0.5倍;若一個轉換條件(一第一轉換關聯)是作為一數值的一預建訊息11的2倍,對應的目標訊息33的數值即為該預建訊息11的數值的2倍;又或是一目標訊息33係可直接與一預建訊息11完全相同,此時對應的轉換條件(第一轉換關聯)即具有定義該目標訊息33與該預建訊息11相等。
可選地,如第5圖示意的一範例,於選擇一個目標資料集態樣31後,該資訊選擇模組3另可用於產生/提供一自定義訊息目錄(Self-defined Message Category)34,該自定義訊息目錄34可包含可選的至少一自定義訊息(Self-defined Message)35,並可自該自定義訊息目錄34選擇該至少一自定義訊息35中的至少一者。其中,所述自定義訊息35中的每一個與該多個預建訊息11中的至少一個有一第二轉換關聯。在一些範例中,若有多個自定義訊息,部分的該多個自定義訊息35的該第二轉換關聯可以相同;較佳地,各該自定義訊息35的該第二轉換關聯係不同。舉例而言,若一個轉換條件(一第二轉換關聯)是作為一數值的一預建訊息11的0.5倍,對應的自定義訊息35的數值即為該預建訊息11的數值的0.5倍;若一個轉換條件(一第二轉換關聯)是作為一數值的一預建訊息11的2倍,對應的自定義訊息35的數值即為該預建訊息11的數值的2倍;又或是一自定義訊息35係可直接與一預建訊息11完全相同,此時對應的轉換條件(第二轉換關聯)即具有定義該自定義訊息35與該預建訊息11相等。
較佳地,該資訊選擇模組3具有一預建立的資訊選擇資料庫,
該資訊選擇資料庫包含該目標資料集目錄30、該目標資料集態樣31、該目標資料集32及該目標訊息33之間的預定義關聯,並較佳包含該自定義訊息目錄34與該自定義訊息35之間的預定義關聯,並更加包含該第一轉換關聯及/或該第二轉換關聯的預定義。其中,該自定義訊息目錄34係與該目標資料集32間具有一關聯,使該目標資料集32確定後,該自定義訊息目錄34可自動對應產生。應注意的是,該第一轉換關聯及/或該第二轉換關聯除了針對預建訊息11之數值或內容的上具有對應的轉換定義外,亦可對預建訊息11資料格式具有對應的轉換定義。
如第6圖示意的一範例,該資訊擷取模組4係於選擇一個目標資料集態樣31後及/或選擇至少一自定義訊息35後,用於產生並執行一資料擷取指令,該資料擷取指令係具有一關聯關係(Associative Relationship),該關聯關係定義為該多個預建訊息11與該多個目標訊息33及/或該至少一自定義訊息35之間的轉換關係,並藉由該關聯關係轉換該多個預建訊息11為對應的該多個目標訊息33及/或該至少一自定義訊息35以獲取一輸出資料集(Output Data Set)40,該輸出資料集40具有多個輸出訊息41,各該輸出訊息41係為各該多個目標訊息33及/或該至少一自定義訊息35經該關聯關係轉換自對應的該多個預建訊息11轉換的一輸出結果。詳言之,該關聯關係代表被選擇的該多個目標訊息33及/或被選擇的該自定義訊息35中的每一者與其所對應的該多個預建訊息11中的至少一者的關係。換言之,該關聯關係即為各該被選擇的目標訊息33(及/或各該自定義訊息35)與預建訊息11間的對應關係,且該被選擇的目標訊息33中的每一者(及/或自定義訊息35中的每一者)係對應至該關聯關係中的一條件;亦即,在該關聯關係中的該條件係指上述的第一轉換關聯及/或第二轉換關聯。另,舉例來說,以第6圖為例,該輸出資料集40中的該輸出訊息41可以分別是由先前所選擇目標訊息33及
自定義訊息35所組成;在其他範例中(未顯示),該輸出資料集40中的該輸出訊息41全部都與所選擇的目標資料集32中的多個目標訊息33一致。
其中,對應第6圖的結果,該關聯關係可舉例如以下定義:
(1)該輸出資料集40中第一行第一列的該輸出訊息41(如「A1」)係為一目標訊息33,並等於一預建資料集10a中的第一個預建訊息11(如「A1」)。
(2)該輸出資料集40中第二行第一列的該輸出訊息41(如「A2」)係為一目標訊息33,並等於該預建資料集10a中的第二個預建訊息11(如「A2」)。
(3)該輸出資料集40中第一行第二列的該輸出訊息41(如「」)係為一目標訊息33,並等於另一預建資料集10b中第一行第一列的預建訊息11(如「B11」)與第二行第一列的預建訊息11(如「B12」)相加後再除以二。
(4)該輸出資料集40中第二行第二列的該輸出訊息41(如「B22」)係為一目標訊息33,並等於該另一預建資料集10b中第二行第二列的預建訊息11(如「B22」)。
(5)該輸出資料集40中第一行第三列的該輸出訊息41(如「2×A5」)係為一自定義訊息35,並等於該預建資料集10a中第5個的預建訊息11(如「A5」)乘以2。
(6)該輸出資料集40中第二行第三列的該輸出訊息41(如「B31」)係為一自定義訊息35,並等於該另一預建資料集10b中第一行第三列的預建訊息11(如「B31」)。
其中,上述關聯關係中具有運算條件的部分係用於表示預建訊息11中的至少一部分是可運算的,例如是呈現為純數值的資料型態;在其他範例中,該關聯關係中的該運算條件可為一函式,特別是可將非為純數值的資料型態的至少一預建訊息11轉換為純數值的資料型態,並可再經運算;或
者,該函式亦可以是將純數值資料型態的至少一預建訊息11(較佳先經運算)轉換為非純數值的資料型態。應注意的是,上述關聯關係中的各種可能條件僅做為釋例性地說明以瞭解本發明的技術,本發明並不以此為限。
其中,有別於第6圖的該關聯關係是以直接定義對應的該預建訊息11來源的方式,該關聯關係也可以是運用對應標籤、獨特辨識碼、訊息本身的全部字或部份字元的條件以定義關聯的預建資料集10中的預建訊息11。特別地,在一些情形中,符合該關聯關係的預建訊息11有多個關聯訊息,上述多個關聯訊息的情況可視為具有重複訊息的情況,可能使後續產出的輸出資料集40出錯,例如因重複訊息產生錯誤,或因重複訊息產生資料覆蓋後變成非目標資料等問題。為了避免上述問題,在符合該關聯關係的該多個預建訊息11有多個關聯訊息的一情形中,該資料擷取模組4,特別是該資料擷取指令,可另包含一去除重複邏輯,該去除重複邏輯係為根據該多個關聯訊息及/或與該多個關聯訊息所關聯的其他訊息所定義的一去除重複判斷條件,以自該多個關聯訊息中獲取符合該去除重複判斷條件的一關聯訊息。
舉例來說,如下表二所示,若一預建資料集10是某個病人的歷史病例,對應的預建訊息11包含該病人多組就診過的多種病症(例如是病症A與病症B)等,與上述病症相關的其他資料例如是就診日期與相關處置;在研究分析的目標是想探知該病人在病症A中的處置與效果,且該關聯關係中的三個目標訊息33分別例如是找出該病人的該病症A訊息及該病症A訊息的下兩個訊息(就診日期、相關處置),透過該關聯關係會獲取二組病症A訊息,第一組病症A訊息中的相關處置訊息為「藥品MA」,第二組病症A訊息中的相關處置訊息為「複檢,無處置」;對於上述的研究分析的目標而言,第一組資訊中的「藥品MA」為正確訊息,但就資料擷取程序面,第二組資訊中的「複檢,無處置」的非正確訊息會覆蓋第一組資訊中的「藥品MA」。
此時,可透過該去除重複邏輯的,定義一去除重複的條件,例如是排除具有「無處置」的訊息特徵(可以透過判斷是否具有一特定字串、一特定標籤或一特定辨識碼等方式實現)作為資料擷取的判斷,便能避免因具有重複資料造成的錯誤結果。
特別地,在另一些情形中,符合該關聯關係所產生的該輸出資料集40中的輸出訊息41(對應該目標訊息33及/或該自定義訊息35)是錯誤的,例如是亂碼、無法識別、無法存取或格式錯誤等,可能是源於原始訊息(如預建訊息11)的錯誤。為了避免上述錯誤的情形產生,該資料擷取模組4,特別是該資料擷取指令,可另包含一錯誤判斷邏輯,該錯誤判斷邏輯具有一錯誤判斷條件及一補正條件及/或一提示條件。該錯誤判斷條件係根據該預建訊息11及/或該輸出訊息41中之字元組成、字串長度等方式以判斷該預建訊息11及/或該輸出訊息41是否為一錯誤訊息。該補正條件用於在該錯誤判
斷條件判斷有一錯誤訊息的情況下,產生一補正訊息;詳言之,該補正條件係為對應該多個預建訊息11中的至少一者且有別於該錯誤訊息所對應的該多個預建訊息11中的至少一者所定義的一補正訊息。該提示條件可用於在該錯誤判斷條件判斷有一錯誤訊息的情況下,產生一提示訊息;詳言之,該提示條件可以是根據一預定義的字元或字串所產生的一提示訊息,以達成提醒使用者該輸出訊息41具有錯誤的情形;較佳地,該提示條件可以是根據該錯誤訊息所對應的該輸出訊息41的一訊息格式所產生的一預定義的字元或字串的一提示訊息,且該提示訊息的一訊息格式符合該輸出訊息的該訊息格式,並可顯示例如是一極大值、一特定符號、一特定文字或其任意組合,除能達成提醒使用者該輸出訊息41具有錯誤的情形,因該提示訊息符合對應輸出訊息41的訊息格式,亦可使輸出訊息41可順利形成對應的一封包訊息。較佳地,該提示條件可用於在該錯誤判斷條件判斷有一錯誤訊息且缺少該補正條件或該補正訊息亦為錯誤的情況下,產生一提示訊息。
較佳地,該資訊擷取模組4具有一預建立的資訊擷取資料庫,該資訊擷取資料庫包含該去除重覆邏輯及/或該錯誤判斷邏輯。
該資訊封裝模組5係用於將該輸出資料集40依一預定封裝格式輸出以形成一資料封包,該資料封包中具有可供存取的多個封包訊息,各該封包訊息與該輸出訊息41中對應的一個關聯。如此,可根據輸出資料集40後續要載入的環境選擇一預定封裝格式進行資料封裝,使後續資料運用時可直接讀取該資料封包,不需再經過繁瑣的資料對應、擷取、轉換及/或去除重複及/或除錯補正的程序。
較佳地,資訊封裝模組5具有一預建立的資訊封裝資料庫,該資訊封裝資料庫包含該預定封裝格式。
根據上述本發明資料封裝系統的架構,本發明一應用範例的態
樣可以是如下所述。
針對該預建資料集10及該預建訊息11:該預建資料集10可包含中華民國衛生福利部資料科學中心提供的各種可下載的資料表格,特別是針對各種病症的統計資料,例如是表Health45(癌症登記年報檔)、表Health14(癌症登記長表LF)、表Health16(癌症登記表長表TCDB)、表Health10(死因統計檔)、表Health06(全民健保處方及治療醫令明細檔_藥局)、表Health05(全民健保處方及治療醫令明細檔_住院)、表Health04(全民健保處方及治療醫令明細檔_門急診)、表Health03(全民健保處方及治療明細檔_藥局)、表Health02(全民健保處方及治療明細檔_住院)、表Health01(全民健保處方及治療明細檔_門急診)等;該預建資料集10亦可包含中華民國內政部的人口統計資料庫中的資料表。其中,該預建訊息11則可以是對應上述單位或其他單位或其他使用者所擁有的任意資料(包含公開資料表或非公開的資料表)中的可供存取的訊息。
針對該目標資料集32、該目標訊息33及該自定義訊息35:該目標資料集32的模板可以是根據任一分析工具可載入的資料集而建立於該資料集態樣31,其中所述可載入的資料集具有多個預定義訊息,各該多個預定義訊息較佳具有特定內容、特定格式,且該多個預定義訊息較佳具有一特定排列順序。較佳地,所述模板可例如是美國疾病管制暨預防中心(Centers for Disease Control and Prevention)的國家癌症研究所(National Cancer Institute)提供的工具SEER*Prep可直接載入並產生可執行結果的一模板,使對應的目標訊息33(或輸出訊息41)經預定封裝格式封裝後可符合對應分析工具SEER*Stat中可分析訊息的定義(包含訊息內容與訊息格式),並可直接透過該分析工具SEER*Stat進行分析。惟,該目標訊息33(或輸出訊息41)並不以專供該分析工具SEER*Stat為限,該目標訊息33(或輸出訊息
41),特別是經封裝後,係可以是符合各種分析工具中可分析訊息的定義。同樣地(如該目標訊息33),該自定義訊息35,特別是經封裝後,亦可以是符合各種分析工具中可分析訊息的定義。
針對該輸出資料集40、該輸出訊息41及該預定封裝格式:該輸出資料集40的模板的定義可與該目標資料集32一致,較佳另包含有關該自定義訊息35的部分。其中,該輸出訊息41的內容係與對應的目標訊息33及/或自定義訊息35一致。此外,該預定封裝格式係用於將該輸出訊息41封裝形成各種分析工具可直接載入並產生對應分析結果的對應格式。較佳地,在對應的分析工具為上述SEER*Stat的情形中,該輸出訊息41的該預定封裝格式可包含以下5種格式:(1)Global234.d02032020.dd;(2)Mort58.d02032020.dd;(3)Pop26.d02032020.dd;(4)Stdpops14.d01292020.dd;及(5)Expsurv29.d05192006.dd。上述5種格式係為對應美國疾病管制暨預防中心的國家癌症研究所提供的封裝工具SEER*Prep所輸出的格式。
針對該錯誤判斷條件及補正條件:以目標訊息33需要自上述表Health14獲取死亡時間為例,其中因該表Health14在死亡時間訊息中允許使用「9999年99月99日」表示死亡日期不詳,因此應連結到上述表Health10來補正死亡日期。根據上述範例,該錯誤判斷條件可以是判斷該表Health14的該死亡日期是否屬於不詳,例如判斷對應訊息是否為「9999年99月99日」且定義該訊息為一錯誤訊息,並在判斷為具有該錯誤訊息的狀態時,定義該補正訊息為連結該表Health10,特別是對應2018年後版本的資料表中為序號
6的訊息列(即「死亡日期」)的訊息。在另一範例中,若要獲取完整的治療資訊,在特定例如是患者因復發從醫院X自行到醫院Y進行後續治療的情形中,依現行相關規定的結果,該表Health14不會有轉院治療的資料,需對應到上述表Health01~表Health06等表的健保就醫記錄來進行對應資料的補正;此時,該錯誤判斷條件則為判斷表Health01~表Health06中是否有對應訊息,該補正條件則為連結到表Health01~表Health06中對應的訊息。
針對該去除重複邏輯:在癌症的資料分析為例,通常會關注一患者的一癌症的最初診斷日期。對應實際案例情況中,一患者可能會針對同一癌症到不同醫院就診,且可能是同一日或不同日到不同醫院,而具有重複資訊息的情形產生。詳言之,不同日到不同醫院看診的情形下,對應上述表Health45(對應一預建資料集10)針對同一病症「最初診斷日期」(對應一預建訊息11)會有兩筆不同日期,此時對應的去除重複邏輯可定義為選擇具有較早日期的資訊為對應的目標訊息33。在同日到不同醫院看診的情形下,則可依該表Health45中「治療情形」(對應一預建訊息11)的種類進行相關定義,例如是針對各治療情形定義不同分數-舉例而言,定義「未治療」分數為40,定義「手術治療」分數為1,定義「放射線治療」分數為2,定義「化學治療」分數為3,定義「免疫治療」分數為4,定義「內分泌(荷爾蒙)治療」分數為5,定義「支持治療」分數為6,定義「中藥(中醫療法)」分數為6,定義「其他」或「新的治療方法」分數為8,定義「局部性化學治療」分數為10-藉此,計算該患者於不同醫院的各該「治療情形」的分數的一總分,並以該總分為低者之「最初診斷日期」為該目標訊息33。應注意的是,就學理上而言,因手術治療、放射線治療、或化學治療為主要治療方式;另就實務面而言,包含有主要治療的相關資訊總是較完整與精確;另再就統計科學而言,相關統計應由主要、完整及精確的資訊進行分析才有較高的信度與
效度;因此,上述針對例如是癌症「最初診斷日期」的去除重複邏輯才會如此定義。
綜上所述,本發明資料封裝系統透過資訊選擇模組、資訊擷取模組及資訊封裝模組,特別是透過關聯關係,可將該多個預建訊息轉換為具有目標訊息及/或自定義訊息的輸出資料集及獲得對應的資料封包,可達成快速且自動化地自預建資料集中獲取所需訊息的功效。另可透過資料擷取模組中的去除重複邏輯,將不需要的重複資料/訊息去除,以避免因重複資料造成的錯誤結果。另可透過資料擷取模組中的錯誤判斷邏輯,判斷由關聯關係所產生的訊息是否錯誤,並產生對應的補正訊息或提示訊息,藉以補正預建訊息中的錯誤或提示預建訊息中的錯誤。
雖然本發明已利用上述較佳實施例揭示,然其並非用以限定本發明,任何熟習此技藝者在不脫離本發明之精神和範圍之內,相對上述實施例進行各種更動與修改仍屬本發明所保護之技術範疇,因此本發明之保護範圍當包含後附之申請專利範圍所記載的文義及均等範圍內之所有變更。又,上述之數個較佳範例/態樣能夠組合時,則本發明包含任意組合的實施態樣。
1:資料庫
10:預建資料集
11:預建訊息
2:電腦
3:資訊選擇模組
4:資訊擷取模組
5:資訊封裝模組
Claims (10)
- 一種資料封裝系統,包含:一預建資料庫,包含至少一預建資料集,該預建資料集包含可存取的多個預建訊息;及一電腦,耦接該預建資料庫,並包含一資訊選擇模組、一資訊擷取模組及一資訊封裝模組;其中,該資訊選擇模組包含至少一目標資料集目錄,該目標資料集目錄包含至少一目標資料集態樣,該至少一目標資料集態樣係可對應至少一目標資料集,該至少一目標資料集係具有多個目標訊息;其中,該資訊擷取模組用於產生並執行一資料擷取指令,該資料擷取指令係具有一關聯關係,該關聯關係定義為該多個預建訊息與該多個目標訊息之間的轉換關係;藉由該關聯關係轉換該多個預建訊息為該多個目標訊息以獲取一輸出資料集,該輸出資料集具有多個輸出訊息,各該輸出訊息係為各該多個目標訊息經該關聯關係自對應的該多個預建訊息轉換的一輸出結果;其中,該資訊封裝模組用於將該輸出資料集依一預定封裝格式輸出以形成一資料封包,該資料封包中具有可供存取的多個封包訊息,各該封包訊息與該多個輸出訊息中對應的一個關聯。
- 如請求項1之資料封裝系統,其中,該資訊選擇模組另包含一自定義訊息目錄,該自定義訊息目錄包含至少一自定義訊息;該關聯關係定義為該多個預建訊息與該多個目標訊息及該至少一自定義訊息之間的轉換關係;藉由該關聯關係轉換該多個預建訊息為該多個目標訊息及該至少一自定義訊息以獲取一輸出資料集,該輸出資料集具有多個輸出訊息,各該輸出訊息係為各該多個目標訊息及該至少一自定義訊息經該關聯關係自對應的該多個預建訊息轉換的一輸出結果;其中,該資訊封裝模組用於將該輸出資料 集依一預定封裝格式輸出以形成一資料封包,該資料封包中具有可供存取的多個封包訊息,各該封包訊息與該多個輸出訊息中對應的一個關聯。
- 如請求項2之資料封裝系統,其中,該多個目標訊息中的每一個與該多個預建訊息中的至少一個有一第一轉換關聯,且各該目標訊息的該第一轉換關聯係不同,該關聯關係為該第一轉換關聯。
- 如請求項3之資料封裝系統,其中,該自定義訊息中的每一個與該多個預建訊息中的至少一個有一第二轉換關聯,且各該自定義訊息的該第二轉換關聯係不同,該關聯關係具有該第一轉換關聯及該二轉換關聯。
- 如請求項1之資料封裝系統,其中,該關聯關係係運用對應的該預建訊息的一來源、一標籤、一獨特識別碼及/或對應的該預建訊息中的全部或部分字元的至少一方式,以定義該多個預建訊息與該多個目標訊息之間的轉換關係。
- 如請求項2之資料封裝系統,其中,該關聯關係是運用對應的該預建訊息的一來源、一標籤、一獨特識別碼及/或對應的該預建訊息中的全部或部分字元的至少一方式,以定義該多個預建訊息與該多個目標訊息及該至少一自定義訊息之間的轉換關係。
- 如請求項1~6中任一項之資料封裝系統,其中,該資料擷取模組另包含一去除重複邏輯,在符合該關聯關係的該多個預建訊息有多個關聯訊息的一情況中,該去除重複邏輯係為根據該多個關聯訊息及/或與該多個關聯訊息所關聯的其他訊息所定義的一去除重複判斷條件,以自該多個關聯訊息中獲取符合該去除重複判斷條件的一關聯訊息。
- 如請求項1~6中任一項之資料封裝系統,其中,該資料擷取模組另包含一錯誤判斷邏輯,該錯誤判斷邏輯具有一錯誤判斷條件;該錯誤判斷條件係根據該預建訊息及/或該輸出訊息中之字元組成或字串長度以判 斷該預建訊息及/或該輸出訊息是否為一錯誤訊息。
- 如請求項8之資料封裝系統,其中,該錯誤判斷邏輯另具有一補正條件;該補正條件係為根據該多個預建訊息中的至少一者且有別於該錯誤訊息所對應的該多個預建訊息中的至少一者所定義的一補正訊息,以用於在該錯誤判斷條件判斷有該錯誤訊息的情況下,產生該補正訊息。
- 如請求項8之資料封裝系統,其中,該錯誤判斷邏輯另具有一提示條件;該提示條件是根據該錯誤訊息所對應的該輸出訊息的一訊息格式所產生具有一預定義的字元或字串的一提示訊息,以在該錯誤判斷條件判斷有該錯誤訊息的情況下,產生該提示訊息;其中,該提示訊息的一訊息格式符合該輸出訊息的該訊息格式。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW110149759A TWI809639B (zh) | 2021-12-30 | 2021-12-30 | 資料封裝系統 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW110149759A TWI809639B (zh) | 2021-12-30 | 2021-12-30 | 資料封裝系統 |
Publications (2)
Publication Number | Publication Date |
---|---|
TW202326463A TW202326463A (zh) | 2023-07-01 |
TWI809639B true TWI809639B (zh) | 2023-07-21 |
Family
ID=88147641
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW110149759A TWI809639B (zh) | 2021-12-30 | 2021-12-30 | 資料封裝系統 |
Country Status (1)
Country | Link |
---|---|
TW (1) | TWI809639B (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TW594532B (en) * | 2002-10-25 | 2004-06-21 | Taipei Medical University Hosp | Medical information system, and method for integrating anamnesis data using the same |
TW200535746A (en) * | 2005-07-22 | 2005-11-01 | Univ Chang Gung | A method for protecting information integrity |
US20200066389A1 (en) * | 2009-11-06 | 2020-02-27 | Crisi Medical Systems, Inc. | Medication Injection Site and Data Collection System |
US20200176094A1 (en) * | 2013-03-01 | 2020-06-04 | Actx, Inc. | Cloud-like medical-information service |
-
2021
- 2021-12-30 TW TW110149759A patent/TWI809639B/zh active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TW594532B (en) * | 2002-10-25 | 2004-06-21 | Taipei Medical University Hosp | Medical information system, and method for integrating anamnesis data using the same |
TW200535746A (en) * | 2005-07-22 | 2005-11-01 | Univ Chang Gung | A method for protecting information integrity |
US20200066389A1 (en) * | 2009-11-06 | 2020-02-27 | Crisi Medical Systems, Inc. | Medication Injection Site and Data Collection System |
US20200176094A1 (en) * | 2013-03-01 | 2020-06-04 | Actx, Inc. | Cloud-like medical-information service |
Also Published As
Publication number | Publication date |
---|---|
TW202326463A (zh) | 2023-07-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111767410B (zh) | 临床医疗知识图谱的构建方法、装置、设备及存储介质 | |
US20190034503A1 (en) | System and Method for Text Extraction and Contextual Decision Support | |
US20160042134A1 (en) | Method of calculating a score of a medical suggestion as a support in medical decision making | |
Lyman et al. | The development of health care data warehouses to support data mining | |
AU2015253661A1 (en) | Identification and analysis of copied and pasted passages in medical documents | |
US20170286604A1 (en) | Computer System and Information Processing Method | |
CN112331298A (zh) | 开具药方的方法、装置、电子设备及存储介质 | |
US20170364640A1 (en) | Machine learning algorithm to automate healthcare communications using nlg | |
CN111145847A (zh) | 临床试验数据的录入方法及装置、介质和电子设备 | |
CN113257377A (zh) | 确定目标用户的方法、装置、电子设备及存储介质 | |
Yu et al. | ADEpedia-on-OHDSI: A next generation pharmacovigilance signal detection platform using the OHDSI common data model | |
US20100306183A1 (en) | Electronic system for a social -network web portal applied to the sector of health and health information | |
WO2020132267A1 (en) | System and method for computerized synthesis of simulated health data | |
TWI809639B (zh) | 資料封裝系統 | |
Fung et al. | RxTerms–a drug interface terminology derived from RxNorm | |
US20160078066A1 (en) | Method and apparatus for processing clinical data | |
JPH04260173A (ja) | 薬剤処方監査処理システム | |
CN114913956A (zh) | 基于知识图谱的重复用药提醒方法、装置以及电子设备 | |
JP6375064B2 (ja) | 非構造化項目特徴を関連する療法特徴に一様に相関付けするためのシステムおよび方法 | |
Matsumura et al. | Template-based data entry for general description in medical records and data transfer to data warehouse for analysis | |
TWI783172B (zh) | 用於處理處方之裝置及方法 | |
Soares et al. | An interdisciplinary approach to reducing errors in extracted electronic health record data for research | |
Freeman et al. | Next generation phenotyping with quantitative narration for DEGCAGS syndrome | |
CN114996452B (zh) | 医保限定支付文本逻辑表达式生成方法、系统及存储介质 | |
CN115691741B (zh) | 一种医疗信息化信息传递及信息合并方法 |