WO2018113209A1 - 医疗信息化医疗文件冗余清除系统及方法 - Google Patents

医疗信息化医疗文件冗余清除系统及方法 Download PDF

Info

Publication number
WO2018113209A1
WO2018113209A1 PCT/CN2017/088347 CN2017088347W WO2018113209A1 WO 2018113209 A1 WO2018113209 A1 WO 2018113209A1 CN 2017088347 W CN2017088347 W CN 2017088347W WO 2018113209 A1 WO2018113209 A1 WO 2018113209A1
Authority
WO
WIPO (PCT)
Prior art keywords
hash
medical
file
medical file
storage path
Prior art date
Application number
PCT/CN2017/088347
Other languages
English (en)
French (fr)
Inventor
张贯京
葛新科
王海荣
Original Assignee
深圳市易特科信息技术有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 深圳市易特科信息技术有限公司 filed Critical 深圳市易特科信息技术有限公司
Publication of WO2018113209A1 publication Critical patent/WO2018113209A1/zh

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/60ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/13File access structures, e.g. distributed indices
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/17Details of further file system functions
    • G06F16/174Redundancy elimination performed by the file system
    • G06F16/1748De-duplication implemented within the file system, e.g. based on file segments
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2228Indexing structures
    • G06F16/2255Hash tables
    • G06F19/32
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H40/00ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices
    • G16H40/60ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices for the operation of medical equipment or devices
    • G16H40/67ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices for the operation of medical equipment or devices for remote operation

Definitions

  • the present invention relates to the field of medical information, and in particular, to a medical information medical file redundancy clearing system and method.
  • the medical file is the original record of the patient's diagnosis and treatment in the hospital. It contains electronic medical records, medical image files, disease encyclopedia documents, government medical policy documents, medical department introduction documents and so on. With the network management of hospital computers, medical documents came into being. As a product of technological advancement, medical documents have been increasingly used in medical systems for their convenience in recording and storage.
  • a mobile terminal with a touch screen such as a mobile phone or a tablet
  • Viewing medical files and storing medical files causes the server to save multiple identical medical files, thus causing redundancy of medical files on the server and reducing server access speed. It is therefore necessary to provide an information system that processes duplicate medical files on the server.
  • a primary object of the present invention is to provide a medical information medical file redundancy removal system and method for solving the technical problem of cleaning redundant medical files on a server.
  • the present invention provides a medical information medical file redundancy clearing system, which is operated in a server, and the server communicates with a client through a network, the system includes:
  • a calculation module configured to calculate a hash value of each medical file on the server
  • a search module configured to find the same hash value from the calculated hash value, and group the same hash value into a group, and the same hash value in each group and the same hash in the group
  • the storage path of the medical file corresponding to the Greek value is stored in a hash association list
  • a deleting module configured to select a storage path in each hash association list, and delete the hash switch a medical file corresponding to the unselected storage path in the list;
  • a modification module configured to modify, in each hash association list, an identifier corresponding to the deleted medical file
  • a receiving module configured to receive a file query instruction sent by the client
  • a determining module configured to determine whether a storage path of the medical file to be queried in the file query instruction has a corresponding hash association list
  • a sending module configured to: when a storage path of the medical file to be queried in the file query instruction has a corresponding hash association list, send the medical file corresponding to the selected storage path in the corresponding hash association list To the client.
  • the hash association list includes four fields, and the four fields are a file name, a hash value, a storage path, and an identifier.
  • the calculating module calculates a hash value of each medical file on the server as follows: traverses the medical file on the server, and calculates a hash value of each medical file by using a hash algorithm.
  • the calculation module calculates a hash value of each medical file on the server by using a hash algorithm, where the hash algorithm is an MD5 algorithm.
  • the determining module determines whether the storage path in the file query instruction has a corresponding hash association list as follows: parsing the file query instruction and obtaining a storage path of the medical file to be queried, The storage path of the medical file to be queried is compared with each hash association list in the server. If a hash association list in the server includes a storage path of the medical file to be queried, the hash association list is to be A hash association list corresponding to the storage path of the queried medical file.
  • the present invention further provides a medical information processing medical file redundancy clearing method, which is applied to a server, wherein the server communicates with a client through a network, and the method includes the following steps:
  • the storage path of the medical file to be queried in the file query instruction has a corresponding hash association list
  • the medical file corresponding to the selected storage path in the corresponding hash association list is sent to the client.
  • the hash association list includes four fields, and the four fields are a file name, a hash value, a storage path, and an identifier.
  • the step of calculating a hash value of each medical file on the server comprises the steps of: traversing medical files on the server, and calculating a hash value of each medical file by using a hash algorithm.
  • the hash value of each medical file on the server is calculated by a hash algorithm, where the hash algorithm is an MD5 algorithm.
  • the step of determining whether the storage path of the medical file to be queried in the file query instruction has a corresponding hash association list comprises the following steps: parsing the file query instruction and obtaining the medical file to be queried a storage path, comparing the storage path of the medical file to be queried with each hash association list in the server. If a hash association list in the server includes a storage path of the medical file to be queried, The hash association list is a hash correlation list corresponding to the storage path of the medical file to be queried.
  • the present invention adopts the above technical solution, and brings the technical effects as follows:
  • the present invention uses the hash value comparison method to find the same medical file, and deletes duplicate medical files, speeds up the access speed of the server, and reduces the server. Redundancy.
  • FIG. 1 is a schematic diagram of an application environment of a medical information medical file redundancy clearing system of the present invention
  • FIG. 2 is a block diagram of a preferred embodiment of the medical information medical file redundancy clearing system of the present invention
  • FIG. 3 is a flow chart of a preferred embodiment of the medical information medical file redundancy clearing method of the present invention
  • FIG. 1 is a schematic diagram of an application environment of a medical information medical file redundancy clearing system of the present invention.
  • the medical information medical file redundancy clearing system 30 in the present invention runs on the server 3.
  • the server 3 is communicatively coupled to a plurality of clients 1 via a network 2.
  • the server 3 stores various types of medical documents (e.g., electronic medical records, medical image files, disease encyclopedia files, government medical policy documents, medical department introduction documents, etc.).
  • the network 2 may be a wired communication network or a wireless communication network.
  • the network is preferably a wireless communication network, including but not limited to a GSM network, a GPRS network, a CDMA network, a TD-S CDMA network, a WiMAX network, a TD-LTE network, an FDD-LTE network, and the like. .
  • the client 1 may be, but is not limited to, any other suitable portable touch screen electronic device such as a smart phone, a tablet computer, a personal digital assistant (PDA), a personal computer, an electronic signboard, and the like.
  • the client 1 is used to access the server 3 through the network 2 and obtain medical files on the server 3.
  • the client 1 is also used to generate a medical file, and the generated medical file is sent to the server 3 for storage.
  • FIG. 2 it is a schematic diagram of a preferred embodiment of the medical information medical file redundancy removal system of the present invention.
  • the medical information medical file redundancy clearing system 30 is applied to the server 3.
  • the server 3 includes, but is not limited to, a medical information medical file redundancy removal system 30, a storage unit 31, a processing unit 32, and a communication unit 33.
  • the storage unit 31 may be a read only storage unit ROM, an electrically erasable storage unit EEPRO M, a flash storage unit FLASH or a solid hard disk.
  • the processing unit 32 may be a central processing unit (CPU), a microcontroller (MCU), a data processing chip, or an information processing unit having a data processing function.
  • the communication unit 33 is a communication interface with a remote communication function, for example, communication supporting wireless communication technologies such as GSM, GPR S, WCDMA, CDMA, TD-SCDMA, WiMAX, TD-LTE, FDD-LTE. Interface, support wired communication interface of USB and network cable.
  • the medical information system 30 remove the medical file redundancy include, but are not limited to, the calculation module 312, a searching module 313, a deleting module 314, modification module 315, a receiving module 316, a determining module 317 and transmission module 318
  • the module referred to in the present invention refers to a series of computer program instruction segments that can be executed by the processing unit 32 of the server 3 and that can perform a fixed function, which are stored in the storage unit 31 of the server 3.
  • the calculation module 312 is configured to calculate a hash value of each medical file on the server 3. Specifically, the calculation module 312 traverses the medical files on the server 3 and calculates a hash value for each medical file by a hash algorithm.
  • the hash algorithm may be, but is not limited to, an MD5 algorithm.
  • the searching module 313 is configured to search for the same hash value from the calculated hash values, and group the same hash values into a group, and the same hash value in each group is the same as the same in the group.
  • the storage path of the medical file corresponding to the hash value is stored in a hash association list.
  • the hash association list includes a plurality of identical hash values and a storage path of each hash value corresponding to the medical file. It should be noted that the hash values in the hash association list are the same.
  • the server 3 has multiple sets of identical medical files, and the lookup module 313 obtains multiple sets of identical hash values and generates a hashed list for each set of identical hash values.
  • the hash association list includes at least four fields, where the four fields are a file name (representing the name of the medical file), a hash value (representing a hash value of the medical file), The storage path (representing the storage path of the medical file on the server 3) and the identification (representing whether the medical file remains in the server 3, where Y indicates reservation and N indicates deletion).
  • the letter B in FIG. 4 merely refers to the hash value, and does not mean that the hash value is B
  • the letters XI to X9 in FIG. 4 are merely referring to the storage path, and do not indicate XI to X9 are storage paths.
  • the deleting module 314 is configured to select one storage path in each hash association list, and delete the medical file corresponding to the unselected storage path in the hash association list. In this embodiment, the deleting module 314 selects the storage path XI, and deletes the medical files corresponding to the remaining storage paths X2 to X9 in the server 3.
  • the modification module 315 is configured to modify the identifier corresponding to the deleted medical file in each hash association list. Specifically, as shown in FIG. 4, the modification module 315 modifies the identifier corresponding to X2 to X9 in the hash association list from Y to N.
  • the receiving module 316 is configured to receive a file query instruction sent by the client 1. Generally, the client 1 queries the medical file on the server 3, and the file query instruction includes a storage path of the medical file to be queried.
  • the determining module 317 is configured to determine whether a storage path of the medical file to be queried in the file query instruction has a corresponding hash association list.
  • the determining module 317 parses the file query instruction and obtains a storage path of the medical file to be queried, and compares the storage path of the medical file to be queried with each hash association list in the server 3, if the server 3 There is a hash association list containing the storage path of the medical file to be queried, and the hash association list is a hash association list corresponding to the storage path of the medical file to be queried.
  • the sending module 318 is configured to send the medical file corresponding to the selected storage path in the corresponding hash association list to the client 1. Specifically, as shown in FIG. 4, if the storage path of the medical file to be queried is X2, the sending module 318 sends the medical file A whose storage path is XI to the client 1.
  • FIG. 3 it is a flow chart of a preferred embodiment of the medical information medical file redundancy clearing method of the present invention.
  • the medical information medical file redundancy clearing method is applied to the server 3, and the method includes the following steps:
  • Step S12 The calculation module 312 calculates a hash value of each medical file on the server 3. Specifically, the calculation module 312 traverses the medical files on the server 3 and calculates a hash value for each medical file by a hash algorithm.
  • the hash algorithm may be, but is not limited to, an MD5 algorithm.
  • Step S13 The searching module 313 searches for the same hash value from the calculated hash values, and groups the same hash values into a group, and sets the same hash value in each group and the group.
  • the storage path of the medical file corresponding to the same hash value is stored in a hash association list.
  • the hash association list includes a plurality of identical hash values and a storage path of each hash value corresponding to the medical file. It should be noted that the hash values in the hash association list are the same.
  • the server 3 has multiple sets of identical medical files, and the search module 313 obtains multiple sets of identical hash values and each set of phases
  • the same hash value generates a hash association list.
  • the hash association list includes at least four fields, where the four fields are a file name (representing the name of the medical file), a hash value (representing a hash value of the medical file),
  • the storage path (representing the storage path of the medical file on the server 3) and the identification (representing whether the medical file remains in the server 3, where Y indicates reservation and N indicates deletion).
  • the letter B in FIG. 4 merely refers to the hash value, and does not mean that the hash value is B
  • the letters XI to X9 in FIG. 4 are merely referring to the storage path, and do not indicate XI to X9 are storage paths.
  • Step S14 The deleting module 314 selects one storage path in each hash association list, and deletes the medical file corresponding to the unselected storage path in the hash association list.
  • the deletion module 314 selects the storage path XI, and deletes the remaining medical files corresponding to the storage paths X2 to X9 in the server 3.
  • Step S15 The modification module 315 modifies the identifier corresponding to the deleted medical file in each hash association list. Specifically, as shown in FIG. 4, the modification module 315 modifies the identifier corresponding to X2 to X9 in the hash association list from Y to N.
  • Step S16 The receiving module 316 receives the file query instruction sent by the client 1. Generally speaking
  • the client 1 queries the medical file on the server 3, and the query instruction includes a storage path of the medical file to be queried.
  • Step S17 The determining module 317 determines whether the storage path of the medical file to be queried in the file query instruction has a corresponding hash association list.
  • the determining module 317 parses the file query instruction and obtains a storage path of the medical file to be queried, and compares the storage path of the medical file to be queried with each hash association list in the server 3, if the server 3 There is a hash association list containing the storage path of the medical file to be queried, and the hash association list is a hash association list corresponding to the storage path of the medical file to be queried. If the storage path in the file query instruction has a corresponding hash association list, the process proceeds to step S18. Otherwise, if the storage path in the file query instruction does not have a corresponding hash association list, the file query instruction directly The storage path traverses the medical file in the server 3 (omitted in FIG. 3), and then ends the flow.
  • Step S18 The sending module 318 sends the medical file corresponding to the selected storage path in the corresponding hash association list to the client 1. Specifically, as shown in FIG. 4, if the medical file to be queried is stored The path is X2, and the sending module 318 sends the medical file A whose storage path is XI to the client.
  • the present invention adopts the above technical solution, and brings the technical effects as follows:
  • the present invention uses the hash value comparison method to find the same medical file, and deletes duplicate medical files, speeds up the access speed of the server, and reduces the server. Redundancy.

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Epidemiology (AREA)
  • Primary Health Care (AREA)
  • Public Health (AREA)
  • Biomedical Technology (AREA)
  • Business, Economics & Management (AREA)
  • General Business, Economics & Management (AREA)
  • Medical Treatment And Welfare Office Work (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

一种医疗信息化医疗文件冗余清除系统及方法,该方法包括:计算服务器上每个医疗文件的哈希值(S12);从计算的哈希值中查找相同的哈希值,将相同的哈希值归为一组,每组中相同的哈希值及该组中相同的哈希值对应的医疗文件的存储路径保存于一个哈希关联列表中(S13);在每一个哈希关联列表中选定一个存储路径,并删除该哈希关联列表中未选定的存储路径所对应的医疗文件(S14);在每一个哈希关联列表修改所删除的医疗文件对应的标识(S15);接收客户端发送过来的文件查询指令(S16);判断文件查询指令中的存储路径是否有对应的哈希关联列表(S17);若是,则将该对应的哈希关联列表中选定的存储路径对应的医疗文件发送给客户端(S18)。该方法加快了服务器的访问速度降低了服务器的冗余。

Description

发明名称:医疗信息化医疗文件冗余清除系统及方法 技术领域
[0001] 本发明涉及医疗信息化领域, 尤其涉及一种医疗信息化医疗文件冗余清除系统 及方法。
背景技术
[0002] 医疗文件是病人在医院诊断治疗全过程的原始记录, 它包含有电子病历、 医学 影像文件、 疾病百科文件、 政府医疗政策文件、 医疗科室介绍文件等等。 随着 医院计算机管理网络化, 医疗文件应运而生。 作为科技进步的产物, 医疗文件 因其方便记录, 易存储等优点被越来越广泛的应用在医疗系统中。
[0003] 进一步地, 随着移动医疗的发展, 现在越来越多的患者或医生都使用移动终端
(例如, 手机、 平板电脑等触摸屏的移动终端) 査看医疗文件并存储医疗文件 , 导致服务器可能保存多个相同的医疗文件, 如此造成服务器上医疗文件的冗 余且降低了服务器的访问速度, 因此有必要提供一种对服务器上重复的医疗文 件进行处理的信息化系统。
技术问题
[0004] 本发明的主要目的在于提供一种医疗信息化医疗文件冗余清除系统及方法, 旨 在解决对服务器上冗余的医疗文件进行清理的技术问题。
问题的解决方案
技术解决方案
[0005] 为实现上述目的, 本发明提供了一种医疗信息化医疗文件冗余清除系统, 运行 于服务器中, 所述服务器通过网络与客户端通信连接, 该系统包括:
[0006] 计算模块, 用于计算所述服务器上每个医疗文件的哈希值;
[0007] 査找模块, 用于从计算的哈希值中査找相同的哈希值, 并将相同的哈希值归为 一组, 将每组中相同的哈希值及该组中相同的哈希值对应的医疗文件的存储路 径保存于一个哈希关联列表中;
[0008] 刪除模块, 用于在每一个哈希关联列表中选定一个存储路径, 并刪除该哈希关 联列表中未选定的存储路径所对应的医疗文件;
[0009] 修改模块, 用于在每一个哈希关联列表修改所刪除的医疗文件对应的标识; [0010] 接收模块, 用于接收客户端发送过来的文件査询指令;
[0011] 判断模块, 用于判断文件査询指令中待査询的医疗文件的存储路径是否有对应 的哈希关联列表; 及
[0012] 发送模块, 用于当文件査询指令中待査询的医疗文件的存储路径有对应的哈希 关联列表, 将该对应的哈希关联列表中选定的存储路径对应的医疗文件发送给 客户端。
[0013] 优选的, 所述哈希关联列表包括四个栏位, 所述四个栏位分别为文件名、 哈希 值、 存储路径及标识。
[0014] 优选的, 所述计算模块计算所述服务器上每个医疗文件的哈希值的方式如下: 遍历服务器上的医疗文件, 并通过哈希算法计算每个医疗文件的哈希值。
[0015] 优选的, 所述计算模块通过哈希算法计算所述服务器上每个医疗文件的哈希值 , 其中, 所述哈希算法为 MD5算法。
[0016] 优选的, 所述判断模块判断文件査询指令中的存储路径是否有对应的哈希关联 列表的方式如下: 解析文件査询指令并获取待査询的医疗文件的存储路径, 将 该待査询的医疗文件的存储路径与服务器中每一个哈希关联列表进行比对, 若 服务器中有一个哈希关联列表包含待査询的医疗文件的存储路径, 则该哈希关 联列表为待査询的医疗文件的存储路径对应的哈希关联列表。
[0017] 另一方面, 本发明还提供一种医疗信息化医疗文件冗余清除方法, 应用于服务 器中, 所述服务器通过网络与客户端通信连接, 该方法包括如下步骤:
[0018] 计算所述服务器上每个医疗文件的哈希值;
[0019] 从计算的哈希值中査找相同的哈希值, 并将相同的哈希值归为一组, 将每组中 相同的哈希值及该组中相同的哈希值对应的医疗文件的存储路径保存于一个哈 希关联列表中;
[0020] 在每一个哈希关联列表中选定一个存储路径, 并刪除该哈希关联列表中未选定 的存储路径所对应的医疗文件;
[0021] 在每一个哈希关联列表修改所刪除的医疗文件对应的标识; [0022] 接收客户端发送过来的文件査询指令;
[0023] 判断文件査询指令中待査询的医疗文件的存储路径是否有对应的哈希关联列表 ; 及
[0024] 当文件査询指令中待査询的医疗文件的存储路径有对应的哈希关联列表, 将该 对应的哈希关联列表中选定的存储路径对应的医疗文件发送给客户端。
[0025] 优选的, 所述哈希关联列表包括四个栏位, 所述四个栏位分别为文件名、 哈希 值、 存储路径及标识。
[0026] 优选的, 所述计算所述服务器上每个医疗文件的哈希值的步骤包括如下步骤: 遍历服务器上的医疗文件, 并通过哈希算法计算每个医疗文件的哈希值。
[0027] 优选的, 所述服务器上每个医疗文件的哈希值通过哈希算法计算, 其中, 所述 哈希算法为 MD5算法。
[0028] 优选的, 所述判断文件査询指令中待査询的医疗文件的存储路径是否有对应的 哈希关联列表的步骤包括如下步骤: 解析文件査询指令并获取待査询的医疗文 件的存储路径, 将该待査询的医疗文件的存储路径与服务器中每一个哈希关联 列表进行比对, 若服务器中有一个哈希关联列表包含待査询的医疗文件的存储 路径, 则该哈希关联列表为待査询的医疗文件的存储路径对应的哈希关联列表 发明的有益效果
有益效果
[0029] 本发明采用上述技术方案, 带来的技术效果为: 本发明采用哈希值比对的方式 寻找相同的医疗文件, 并刪除重复的医疗文件, 加快了服务器的访问速度, 降 低了服务器的冗余。
对附图的简要说明
附图说明
[0030] 图 1是本发明医疗信息化医疗文件冗余清除系统的应用环境示意图;
[0031] 图 2是本发明医疗信息化医疗文件冗余清除系统的优选实施例的模块示意图; [0032] 图 3是本发明医疗信息化医疗文件冗余清除方法的优选实施例的流程图;
[0033] 图 4是本发明哈希关联列表的示意图。 [0034] 本发明目的实现、 功能特点及优点将结合实施例, 参照附图做进一步说明。 实施该发明的最佳实施例
本发明的最佳实施方式
[0035] 为更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效, 以下结 合附图及较佳实施例, 对本发明的具体实施方式、 结构、 特征及其功效, 详细 说明如下。 应当理解, 此处所描述的具体实施例仅仅用以解释本发明, 并不用 于限定本发明。
[0036] 参照图 1所示, 图 1是本发明医疗信息化医疗文件冗余清除系统的应用环境示意 图。 本发明中的医疗信息化医疗文件冗余清除系统 30运行于服务器 3上。 所述服 务器 3通过网络 2与多个客户端 1通信连接。 所述服务器 3上存储有各种类型的医 疗文件 (例如, 电子病历、 医学影像文件、 疾病百科文件、 政府医疗政策文件 、 医疗科室介绍文件等等) 。
[0037] 在本实施例中, 所述网络 2可以是有线通讯网络或无线通讯网络。 所述网络优 选为无线通讯网络, 包括但不限于, GSM网络、 GPRS网络、 CDMA网络、 TD-S CDMA网络、 WiMAX网络、 TD-LTE网络、 FDD-LTE网络等无线传输网络。 。
[0038] 所述客户端 1可以是, 但不限于, 智能手机、 平板电脑、 个人数字助理 (Person al Digital Assistant, PDA) 、 个人电脑、 电子看板等其它任意合适的便携式触摸 屏电子设备。 所述客户端 1用于通过网络 2访问所述服务器 3, 并获取服务器 3上 的医疗文件。 所述客户端 1还用于产生医疗文件, 并将所述产生的医疗文件发送 至服务器 3保存。
[0039] 参照图 2所示, 是本发明医疗信息化医疗文件冗余清除系统的优选实施例的模 块示意图。 在本实施例中, 所述医疗信息化医疗文件冗余清除系统 30应用于服 务器 3。 该服务器 3包括, 但不仅限于, 医疗信息化医疗文件冗余清除系统 30、 存储单元 31、 处理单元 32、 及通讯单元 33。
[0040] 所述的存储单元 31可以为一种只读存储单元 ROM, 电可擦写存储单元 EEPRO M、 快闪存储单元 FLASH或固体硬盘等。
[0041] 所述的处理单元 32可以为一种中央处理器 (Central Processing Unit, CPU) 、 微控制器 (MCU) 、 数据处理芯片、 或者具有数据处理功能的信息处理单元。 [0042] 所述的通讯单元 33为一种具有远程通讯功能的通讯接口, 例如支持 GSM、 GPR S、 WCDMA、 CDMA、 TD-SCDMA、 WiMAX、 TD-LTE、 FDD-LTE等无线通讯 技术的通讯接口, 支持 USB、 网线的有线通讯接口。
[0043] 所述医疗信息化医疗文件冗余清除系统 30包括, 但不局限于, 计算模块 312、 査找模块 313、 刪除模块 314、 修改模块 315、 接收模块 316、 判断模块 317及发送 模块 318, 本发明所称的模块是指一种能够被所述服务器 3的处理单元 32执行并 且能够完成固定功能的一系列计算机程序指令段, 其存储在所述服务器 3的存储 单元 31中。
[0044] 所述计算模块 312用于计算服务器 3上每个医疗文件的哈希值。 具体地说, 所述 计算模块 312遍历服务器 3上的医疗文件, 并通过哈希算法计算每个医疗文件的 哈希值。 所述哈希算法可以是, 但不限于, MD5算法。
[0045] 所述査找模块 313用于从计算的哈希值中査找相同的哈希值, 并将相同的哈希 值归为一组, 将每组中相同的哈希值及该组中相同的哈希值对应的医疗文件的 存储路径保存于一个哈希关联列表中。 一般而言, 由于哈希值的唯一性, 若査 找到相同的哈希值, 表明服务器 3中存在相同的医疗文件。 在本实施例中, 所述 哈希关联列表包括多个相同的哈希值及每个哈希值对应医疗文件的存储路径。 需要说明的是, 所述哈希关联列表中的哈希值都是相同的。 所述服务器 3中有多 组相同的医疗文件, 则所述査找模块 313获得多组相同的哈希值并对每组相同的 哈希值生成一个哈希关联列表。 如图四所示, 所述哈希关联列表至少包括四个 栏位, 所述四个栏位分别为文件名 (表示医疗文件的名称) 、 哈希值 (表示医 疗文件的哈希值) 、 存储路径 (表示医疗文件在服务器 3上的存储路径) 及标识 (表示医疗文件是否保留于服务器 3中, 其中, Y表示保留, N表示刪除) 。 进一 步地, 为了方便起见, 图 4中的字母 B仅仅是代指哈希值, 并不表示哈希值为 B, 而图 4中的字母 XI至 X9也仅仅是代指存储路径, 并不表示 XI至 X9为存储路径。
[0046] 所述刪除模块 314用于在每一个哈希关联列表中选定一个存储路径, 并刪除该 哈希关联列表中未选定的存储路径所对应的医疗文件。 在本实施例中, 所述刪 除模块 314选定存储路径 XI, 并在服务器 3中刪除其余存储路径为 X2至 X9对应的 医疗文件。 [0047] 所述修改模块 315用于在每一个哈希关联列表修改所刪除的医疗文件对应的标 识。 具体地说, 如图 4所示, 所述修改模块 315将哈希关联列表中 X2至 X9对应的 标识从 Y修改为 N。
[0048] 所述接收模块 316用于接收客户端 1发送过来的文件査询指令。 一般而言, 所述 客户端 1査询服务器 3上的医疗文件吋, 文件査询指令中包括待査询的医疗文件 的存储路径。
[0049] 所述判断模块 317用于判断文件査询指令中待査询的医疗文件的存储路径是否 有对应的哈希关联列表。 所述判断模块 317解析文件査询指令并获取待査询的医 疗文件的存储路径, 将该待査询的医疗文件的存储路径与服务器 3中每一个哈希 关联列表进行比对, 若服务器 3中有一个哈希关联列表包含待査询的医疗文件的 存储路径, 则该哈希关联列表为待査询的医疗文件的存储路径对应的哈希关联 列表。
[0050] 所述发送模块 318用于将该对应的哈希关联列表中选定的存储路径对应的医疗 文件发送给客户端 1。 具体而言, 如图 4所示, 若待査询的医疗文件的存储路径 为 X2, 则所述发送模块 318将存储路径为 XI对应的医疗文件 A发送给客户端 1。
[0051] 参照图 3所示, 是本发明医疗信息化医疗文件冗余清除方法的优选实施例的流 程图。 在本实施例中, 所述的医疗信息化医疗文件冗余清除方法应用于服务器 3 , 该方法包括以下步骤:
[0052] 步骤 S12: 所述计算模块 312计算服务器 3上每个医疗文件的哈希值。 具体地说 , 所述计算模块 312遍历服务器 3上的医疗文件, 并通过哈希算法计算每个医疗 文件的哈希值。 所述哈希算法可以是, 但不限于, MD5算法。
[0053] 步骤 S13: 所述査找模块 313从计算的哈希值中査找相同的哈希值, 并将相同的 哈希值归为一组, 将每组中相同的哈希值及该组中相同的哈希值对应的医疗文 件的存储路径保存于一个哈希关联列表中。 一般而言, 由于哈希值的唯一性, 若査找到相同的哈希值, 表明服务器 3中存在相同的医疗文件。 在本实施例中, 所述哈希关联列表包括多个相同的哈希值及每个哈希值对应医疗文件的存储路 径。 需要说明的是, 所述哈希关联列表中的哈希值都是相同的。 所述服务器 3中 有多组相同的医疗文件, 则所述査找模块 313获得多组相同的哈希值并对每组相 同的哈希值生成一个哈希关联列表。 如图四所示, 所述哈希关联列表至少包括 四个栏位, 所述四个栏位分别为文件名 (表示医疗文件的名称) 、 哈希值 (表 示医疗文件的哈希值) 、 存储路径 (表示医疗文件在服务器 3上的存储路径) 及 标识 (表示医疗文件是否保留于服务器 3中, 其中, Y表示保留, N表示刪除) 。 进一步地, 为了方便起见, 图 4中的字母 B仅仅是代指哈希值, 并不表示哈希值 为 B, 而图 4中的字母 XI至 X9也仅仅是代指存储路径, 并不表示 XI至 X9为存储 路径。
[0054] 步骤 S14: 所述刪除模块 314在每一个哈希关联列表中选定一个存储路径, 并刪 除该哈希关联列表中未选定的存储路径所对应的医疗文件。 在本实施例中, 所 述刪除模块 314选定存储路径 XI, 并在服务器 3中刪除其余存储路径为 X2至 X9对 应的医疗文件。
[0055] 步骤 S15: 所述修改模块 315在每一个哈希关联列表修改所刪除的医疗文件对应 的标识。 具体地说, 如图 4所示, 所述修改模块 315将哈希关联列表中 X2至 X9对 应的标识从 Y修改为 N。
[0056] 步骤 S16: 所述接收模块 316接收客户端 1发送过来的文件査询指令。 一般而言
, 所述客户端 1査询服务器 3上的医疗文件吋, 査询指令中包括待査询的医疗文 件的存储路径。
[0057] 步骤 S17: 所述判断模块 317判断文件査询指令中待査询的医疗文件的存储路径 是否有对应的哈希关联列表。 所述判断模块 317解析文件査询指令并获取待査询 的医疗文件的存储路径, 将该待査询的医疗文件的存储路径与服务器 3中每一个 哈希关联列表进行比对, 若服务器 3中有一个哈希关联列表包含待査询的医疗文 件的存储路径, 则该哈希关联列表为待査询的医疗文件的存储路径对应的哈希 关联列表。 若文件査询指令中的存储路径有对应的哈希关联列表, 流程进入步 骤 S18, 否则, 若文件査询指令中的存储路径没有对应的哈希关联列表, 则直接 通过文件査询指令中的存储路径遍历服务器 3中的医疗文件 (附图 3中进行了省 略) , 之后结束流程。
[0058] 步骤 S18: 所述发送模块 318将该对应的哈希关联列表中选定的存储路径对应的 医疗文件发送给客户端 1。 具体而言, 如图 4所示, 若待査询的医疗文件的存储 路径为 X2, 则所述发送模块 318将存储路径为 XI对应的医疗文件 A发送给客户端 1 =
[0059] 以上仅为本发明的优选实施例, 并非因此限制本发明的专利范围, 凡是利用本 发明说明书及附图内容所作的等效结构或等效流程变换, 或之间或间接运用在 其他相关的技术领域, 均同理包括在本发明的专利保护范围内。
工业实用性
[0060] 本发明采用上述技术方案, 带来的技术效果为: 本发明采用哈希值比对的方式 寻找相同的医疗文件, 并刪除重复的医疗文件, 加快了服务器的访问速度, 降 低了服务器的冗余。

Claims

权利要求书
[权利要求 1] 一种医疗信息化医疗文件冗余清除系统, 运行于服务器中, 其特征在 于, 所述服务器通过网络与客户端通信连接, 该系统包括: 计算模块 , 用于计算所述服务器上每个医疗文件的哈希值; 査找模块, 用于从 计算的哈希值中査找相同的哈希值, 并将相同的哈希值归为一组, 将 每组中相同的哈希值及该组中相同的哈希值对应的医疗文件的存储路 径保存于一个哈希关联列表中; 刪除模块, 用于在每一个哈希关联列 表中选定一个存储路径, 并刪除该哈希关联列表中未选定的存储路径 所对应的医疗文件; 修改模块, 用于在每一个哈希关联列表修改所刪 除的医疗文件对应的标识; 接收模块, 用于接收客户端发送过来的文 件査询指令; 判断模块, 用于判断文件査询指令中待査询的医疗文件 的存储路径是否有对应的哈希关联列表; 及发送模块, 用于当文件査 询指令中待査询的医疗文件的存储路径有对应的哈希关联列表, 将该 对应的哈希关联列表中选定的存储路径对应的医疗文件发送给客户端
[权利要求 2] 如权利要求 1所述的医疗信息化医疗文件冗余清除系统, 其特征在于
, 所述哈希关联列表包括四个栏位, 所述四个栏位分别为文件名、 哈 希值、 存储路径及标识。
[权利要求 3] 如权利要求 1所述的医疗信息化医疗文件冗余清除系统, 其特征在于
, 所述计算模块计算所述服务器上每个医疗文件的哈希值的方式如下 : 遍历服务器上的医疗文件, 并通过哈希算法计算每个医疗文件的哈 希值。
[权利要求 4] 如权利要求 3所述的医疗信息化医疗文件冗余清除系统, 其特征在于
, 所述计算模块通过哈希算法计算所述服务器上每个医疗文件的哈希 值, 其中, 所述哈希算法为 MD5算法。
[权利要求 5] 如权利要求 1所述的医疗信息化医疗文件冗余清除系统, 其特征在于
, 所述判断模块判断文件査询指令中待査询的医疗文件的存储路径是 否有对应的哈希关联列表的方式如下: 解析文件査询指令并获取待査 询的医疗文件的存储路径, 将该待査询的医疗文件的存储路径与服务 器中每一个哈希关联列表进行比对, 若服务器中有一个哈希关联列表 包含待査询的医疗文件的存储路径, 则该哈希关联列表为待査询的医 疗文件的存储路径对应的哈希关联列表。
一种医疗信息化医疗文件冗余清除方法, 应用于服务器中, 其特征在 于, 所述服务器通过网络与客户端通信连接, 该方法包括如下步骤: 计算所述服务器上每个医疗文件的哈希值; 从计算的哈希值中査找相 同的哈希值, 并将相同的哈希值归为一组, 将每组中相同的哈希值及 该组中相同的哈希值对应的医疗文件的存储路径保存于一个哈希关联 列表中; 在每一个哈希关联列表中选定一个存储路径, 并刪除该哈希 关联列表中未选定的存储路径所对应的医疗文件; 在每一个哈希关联 列表修改所刪除的医疗文件对应的标识; 接收客户端发送过来的文件 査询指令; 判断文件査询指令中待査询的医疗文件的存储路径是否有 对应的哈希关联列表; 及当文件査询指令中待査询的医疗文件的存储 路径有对应的哈希关联列表, 将该对应的哈希关联列表中选定的存储 路径对应的医疗文件发送给客户端。
如权利要求 6所述的医疗信息化医疗文件冗余清除方法, 其特征在于 , 所述哈希关联列表包括四个栏位, 所述四个栏位分别为文件名、 哈 希值、 存储路径及标识。
如权利要求 6所述的医疗信息化医疗文件冗余清除方法, 其特征在于 , 所述计算所述服务器上每个医疗文件的哈希值的步骤包括如下步骤 : 遍历服务器上的医疗文件, 并通过哈希算法计算每个医疗文件的哈 希值。
如权利要求 8所述的医疗信息化医疗文件冗余清除方法, 其特征在于 , 所述服务器上每个医疗文件的哈希值通过哈希算法计算, 其中, 所 述哈希算法为 MD5算法。
如权利要求 6所述的医疗信息化医疗文件冗余清除方法, 其特征在于 , 所述判断文件査询指令中待査询的医疗文件的存储路径是否有对应 的哈希关联列表的步骤包括如下步骤: 解析文件査询指令并获取待査 询的医疗文件的存储路径, 将该待査询的医疗文件的存储路径与服务 器中每一个哈希关联列表进行比对, 若服务器中有一个哈希关联列表 包含待査询的医疗文件的存储路径, 则该哈希关联列表为待査询的医 疗文件的存储路径对应的哈希关联列表。
PCT/CN2017/088347 2016-12-21 2017-06-15 医疗信息化医疗文件冗余清除系统及方法 WO2018113209A1 (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201611193986.4A CN106599262A (zh) 2016-12-21 2016-12-21 医疗信息化医疗文件冗余清除系统及方法
CN201611193986.4 2016-12-21

Publications (1)

Publication Number Publication Date
WO2018113209A1 true WO2018113209A1 (zh) 2018-06-28

Family

ID=58600386

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/CN2017/088347 WO2018113209A1 (zh) 2016-12-21 2017-06-15 医疗信息化医疗文件冗余清除系统及方法

Country Status (2)

Country Link
CN (1) CN106599262A (zh)
WO (1) WO2018113209A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110489701A (zh) * 2019-08-19 2019-11-22 安徽三实信息技术服务有限公司 提取cms识别特征的方法、装置及cms识别方法

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106777170A (zh) * 2016-12-21 2017-05-31 深圳市易特科信息技术有限公司 增强服务器访问速度的医疗信息化文件处理系统及方法
CN106599262A (zh) * 2016-12-21 2017-04-26 深圳市易特科信息技术有限公司 医疗信息化医疗文件冗余清除系统及方法
CN106649717A (zh) * 2016-12-21 2017-05-10 深圳市易特科信息技术有限公司 基于哈希值的医疗文件冗余处理系统及方法
CN111105856A (zh) * 2019-12-24 2020-05-05 中电数据服务有限公司 一种医疗数据脱敏、关联系统及方法
CN112463071B (zh) * 2020-12-11 2022-06-07 苏州浪潮智能科技有限公司 一种选择性清除非易失存储的方法及装置
CN113300976B (zh) * 2021-05-20 2022-12-27 北京字跳网络技术有限公司 一种数据的传输方法、装置、存储介质及电子设备
CN116450887B (zh) * 2023-03-03 2024-05-17 山东博鹏信息科技有限公司 一种医院信息化设备管理系统

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101582076A (zh) * 2009-06-24 2009-11-18 浪潮电子信息产业股份有限公司 一种基于数据库的重复数据删除方法
US20110125722A1 (en) * 2009-11-23 2011-05-26 Ocarina Networks Methods and apparatus for efficient compression and deduplication
CN102902762A (zh) * 2012-09-25 2013-01-30 华为技术有限公司 一种删除重复数据的方法、装置和系统
CN104123347A (zh) * 2014-07-04 2014-10-29 北京思特奇信息技术股份有限公司 一种应用于boss系统的数据重删方法及系统
CN106599260A (zh) * 2016-12-21 2017-04-26 深圳市易特科信息技术有限公司 医疗信息化重复医疗文件删除系统及方法
CN106599262A (zh) * 2016-12-21 2017-04-26 深圳市易特科信息技术有限公司 医疗信息化医疗文件冗余清除系统及方法
CN106649717A (zh) * 2016-12-21 2017-05-10 深圳市易特科信息技术有限公司 基于哈希值的医疗文件冗余处理系统及方法
CN106777170A (zh) * 2016-12-21 2017-05-31 深圳市易特科信息技术有限公司 增强服务器访问速度的医疗信息化文件处理系统及方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101582076A (zh) * 2009-06-24 2009-11-18 浪潮电子信息产业股份有限公司 一种基于数据库的重复数据删除方法
US20110125722A1 (en) * 2009-11-23 2011-05-26 Ocarina Networks Methods and apparatus for efficient compression and deduplication
CN102902762A (zh) * 2012-09-25 2013-01-30 华为技术有限公司 一种删除重复数据的方法、装置和系统
CN104123347A (zh) * 2014-07-04 2014-10-29 北京思特奇信息技术股份有限公司 一种应用于boss系统的数据重删方法及系统
CN106599260A (zh) * 2016-12-21 2017-04-26 深圳市易特科信息技术有限公司 医疗信息化重复医疗文件删除系统及方法
CN106599262A (zh) * 2016-12-21 2017-04-26 深圳市易特科信息技术有限公司 医疗信息化医疗文件冗余清除系统及方法
CN106649717A (zh) * 2016-12-21 2017-05-10 深圳市易特科信息技术有限公司 基于哈希值的医疗文件冗余处理系统及方法
CN106777170A (zh) * 2016-12-21 2017-05-31 深圳市易特科信息技术有限公司 增强服务器访问速度的医疗信息化文件处理系统及方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110489701A (zh) * 2019-08-19 2019-11-22 安徽三实信息技术服务有限公司 提取cms识别特征的方法、装置及cms识别方法

Also Published As

Publication number Publication date
CN106599262A (zh) 2017-04-26

Similar Documents

Publication Publication Date Title
WO2018113209A1 (zh) 医疗信息化医疗文件冗余清除系统及方法
WO2018113211A1 (zh) 基于哈希值的医疗文件冗余处理系统及方法
WO2018113210A1 (zh) 医疗信息化重复医疗文件删除系统及方法
US10949405B2 (en) Data deduplication device, data deduplication method, and data deduplication program
US9251160B1 (en) Data transfer between dissimilar deduplication systems
CN102782643B (zh) 使用布隆过滤器的索引搜索
US8255365B2 (en) Source classification for performing deduplication in a backup operation
US8458144B2 (en) Data deduplication method using file system constructs
US7870392B2 (en) Digital fingerprinting for management and recovery of data objects
CN103548003B (zh) 用于提高去重复系统备份性能的客户端侧指纹缓存的方法和系统
WO2018113212A1 (zh) 增强服务器访问速度的医疗信息化文件处理系统及方法
US8712216B1 (en) Selection of hash lookup keys for efficient retrieval
US8634947B1 (en) System and method for identifying digital files
US10983867B1 (en) Fingerprint change during data operations
EP3839785B1 (en) Characterizing malware files for similarity searching
US20180143979A1 (en) Method for segmenting and indexing features from multidimensional data
WO2018153030A1 (zh) 医疗信息化基于网页的医生评级推荐系统及方法
TWI420333B (zh) 分散式的重複數據刪除系統及其處理方法
US11163748B1 (en) Fingerprint backward compatibility in deduplication backup systems
US10606844B1 (en) Method and apparatus for identifying legitimate files using partial hash based cloud reputation
US20190188183A1 (en) Handling weakening of hash functions by using epochs
US9189488B2 (en) Determination of landmarks
CN105574028B (zh) 信息检索方法和装置
CN117407372A (zh) 一种上传文件去重方法及系统
CN114676096A (zh) 索引存储方法、文件查找方法、装置、电子设备和介质

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 17883052

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 17883052

Country of ref document: EP

Kind code of ref document: A1