WO2018113211A1 - 基于哈希值的医疗文件冗余处理系统及方法 - Google Patents

基于哈希值的医疗文件冗余处理系统及方法 Download PDF

Info

Publication number
WO2018113211A1
WO2018113211A1 PCT/CN2017/088349 CN2017088349W WO2018113211A1 WO 2018113211 A1 WO2018113211 A1 WO 2018113211A1 CN 2017088349 W CN2017088349 W CN 2017088349W WO 2018113211 A1 WO2018113211 A1 WO 2018113211A1
Authority
WO
WIPO (PCT)
Prior art keywords
hash
hash value
medical file
client
association list
Prior art date
Application number
PCT/CN2017/088349
Other languages
English (en)
French (fr)
Inventor
张贯京
葛新科
王海荣
Original Assignee
深圳市易特科信息技术有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 深圳市易特科信息技术有限公司 filed Critical 深圳市易特科信息技术有限公司
Publication of WO2018113211A1 publication Critical patent/WO2018113211A1/zh

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H40/00ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices
    • G16H40/60ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices for the operation of medical equipment or devices
    • G16H40/67ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices for the operation of medical equipment or devices for remote operation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/13File access structures, e.g. distributed indices
    • G06F16/137Hash-based
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/16File or folder operations, e.g. details of user interfaces specifically adapted to file systems
    • G06F16/162Delete operations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/17Details of further file system functions
    • G06F16/174Redundancy elimination performed by the file system
    • G06F16/1748De-duplication implemented within the file system, e.g. based on file segments
    • G06F19/32
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/60ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records

Definitions

  • the present invention relates to the field of medical information, and in particular, to a medical file redundancy processing system and method based on a hash value.
  • the medical file is the original record of the patient's diagnosis and treatment in the hospital. It contains electronic medical records, medical image files, disease encyclopedia documents, government medical policy documents, medical department introduction documents and so on. With the network management of hospital computers, medical documents came into being. As a product of technological advancement, medical documents have been increasingly used in medical systems for their convenience in recording and storage.
  • a mobile terminal with a touch screen such as a mobile phone or a tablet
  • Viewing medical files and storing medical files causes the server to save multiple identical medical files, thus causing redundancy of medical files on the server and reducing server access speed. It is therefore necessary to provide an information system that processes duplicate medical files on the server.
  • a primary object of the present invention is to provide a medical file redundancy processing system and method based on a hash value, which aims to solve the technical problem of cleaning redundant medical files on a server.
  • the present invention provides a medical file redundancy processing system based on a hash value, which is operated in a server, and the server is connected to a client through a network, and the system includes:
  • a calculation module configured to calculate a hash value of each medical file on the server
  • a search module configured to find the same hash value from the calculated hash value, and group the same hash value into a group, and the same hash value in each group and the same hash in the group
  • the storage path of the medical file corresponding to the Greek value is stored in a hash association list
  • a deleting module configured to select a storage path in each hash association list, and delete the hash switch a medical file corresponding to the unselected storage path in the list;
  • a modifying module configured to modify, in each hash association list, an identifier corresponding to the deleted medical file
  • a receiving module configured to receive a medical file sent by the client
  • the calculation module is further configured to calculate a hash value of the medical file sent by the client;
  • the determining module is configured to determine whether a hash value of the medical file sent by the client has a corresponding hash association list
  • the deleting module is further configured to: when the hash value of the medical file sent by the client has a corresponding hash association list, delete the medical file sent by the client;
  • the saving module is configured to: when the hash value of the medical file sent by the client does not have a corresponding hash association list, save the medical file sent by the client to the server.
  • the hash association list includes four fields, and the four fields are a file name, a hash value, a storage path, and an identifier.
  • the calculating module calculates a hash value of each medical file on the server as follows: traverses the medical file on the server, and calculates a hash value of each medical file by using a hash algorithm.
  • the calculation module calculates a hash value of each medical file on the server by using a hash algorithm, where the hash algorithm is an MD5 algorithm.
  • the determining module determines whether the hash value of the medical file sent by the client has a corresponding hash association list as follows: determining whether a hash association list in the server includes the client The hash value of the sent medical file, if there is a hash association list in the server that contains the hash value of the medical file sent by the client, the hash association list is the medical file sent by the client. A list of hashes corresponding to the hash value.
  • the present invention further provides a method for processing a medical file redundancy based on a hash value, which is applied to a server, wherein the server communicates with a client through a network, and the method includes the following steps:
  • the hash association list includes four fields, and the four fields are a file name, a hash value, a storage path, and an identifier.
  • the step of calculating a hash value of each medical file on the server comprises the steps of: traversing a medical file on the server, and calculating a hash value of each medical file by using a hash algorithm.
  • the hash value of each medical file on the server is calculated by a hash algorithm, where the hash algorithm is an MD5 algorithm.
  • the step of determining whether the hash value of the medical file sent by the client has a corresponding hash association list comprises the following steps: determining whether a hash association list in the server includes the client The hash value of the sent medical file, if there is a hash association list in the server that contains the hash value of the medical file sent by the client, the hash association list is the medical file sent by the client. A list of hashes corresponding to the hash value.
  • the present invention adopts the above technical solution, and brings the technical effects as follows:
  • the present invention uses the hash value comparison method to find the same medical file, and deletes duplicate medical files, speeds up the access speed of the server, and reduces the server. Redundancy.
  • FIG. 1 is a schematic diagram of an application environment of a medical file redundancy processing system based on a hash value according to the present invention
  • FIG. 2 is a block diagram of a preferred embodiment of a hash value based medical file redundancy processing system of the present invention
  • FIG. 3 is a flow chart of a preferred embodiment of a hash value-based medical file redundancy processing method according to the present invention
  • FIG. 4 is a schematic diagram of a hash association list of the present invention.
  • FIG. 1 is a schematic diagram of an application environment of a medical file redundancy processing system based on a hash value according to the present invention.
  • the hash value based medical file redundancy processing system 30 of the present invention runs on the server 3.
  • the server 3 is communicatively coupled to a plurality of clients 1 via the network 2.
  • the server 3 stores various types of medical documents (for example, electronic medical records, medical image files, disease encyclopedia files, government medical policy documents, medical department introduction documents, etc.).
  • the network 2 may be a wired communication network or a wireless communication network.
  • the network is preferably a wireless communication network, including but not limited to a GSM network, a GPRS network, a CDMA network, a TD-S CDMA network, a WiMAX network, a TD-LTE network, an FDD-LTE network, and the like. .
  • the client 1 may be, but is not limited to, any other suitable portable touch screen electronic device such as a smart phone, a tablet computer, a personal digital assistant (PDA), a personal computer, an electronic signboard, and the like.
  • the client 1 is used to access the server 3 through the network 2 and obtain medical files on the server 3.
  • the client 1 is also used to generate a medical file, and the generated medical file is sent to the server 3 for storage.
  • FIG. 2 it is a block diagram of a preferred embodiment of a hash value based medical file redundancy processing system of the present invention.
  • the hash value based medical file redundancy processing system 30 is applied to the server 3.
  • the server 3 includes, but is not limited to, a hash value based medical file redundancy processing system 30, a storage unit 31, a processing unit 32, and a communication unit 33.
  • the storage unit 31 may be a read only storage unit ROM, an electrically erasable storage unit EEPRO M, flash memory unit FLASH or solid hard disk.
  • the processing unit 32 may be a central processing unit (CPU), a microcontroller (MCU), a data processing chip, or an information processing unit having a data processing function.
  • CPU central processing unit
  • MCU microcontroller
  • data processing chip or an information processing unit having a data processing function.
  • the communication unit 33 is a communication interface with a remote communication function, for example, supporting GSM, GPR.
  • the communication interface of wireless communication technologies such as S, WCDMA, CDMA, TD-SCDMA, WiMAX, TD-LTE, FDD-LTE, and the wired communication interface supporting USB and network cable.
  • the hash value based medical file redundancy processing system 30 includes, but is not limited to, a calculation module 311
  • the search module 312, the delete module 313, the modification module 314, the receive module 315, the determination module 316, and the save module 317 which are referred to as a module that can be executed by the processing unit 32 of the server 3 and can be fixed.
  • a series of computer program instructions which are stored in the storage unit 31 of the server 3.
  • the calculation module 311 is configured to calculate a hash value of each medical file on the server 3. Specifically, the calculation module 311 traverses the medical files on the server 3 and calculates a hash value of each medical file by a hash algorithm.
  • the hash algorithm may be, but is not limited to, an MD5 algorithm.
  • the searching module 312 is configured to search for the same hash value from the calculated hash values, and group the same hash values into a group, and the same hash value in each group is the same as the same in the group.
  • the storage path of the medical file corresponding to the hash value is stored in a hash association list.
  • the hash association list includes a plurality of identical hash values and a storage path of each hash value corresponding to the medical file. It should be noted that the hash values in the hash association list are the same.
  • the server 3 has multiple sets of identical medical files, and the lookup module 312 obtains multiple sets of identical hash values and generates a hashed list for each set of identical hash values.
  • the hash association list includes at least four fields, where the four fields are a file name (representing the name of the medical file), a hash value (representing a hash value of the medical file), The storage path (representing the storage path of the medical file on the server 3) and the identification (representing whether the medical file remains in the server 3, where Y indicates reservation and N indicates deletion).
  • the letter B in FIG. 4 merely refers to the hash value, and does not mean that the hash value is B
  • the letters XI to X9 in FIG. 4 are merely referring to the storage path, and do not indicate XI to X9 are storage paths.
  • the deleting module 313 is configured to select one storage path in each hash association list, and delete the The medical file corresponding to the unselected storage path in the hash association list.
  • the deleting module 313 selects the storage path XI, and deletes the medical files corresponding to the remaining storage paths X2 to X9 in the server 3.
  • the modification module 314 is configured to modify the identifier corresponding to the deleted medical file in each hash association list. Specifically, as shown in FIG. 4, the modification module 314 modifies the identifier corresponding to X2 to X9 in the hash association list from Y to N.
  • the receiving module 315 is configured to receive a medical file sent by the client 1.
  • the hash value of the medical file sent by the client 1 is temporarily stored in the memory of the server 3.
  • the calculation module 311 is further configured to calculate a hash value of the medical file sent by the client 1.
  • the determining module 316 is configured to determine whether the hash value of the medical file sent by the client 1 has a corresponding hash association list.
  • the determining module 316 performs a query by using a hash value of the medical file sent by the client 1, and determines whether the hash association list includes a hash value of the medical file sent by the client 1, if the server 3 There is a hash association list containing a hash value of the medical file sent by the client 1, and the hash association list is a hash association list corresponding to the hash value of the medical file sent by the client 1. .
  • the deleting module 313 is configured to delete a medical file sent by the client 1 when the hash value of the medical file sent by the client 1 has a corresponding hash association list.
  • the hash value of the medical file sent by the client 1 is deleted from the memory of the server 3.
  • the saving module 317 is configured to save the medical file sent by the client 1 in the server 3 when the hash value of the medical file sent by the client 1 does not have a corresponding hash association list.
  • the hash value of the medical file sent by the client 1 is stored in the storage unit 31 of the server 3 or in a database (not shown).
  • FIG. 3 there is shown a flow chart of a preferred embodiment of the hash value based medical file redundancy processing method of the present invention.
  • the hash value-based medical file redundancy processing method is applied to the server 3, and the method includes the following steps:
  • Step S11 The calculation module 311 calculates a hash value of each medical file on the server 3. Specifically, the calculation module 311 traverses the medical files on the server 3 and calculates a hash value of each medical file by a hash algorithm.
  • the hash algorithm may be, but is not limited to, an MD5 algorithm.
  • Step S12 The lookup module 312 searches for the same hash value from the calculated hash values, and groups the same hash values into a group, and the same hash value in each group and the group The storage path of the medical file corresponding to the same hash value is stored in a hash association list.
  • the hash association list includes a plurality of identical hash values and a storage path of each hash value corresponding to the medical file. It should be noted that the hash values in the hash association list are the same.
  • the server 3 has multiple sets of identical medical files, and the lookup module 312 obtains multiple sets of identical hash values and generates a hash association list for each set of identical hash values. As shown in FIG.
  • the hash association list includes at least four fields, where the four fields are a file name (representing the name of the medical file), a hash value (representing a hash value of the medical file), The storage path (representing the storage path of the medical file on the server 3) and the identification (representing whether the medical file remains in the server 3, where Y indicates reservation and N indicates deletion).
  • the letter B in FIG. 4 merely refers to the hash value, and does not mean that the hash value is B
  • the letters XI to X9 in FIG. 4 are merely referring to the storage path, and do not indicate XI to X9 are storage paths.
  • Step S13 The deleting module 313 selects one storage path in each hash association list, and deletes the medical file corresponding to the unselected storage path in the hash association list.
  • the deletion module 313 selects the storage path XI, and deletes the remaining medical files corresponding to the storage paths X2 to X9 in the server 3.
  • Step S14 The modification module 314 modifies the identifier corresponding to the deleted medical file in each hash association list. Specifically, as shown in FIG. 4, the modification module 314 modifies the identifier corresponding to X2 to X9 in the hash association list from Y to N.
  • Step S15 The receiving module 315 receives the medical file sent by the client 1.
  • the hash value of the medical file sent by the client 1 is temporarily stored in the memory of the server 3.
  • Step S16 The calculation module 311 calculates a hash value of the medical file sent by the client 1.
  • Step S17 The determining module 316 determines whether the hash value of the medical file sent by the client 1 has a corresponding hash association list.
  • the determining module 316 performs a query by using a hash value of the medical file sent by the client 1, and determines whether the hash association list includes a hash value of the medical file sent by the client 1, if the server 3 There is a hash association list containing the client 1 sent
  • the hash value of the incoming medical file is the hash association list corresponding to the hash value of the medical file sent by the client 1. If the hash value of the medical file sent by the client 1 has a corresponding hash association list, the process proceeds to step S18. Otherwise, if the hash value of the medical file sent by the client 1 does not have a corresponding hash. If the list is associated, the flow proceeds to step S19.
  • Step S18 The deleting module 313 deletes the medical file sent by the client 1.
  • the hash value of the medical file sent by the client 1 is deleted from the memory of the server 3.
  • Step S19 The saving module 317 saves the medical file sent by the client 1 in the server 3.
  • the hash value of the medical file sent by the client 1 is stored in the storage unit 31 of the server 3 or in a database (not shown).
  • the present invention adopts the above technical solution, and brings the technical effects as follows:
  • the present invention uses the hash value comparison method to find the same medical file, and deletes duplicate medical files, speeds up the access speed of the server, and reduces the server. Redundancy.

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Human Computer Interaction (AREA)
  • Biomedical Technology (AREA)
  • Epidemiology (AREA)
  • Primary Health Care (AREA)
  • Public Health (AREA)
  • Business, Economics & Management (AREA)
  • General Business, Economics & Management (AREA)
  • Medical Treatment And Welfare Office Work (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

一种基于哈希值的医疗文件冗余处理系统及方法,该方法包括:通过哈希算法计算每个医疗文件的哈希值;查找相同的哈希值,将相同的哈希值及相同的哈希值对应的医疗文件的存储路径保存于一个哈希关联列表中;在每一个哈希关联列表修改所删除的医疗文件对应的标识;接收客户端发送过来的医疗文件;计算所述客户端发送过来的医疗文件的哈希值;当所述客户端发送过来的医疗文件的哈希值有对应的哈希关联列表,删除所述客户端发送过来的医疗文件;当所述客户端发送过来的医疗文件的哈希值没有对应的哈希关联列表,将所述客户端发送过来的医疗文件保存于服务器中。该方法可以加快服务器的访问速度并降低服务器的冗余。

Description

基于哈希值的医疗文件冗余处理系统及方法 技术领域
[0001] 本发明涉及医疗信息化领域, 尤其涉及一种基于哈希值的医疗文件冗余处理系 统及方法。
背景技术
[0002] 医疗文件是病人在医院诊断治疗全过程的原始记录, 它包含有电子病历、 医学 影像文件、 疾病百科文件、 政府医疗政策文件、 医疗科室介绍文件等等。 随着 医院计算机管理网络化, 医疗文件应运而生。 作为科技进步的产物, 医疗文件 因其方便记录, 易存储等优点被越来越广泛的应用在医疗系统中。
[0003] 进一步地, 随着移动医疗的发展, 现在越来越多的患者或医生都使用移动终端
(例如, 手机、 平板电脑等触摸屏的移动终端) 査看医疗文件并存储医疗文件 , 导致服务器可能保存多个相同的医疗文件, 如此造成服务器上医疗文件的冗 余且降低了服务器的访问速度, 因此有必要提供一种对服务器上重复的医疗文 件进行处理的信息化系统。
技术问题
[0004] 本发明的主要目的在于提供一种基于哈希值的医疗文件冗余处理系统及方法, 旨在解决对服务器上冗余的医疗文件进行清理的技术问题。
问题的解决方案
技术解决方案
[0005] 为实现上述目的, 本发明提供了一种基于哈希值的医疗文件冗余处理系统, 运 行于服务器中, 所述服务器通过网络与客户端通信连接, 该系统包括:
[0006] 计算模块, 用于计算所述服务器上每个医疗文件的哈希值;
[0007] 査找模块, 用于从计算的哈希值中査找相同的哈希值, 并将相同的哈希值归为 一组, 将每组中相同的哈希值及该组中相同的哈希值对应的医疗文件的存储路 径保存于一个哈希关联列表中;
[0008] 刪除模块, 用于在每一个哈希关联列表中选定一个存储路径, 并刪除该哈希关 联列表中未选定的存储路径所对应的医疗文件;
[0009] 修改模块, 用于在每一个哈希关联列表修改所刪除的医疗文件对应的标识; [0010] 接收模块, 用于接收客户端发送过来的医疗文件;
[0011] 所述计算模块, 还用于计算所述客户端发送过来的医疗文件的哈希值;
[0012] 所述判断模块, 用于判断所述客户端发送过来的医疗文件的哈希值是否有对应 的哈希关联列表;
[0013] 所述刪除模块, 还用于当所述客户端发送过来的医疗文件的哈希值有对应的哈 希关联列表, 刪除所述客户端发送过来的医疗文件; 及
[0014] 保存模块, 用于当所述客户端发送过来的医疗文件的哈希值没有对应的哈希关 联列表, 将所述客户端发送过来的医疗文件保存于服务器中。
[0015] 优选的, 所述哈希关联列表包括四个栏位, 所述四个栏位分别为文件名、 哈希 值、 存储路径及标识。
[0016] 优选的, 所述计算模块计算所述服务器上每个医疗文件的哈希值的方式如下: 遍历服务器上的医疗文件, 并通过哈希算法计算每个医疗文件的哈希值。
[0017] 优选的, 所述计算模块通过哈希算法计算所述服务器上每个医疗文件的哈希值 , 其中, 所述哈希算法为 MD5算法。
[0018] 优选的, 所述判断模块判断所述客户端发送过来的医疗文件的哈希值是否有对 应的哈希关联列表的方式如下: 判断服务器中是否有哈希关联列表包含所述客 户端发送过来的医疗文件的哈希值, 若服务器中有一个哈希关联列表包含所述 客户端发送过来的医疗文件的哈希值, 则该哈希关联列表为所述客户端发送过 来的医疗文件的哈希值对应的哈希关联列表。
[0019] 另一方面, 本发明还提供一种基于哈希值的医疗文件冗余处理方法, 应用于服 务器中, 所述服务器通过网络与客户端通信连接, 该方法包括如下步骤:
[0020] 计算所述服务器上每个医疗文件的哈希值;
[0021] 从计算的哈希值中査找相同的哈希值, 并将相同的哈希值归为一组, 将每组中 相同的哈希值及该组中相同的哈希值对应的医疗文件的存储路径保存于一个哈 希关联列表中;
[0022] 在每一个哈希关联列表中选定一个存储路径, 并刪除该哈希关联列表中未选定 的存储路径所对应的医疗文件;
[0023] 在每一个哈希关联列表修改所刪除的医疗文件对应的标识;
[0024] 接收客户端发送过来的医疗文件;
[0025] 计算所述客户端发送过来的医疗文件的哈希值;
[0026] 当所述客户端发送过来的医疗文件的哈希值有对应的哈希关联列表, 刪除所述 客户端发送过来的医疗文件; 及
[0027] 当所述客户端发送过来的医疗文件的哈希值没有对应的哈希关联列表, 将所述 客户端发送过来的医疗文件保存于服务器中。
[0028] 优选的, 所述哈希关联列表包括四个栏位, 所述四个栏位分别为文件名、 哈希 值、 存储路径及标识。
[0029] 优选的, 所述计算所述服务器上每个医疗文件的哈希值的步骤包括如下步骤: 遍历服务器上的医疗文件, 并通过哈希算法计算每个医疗文件的哈希值。
[0030] 优选的, 所述服务器上每个医疗文件的哈希值通过哈希算法计算, 其中, 所述 哈希算法为 MD5算法。
[0031] 优选的, 所述判断所述客户端发送过来的医疗文件的哈希值是否有对应的哈希 关联列表的步骤包括如下步骤: 判断服务器中是否有哈希关联列表包含所述客 户端发送过来的医疗文件的哈希值, 若服务器中有一个哈希关联列表包含所述 客户端发送过来的医疗文件的哈希值, 则该哈希关联列表为所述客户端发送过 来的医疗文件的哈希值对应的哈希关联列表。
发明的有益效果
有益效果
[0032] 本发明采用上述技术方案, 带来的技术效果为: 本发明采用哈希值比对的方式 寻找相同的医疗文件, 并刪除重复的医疗文件, 加快了服务器的访问速度, 降 低了服务器的冗余。
对附图的简要说明
附图说明
[0033] 图 1是本发明基于哈希值的医疗文件冗余处理系统的应用环境示意图;
[0034] 图 2是本发明基于哈希值的医疗文件冗余处理系统的优选实施例的模块示意图 [0035] 图 3是本发明基于哈希值的医疗文件冗余处理方法的优选实施例的流程图; [0036] 图 4是本发明哈希关联列表的示意图。
[0037] 本发明目的实现、 功能特点及优点将结合实施例, 参照附图做进一步说明。
实施该发明的最佳实施例
本发明的最佳实施方式
[0038] 为更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效, 以下结 合附图及较佳实施例, 对本发明的具体实施方式、 结构、 特征及其功效, 详细 说明如下。 应当理解, 此处所描述的具体实施例仅仅用以解释本发明, 并不用 于限定本发明。
[0039] 参照图 1所示, 图 1是本发明基于哈希值的医疗文件冗余处理系统的应用环境示 意图。 本发明中的基于哈希值的医疗文件冗余处理系统 30运行于服务器 3上。 所 述服务器 3通过网络 2与多个客户端 1通信连接。 所述服务器 3上存储有各种类型 的医疗文件 (例如, 电子病历、 医学影像文件、 疾病百科文件、 政府医疗政策 文件、 医疗科室介绍文件等等) 。
[0040] 在本实施例中, 所述网络 2可以是有线通讯网络或无线通讯网络。 所述网络优 选为无线通讯网络, 包括但不限于, GSM网络、 GPRS网络、 CDMA网络、 TD-S CDMA网络、 WiMAX网络、 TD-LTE网络、 FDD-LTE网络等无线传输网络。 。
[0041] 所述客户端 1可以是, 但不限于, 智能手机、 平板电脑、 个人数字助理 (Person al Digital Assistant, PDA) 、 个人电脑、 电子看板等其它任意合适的便携式触摸 屏电子设备。 所述客户端 1用于通过网络 2访问所述服务器 3, 并获取服务器 3上 的医疗文件。 所述客户端 1还用于产生医疗文件, 并将所述产生的医疗文件发送 至服务器 3保存。
[0042] 参照图 2所示, 是本发明基于哈希值的医疗文件冗余处理系统的优选实施例的 模块示意图。 在本实施例中, 所述基于哈希值的医疗文件冗余处理系统 30应用 于服务器 3。 该服务器 3包括, 但不仅限于, 基于哈希值的医疗文件冗余处理系 统 30、 存储单元 31、 处理单元 32、 及通讯单元 33。
[0043] 所述的存储单元 31可以为一种只读存储单元 ROM, 电可擦写存储单元 EEPRO M、 快闪存储单元 FLASH或固体硬盘等。
[0044] 所述的处理单元 32可以为一种中央处理器 (Central Processing Unit, CPU) 、 微控制器 (MCU) 、 数据处理芯片、 或者具有数据处理功能的信息处理单元。
[0045] 所述的通讯单元 33为一种具有远程通讯功能的通讯接口, 例如支持 GSM、 GPR
S、 WCDMA、 CDMA、 TD-SCDMA、 WiMAX、 TD-LTE、 FDD-LTE等无线通讯 技术的通讯接口, 支持 USB、 网线的有线通讯接口。
[0046] 所述基于哈希值的医疗文件冗余处理系统 30包括, 但不局限于, 计算模块 311
、 査找模块 312、 刪除模块 313、 修改模块 314、 接收模块 315、 判断模块 316及保 存模块 317, 本发明所称的模块是指一种能够被所述服务器 3的处理单元 32执行 并且能够完成固定功能的一系列计算机程序指令段, 其存储在所述服务器 3的存 储单元 31中。
[0047] 所述计算模块 311用于计算服务器 3上每个医疗文件的哈希值。 具体地说, 所述 计算模块 311遍历服务器 3上的医疗文件, 并通过哈希算法计算每个医疗文件的 哈希值。 所述哈希算法可以是, 但不限于, MD5算法。
[0048] 所述査找模块 312用于从计算的哈希值中査找相同的哈希值, 并将相同的哈希 值归为一组, 将每组中相同的哈希值及该组中相同的哈希值对应的医疗文件的 存储路径保存于一个哈希关联列表中。 一般而言, 由于哈希值的唯一性, 若査 找到相同的哈希值, 表明服务器 3中存在相同的医疗文件。 在本实施例中, 所述 哈希关联列表包括多个相同的哈希值及每个哈希值对应医疗文件的存储路径。 需要说明的是, 所述哈希关联列表中的哈希值都是相同的。 所述服务器 3中有多 组相同的医疗文件, 则所述査找模块 312获得多组相同的哈希值并对每组相同的 哈希值生成一个哈希关联列表。 如图四所示, 所述哈希关联列表至少包括四个 栏位, 所述四个栏位分别为文件名 (表示医疗文件的名称) 、 哈希值 (表示医 疗文件的哈希值) 、 存储路径 (表示医疗文件在服务器 3上的存储路径) 及标识 (表示医疗文件是否保留于服务器 3中, 其中, Y表示保留, N表示刪除) 。 进一 步地, 为了方便起见, 图 4中的字母 B仅仅是代指哈希值, 并不表示哈希值为 B, 而图 4中的字母 XI至 X9也仅仅是代指存储路径, 并不表示 XI至 X9为存储路径。
[0049] 所述刪除模块 313用于在每一个哈希关联列表中选定一个存储路径, 并刪除该 哈希关联列表中未选定的存储路径所对应的医疗文件。 在本实施例中, 所述刪 除模块 313选定存储路径 XI, 并在服务器 3中刪除其余存储路径为 X2至 X9对应的 医疗文件。
[0050] 所述修改模块 314用于在每一个哈希关联列表修改所刪除的医疗文件对应的标 识。 具体地说, 如图 4所示, 所述修改模块 314将哈希关联列表中 X2至 X9对应的 标识从 Y修改为 N。
[0051] 所述接收模块 315用于接收客户端 1发送过来的医疗文件。 所述客户端 1发送过 来的医疗文件的哈希值暂存于服务器 3的内存中。
[0052] 所述计算模块 311还用于计算所述客户端 1发送过来的医疗文件的哈希值。
[0053] 所述判断模块 316用于判断所述客户端 1发送过来的医疗文件的哈希值是否有对 应的哈希关联列表。 所述判断模块 316通过所述客户端 1发送过来的医疗文件的 哈希值进行査询, 判断是否有哈希关联列表包含所述客户端 1发送过来的医疗文 件的哈希值, 若服务器 3中有一个哈希关联列表包含所述客户端 1发送过来的医 疗文件的哈希值, 则该哈希关联列表为所述客户端 1发送过来的医疗文件的哈希 值对应的哈希关联列表。
[0054] 所述刪除模块 313用于当所述客户端 1发送过来的医疗文件的哈希值有对应的哈 希关联列表, 刪除所述客户端 1发送过来的医疗文件。 所述客户端 1发送过来的 医疗文件的哈希值从所述服务器 3的内存中刪除。
[0055] 所述保存模块 317用于当所述客户端 1发送过来的医疗文件的哈希值没有对应的 哈希关联列表, 将所述客户端 1发送过来的医疗文件保存于服务器 3中。 所述客 户端 1发送过来的医疗文件的哈希值保存于服务器 3的存储单元 31中或数据库 ( 图中未示出) 中。
[0056] 参照图 3所示, 是本发明基于哈希值的医疗文件冗余处理方法的优选实施例的 流程图。 在本实施例中, 所述的基于哈希值的医疗文件冗余处理方法应用于服 务器 3, 该方法包括以下步骤:
[0057] 步骤 S11 : 所述计算模块 311计算服务器 3上每个医疗文件的哈希值。 具体地说 , 所述计算模块 311遍历服务器 3上的医疗文件, 并通过哈希算法计算每个医疗 文件的哈希值。 所述哈希算法可以是, 但不限于, MD5算法。 [0058] 步骤 S12: 所述査找模块 312从计算的哈希值中査找相同的哈希值, 并将相同的 哈希值归为一组, 将每组中相同的哈希值及该组中相同的哈希值对应的医疗文 件的存储路径保存于一个哈希关联列表中。 一般而言, 由于哈希值的唯一性, 若査找到相同的哈希值, 表明服务器 3中存在相同的医疗文件。 在本实施例中, 所述哈希关联列表包括多个相同的哈希值及每个哈希值对应医疗文件的存储路 径。 需要说明的是, 所述哈希关联列表中的哈希值都是相同的。 所述服务器 3中 有多组相同的医疗文件, 则所述査找模块 312获得多组相同的哈希值并对每组相 同的哈希值生成一个哈希关联列表。 如图四所示, 所述哈希关联列表至少包括 四个栏位, 所述四个栏位分别为文件名 (表示医疗文件的名称) 、 哈希值 (表 示医疗文件的哈希值) 、 存储路径 (表示医疗文件在服务器 3上的存储路径) 及 标识 (表示医疗文件是否保留于服务器 3中, 其中, Y表示保留, N表示刪除) 。 进一步地, 为了方便起见, 图 4中的字母 B仅仅是代指哈希值, 并不表示哈希值 为 B, 而图 4中的字母 XI至 X9也仅仅是代指存储路径, 并不表示 XI至 X9为存储 路径。
[0059] 步骤 S13: 所述刪除模块 313在每一个哈希关联列表中选定一个存储路径, 并刪 除该哈希关联列表中未选定的存储路径所对应的医疗文件。 在本实施例中, 所 述刪除模块 313选定存储路径 XI, 并在服务器 3中刪除其余存储路径为 X2至 X9对 应的医疗文件。
[0060] 步骤 S14: 所述修改模块 314在每一个哈希关联列表修改所刪除的医疗文件对应 的标识。 具体地说, 如图 4所示, 所述修改模块 314将哈希关联列表中 X2至 X9对 应的标识从 Y修改为 N。
[0061] 步骤 S15: 所述接收模块 315接收客户端 1发送过来的医疗文件。 所述客户端 1发 送过来的医疗文件的哈希值暂存于服务器 3的内存中。
[0062] 步骤 S16: 所述计算模块 311计算所述客户端 1发送过来的医疗文件的哈希值。
[0063] 步骤 S17: 所述判断模块 316判断所述客户端 1发送过来的医疗文件的哈希值是 否有对应的哈希关联列表。 所述判断模块 316通过所述客户端 1发送过来的医疗 文件的哈希值进行査询, 判断是否有哈希关联列表包含所述客户端 1发送过来的 医疗文件的哈希值, 若服务器 3中有一个哈希关联列表包含所述客户端 1发送过 来的医疗文件的哈希值, 则该哈希关联列表为所述客户端 1发送过来的医疗文件 的哈希值对应的哈希关联列表。 若所述客户端 1发送过来的医疗文件的哈希值有 对应的哈希关联列表, 流程进入步骤 S18, 否则, 若所述客户端 1发送过来的医 疗文件的哈希值没有对应的哈希关联列表, 则流程进入步骤 S19。
[0064] 步骤 S18: 所述刪除模块 313刪除所述客户端 1发送过来的医疗文件。 所述客户 端 1发送过来的医疗文件的哈希值从所述服务器 3的内存中刪除。
[0065] 步骤 S19: 所述保存模块 317将所述客户端 1发送过来的医疗文件保存于服务器 3 中。 所述客户端 1发送过来的医疗文件的哈希值保存于服务器 3的存储单元 31中 或数据库 (图中未示出) 中。
[0066] 以上仅为本发明的优选实施例, 并非因此限制本发明的专利范围, 凡是利用本 发明说明书及附图内容所作的等效结构或等效流程变换, 或之间或间接运用在 其他相关的技术领域, 均同理包括在本发明的专利保护范围内。
工业实用性
[0067] 本发明采用上述技术方案, 带来的技术效果为: 本发明采用哈希值比对的方式 寻找相同的医疗文件, 并刪除重复的医疗文件, 加快了服务器的访问速度, 降 低了服务器的冗余。

Claims

权利要求书
一种基于哈希值的医疗文件冗余处理系统, 运行于服务器中, 其特征 在于, 所述服务器通过网络与客户端通信连接, 该系统包括: 计算模 块, 用于计算所述服务器上每个医疗文件的哈希值; 査找模块, 用于 从计算的哈希值中査找相同的哈希值, 并将相同的哈希值归为一组, 将每组中相同的哈希值及该组中相同的哈希值对应的医疗文件的存储 路径保存于一个哈希关联列表中; 刪除模块, 用于在每一个哈希关联 列表中选定一个存储路径, 并刪除该哈希关联列表中未选定的存储路 径所对应的医疗文件; 修改模块, 用于在每一个哈希关联列表修改所 刪除的医疗文件对应的标识; 接收模块, 用于接收客户端发送过来的 医疗文件; 所述计算模块, 还用于计算所述客户端发送过来的医疗文 件的哈希值; 所述判断模块, 用于判断所述客户端发送过来的医疗文 件的哈希值是否有对应的哈希关联列表; 所述刪除模块, 还用于当所 述客户端发送过来的医疗文件的哈希值有对应的哈希关联列表, 刪除 所述客户端发送过来的医疗文件; 及保存模块, 用于当所述客户端发 送过来的医疗文件的哈希值没有对应的哈希关联列表, 将所述客户端 发送过来的医疗文件保存于服务器中。
如权利要求 1所述的基于哈希值的医疗文件冗余处理系统, 其特征在 于, 所述哈希关联列表包括四个栏位, 所述四个栏位分别为文件名、 哈希值、 存储路径及标识。
如权利要求 1所述的基于哈希值的医疗文件冗余处理系统, 其特征在 于, 所述计算模块计算所述服务器上每个医疗文件的哈希值的方式如 下: 遍历服务器上的医疗文件, 并通过哈希算法计算每个医疗文件的 哈希值。
如权利要求 3所述的基于哈希值的医疗文件冗余处理系统, 其特征在 于, 所述计算模块通过哈希算法计算所述服务器上每个医疗文件的哈 希值, 其中, 所述哈希算法为 MD5算法。
如权利要求 1所述的基于哈希值的医疗文件冗余处理系统, 其特征在 于, 所述判断模块判断所述客户端发送过来的医疗文件的哈希值是否 有对应的哈希关联列表的方式如下: 判断服务器中是否有哈希关联列 表包含所述客户端发送过来的医疗文件的哈希值, 若服务器中有一个 哈希关联列表包含所述客户端发送过来的医疗文件的哈希值, 则该哈 希关联列表为所述客户端发送过来的医疗文件的哈希值对应的哈希关 联列表。
一种基于哈希值的医疗文件冗余处理方法, 应用于服务器中, 其特征 在于, 所述服务器通过网络与客户端通信连接, 该方法包括如下步骤 : 计算所述服务器上每个医疗文件的哈希值; 从计算的哈希值中査找 相同的哈希值, 并将相同的哈希值归为一组, 将每组中相同的哈希值 及该组中相同的哈希值对应的医疗文件的存储路径保存于一个哈希关 联列表中; 在每一个哈希关联列表中选定一个存储路径, 并刪除该哈 希关联列表中未选定的存储路径所对应的医疗文件; 在每一个哈希关 联列表修改所刪除的医疗文件对应的标识; 接收客户端发送过来的医 疗文件; 计算所述客户端发送过来的医疗文件的哈希值; 判断所述客 户端发送过来的医疗文件的哈希值是否有对应的哈希关联列表; 当所 述客户端发送过来的医疗文件的哈希值有对应的哈希关联列表, 刪除 所述客户端发送过来的医疗文件; 及当所述客户端发送过来的医疗文 件的哈希值没有对应的哈希关联列表, 将所述客户端发送过来的医疗 文件保存于服务器中。
如权利要求 6所述的基于哈希值的医疗文件冗余处理方法, 其特征在 于, 所述哈希关联列表包括四个栏位, 所述四个栏位分别为文件名、 哈希值、 存储路径及标识。
如权利要求 6所述的基于哈希值的医疗文件冗余处理方法, 其特征在 于, 所述计算所述服务器上每个医疗文件的哈希值的步骤包括如下步 骤: 遍历服务器上的医疗文件, 并通过哈希算法计算每个医疗文件的 哈希值。
如权利要求 8所述的基于哈希值的医疗文件冗余处理方法, 其特征在 于, 所述服务器上每个医疗文件的哈希值通过哈希算法计算, 其中, 所述哈希算法为 MD5算法。
[权利要求 10] 如权利要求 6所述的基于哈希值的医疗文件冗余处理方法, 其特征在 于, 所述判断所述客户端发送过来的医疗文件的哈希值是否有对应的 哈希关联列表的步骤包括如下步骤: 判断服务器中是否有哈希关联列 表包含所述客户端发送过来的医疗文件的哈希值, 若服务器中有一个 哈希关联列表包含所述客户端发送过来的医疗文件的哈希值, 则该哈 希关联列表为所述客户端发送过来的医疗文件的哈希值对应的哈希关 联列表。
PCT/CN2017/088349 2016-12-21 2017-06-15 基于哈希值的医疗文件冗余处理系统及方法 WO2018113211A1 (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201611193982.6A CN106649717A (zh) 2016-12-21 2016-12-21 基于哈希值的医疗文件冗余处理系统及方法
CN201611193982.6 2016-12-21

Publications (1)

Publication Number Publication Date
WO2018113211A1 true WO2018113211A1 (zh) 2018-06-28

Family

ID=58834468

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/CN2017/088349 WO2018113211A1 (zh) 2016-12-21 2017-06-15 基于哈希值的医疗文件冗余处理系统及方法

Country Status (2)

Country Link
CN (1) CN106649717A (zh)
WO (1) WO2018113211A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110008194A (zh) * 2019-03-01 2019-07-12 上海七印信息科技有限公司 一种基于区块链和星际文件系统ipfs的快速文件获取方法

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106777170A (zh) * 2016-12-21 2017-05-31 深圳市易特科信息技术有限公司 增强服务器访问速度的医疗信息化文件处理系统及方法
CN106599262A (zh) * 2016-12-21 2017-04-26 深圳市易特科信息技术有限公司 医疗信息化医疗文件冗余清除系统及方法
CN106649717A (zh) * 2016-12-21 2017-05-10 深圳市易特科信息技术有限公司 基于哈希值的医疗文件冗余处理系统及方法
CN110019053B (zh) * 2017-11-02 2022-04-01 福建天晴数码有限公司 一种Unity3D资源包冗余数据检测方法及终端
CN108228763A (zh) * 2017-12-25 2018-06-29 深圳市海派通讯科技有限公司 一种基于智能终端自媒体冗余数据处理的方法
CN111309689A (zh) * 2018-12-12 2020-06-19 杭州海康存储科技有限公司 文件查重方法及装置
CN110727663A (zh) * 2019-09-09 2020-01-24 光通天下网络科技股份有限公司 数据清洗方法、装置、设备及介质
CN111211966B (zh) * 2019-12-30 2022-10-18 航天信息股份有限公司 一种用于存储聊天工具中传输文件的方法及系统

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101582076A (zh) * 2009-06-24 2009-11-18 浪潮电子信息产业股份有限公司 一种基于数据库的重复数据删除方法
US20100235333A1 (en) * 2009-03-16 2010-09-16 International Business Machines Corporation Apparatus and method to sequentially deduplicate data
CN106599260A (zh) * 2016-12-21 2017-04-26 深圳市易特科信息技术有限公司 医疗信息化重复医疗文件删除系统及方法
CN106599262A (zh) * 2016-12-21 2017-04-26 深圳市易特科信息技术有限公司 医疗信息化医疗文件冗余清除系统及方法
CN106649717A (zh) * 2016-12-21 2017-05-10 深圳市易特科信息技术有限公司 基于哈希值的医疗文件冗余处理系统及方法
CN106777170A (zh) * 2016-12-21 2017-05-31 深圳市易特科信息技术有限公司 增强服务器访问速度的医疗信息化文件处理系统及方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100235333A1 (en) * 2009-03-16 2010-09-16 International Business Machines Corporation Apparatus and method to sequentially deduplicate data
CN101582076A (zh) * 2009-06-24 2009-11-18 浪潮电子信息产业股份有限公司 一种基于数据库的重复数据删除方法
CN106599260A (zh) * 2016-12-21 2017-04-26 深圳市易特科信息技术有限公司 医疗信息化重复医疗文件删除系统及方法
CN106599262A (zh) * 2016-12-21 2017-04-26 深圳市易特科信息技术有限公司 医疗信息化医疗文件冗余清除系统及方法
CN106649717A (zh) * 2016-12-21 2017-05-10 深圳市易特科信息技术有限公司 基于哈希值的医疗文件冗余处理系统及方法
CN106777170A (zh) * 2016-12-21 2017-05-31 深圳市易特科信息技术有限公司 增强服务器访问速度的医疗信息化文件处理系统及方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110008194A (zh) * 2019-03-01 2019-07-12 上海七印信息科技有限公司 一种基于区块链和星际文件系统ipfs的快速文件获取方法

Also Published As

Publication number Publication date
CN106649717A (zh) 2017-05-10

Similar Documents

Publication Publication Date Title
WO2018113211A1 (zh) 基于哈希值的医疗文件冗余处理系统及方法
WO2018113209A1 (zh) 医疗信息化医疗文件冗余清除系统及方法
WO2018113210A1 (zh) 医疗信息化重复医疗文件删除系统及方法
US10949405B2 (en) Data deduplication device, data deduplication method, and data deduplication program
WO2018113212A1 (zh) 增强服务器访问速度的医疗信息化文件处理系统及方法
CN110168523B (zh) 改变监测跨图查询
CN106605221B (zh) 具有用于即时索引的方法的多用户搜索系统
CN106933854B (zh) 短链接处理方法、装置及服务器
US7870392B2 (en) Digital fingerprinting for management and recovery of data objects
US8335890B1 (en) Associating an identifier with a content unit
TWI528196B (zh) Similar image recognition method and apparatus
WO2019153592A1 (zh) 用户权限数据管理装置、方法及计算机可读存储介质
EP2857990A1 (en) File information previewing method and system
CN102456059A (zh) 重复数据删除的处理系统
WO2018153030A1 (zh) 医疗信息化基于网页的医生评级推荐系统及方法
US20190123890A1 (en) Witness blocks in blockchain applications
WO2019095551A1 (zh) 区域医疗电子病历共享整合查询系统及方法
CN106649676A (zh) 一种基于hdfs存储文件的去重方法及装置
WO2018082258A1 (zh) 基于电子病历的医疗数据查询系统及方法
CN111651424B (zh) 一种数据处理方法、装置、数据节点及存储介质
WO2016029441A1 (zh) 一种文件扫描方法及装置
WO2015187187A1 (en) Journal events in a file system and a database
US11163748B1 (en) Fingerprint backward compatibility in deduplication backup systems
US10242025B2 (en) Efficient differential techniques for metafiles
US9189488B2 (en) Determination of landmarks

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 17883209

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 17883209

Country of ref document: EP

Kind code of ref document: A1