CN107818124B - 数据匹配方法及装置 - Google Patents

数据匹配方法及装置 Download PDF

Info

Publication number
CN107818124B
CN107818124B CN201710124863.3A CN201710124863A CN107818124B CN 107818124 B CN107818124 B CN 107818124B CN 201710124863 A CN201710124863 A CN 201710124863A CN 107818124 B CN107818124 B CN 107818124B
Authority
CN
China
Prior art keywords
data
standard
medicine
matched
matching
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710124863.3A
Other languages
English (en)
Other versions
CN107818124A (zh
Inventor
魏国峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Ping An Medical Health Technology Service Co Ltd
Original Assignee
Ping An Medical and Healthcare Management Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Medical and Healthcare Management Co Ltd filed Critical Ping An Medical and Healthcare Management Co Ltd
Priority to CN201710124863.3A priority Critical patent/CN107818124B/zh
Publication of CN107818124A publication Critical patent/CN107818124A/zh
Application granted granted Critical
Publication of CN107818124B publication Critical patent/CN107818124B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/288Entity relationship models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2455Query execution
    • G06F16/24564Applying rules; Deductive queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/08Logistics, e.g. warehousing, loading or distribution; Inventory or stock management
    • G06Q10/087Inventory or stock management, e.g. order filling, procurement or balancing against orders
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/22Social work or social welfare, e.g. community support activities or counselling services

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Tourism & Hospitality (AREA)
  • Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Marketing (AREA)
  • Human Resources & Organizations (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Finance (AREA)
  • Operations Research (AREA)
  • Child & Adolescent Psychology (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Development Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Accounting & Taxation (AREA)
  • Quality & Reliability (AREA)
  • Medical Treatment And Welfare Office Work (AREA)
  • Medical Preparation Storing Or Oral Administration Devices (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及一种数据匹配方法及装置,该数据匹配方法包括:获取待匹配数据;查找标准数据库,检测标准数据库中是否存在与待匹配数据的药品名称相同、药品剂型相同、药品规格相同和药品厂家相同的标准数据;当在标准数据库中未查找到与待匹配数据的药品名称相同、药品剂型相同、药品规格相同和药品厂家相同的标准数据时,查找映射关系库,获取与待匹配数据相匹配的标准数据;将待匹配数据和获取到的标准数据建立匹配关系,存储待匹配数据和标准数据的匹配关系。上述的数据匹配方法具有匹配效率高、降低人工劳动强度且匹配精度高的有益效果。相应的,本发明还提供一种数据匹配装置。

Description

数据匹配方法及装置
技术领域
本发明涉及计算机技术领域,特别是涉及一种数据匹配方法及装置。
背景技术
一般的,地方药品库或医院药品库的药品信息复杂多样,使得各种来源的药品信息目录(如各地方社保或医院的药品目录)中记录的药品信息各不相同。通过将各地方药品库或医院药品库中的药品信息与基准药品信息库中的药品信息进行匹配,形成药品信息匹配表可实现药品信息规范管理。然而,传统药品信息匹配方式为人工逐条将地方药品库或医院药品库中的药品信息与基准药品信息库中的药品信息进行比对,形成药品信息匹配表。该种药品信息匹配方式人工劳动强度大、匹配效率低,且匹配过程中容易出现数据遗漏或串行等错误,严重影响数据匹配精度。
发明内容
基于此,有必要针对传统药品信息匹配方式存在的匹配效率低、劳动强度大且匹配精度低的问题,提供一种数据匹配方法及装置。
一种数据匹配方法,包括以下步骤:
获取待匹配数据;
查找标准数据库,检测标准数据库中是否存在与待匹配数据的药品名称相同、药品剂型相同、药品规格相同和药品厂家相同的标准数据;标准数据库中存储标准数据,标准数据包括标准药品名称、标准药品剂型、标准药品规格和标准药品厂家;
当在标准数据库中未查找到与待匹配数据的药品名称相同、药品剂型相同、药品规格相同和药品厂家相同的标准数据时,查找映射关系库;映射关系库中存储标准药品名称与非标准药品名称的对应关系、标准药品剂型与非标准药品剂型的对应关系、标准药品规格与非标准药品规格的对应关系,以及标准药品厂家与非标准药品厂家的对应关系;
获取与待匹配数据的药品名称相对应的标准药品名称、与待匹配数据的药品剂型相对应的标准药品剂型、与待匹配数据的药品规格相对应的标准药品规格和与待匹配数据的药品厂家相对应的标准药品厂家,以及,标准药品名称、标准药品剂型、标准药品规格和标准药品厂家对应的标准数据;
将待匹配数据和获取到的标准数据建立匹配关系,存储待匹配数据和标准数据的匹配关系。
在其中一个实施例中,查找映射关系库的步骤之后,还包括:
当在映射关系库中未获取到与待匹配数据的药品名称相同的标准药品名称、与待匹配数据的药品剂型相同的标准药品剂型、与待匹配数据的药品规格相同的标准药品规格,或与待匹配数据的药品厂家相同的标准药品厂家时,定义并显示待匹配数据的匹配等级;
检测是否获取到对待匹配数据的匹配等级的审核指令,当获取到审核指令时,根据审核指令获取映射数据,存储映射数据至映射关系库。
在其中一个实施例中,标准数据库中还存储标准药品本位码,查找标准数据库的步骤之后,还包括以下步骤:
获取与待匹配数据的药品本位码相同的标准数据。
在其中一个实施例中,获取待匹配数据的步骤之前,还包括以下步骤:
获取预设标化逻辑,根据预设标化逻辑对待匹配数据库中存储的数据进行标准化处理。
在其中一个实施例中,存储待匹配数据和标准数据的匹配关系的步骤之后,还包括以下步骤:
获取标准数据库中更新的标准数据及预设匹配更新逻辑,根据更新的标准数据和预设匹配更新逻辑更新待匹配数据和标准数据的匹配关系。
在其中一个实施例中,查找标准数据库的步骤之后,还包括以下步骤:
当在标准数据库中未获取到与待匹配数据的药品名称相同、药品剂型相同、药品规格相同和药品厂家相同的标准数据时,根据预设分词逻辑对待匹配数据的药品名称、药品剂型、药品规格或药品厂家,以及标注数据的标准药品名称、标准药品剂型、标准药品规格或标准药品厂家进行分词处理;
获取与待匹配数据的药品名称分词相同、药品剂型分词相同、药品规格分词相同或药品厂家分词相同的标准数据。
一种数据匹配装置,包括:
待匹配数据获取模块,用于获取待匹配数据;
数据查找模块,用于查找标准数据库,检测标准数据库中是否存在与待匹配数据的药品名称相同、药品剂型相同、药品规格相同和药品厂家相同的标准数据;标准数据库中存储标准数据,标准数据包括标准药品名称、标准药品剂型、标准药品规格和标准药品厂家;
映射数据查找模块,用于当在标准数据库中未查找到与待匹配数据的药品名称相同、药品剂型相同、药品规格相同和药品厂家相同的标准数据时,查找映射关系库,获取与待匹配数据的药品名称相对应的标准药品名称、与待匹配数据的药品剂型相对应的标准药品剂型、与待匹配数据的药品规格相对应的标准药品规格和与待匹配数据的药品厂家相对应的标准药品厂家,以及,标准药品名称、标准药品剂型、标准药品规格和标准药品厂家对应的标准数据;
映射关系库中存储标准药品名称与非标准药品名称的对应关系、标准药品剂型与非标准药品剂型的对应关系、标准药品规格与非标准药品规格的对应关系,以及标准药品厂家与非标准药品厂家的对应关系;
数据匹配模块,用于将待匹配数据和获取到的标准数据建立匹配关系,存储待匹配数据和标准数据的匹配关系。
在其中一个实施例中,数据匹配装置还包括:
匹配等级定义模块,用于当在映射关系库中未获取到与待匹配数据的药品名称相同的标准药品名称、与待匹配数据的药品剂型相同的标准药品剂型、与待匹配数据的药品规格相同的标准药品规格,或与待匹配数据的药品厂家相同的标准药品厂家时,定义并显示待匹配数据的匹配等级;
映射数据获取模块,用于检测是否获取到对待匹配数据的匹配等级的审核指令,当获取到审核指令时,根据审核指令获取映射数据,存储映射数据至映射关系库。
在其中一个实施例中,标准数据库中还存储标准药品本位码,数据查找模块还用于获取与待匹配数据的药品本位码相同的标准数据。
在其中一个实施例中,数据匹配装置还包括:
数据标化模块,用于获取预设标化逻辑,根据预设标化逻辑对待匹配数据库中存储的数据进行标准化处理。
上述数据匹配方法及装置当在标准数据库中查找不到与待匹配数据的药品名称相同、药品剂型相同、药品规格相同和药品厂家相同的标准数据时,通过查找映射关系库获取与待匹配数据的药品名称相对应、药品剂型相对应、药品规格相对应或药品厂家相对应的标准数据并建立匹配关系,实现了待匹配数据与标准数据的自动匹配,降低了人工劳动强度、大大提高匹配效率,且有效保证了匹配精度,与传统药品信息匹配方式相比,上述的数据匹配方法及装置具有匹配效率高、降低人工劳动强度且匹配精度高的有益效果。
附图说明
图1为一个实施例中用于执行数据匹配方法的服务器或终端的内部结构示意图;
图2为一个实施例中数据匹配方法的流程图;
图3为另一个实施例中数据匹配方法的流程图;
图4为一个实施例中匹配表的结构示意图;
图5为一个实施例中数据匹配装置的结构示意图;
图6为另一个实施例中数据匹配装置的结构示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
在一个实施例中,如图1所示,为一个服务器或终端的内部结构示意图。该服务器或终端包括通过系统总线连接的处理器、非易失性存储介质和内存储器。其中,服务器的非易失性存储介质存储有操作系统、标准数据库和映射关系库,还包括一种数据匹配装置。标准数据库用于存储标准数据,标准数据包括标准药品名称、标准药品剂型、标准药品规格和标准药品厂家。映射关系库用于存储标准药品名称与非标准药品名称的对应关系、标准药品剂型与非标准药品剂型的对应关系、标准药品规格与非标准药品规格的对应关系,以及标准药品厂家与非标准药品厂家的对应关系。数据匹配装置用于实现一种数据匹配方法。该处理器用于提供计算和控制能力,支撑整个服务器的运行。服务器中的内存储器为非易失性存储介质中的数据匹配装置的运行提供环境,该内存储器中可储存有计算机可读指令,该计算机可读指令被处理器执行时,可使得处理器执行一种数据匹配方法。本领域技术人员可以理解,图1中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的服务器的限定,具体的服务器可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,如图2所示,提供了一种数据匹配方法,以应用于图1所示的服务器进行说明,包括以下步骤:
步骤202:获取待匹配数据。
具体的,服务器读取待匹配数据库中存储的数据,获取待匹配数据。待匹配数据库为各种来源的药品信息目录,如不同的地方药品库或医院药品库等。待匹配数据库中存储包括药品名称、药品剂型、药品规格和药品厂家的药品数据,不同来源的待匹配数据库中存储的药品数据的药品名称、药品剂型、药品规格或药品厂家会有所差异,服务器获取到待匹配数据后执行步骤204至步骤208,将待匹配数据库与标准数据库进行匹配,以规范药品信息管理。
步骤204:查找标准数据库,检测标准数据库中是否存在与待匹配数据的药品名称相同、药品剂型相同、药品规格相同和药品厂家相同的标准数据。
标准数据库中存储标准数据,标准数据包括标准药品名称、标准药品剂型、标准药品规格和标准药品厂家。服务器获取到待匹配数据后提取待匹配数据的药品名称、药品剂型、药品规格和药品厂家,根据待匹配数据的药品名称、药品剂型、药品规格和药品厂家查找标准数据库,将待匹配数据的药品名称、药品剂型、药品规格和药品厂家与标准数据的标准药品名称、标准药品剂型、标准药品规格和标准药品厂家进行匹配,检测标准数据库中是否存在与待匹配数据的药品名称相同、药品剂型相同、药品规格相同和药品厂家相同的标准数据。当在标准数据库中查找不到与待匹配数据的药品名称相同、药品剂型相同、药品规格相同和药品厂家相同的标注数据时,执行步骤206;如果标准数据中存在与待匹配数据相同的标准数据,则可直接获取该标准数据执行步骤210。
具体的,标准数据库为根据权威机构发布的权威文件制定的标准药品信息目录,为药品信息规范管理提供标准、权威的匹配依据。在一个实施例中,标准数据库依照国家药典制定,上述标准数据的标准药品名称、标准药品剂型、标准药品规格和标准药品厂家均依照国家药典的相关定义进行规范命名,符合卫生部的药品标准要求。进一步的,在一个实施例中,国家药典采用《中国药典》2010年版,标准数据库如以下表一所示。
表一标准数据库
药品名称 药品剂型 药品规格 药品厂家
氯化钾注射液 注射液 10ml:1g 上海XX药业有限公司
盐酸美西律片 片剂 50mg XX药业有限公司
银翘解毒丸 浓缩丸 每丸重3g XX制药股份有限公司
步骤206:当在标准数据库中未查找到与待匹配数据的药品名称相同、药品剂型相同、药品规格相同和药品厂家相同的标准数据时,查找映射关系库。
映射关系库中存储标准药品名称与非标准药品名称的对应关系、标准药品剂型与非标准药品剂型的对应关系、标准药品规格与非标准药品规格的对应关系,以及标准药品厂家与非标准药品厂家的对应关系。
当待匹配数据的药品名称为非标准药品名称、药品剂型为非标准药品剂型、药品规格为给标准药品规格或药品厂家为非标准药品厂家时,在标注数据中查找不到与待匹配数据的药品名称相同、药品剂型相同、药品规格相同和药品厂家相同的标准数据。此时,服务器通过查找映射关系库查找与待匹配数据库想对应的标准数据,以实现待匹配数据与标准数据自动匹配。
具体地,由于待匹配数据库中存储的药品信息复杂多样,经常会包括一些不规范的药品名称、药品剂型、药品规格或药品厂家。本实施例中,映射关系库中存储相对应的原值和映射值,其中,原值为非标准药品名称、非标准药品剂型、非标准药品规格或非标准药品厂家,映射值为标准药品名称、标准药品剂型、标准药品规格或标准药品厂家。具体的,如表二所示,原值为四川XX的药品厂家的全称为四川XX药业有限公司,映射关系库中存储映射值为四川XX药业有限公司。又如,药品商品名双益平片和不规范药品商品名双益平的原值对应的标准药品名称均为石杉碱甲片,二者对应的映射值相同。映射关系库中还存储药品规格映射关系及药品剂型映射信息,如,在一个实施例中,映射关系库中存储剂型映射数据和规格映射数据,原值为胶囊剂的非标准药品剂型对应的映射为胶囊的标准剂型,非标准药品规格2ml:40mg(4万单位)对应的标准规格为2ml:4万单位。服务器通过查找映射关系库取与非标准药品名称相同的标准药品名称、与非标准药品剂型相同的标准药品剂型、与非标准药品规格相同的标准药品规格或与非标准药品厂家相同的标准药品厂家。
表二映射关系库
原值 映射值
双益平 石杉碱甲片
双益平片 石杉碱甲片
2ml:40mg(4万单位) 2ml:4万单位
胶囊剂 胶囊
四川XX 四川XX药业有限公司
步骤208:获取与待匹配数据的药品名称相对应的标准药品名称、与待匹配数据的药品剂型相对应的标准药品剂型、与待匹配数据的药品规格相对应的标准药品规格和与待匹配数据的药品厂家相对应的标准药品厂家,以及,标准药品名称、标准药品剂型、标准药品规格和标准药品厂家对应的标准数据。
具体地,当在映射关系库中查找到原值为待匹配数据的非标准药品名称时,获取与该原值对应对应的映射值,得到与待匹配数据的药品名称对应的标准药品名称。同样的,当在映射关系库中查找到原值为待匹配数据的非标准药品剂型、非标准药品规格或非标准药品厂时,即获取到与待匹配数据的药品剂型、药品规格或药品厂家相对应的标准药品剂型、标准药品规格或标准药品厂家,进一步获取标准药品名称、标准药品剂型、标准药品规格和标准药品厂家对应的标准数据即为与待匹配数据对应的标准数据。
步骤210:将待匹配数据和获取到的标准数据建立匹配关系,存储待匹配数据和标准数据的匹配关系。
具体的,服务器将待匹配数据和获取到的标准数据对应存储至匹配表,为待匹配数据和获取到的标准数据建立匹配关系,并存储待匹配数据和标准数据的匹配关系。
上述数据匹配方法当在标准数据库中查找不到与待匹配数据的药品名称相同、药品剂型相同、药品规格相同和药品厂家相同的标准数据时,通过查找标准数据库获取与待匹配数据的药品名称相对应、药品剂型相对应、药品规格相对应或药品厂家相对应的标准数据并建立匹配关系,实现了待匹配数据与标准数据的自动匹配,降低了人工劳动强度、大大提高匹配效率,且有效保证了匹配精度,具有药品信息规范管理效率高、精度高且人工劳动强度低的优点。
在一个实施例中,上述步骤206之后,还包括:当在映射关系库中未获取到与待匹配数据的药品名称相同的标准药品名称、与待匹配数据的药品剂型相同的标准药品剂型、与待匹配数据的药品规格相同的标准药品规格,或与待匹配数据的药品厂家相同的标准药品厂家时,定义并显示待匹配数据的匹配等级;检测是否获取到对待匹配数据的匹配等级的审核指令,当获取到审核指令时,根据审核指令获取映射数据,存储映射数据至映射关系库。
本实施例中,对待匹配数据与标准数据的匹配关系定义匹配等级,如,在一个实施例中,如果待匹配数据的药品名称、药品剂型、药品规格及药品厂家均与标准数据的标准药品名称、标准药品剂型、标准药品规格和标准药品厂家相同,则定义待匹配数据与标准数据的匹配等级为A级;如果待匹配数据的药品厂家与标准数据的标准药品厂家不同,其它三部分内容均相同,定义待匹配数据与标准数据的匹配等级为B级;如果待匹配数据与标准数据的药品规格和药品厂家都不同,则定义待匹配数据与标准数据的匹配等级为C级;如果待匹配数据与标准数据的药品剂型、药品规格和药品厂家都不同,只有药品药品名称相同,定义待匹配数据与标准数据的匹配等级为D级;如果如果待匹配数据与标准数据的药品名称、药品剂型、药品规格和药品厂家都不同,定义待匹配数据与标准数据的匹配等级为E级。上述匹配等级由A级至E级匹配级别逐级降低,A级数据的匹配等级最高,E级数据的匹配等级最低。服务器将A级匹配数据直接存储至匹配表,B、C、D、E级数据进行缓存,当遍历完待匹配数据库,完成所有待匹配数据的自动比对后,通过人工对缓存的B、C、D、E级数据进行审核,经人工审核后存储至匹配表,完成数据匹配。
本实施例中,通过上述对待匹配数据与标准数据的匹配等级分级可以减少自动匹配后人工审核没能完全匹配的待匹配数据的工作量,如,对于B级匹配数据,人工审核只需审核待匹配数据的药品厂家是否与标准药品厂家相同,对于C级数据,只需审核待匹配数据的药品规格和药品厂家是否与标准药品规格和标准药品厂家相同,对于D级数据,审核待匹配数据的药品剂型、药品规格和药品厂家是否与标准药品剂型、标准药品规格和标准药品厂家相同,只对于E级数据需要审核待匹配数据的药品名称、药品剂型、药品规格和药品厂家是否与标准药品名称、标准药品剂型、标准药品规格和标准药品厂家相同,能够大大减少人工审核工作量。
进一步的,在人工审核过程中,经常会出现审核后数据匹配等级升级,此时,会有新的映射数据产生,服务器需要根据人工审核后待匹配数据与标准数据的匹配等级存储待匹配数据与标准数据的匹配关系,并且,服务器需要根据用户对待匹配数据的匹配等级的审核指令获取新的映射数据更新映射数据库,以使得在后续数据匹配过程中再遇到该条数据时通过映射关系库就可完成自动匹配,无需再进行人工审核,以减少人工审核工作量。
具体的,服务器获取到审核指令时,获取审核后的待匹配数据的匹配等级,将审核后的待匹配数据的匹配等级与自动匹配得到的待匹配数据的匹配等级进行比较,判断审核后待匹配数据的匹配等级是否相同,如果审核后待匹配数据的匹配等级与自动匹配得到的待匹配数据的等级不同,则表示人工审核后待匹配数据的匹配等级升高,此时,服务器根据变更后的匹配等级获取映射数据,将映射数据存储至映射关系库,并将待匹配数据和对应的标准数据存储至匹配表;如果匹配等级没有改变,则服务器按照自动匹配的匹配等级存储待匹配数据和对应的标准数据至匹配表。例如,在一个实施例中,某一待匹配数据经自动匹配后的匹配等级为B级,其药品厂家为云南省A1制药厂,对应的标准数据中的标准药品厂家为云南A制药股份有限公司,待匹配数据的药品厂家与与标准药品厂家不同。但在人工审核的过程中,确认云南省A1制药厂就是云南A制药股份有限公司,此时,人工选取标准数据库中标注数据与待匹配数据匹配,待匹配数据与标准数据的药品名称、药品剂型、药品规格和药品厂家均相同,人工修改待匹配数据的匹配等级为A级,服务器获取到审核指令后,比较审核前后待匹配数据的匹配等级,经比较,待匹配数据的匹配等级由B级变为A级,则根据匹配等级选取映射数据,由于数据由B级变为A级,说明药品厂家字段经人工审核为相同信息,因此,分别获取待匹配数据的药品厂家和标准药品厂家建立映射关系,生成映射数据,存储映射数据至映射关系库。
具体的,在一个实施例中,在待匹配数据与标准数据的匹配过程中,按照药品名称、药品剂型、药品规格、药品厂家的顺序进行匹配。服务器先根据待匹配数据的药品名称查找标准数据库,如果查找到相同的标准药品名称,则药品名称匹配成功,继续查找药品剂型,如果药品剂型匹配成功,继续查找药品规格,药品规格匹配成功,再查找药品厂家,如果药品厂家也匹配成功,定义待匹配数据的匹配等级为A级,服务器将待匹配数据与对应的标准数据存储至匹配表。否则,如果药品名称匹配不成功,则服务器不再查找其它字段,直接定义待匹配数据的匹配等级为E级,并缓存待匹配数据;如果药品剂型匹配不成功,则服务器不再匹配药品规格和药品厂家,定义待匹配数据的匹配等级为D级,缓存待匹配数据和对应的标准数据以及待匹配数据的匹配等级;如果药品规格匹配不成功,服务器不再匹配药品厂家,定义待匹配数据的匹配等级为C级,缓存待匹配数据和对应的标准数据以及待匹配数据的匹配等级;如果药品厂家匹配不成功,则服务器定义待匹配数据的匹配等级为B级,缓存待匹配数据和对应的标准数据以及待匹配数据的匹配等级。
进一步的,在以上药品名称、药品剂型、药品规格、药品厂家的自动匹配过程中,如果待匹配数据的药品名称、药品剂型、药品规格或药品厂家的命名不规范,在标准数据库中没有查找到与待匹配数据的药品名称、药品剂型、药品规格或药品厂家相同的标准药品名称、标准药品剂型、标准药品规格或标准药品剂型时,服务器进一步查找映射关系库,通过映射关系库进行药品名称、药品剂型、药品规格或药品厂家的进一步匹配,如果通过映射关系库能够查找到与待匹配数据的药品名称相同的标准药品名称、与待匹配数据的药品剂型相同的标准药品剂型、与待匹配数据的药品规格相同的标准药品规格或与待匹配数据的药品厂家相同的标准药品厂家,对应进行下一个字段的匹配,获取与待匹配数据对应的标准数据;如果通过映射关系库没有查找到与待匹配数据的药品名称相同的标准药品名称、与待匹配数据的药品剂型相同的标准药品剂型、与待匹配数据的药品规格相同的标准药品规格或与待匹配数据的药品厂家相同的标准药品厂家,服务器定义待匹配数据的相应等级并缓存待匹配数据与对应的标准数据的匹配关系和待匹配数据的匹配等级。例如,在一个实施例中,如以表二所示的映射关系库为例,在某次匹配读取到药品名称为双益平进行数据匹配时,在标准数据库中查找不到相同的标准药品名称,此时,服务器查找映射关系库,在映射关系库中查找到双益平对应的映射值为石杉碱甲片,则选取基准数据库中标准药品名称为石杉碱甲片的标准数据与待匹配数据匹配,药品名称匹配成功,可继续进行药品剂型匹配。
本实施例中,按照药品名称、药品剂型、药品规格和药品厂家的顺序逐一对各字段信息进行匹配,一方面实现了对待匹配数据的匹配等级进行定义,以减少人工审核工作量;另一方面能够确保匹配精度,当药品名称匹配成功后,匹配药品剂型;当药品剂型匹配成功后,匹配药品规格;当药品规格匹配成功后,匹配药品厂家;当药品厂家匹配成功后可获取唯一与待匹配数据相匹配的标准药品信息,有效保证匹配结果唯一,确保了匹配精度,数据匹配精度高。
以下结合图3对本实施例的数据匹配方法进行详细说明。如图3所示,一种数据匹配方法,包括以下步骤;
首先,获取待匹配数据,读取待匹配数据的药品名称、药品剂型、药品规格和药品厂家。
其次,根据待匹配数据的药品名称查找标准数据库,当在标准数据库中查找到与待匹配数据的药品名称相同的标准药品名称时,获取标准药品名称对应的标准数据,得到与待匹配数据的药品名称相同的标准数据;当在标准数据库中未查找到与待匹配数据的药品名称相同的标准药品名称时,查找映射关系库,检测待匹配数据的药品名称是否具有映射值,当待匹配数据的药品名称具有映射值时,则该药品名称具有对应的标准药品名称,获取标准药品名称对应的标准数据,得到与待匹配数据的药品名称相同的标准数据;当待匹配数据的药品名称不具有映射值时,说明在映射关系库中未查找到与待匹配数据的药品名称相同的标准药品名称,定义待匹配数据的匹配等级为E级,缓存待匹配数据。
之后,将待匹配数据的药品剂型与获取到的标准数据的标准药品剂型进行对比,当待匹配数据的药品剂型与标准药品剂型相同时,获取标准药品剂型对应的标准数据,得到与待匹配数据的药品名称、药品剂型均相同的标准数据;当待匹配数据的药品剂型与标准数据的药品剂型不同时,查找映射关系库,判断待匹配数据的药品剂型与标准数据的标准药品剂型是否相同,当待匹配数据的药品剂型与标准数据的标准药品剂型相同时,获取标准药品剂型对应的标准数据,得到与待匹配数据的药品名称、药品剂型均相同的标准数据;当待匹配数据的药品剂型与标准数据的标准药品剂型不同时,定义待匹配数据的匹配等级为D级,缓存待匹配数据及与待匹配数据对应的药品名称相同的标准数据。
然后,将待匹配数据的药品规格与获取到的标准数据的标准药品规格进行对比,当待匹配数据的药品规格与标准药品规格相同时,获取标准药品规格对应的标准数据,得到与待匹配数据的药品名称、药品剂型、药品规格均相同的标准数据;当待匹配数据的药品规格与标准数据的药品规格不同时,查找映射关系库,判断待匹配数据的药品规格与标准数据的标准药品规格是否相同,当待匹配数据的药品规格与标准数据的标准药品规格相同时,获取标准药品规格对应的标准数据,得到与待匹配数据的药品名称、药品剂型、药品规格均相同的标准数据;当待匹配数据的药品剂型与标准数据的标准药品规格不同时,定义待匹配数据的匹配等级为C级,缓存待匹配数据及与待匹配数据对应的药品名称、药品剂型均相同的标准数据。
最后,将待匹配数据的药品厂家与获取到的标准数据的标准药品厂家进行对比,当待匹配数据的药品厂家与标准药品厂家相同时,获取标准药品厂家对应的标准数据,得到与待匹配数据的药品名称、药品剂型、药品规格、药品厂家均相同的标准数据,定义待匹配数据的匹配等级为A级,存储待匹配数据与标准数据的匹配关系;当待匹配数据的药品厂家与标准数据的药品厂家不同时,查找映射关系库,判断待匹配数据的药品厂家与标准数据的标准药品厂家是否相同,当待匹配数据的药品厂家与标准数据的标准药品厂家相同时,获取标准药品厂家对应的标准数据,得到与待匹配数据的药品名称、药品剂型、药品规格、药品厂家均相同的标准数据,定义待匹配数据的匹配等级为A级,存储待匹配数据与标准数据的匹配关系;当待匹配数据的药品厂家与标准数据的标准药品厂家不同时,定义待匹配数据的匹配等级为D级,缓存待匹配数据及与待匹配数据对应的药品名称、药品剂型、药品规格均相同的标准数据。
进一步的,对于上述匹配等级为B级、C级、D级或E级的待匹配数据,服务器根据获取到的用户输入的审核指令存储待匹配数据与对应的标准数据及匹配等级至匹配表。在一个实施例中,以待匹配数据库为地方药品库为例,完成数据匹配后生成的匹配表如图4所示。
以下结合图4所示的匹配表对上述数据匹配方法进行进一步详细说明。具体的,本实施例以图4中的第一条数据的匹配过程为例进行说明。一种数据匹配方法,包括以下步骤:
首先,读取地方药品库,待匹配数据,提取待匹配数据的药品名称为奥美拉唑,药品剂型为肠溶胶囊剂、药品规格为10mg、药品厂家为山东A药业股份有限公司。
其次,根据获取到的药品名称查找标准数据库,查找到标准数据库中有十条标准药品名称为奥美拉唑肠溶胶囊的标准数据,但没有标准药品名称为奥美拉唑的标准数据,此时,服务器查找映射关系库,在映射关系库中查找到奥美拉唑对应的映射值为奥美拉唑肠溶胶囊,即奥美拉唑与奥美拉唑肠溶胶囊相同,药品名称匹配成功,获取标准药品名称为奥美拉唑肠溶胶囊的十条标准数据。然后,将待匹配数据的药品剂型分别与十条标准数据的标准药品剂型进行对比,匹配药品剂型。经比较,十条数据包含六条剂型为肠溶胶囊的数据,四条剂型为片剂的数据,此时,服务器再查找映射关系库,查找倒肠溶胶囊剂对应的映射值为肠溶胶囊,获取标准药品剂型为肠溶胶囊的六条标准数据。
之后,将匹配数据的药品规格继续与六条标准药品剂型为肠溶胶囊的标准数据进行对比,匹配药品规格。经比较,六条剂型为肠溶胶囊的标准数据包括五条药品规格为10mg,一条药品规格为20mg的标准数据,药品规格匹配成功,获取药品规格为10mg的五条标准数据。
最后,将待匹配数据的药品厂家分别与五条标准数据的标准药品厂家进行对比,匹配药品厂家。经比较,没有获取到与待匹配数据的药品厂家相同的标准药品厂家,服务器查找映射关系库,仍未查找到待匹配数据的药品厂家的映射值,此时,药品厂家匹配失败,服务器定义待匹配数据的匹配等级为B级,缓存待匹配数据与对应的五条标准数据及匹配等级。
本实施例中,完成上述自动匹配后得到的数据匹配等级为B级,未能得到与待匹配数据完全匹配的标准数据,需要人工进一步审核,服务器显示待匹配数据与对应的五条标准数据及待匹配数据的匹配等级。人工对待匹配数据审核时发现山东A药业集团股份有限公司与山东A药业股份有限公司为同一个药品生产厂家,此时,人工输入审核指令,选中五条标准数据中药品厂家为山东A药业集团股份有限公司的标准数据与待匹配数据匹配,并修改匹配等级为A级,服务器获取到审核指令后,存储待匹配数据与标准数据至匹配表,并记录匹配等级为A级,同时,服务器将审核前后待匹配数据的匹配等级进行比较,经比较,待匹配数据的匹配等级由B级变为A级,服务器分别获取待匹配数据和标准数据的药品厂家,定义原值为山东A药业股份有限公司,映射值为山东A药业集团股份有限公司,生成映射数据,并存储映射数据至映射关系库,完成数据匹配及映射关系库更新。
本实施例中,经人工审核后药品厂家匹配成功,若人工审核后仍然未获取到与待匹配数据的药品厂家相同的标准药品厂家,审核人员可以从五条标准数据中任意选取一条标准数据与待匹配数据匹配,并按照B级匹配等级存储数据即可,服务器获取到审核指令后存储待匹配数据与人工选中的标准数据的匹配关系并记录匹配等级为B级。
在一个实施例中,标准数据库中还存储标准药品本位码,步骤204之后,还包括以下步骤:获取与待匹配数据的药品本位码相同的标准数据。
具体的,本实施例中,服务器获取到待匹配数据后,首先检测待匹配数据是否包括药品本位码;当待匹配数据不包括药品本位码时,执行步骤202至步骤208;当待匹配数据包括药品本位码时,提取药品本位码,并根据药品本位码查找标准数据库,当在标准数据库中获取到与药品本位码相同的标准药品本位码时,获取标准药品本位码对应的标准匹配数据,存储待匹配数据与标准匹配数据的匹配关系,并定义数据匹配等级为A级;当在标准数据库中未查找到与药品本位码相同的标准药品本位码时,执行步骤202至步骤208。药品本位码是国家批准注册药品唯一的身份标识,具有唯一性,本实施例中,当待匹配数据包括药品本位码并药品本位码正确时,可先通过药品本位码完成待匹配数据与标准数据匹配,能够大大减少服务器的数据处理量,进一步提高匹配效率。
在一个实施例中,步骤202之前,还包括以下步骤:获取预设标化逻辑,根据预设标化逻辑对待匹配数据库中存储的数据进行标准化处理。
具体的,在一个实施例中,服务器获取到待匹配数据库后根据预设标化先对待匹配数据库中的待匹配数据进行标准化处理,如,全部字段全角半角转换、药品规格单位中英文转换、规格单位大小写统一、形式统一、删除字符串首位空格、删除无关字符(如※¤⊿●☆)等。
在一个实施例中,服务器还可以按照以下预设标化逻辑对药品名称和药品剂型进行标化处理:
标化逻辑一:药品名称中标化剂型唯一,标化药品剂型为空,以药品名称中的标化剂型填充药品剂型。
标化逻辑二:药品名称中标化剂型为空,标化药品剂型唯一,以药品剂型补充药品名称中剂型。
标化逻辑三:药品名称中标化剂型与标化药品剂型对比去重后结果不唯一,输出“问题数据”,待人工判断审核。
进一步的,在其它实施例中,服务器和可以根据预设名称及剂型标化表对药品名称和药品剂型进行标化处理,预设名称及剂型标化表中存储标准名称或剂型符号及标准名称或剂型说明,当服务器检测到药品名称或药品剂型中包含符号或说明时,查找预设名称及剂型标化表,如果在预设名称及剂型标化表中能够查找到相应的符号或说明,则不做处理,否则,则将符号或说明删除,如,对于药品名称中带有括号说明的情况,标准说明包括(18AA)、(Ⅱ)等;而非标准说明如(限中心慢性病报销)、(甲),以及无关字符如“@”、“外购西药甲”等则直接删除。具体预设名称及剂型标化表中存储的标准符号或说明可根据实际需要进行定义并随时更新,本实施例不做具体限定。
本实施例中,通过在数据匹配前先对待匹配数据进行标化处理能够减少数据匹配过程中的服务器数据处理量,提高数据匹配效率,并且,可以最大程度的对待匹配数据进行规范,有助于提高匹配成功率。
在一个实施例中,步骤208之后,还包括以下步骤:获取标准数据库中更新的标准数据及预设匹配更新逻辑,根据更新的标准数据和预设匹配更新逻辑更新待匹配数据和标准数据的匹配关系。
具体的,在一个实施例中,标准数据库中还存储药品标准库编码,每一条标准数据具有一唯一药品标准编码。服务器实时或周期性地检测标准数据库中的数据是否有更新(数据更新包括数据修改、数据新增或数据删除),当检测到标准数据库中的数据有更新时,获取更新的标准数据的药品标准库编码,之后根据药品标准库编码查找匹配表中的标准数据,判断匹配表中是否包括该更新的标准数据,如果匹配表中包括更新的的标准数据,则先将没有应用到更新的标准数据的匹配数据平移到新版匹配表中,再根据以下预设更新逻辑对应用到更新的标准数据的匹配数据进行匹配更新,更新对应的待匹配数据与标准数据的匹配关系,并存储更新后的待匹配数据与标准数据的匹配关系至新版匹配表,完成匹配表更新。
具体的,当匹配表中包括更新的标准数据时,预设更新匹配逻辑如下:
若标准数据停用,选取对应的A级、B级、C级、D级四个匹配等级的数据重新匹配。具体的,如果更新的标准数据为数据停用,则选取匹配表中匹配等级为A级、B级、C级和D级四个匹配等级全部的应用到该更新的标准数据的匹配数据执行步骤202至步骤208,对四个等级的数据进行重新匹配,更新对应的待匹配数据与标准数据的匹配关系。
若修改标准数据,根据具体修改内容选取对应匹配等级的匹配数据进行更新,具体的,若修改内容为药品厂家,则只取匹配表中匹配等级为A级的应用到更新的标准数据的匹配数据执行步骤202至步骤208进行重新匹配;若修改内容为药品规格,则选取匹配表中匹配等级为A级和B级的应用到更新的标准数据的匹配数据执行步骤202至步骤208进行重新匹配;若修改内容为药品剂型,则选取对应的匹配表中匹配等级为A级、B级和C级的应用到更新的标准数据的匹配数据执行步骤202至步骤208进行重新匹配;若修改内容为药品名称,则选取对应的匹配表中匹配等级为A级、B级、C级和D级的应用到更新的标准数据的匹配数据执行步骤202至步骤208进行重新匹配。
进一步的,如果匹配表没有用到更新的标准数据时,则先将没有应用到更新的标准数据的匹配数据平移到新版匹配表中,再根据以下预设更新逻辑选取匹配数据,对匹配数据进行重新匹配,更新对应的待匹配数据和标准数据的匹配关系,并将更新后的待匹配数据与标准数据的匹配关系存储至新版匹配表:若修改或新增内容为药品名称,则选取匹配表中匹配等级为E级的应用到更新的标准数据的匹配数据执行步骤202至步骤208进行重新匹配;若修改或新增内容为药品剂型,则选取匹配表中匹配等级为D级的应用到更新的标准数据的匹配数据执行步骤202至步骤208进行重新匹配;若修改或新增内容为药品规格,则选取匹配表中匹配等级为C级的应用到更新的标准数据的匹配数据执行步骤202至步骤208进行重新匹配;若修改或新增内容为药品厂家,则选取匹配表中匹配等级为B级的应用到更新的标准数据的匹配数据执行步骤202至步骤208进行重新匹配。
进一步的,在一个实施例中,如果待匹配数据库的原始数据有更新,则服务器接收新版待匹配数据库,将接收到的新版待匹配数据库中的数据与匹配表中的待匹配数据的药品名称、药品剂型、药品规格及药品厂家进行去重比较,将比较后药品名称、药品剂型、药品规格及药品厂家均相同的原匹配数据平移到新版匹配表,再执行步骤202至步骤208,将新版待匹配数据库中的更新待匹配数据与标准数据库中的标准数据进行匹配,匹配后存储更新待匹配数据与标准数据的匹配关系至新版匹配表。
在一个实施例中,步骤202之后,还包括以下步骤:当在标准数据库中未获取到与待匹配数据的药品名称相同、药品剂型相同、药品规格相同和药品厂家相同的标准数据时,根据预设分词逻辑对待匹配数据的药品名称、药品剂型、药品规格或药品厂家,以及标注数据的标准药品名称、标准药品剂型、标准药品规格或标准药品厂家进行分词处理;获取与待匹配数据的药品名称分词相同、药品剂型分词相同、药品规格分词相同或药品厂家分词相同的标准数据。
具体的,预设分词逻辑包括预设药品名称分词逻辑、预设药品剂型分词逻辑、预设药品规格分词逻辑和预设药品厂家分词逻辑。如果在标注数据库中没有查找到与待匹配数据的药品名称、药品剂型、药品规格或药品厂家相同的标准药品名称、标准药品剂型、标准药品规格或标准药品厂家时,服务器先通过分词处理进一步查找,如果分词查找还没有获取到与待匹配数据的药品名称、药品剂型、药品规格或药品厂家相同的标准药品名称、标准药品剂型、标准药品规格或标准药品厂家时则进一步通过映射关系库查找。以下分别对药品名称、药品剂型、药品规格或药品厂家的分词查找过程进行详细说明。
在一个实施例中,当在标准数据库中没有查找到与待匹配数据的药品名称相同的标准药品名称时,服务器获取预设药品名称分词逻辑,对待匹配数据的药品名称和标准数据库中的标准药品名称进行分词处理。首先,服务器判断待匹配数据的药品名称和标准药品名称中是否包含两个以上具有独立语义的药品名称,当药品名称或标准药品名称中包含两个以上具有独立的药品名称时,在各个具有独立语义的药品名称之间增加分词符,对药品名称或相应的标准药品名称进行分词处理,完成分词处理后,服务器根据分词后药品名称中的多个分词查找标准数据库,将多个分词分别与分词后的标准药品名称对比,如果待匹配数据的药品名称的包括的分词数量与标准药品名称包括的分词数量相同,且待匹配数据段押品名称的多个分词与标准药品名称的多个分词均相同,则待匹配数据的药品名称与该标准药品名称相同,药品名称匹配成功。如,在一个实施例中,待匹配数据的药品名称为阿卡波糖葡萄糖,标准数据库中存储的标准药品名称为葡萄糖阿卡波糖,根据药品名称查找标准数据库时二者不能完全匹配,不能获取到与药品名称相同的标准药品名称,而阿卡波糖和葡萄糖均为具有独立语义的药品名称,因此,将药品名称分次为阿卡波糖/葡萄糖,将标准药品名称分词为葡萄糖/阿卡波糖,之后先根据阿卡波糖查找映射关系库,可获取到标准药品名称为阿卡波糖和标准药品名称分词包括阿卡波糖的标准数据,之后再将葡萄糖与获取到的标准数据进行匹配,获取标准药品名称包括葡萄糖的标准数据,最后分析标准药品名称是否只包括两个两个分词,如果标准药品名称只包括两个分词,则匹配成功,获取标准药品名称葡萄糖/阿卡波糖及葡萄糖/阿卡波糖对应的标准数据。
在一个实施例中,当在标准数据库中没有查找到与待匹配数据的药品剂型相同的标准药品剂型时,服务器获取预设药品剂型分词逻辑,对待匹配数据的药品剂型和标准数据库中的标准药品剂型进行分词处理。首先,服务器分析药品剂型和标准药品剂型中是否包含剂型名称和不能作为独立的剂型名称的剂型形态,如果药品剂型或标准药品剂型中包含剂型名称和不能作为独立的剂型名称的剂型形态,则在剂型名称和剂型形态之间增加分词符,对药品剂型或相应的标准药品剂型进行分词,完成分词后,服务器根据分词后的药品剂型中的多个药品剂型分词与获取到的与待匹配数据的药品名称相同的标准数据的标准药品剂型相匹配,获取与待匹配数据的药品剂型相同的标准数据,如在一个实施例中,待匹配数据的药品剂型为冻干粉(外用),标准药品剂型为外用冻干粉,根据上述的分词逻辑对药品剂型和标准药品剂型进行分词处理后,得到药品剂型分词为冻干粉/外用;标准药品剂型分词为外用/冻干粉,通过将药品剂型分词与标准药品剂型分词进行匹配即可得到二者为相同的剂型,获取与待匹配数据的药品剂型相同的标准药品剂型及标准药品剂型对应的标准数据,具体根据分词后的药品剂型与标准数据的标准药品剂型进行匹配的过程与上述药品名称分词匹配的原理及过程相同,本实施例不予赘述。
在一个实施例中,当在标准数据库中没有查找到与待匹配数据的药品规格相同的标准药品规格时,服务器获取预设药品规格分词逻辑,对待匹配数据的药品规格和标准数据库中的标准药品规格进行分词处理。首先,服务器分析药品规格和标准药品规格中是否包含两个以上预设单位字段,如果药品规格或标准药品规格包含两个以上预设单位字段,则取每个单位字段之前的数字与单位字段组成一个分词,对药品规格或标准药品规格进行分词。如,在一个实施例中,药品规格为20mg:5ml,按照以上预设药品规格分词逻辑进行分词后的药品规格分词为20mg/5ml。完成分词后,服务器根据分词后的药品规格中的多个药品规格分词与获取到的与待匹配数据的药品名称和药品剂型相同的标准数据的标准药品规格相匹配,获取与待匹配数据的药品规格相同的标准数据,具体根据分词后的药品规格与标准数据的标准药品规格进行匹配的过程与上述药品名称分词匹配的原理及过程相同,本实施例不予赘述。
具体的,本实施例中,预先存储规格单位表,规格单位表用于存储预设单位字段,预设单位字段包括:mg、g、μg、l、ml、kg、U、IU、cm、mm、%、cm2、m3等。
在一个实施例中,当在标准数据库中没有查找到与待匹配数据的药品厂家相同的标准药品厂家时,服务器获取预设药品厂家分词逻辑,对待匹配数据的药品厂家和标准数据库中的标准药品厂家进行分词处理。首先,服务器将药品厂家中包含的制药、集团、股份、药业、有限公司等非关键字段删除,之后,分析药品厂家和标准药品厂家中是否包含行政区域名称,如果药品厂家或标准药品厂家中包含行政区域名称,则提取行政区域名称,将药品厂家分词为行政区域名称/厂家关键字分词,如,某一药品厂家为北京XX制药集团,经上述预设药品厂家分词逻辑分词后得到的药品厂家分词为北京/XX。完成分词后,服务器根据分词后的药品厂家中的多个药品厂家分词与获取到的与待匹配数据的药品名称相同、药品剂型相同且药品规格相同的标准数据的标准药品厂家相匹配,获取与待匹配数据的药品厂家相同的标准数据,具体根据分词后的药品厂家与标准数据的药品厂家进行匹配的过程与上述药品名称分词匹配的原理及过程相同,本实施例不予赘述。
上述各实施例中,药品名称、药品剂型、药品规格或药品厂家匹配成功后,服务器可继续执行下一步操作,可以省区查找映射关系库的步骤,如果分词查找没有查找到与药品名称相同的标准药品名称,才继续查找映射关系库获取与药品名称相同的标准药品名称、与药品剂型相同标准药品剂型、与药品规格相同的标准药品规格或与药品厂家相同的标准药品厂家。本实施例中,在查找映射关系库之前先通过分词查找获取与药品名称相同的标准药品名称、与药品剂型相同的标准药品剂型、与药品规格相同的标准药品规格或与药品厂家相同的标准药品厂家,以获得与待匹配数据相匹配的标准数据,能够避免映射关系库存储大量映射数据占用存储空间而影响服务器运行速度,可有效节约存储空间,有利于提升数据匹配效率。
进一步的,在一个实施例中,当通过上述的分词查找及映射关系库查找都没有获取到与待匹配数据的药品名称相同的标准药品名称、与药品剂型相同的标准药品剂型、与药品规格相同的标准药品规格或与药品厂家相同的标准药品厂家时,还可以进一步按照上述各预设分词逻辑分词后进行模糊匹配,获取与药品名称相似的标准药品名称、与药品剂型相似的标准药品剂型、与药品规格相似的标准药品规格或与药品厂家相似的标准药品厂家、并按照相似度由高到底显示获取到的相应的相似数据,以进一步减少人工审核的工作量。如,以药品厂家为例,某待匹配数据的药品厂家为陕西A制药有限公司,通过预设药品厂家分词逻辑分词后模糊匹配得到两个相似的标准药品厂家,分别为相似度为80%的陕西A制药集团和相似度为20%的陕西A1药业有限公司,则显示相似数据时,陕西A制药集团显示在陕西A1药业有限公司之前。进一步的,在一个实施例中,在对药品厂家进行分词时,还可以将行政区域名称也删除,仅保留厂家关键字进行模糊匹配,以尽可能得到与待匹配数据的药品厂家相似的标准药品厂家,提高获得相似数据的概率,最大限度的减少人工审核的工作量。
请参阅图5,一种数据匹配装置500,包括:
待匹配数据获取模块502,用于获取待匹配数据。
数据查找模块504,用于查找标准数据库,检测标准数据库中是否存在与待匹配数据的药品名称相同、药品剂型相同、药品规格相同和药品厂家相同的标准数据;标准数据库中存储标准数据,标准数据包括标准药品名称、标准药品剂型、标准药品规格和标准药品厂家。
映射数据查找模块506,用于当在标准数据库中未查找到与待匹配数据的药品名称相同、药品剂型相同、药品规格相同和药品厂家相同的标准数据时,查找映射关系库,获取与待匹配数据的药品名称相对应的标准药品名称、与待匹配数据的药品剂型相对应的标准药品剂型、与待匹配数据的药品规格相对应的标准药品规格和与待匹配数据的药品厂家相对应的标准药品厂家,以及,标准药品名称、标准药品剂型、标准药品规格和标准药品厂家对应的标准数据。
其中,映射关系库中存储标准药品名称与非标准药品名称的对应关系、标准药品剂型与非标准药品剂型的对应关系、标准药品规格与非标准药品规格的对应关系,以及标准药品厂家与非标准药品厂家的对应关系。
数据匹配模块508,用于将待匹配数据和获取到的标准数据建立匹配关系,存储待匹配数据和标准数据的匹配关系。
如图6所示,在一个实施例中,数据匹配装置500还包括:
匹配等级定义模块510,用于当在映射关系库中未获取到与待匹配数据的药品名称相同的标准药品名称、与待匹配数据的药品剂型相同的标准药品剂型、与待匹配数据的药品规格相同的标准药品规格,或与待匹配数据的药品厂家相同的标准药品厂家时,定义并显示待匹配数据的匹配等级。
映射数据获取模块512,用于检测是否获取到对待匹配数据的匹配等级的审核指令,当获取到审核指令时,根据审核指令获取映射数据,存储映射数据至映射关系库。
在一个实施例中,标准数据库中还存储标准药品本位码,数据查找模块504还用于获取与待匹配数据的药品本位码相同的标准数据。
在一个实施例中,数据匹配装置500还包括:数据标化模块514,用于获取预设标化逻辑,根据预设标化逻辑对待匹配数据库中存储的数据进行标准化处理。
在一个实施例中,数据匹配装置500还包括:匹配更新模块516,用于获取标准数据库中更新的标准数据及预设匹配更新逻辑,根据更新的标准数据和预设匹配更新逻辑更新待匹配数据和标准数据的匹配关系。
在一个实施例中,数据匹配装置500还包括:分词处理模块518,用于当在标准数据库中未获取到与待匹配数据的药品名称相同、药品剂型相同、药品规格相同和药品厂家相同的标准数据时,根据预设分词逻辑对待匹配数据的药品名称、药品剂型、药品规格或药品厂家,以及标注数据的标准药品名称、标准药品剂型、标准药品规格或标准药品厂家进行分词处理;所述数据匹配模块506还用于获取与待匹配数据的药品名称分词相同、药品剂型分词相同、药品规格分词相同或药品厂家分词相同的标准数据。
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。

Claims (10)

1.一种数据匹配方法,其特征在于,包括以下步骤:
获取待匹配数据;
查找标准数据库,检测所述标准数据库中是否存在与所述待匹配数据的药品名称相同、药品剂型相同、药品规格相同和药品厂家相同的标准数据;所述标准数据库中存储标准数据,所述标准数据包括标准药品名称、标准药品剂型、标准药品规格和标准药品厂家;
当在所述标准数据库中未查找到与所述待匹配数据的药品名称相同、药品剂型相同、药品规格相同和药品厂家相同的标准数据时,查找映射关系库;所述映射关系库中存储所述标准药品名称与非标准药品名称的对应关系、所述标准药品剂型与非标准药品剂型的对应关系、所述标准药品规格与非标准药品规格的对应关系,以及所述标准药品厂家与非标准药品厂家的对应关系;
获取与所述待匹配数据的药品名称相对应的标准药品名称、与所述待匹配数据的药品剂型相对应的标准药品剂型、与所述待匹配数据的药品规格相对应的标准药品规格和与所述待匹配数据的药品厂家相对应的标准药品厂家,以及,所述标准药品名称、标准药品剂型、标准药品规格和标准药品厂家对应的所述标准数据;
将所述待匹配数据和获取到的所述标准数据建立匹配关系,存储所述待匹配数据和所述标准数据的匹配关系。
2.根据权利要求1所述的数据匹配方法,其特征在于,所述查找映射关系库的步骤之后,还包括:
当在所述映射关系库中未获取到与所述待匹配数据的药品名称相同的标准药品名称、与所述待匹配数据的药品剂型相同的标准药品剂型、与所述待匹配数据的药品规格相同的标准药品规格,或与所述待匹配数据的药品厂家相同的标准药品厂家时,定义并显示所述待匹配数据的匹配等级;
检测是否获取到对所述待匹配数据的匹配等级的审核指令,当获取到所述审核指令时,根据所述审核指令获取映射数据,存储所述映射数据至所述映射关系库。
3.根据权利要求1所述的数据匹配方法,其特征在于,所述标准数据库中还存储标准药品本位码,所述查找标准数据库的步骤之后,还包括以下步骤:
获取与所述待匹配数据的药品本位码相同的所述标准数据。
4.根据权利要求1所述的数据匹配方法,其特征在于,所述获取待匹配数据的步骤之前,还包括以下步骤:
获取预设标化逻辑,根据所述预设标化逻辑对所述待匹配数据库中存储的数据进行标准化处理。
5.根据权利要求1所述的数据匹配方法,其特征在于,所述存储所述待匹配数据和所述标准数据的匹配关系的步骤之后,还包括以下步骤:
获取所述标准数据库中更新的标准数据及预设匹配更新逻辑,根据所述更新的标准数据和预设匹配更新逻辑更新所述待匹配数据和所述标准数据的匹配关系。
6.根据权利要求1所述的数据匹配方法,其特征在于,所述查找标准数据库的步骤之后,还包括以下步骤:
当在所述标准数据库中未获取到与所述待匹配数据的药品名称相同、药品剂型相同、药品规格相同和药品厂家相同的标准数据时,根据预设分词逻辑对所述待匹配数据的药品名称、药品剂型、药品规格或药品厂家,以及标注数据的标准药品名称、标准药品剂型、标准药品规格或标准药品厂家进行分词处理;
获取与所述待匹配数据的药品名称分词相同、药品剂型分词相同、药品规格分词相同或药品厂家分词相同的所述标准数据。
7.一种数据匹配装置,其特征在于,包括:
待匹配数据获取模块,用于获取待匹配数据;
数据查找模块,用于查找标准数据库,检测所述标准数据库中是否存在与所述待匹配数据的药品名称相同、药品剂型相同、药品规格相同和药品厂家相同的标准数据;所述标准数据库中存储标准数据,所述标准数据包括标准药品名称、标准药品剂型、标准药品规格和标准药品厂家;
映射数据查找模块,用于当在所述标准数据库中未查找到与所述待匹配数据的药品名称相同、药品剂型相同、药品规格相同和药品厂家相同的标准数据时,查找映射关系库,获取与所述待匹配数据的药品名称相对应的标准药品名称、与所述待匹配数据的药品剂型相对应的标准药品剂型、与所述待匹配数据的药品规格相对应的标准药品规格和与所述待匹配数据的药品厂家相对应的标准药品厂家,以及,所述标准药品名称、标准药品剂型、标准药品规格和标准药品厂家对应的所述标准数据;
所述映射关系库中存储所述标准药品名称与非标准药品名称的对应关系、所述标准药品剂型与非标准药品剂型的对应关系、所述标准药品规格与非标准药品规格的对应关系,以及所述标准药品厂家与非标准药品厂家的对应关系;
数据匹配模块,用于将所述待匹配数据和获取到的所述标准数据建立匹配关系,存储所述待匹配数据和所述标准数据的匹配关系。
8.根据权利要求7所述的数据匹配装置,其特征在于,还包括:
匹配等级定义模块,用于当在所述映射关系库中未获取到与所述待匹配数据的药品名称相同的标准药品名称、与所述待匹配数据的药品剂型相同的标准药品剂型、与所述待匹配数据的药品规格相同的标准药品规格,或与所述待匹配数据的药品厂家相同的标准药品厂家时,定义并显示所述待匹配数据的匹配等级;
映射数据获取模块,用于检测是否获取到对所述待匹配数据的匹配等级的审核指令,当获取到所述审核指令时,根据所述审核指令获取映射数据,存储所述映射数据至所述映射关系库。
9.根据权利要求7所述的数据匹配装置,其特征在于,所述标准数据库中还存储标准药品本位码,所述数据查找模块还用于获取与所述待匹配数据的药品本位码相同的所述标准数据。
10.根据权利要求7所述的数据匹配装置,其特征在于,还包括:
数据标化模块,用于获取预设标化逻辑,根据所述预设标化逻辑对所述待匹配数据库中存储的数据进行标准化处理。
CN201710124863.3A 2017-03-03 2017-03-03 数据匹配方法及装置 Active CN107818124B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710124863.3A CN107818124B (zh) 2017-03-03 2017-03-03 数据匹配方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710124863.3A CN107818124B (zh) 2017-03-03 2017-03-03 数据匹配方法及装置

Publications (2)

Publication Number Publication Date
CN107818124A CN107818124A (zh) 2018-03-20
CN107818124B true CN107818124B (zh) 2020-07-14

Family

ID=61601530

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710124863.3A Active CN107818124B (zh) 2017-03-03 2017-03-03 数据匹配方法及装置

Country Status (1)

Country Link
CN (1) CN107818124B (zh)

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108376365B (zh) * 2018-03-22 2021-06-18 中国银行股份有限公司 一种银行编号确定方法及装置
CN109215771B (zh) * 2018-05-29 2024-07-12 深圳平安医疗健康科技服务有限公司 医疗映射关系库建立方法、装置、计算机设备和存储介质
CN109145003B (zh) * 2018-08-24 2022-05-27 联动数科(北京)科技有限公司 一种构建知识图谱的方法及装置
CN109165849A (zh) * 2018-08-27 2019-01-08 众安信息技术服务有限公司 风险评估方法和装置
CN109509517A (zh) * 2018-10-16 2019-03-22 华东理工大学 一种医学检验检查指标自动修正的方法
CN109410005A (zh) * 2018-10-30 2019-03-01 北京筑龙信息技术有限责任公司 一种查价方法以及查价装置
CN109472029B (zh) * 2018-11-09 2023-04-07 天津开心生活科技有限公司 药品名称处理方法与装置
CN109740883A (zh) * 2018-12-21 2019-05-10 中铁二十四局集团浙江工程检测有限公司 一种基于药品的智能监控系统
CN109685576A (zh) * 2018-12-25 2019-04-26 华联世纪工程咨询股份有限公司 一种工程材料自动配价方法、装置、终端设备及存储介质
CN109933612A (zh) * 2019-03-13 2019-06-25 泰康保险集团股份有限公司 医疗数据匹配方法、装置、存储介质及电子设备
CN110287486A (zh) * 2019-06-17 2019-09-27 迪普佰奥生物科技(上海)有限公司 基于人工智能的生物医药产品识别方法、装置、终端、介质
CN110502504A (zh) * 2019-08-27 2019-11-26 云汉芯城(上海)互联网科技股份有限公司 产品单元库构建系统、方法、装置及计算机可读存储介质
CN110751989B (zh) 2019-10-09 2022-02-11 深圳市远光宙科技有限公司 护肤品配方研制方法及系统
CN111361859A (zh) * 2020-03-16 2020-07-03 中国人民解放军东部战区总医院 一种实时显示药量信息可控温湿度的便携智能药箱
CN111933244A (zh) * 2020-08-17 2020-11-13 医渡云(北京)技术有限公司 药品数据编码方法、装置、计算机可读介质及电子设备
CN112116239A (zh) * 2020-09-16 2020-12-22 山东健康医疗大数据有限公司 一种实现药品标准化的方法
CN112202675B (zh) * 2020-10-10 2022-04-15 四川天邑康和通信股份有限公司 一种基于linux内核解析DNS实现使用域名访问路由器的方法
CN112925819B (zh) * 2020-12-21 2023-05-19 上海药慧信息技术有限公司 药品中标信息挖掘方法和装置
CN113130038A (zh) * 2021-04-30 2021-07-16 康键信息技术(深圳)有限公司 药品数据匹配方法、装置、设备及存储介质
CN113223657B (zh) * 2021-06-01 2024-07-19 联仁健康医疗大数据科技股份有限公司 药品信息的处理方法、装置、电子设备及存储介质
CN115359925B (zh) * 2022-10-20 2023-03-28 阿里巴巴(中国)有限公司 一种药品归集方法、设备及存储介质

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8521758B2 (en) * 2010-01-15 2013-08-27 Salesforce.Com, Inc. System and method of matching and merging records
CN102054032A (zh) * 2010-12-22 2011-05-11 广州市慧通计算机有限公司 一种医疗数据信息处理方法及其系统
CN102509012A (zh) * 2011-11-04 2012-06-20 厦门市智业软件工程有限公司 将电子病历的内容映射电子病历标准数据库的方法
US9235686B2 (en) * 2012-01-06 2016-01-12 Molecular Health Gmbh Systems and methods for using adverse event data to predict potential side effects
JP2014215935A (ja) * 2013-04-30 2014-11-17 富士通株式会社 情報処理方法、装置及びプログラム
CN103678435B (zh) * 2013-07-08 2017-02-08 重庆药品交易所股份有限公司 一种药品规格数据相似度匹配方法
CN104268137A (zh) * 2013-07-31 2015-01-07 深圳市华傲数据技术有限公司 一种药品名称数据匹配方法和装置
CN103678262A (zh) * 2013-12-27 2014-03-26 中西亚通医疗信息科技(北京)有限公司 一种文本处理方法和文本处理装置
KR20160123801A (ko) * 2015-04-17 2016-10-26 한국전자통신연구원 데이터베이스 테이블 맵핑을 이용한 기준 위성 데이터베이스 구축 시스템
CN104933159B (zh) * 2015-06-26 2019-01-18 南京邮电大学 一种基于药品本体库的语义查询方法
CN105843917B (zh) * 2016-03-24 2019-12-03 成都金盘电子科大多媒体技术有限公司 基于云服务的医疗数据字典标准化方法与系统
KR20170135331A (ko) * 2016-05-31 2017-12-08 주식회사 라이프시맨틱스 이기종 건강측정기기 데이터 교환 의미적 상호운용성 처리 시스템 및 방법
CN106095759B (zh) * 2016-06-20 2019-05-24 西安交通大学 一种基于启发式规则的发票货物归类方法

Also Published As

Publication number Publication date
CN107818124A (zh) 2018-03-20

Similar Documents

Publication Publication Date Title
CN107818124B (zh) 数据匹配方法及装置
CN108986879B (zh) 药品推荐方法、装置、计算机设备和存储介质
CN107783950B (zh) 药品说明书处理方法及装置
US9098490B2 (en) Genetic information management system and method
US11030183B2 (en) Automatic content-based append detection
US20140344195A1 (en) System and method for machine learning and classifying data
WO2022228347A1 (zh) 药品数据匹配方法、装置、设备及存储介质
CN112017745B (zh) 决策信息推荐、药物信息推荐方法、装置、设备及介质
CN101021850A (zh) 单词检索设备、单词检索方法,以及记录介质
CN111180087A (zh) 上市药品信息标准化方法、设备、服务器及存储介质
US20100042395A1 (en) Computer visualized drug interaction information retrieval
CN112328677B (zh) 基于表关联的丢失数据回收方法、装置、设备及介质
CN111814793A (zh) 药品图文信息违规检测方法及系统
CN109036508A (zh) 一种中医医疗信息处理方法、装置、计算机设备和存储介质
CN111563139B (zh) Ocr识别发票药品名的校验方法、装置及计算机设备
CN110491519B (zh) 一种医学数据的检验方法
McBRIDE et al. Using Australian Medicines Terminology (AMT) and SNOMED CT-AU to better support clinical research
JP2006079189A (ja) レセプトファイル生成システム、カルテファイル生成システムおよびファイル生成システム
US9576008B2 (en) System and method for search indexing
CN107085603A (zh) 一种数据处理方法及装置
US20150248634A1 (en) System, method, and apparatus for mapping product identification to medication identification
US20170075989A1 (en) Search method
JP6763967B2 (ja) データ変換装置とデータ変換方法
US20160275250A1 (en) Drug formulary document parsing and comparison system and method
CN113590845A (zh) 基于知识图谱的文献检索方法、装置、电子设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20220525

Address after: 518048 China Aviation Center 2901, No. 1018, Huafu Road, Huahang community, Huaqiang North Street, Futian District, Shenzhen, Guangdong Province

Patentee after: Shenzhen Ping An medical and Health Technology Service Co.,Ltd.

Address before: Room 12G, Area H, 666 Beijing East Road, Huangpu District, Shanghai 200001

Patentee before: PING AN MEDICAL AND HEALTHCARE MANAGEMENT Co.,Ltd.