CN117332284A - 线下医疗数据匹配算法及系统 - Google Patents

线下医疗数据匹配算法及系统 Download PDF

Info

Publication number
CN117332284A
CN117332284A CN202311630924.5A CN202311630924A CN117332284A CN 117332284 A CN117332284 A CN 117332284A CN 202311630924 A CN202311630924 A CN 202311630924A CN 117332284 A CN117332284 A CN 117332284A
Authority
CN
China
Prior art keywords
data
matching
module
commodity
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202311630924.5A
Other languages
English (en)
Other versions
CN117332284B (zh
Inventor
唐庄
陈友华
陈龙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hunan Space Folding Internet Technology Co ltd
Original Assignee
Hunan Space Folding Internet Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hunan Space Folding Internet Technology Co ltd filed Critical Hunan Space Folding Internet Technology Co ltd
Priority to CN202311630924.5A priority Critical patent/CN117332284B/zh
Publication of CN117332284A publication Critical patent/CN117332284A/zh
Application granted granted Critical
Publication of CN117332284B publication Critical patent/CN117332284B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/10Pre-processing; Data cleansing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06KGRAPHICAL DATA READING; PRESENTATION OF DATA; RECORD CARRIERS; HANDLING RECORD CARRIERS
    • G06K7/00Methods or arrangements for sensing record carriers, e.g. for reading patterns
    • G06K7/10Methods or arrangements for sensing record carriers, e.g. for reading patterns by electromagnetic radiation, e.g. optical sensing; by corpuscular radiation
    • G06K7/14Methods or arrangements for sensing record carriers, e.g. for reading patterns by electromagnetic radiation, e.g. optical sensing; by corpuscular radiation using light without selection of wavelength, e.g. sensing reflected white light
    • G06K7/1404Methods for optical code recognition
    • G06K7/1408Methods for optical code recognition the method being specifically adapted for the type of code
    • G06K7/14131D bar codes
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H20/00ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance
    • G16H20/10ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance relating to drugs or medications, e.g. for ensuring correct administration to patients

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Toxicology (AREA)
  • Electromagnetism (AREA)
  • Computational Linguistics (AREA)
  • Chemical & Material Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Epidemiology (AREA)
  • Medical Informatics (AREA)
  • Primary Health Care (AREA)
  • Public Health (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本发明公开了线下医疗数据匹配算法及系统,包括数据获取模块、数据清洗模块,本发明涉及医疗数据匹配技术领域,解决了匹配结果可能会出现较大偏差,采集数据的完整度不够,缺失商品核心属性时,可能会影响算法准确度的技术问题,本发明通过特殊符号处理、规格单位换算和含量的提取,有效进行数据清洗工作而提升匹配度,利用基准库的商品类目与商品信息,有效匹配客户的商品信息,通过精准匹配与模糊匹配等算法规则环节进行一一校验判断进行匹配,其次通过核心属性进行自动生成规则进行计算,以此确保多维度的匹配实现高精度匹配,通过匹配算法计算出基准库不存在的商品且符合新增规则的数据,提供人工审核入库,以此持续完善平台基准库商品。

Description

线下医疗数据匹配算法及系统
技术领域
本发明涉及医疗数据匹配技术领域,具体为线下医疗数据匹配算法及系统。
背景技术
医药行业各经营主体,商品名称规则不统一,同一类型商品,因剂型、含量、规格等的细微差异,有不同的命名方式;在经营过程中,因数据录入错误、数据完整性约束缺失等因素,造成商品信息无法精准识别。
现有去噪规则依赖于已采集的商品数据,因不同客户对商品数据的维护方式不同,未能穷举所有规则,如待匹配的商品数据不符合现有规则,匹配结果可能会出现较大偏差,采集数据的完整度不够,缺失商品核心属性时,可能会影响算法准确度。
发明内容
针对现有技术的不足,本发明提供了线下医疗数据匹配算法及系统,解决了匹配结果可能会出现较大偏差,采集数据的完整度不够,缺失商品核心属性时,可能会影响算法准确度的问题。
为实现以上目的,本发明通过以下技术方案予以实现:线下医疗数据匹配系统,包括:
数据获取模块、数据清洗模块、数据匹配模块、数据存储模块、类目匹配数据模块和精准匹配数据模块。
数据获取模块,用于对商品数据和商品数据的核心属性进行获取同时将商品数据传输到数据清洗模块,其中商品数据的核心属性包括:商品通用名、商品规格、生产厂家、批准文号、国际条形码、包装单位等。
数据存储模块,用于将存储的基准库传输到数据清洗模块和数据匹配模块,其中基准库包括:已存储的商品数据核心属性数据,且该数据为操作人员事先录入的数据。
数据清洗模块,根据获取到的商品数据核心属性和基准库,然后对商品数据和基准库进行数据清洗,对基准库清洗的内容包括:对基准库中的重复数据和不能识别数据进行清洗,对商品数据核心属性清洗的内容包括:特殊符号处理、规格单位换算、含量的提取和不正确属性数据的删除或纠正,得到待匹配数据,并将待匹配数据传输到数据匹配模块,且对商品数据核心属性和基准库进行清洗的具体方式如下:
S1:获取到所有的基准库并对其中的重复数据和不能识别数据进行筛选,且重复数据表示为相似度超过95%的数据,且重复数据的识别方式为:
S11:获取到存在两个及以上相同数据的基准库数据,且此处相同数据表示为核心属性中录入了两个及以上的数据,比如商品通用名录入了两次,或者是条形码的图片录入两次,接着对该基准库数据进行比较匹配,当进行比较的基准库数据相似度值超过95%,则将进行比较的基准库数据标记为重复数据,反之则不进行处理,且此处的相似度比较是通过获取到基准库数据中相同的字数进行比较;
S12:获取到重复数据并对其进行筛选,筛选的标准为根据录入时间,并选取最新录入时间的重复数据作为标准,且最新录入时间表示距离当前时间节点最小的时间值;
不能识别数据具体表示为:不能通过该基准库对商品数据核心属性进行核验的数据记作为不能识别数据,比如基准库中的批准文号与对应商品的批准文号不匹配,则将基准库中的批准文号记作为不能识别数据,针对不能识别数据需要进行重新录入。
S2:对商品数据的核心属性进行提取,且提取的具体方式为:
针对通用名的提取:去除特殊字符并将通用名中的字母进行小写转化,最终只保留汉字+字母+数字的形式;
针对规格的提取:提取出前缀和后缀,同时对前缀单位标准化,对多个后缀进行乘积运算得到总量,其中前缀比如:mg,g,ml,毫克...后缀比如:片、板、袋...,对前缀单位标准化mg->g , ml->l,;
针对单位:去特殊字符,同时将单位进行小写转化;比如(Mg转小写为mg)。
针对生产厂家的提取:去特殊字符,转小写,去除以下词包括:"药厂","受委托生产","医药","制药","制剂","药业","集团","股份","科技","有限","责任","总公司","生产","加工厂","工业","食品厂","饮片厂","制品","开发","经营部","企业","用品";
针对条形码的提取:抽取出数字,如果数字位数不为8或13位,条形码为0,则表示没有条形码;
针对批准文号的提取:抽取出字母和数字,同时将批准文号中的字母转小写。
本发明提供了线下医疗数据匹配算法及系统。与现有技术相比具备以下有益效果:
本发明通过特殊符号处理、规格单位换算和含量的提取,有效进行数据清洗工作而提升匹配度,利用基准库的商品类目与商品信息,有效匹配客户的商品信息,通过精准匹配与模糊匹配等算法规则环节进行一一校验判断进行匹配,其次通过核心属性进行自动生成规则进行计算,以此确保多维度的匹配实现高精度匹配,通过匹配算法计算出基准库不存在的商品且符合新增规则的数据,提供人工审核入库,以此持续完善平台基准库商品。支持一码多品匹配,基准的一条记录可以同时匹对多条客户品种,基准库具备自动学习成长的能力。
附图说明
图1为本发明系统框图;
图2为本发明精准匹配流程图;
图3为本发明类目匹配流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例一,请参阅图1至图3,本申请提供了线下医疗数据匹配系统,包括:数据获取模块、数据清洗模块、数据匹配模块、数据存储模块、类目匹配数据模块和精准匹配数据模块。
数据获取模块,用于对商品数据和商品数据的核心属性进行获取同时将商品数据传输到数据清洗模块,其中商品数据的核心属性包括:商品通用名、商品规格、生产厂家、批准文号、国际条形码、包装单位等。
数据存储模块,用于将存储的基准库传输到数据清洗模块和数据匹配模块,其中基准库包括:已存储的商品数据核心属性数据,且该数据为操作人员事先录入的数据。
数据清洗模块,根据获取到的商品数据核心属性和基准库,然后对商品数据和基准库进行数据清洗,对基准库清洗的内容包括:对基准库中的重复数据和不能识别数据进行清洗,对商品数据核心属性清洗的内容包括:特殊符号处理、规格单位换算、含量的提取和不正确属性数据的删除或纠正,得到待匹配数据,并将待匹配数据传输到数据匹配模块,且对商品数据核心属性和基准库进行清洗的具体方式如下:
S1:获取到所有的基准库并对其中的重复数据和不能识别数据进行筛选,且重复数据表示为相似度超过95%的数据,且重复数据的识别方式为:
S11:获取到存在两个及以上相同数据的基准库数据,且此处相同数据表示为核心属性中录入了两个及以上的数据,比如商品通用名录入了两次,或者是条形码的图片录入两次,接着对该基准库数据进行比较匹配,当进行比较的基准库数据相似度值超过95%,则将进行比较的基准库数据标记为重复数据,反之则不进行处理,且此处的相似度比较是通过获取到基准库数据中相同的字数进行比较;
S12:获取到重复数据并对其进行筛选,筛选的标准为根据录入时间,并选取最新录入时间的重复数据作为标准,且最新录入时间表示距离当前时间节点最小的时间值;
不能识别数据具体表示为:不能通过该基准库对商品数据核心属性进行核验的数据记作为不能识别数据,比如基准库中的批准文号与对应商品的批准文号不匹配,则将基准库中的批准文号记作为不能识别数据,针对不能识别数据需要进行重新录入。
S2:对商品数据的核心属性进行提取,且提取的具体方式为:
针对通用名的提取:去除特殊字符并将通用名中的字母进行小写转化,最终只保留汉字+字母+数字的形式;
针对规格的提取:提取出前缀和后缀,同时对前缀单位标准化,对多个后缀进行乘积运算得到总量,其中前缀比如:mg,g,ml,毫克...后缀比如:片、板、袋...,对前缀单位标准化mg->g , ml->l,;
针对单位:去特殊字符,同时将单位进行小写转化;比如(Mg转小写为mg)。
针对生产厂家的提取:去特殊字符,转小写,去除以下词包括:"药厂","受委托生产","医药","制药","制剂","药业","集团","股份","科技","有限","责任","总公司","生产","加工厂","工业","食品厂","饮片厂","制品","开发","经营部","企业","用品";
针对条形码的提取:抽取出数字,如果数字位数不为8或13位,条形码为0,则表示没有条形码;
针对批准文号的提取:抽取出字母和数字,同时将批准文号中的字母转小写。
实施例二,本实施例在实施例一的基础上实施,且与实施例一的区别之处在于,数据匹配模块获取到传输的待匹配数据并与基准库进行匹配,且分别通过对待匹配数据中的条形码、批准文号、中药饮片和通用名进行匹配得到匹配数据和未匹配数据,接着将匹配数据传输到精准匹配数据模块,将未匹配数据传输到类目匹配数据模块,且得到匹配数据和未匹配数据的具体方式如下:
P1:判断商品是否存在条形码信息,若存在则生成条形码匹配信号,然后根据生成的条形码匹配信号对条形码进行匹配,且具体的匹配方式如下:
P11:采用条形码+通用名+商品规格匹配,其中需包括结合通用名别名匹配,若匹配成功则生成匹配数据,同时将匹配数据传输到精准匹配数据模块进行展示,若匹配失败,则采用条形码+商品名或品牌名+商品规格进行匹配;且商品名或品牌名需根据阈值进行匹配,不按绝对百分比,阈值为操作人员自行设定的值。
P12:若匹配成功则生成匹配数据,同时将匹配数据传输到精准匹配数据模块进行展示,若匹配失败则进行批准文号匹配信号。
结合实际分析,条形码+通用名匹配上后,需进行通用名校准商品,校准成功的商品,不需要进行通用名相似度匹配;校准不成功,进行相似度匹配,校准成功后如果匹配到多个商品,取相似度最高的商品作为匹配结果,相似度算法(具体阈值规则见下文说明):按字符计算,拿名称的分子/分母 (分子=相符合的字数、分母=相比商品最短字符),例:基准库中有2个条形码为6937144320531的商品,客户导入的商品数据通用名为 “维诺健医用退热贴”,根据条形码匹配到2条记录,然后计算通用名相似度,与第一条记录的通用名相似度为1.4, 与第二条记录的通用名相似度为0.62,因为与第一条的通用名相似度最高,所以第一条记录匹配,且通用名采取客户原始的通用名字符长度进行匹配,无需使用清洗去噪后的通用名。
P2:获取到批准文号匹配信号,接着根据商品批准文号进行匹配,且具体的匹配方式如下:
P21:采用批准文号+通用名+商品规格匹配,其中商品规格需包括结合商品规格别名匹配,若匹配成功则生成批准文号匹配成功信号,同时生成匹配数据,并将匹配数据传输到精准匹配数据模块进行展示,若匹配失败则生成批准文号匹配失败信号;则采用;
P22:获取到批准文号匹配失败信号,再通过批准文号+商品名/品牌名+商品规格进行匹配,若匹配成功则生成批准文号匹配成功信号,同时生成匹配数据,并将匹配数据传输到精准匹配数据模块,若匹配失败则生成中药饮片判断信号。具体的,第一步是通过批准文号+通用名+商品规格匹配,第二步是通过批准文号+商品名/品牌名+商品规格进行匹配。
结合实际分析,批准文号匹配上后,进行通用名校准商品,商品规格匹配根据前后缀经过单位换算和计算乘积后,前后缀是否一致,不需要进行包装单位和厂家匹配,校准后如果匹配到多个商品,再进行商品规格匹配,取相似度最高的商品作为匹配结果;
通用名匹配:通用名采取客户原始的通用名字符长度进行匹配,无需使用清洗去噪后的通用名。
P3:获取到中药饮片判断信号,并根据判断规则生成对应的匹配信号,具体的判断规则为:满足包括单位与商品规格任一条件则为中药饮片,且匹配信号包括匹配成功信号和通用名匹配信号,并对匹配信号进行单独分析;具体的,还包括中药饮片补充规则:中药饮片精准匹配和中药饮片类目匹配,同时对商品进行“中药饮片”匹配,其中需包括结合通用名别名匹配和通用名匹配,并将平台基准库作为标准。
结合实际分析,包装单位为 'g', '1g', '10g', '10', '克', '1克', '10克','饮片', 'kg'中任一值,商品规格为 'g','10g', '10克', '饮片', '中药饮片', '选','统', '统装', '选货', '1千克', '1000克', '1kg', '1000g', '1g', '1克','1000g/每袋','条','个','对'中任一值;
中药饮片精准匹配:客户商品的规格含有'统','选','1千克', '1kg', '1000克', '1000g', '500克', '500g', '0.5kg', '0.5千克','一等','二等','特等','一级','二级','三等','特级','三级','条','个','对'或者客户商品的生产厂家含'批次'字。
中药饮片类目匹配:客户商品的规格含有'统','选','一等','二等','特等','一级','二级','三等','特级','三级'字或者客户商品的生产厂家含‘批次'字。
P31:当通用名与基准库的中药饮片通用名或别名一致时,则表示匹配成功同时生成中药饮片匹配成功信号,并将匹配数据传输到精准匹配数据模块,若不一致,则表示匹配失败同时生成养生中药匹配信号;
P32:获取到生成的养生中药匹配信号,当通用名与基准库的养生中药通用名或别名一致时,则表示匹配成功同时生成养生中药匹配成功信号,并将匹配数据传输到精准匹配数据模块进行展示,若不一致,则表示匹配失败同时生成通用名匹配信号。
P4:获取到生成的通用名匹配信号,并通过通用名+商品规格+生产厂家匹配,其中生产厂家需包括结合生产厂家别名匹配,若匹配成功则生成匹配通用名匹配成功信号,并将匹配数据传输到精准匹配数据模块,若匹配失败则生成通用名匹配失败信号,同时生成未匹配数据,并将其传输到类目匹配数据模块。
精准匹配数据模块,用于获取到传输的匹配数据,并将其通过显示设备进行展示。
实施例三,本实施例在实施例二的基础上实施,且与实施例二的区别之处在于,类目匹配数据模块用于获取到未匹配数据并对其进行分析。
类目匹配数据模块,获取到未匹配数据并对其进行二次清洗得到二次清洗数据,接着对二次清洗数据进行自动校验生成校验成功数据和校验未成功数据,并对校验成功数据进行商品类目匹配,对校验未成功数据进行存储。具体的,系统将预先制定好通用名、商品名、规格、生产厂家、包装单位、条形码、批准文号、剂型字段入库规则标准,对符合规则标准的数据则进行商品类目匹配,也就是校验成功数据,属于基准库没有的数据存入新增数据表,不符合规则标准的数据,也就是校验未成功数据,最后存至模糊数据表。且商品类目匹配为现有技术,在此不做过多的赘述。
实施例四,作为本发明的实施例四,重点在于将实施例一、实施例二和实施例三的实施过程结合实施。
线下医疗数据匹配算法,该算法具体包括以下步骤:
步骤一:对商品数据的核心数据属性进行数据清洗得到待匹配数据;
步骤二:将待匹配数据与基准库的条形码进行匹配,得到匹配数据和批准文号匹配信号;
步骤三:获取到批准文号匹配信号并根据商品批准文号进行匹配得到匹配数据和中药饮片判断信号;
步骤四:获取到中药饮片判断信号并根据通用名进行匹配的搭配匹配数据和未匹配数据;
步骤五:获取到未匹配数据并进行二次清洗得到二次清洗数据,接着对其进行自动校验得到校验成功数据和校验未成功数据;
步骤六:对校验成功数据进行商品类目匹配,对校验未成功数据进行存储。
上述公式中的部分数据均是去其纲量进行数值计算,同时本说明书中未作详细描述的内容均属于本领域技术人员公知的现有技术。
以上实施例仅用以说明本发明的技术方法而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方法进行修改或等同替换,而不脱离本发明技术方法的精神和范围。

Claims (9)

1.线下医疗数据匹配系统,其特征在于,包括:数据获取模块、数据清洗模块、数据匹配模块、数据存储模块、类目匹配数据模块和精准匹配数据模块;
数据获取模块,用于将商品数据传输到数据清洗模块;
数据存储模块,用于将存储的基准库传输到数据清洗模块和数据匹配模块;
数据清洗模块,对基准库中的不正确属性数据进行识别和筛选,对商品数据进行数据清洗得到待匹配数据,并将待匹配数据传输到数据匹配模块;
数据匹配模块,用于将获取到的待匹配数据与基准库进行条形码、批准文号、中药饮片和通用名匹配得到匹配数据和未匹配数据,同时将匹配数据传输到精准匹配数据模块,将未匹配数据传输到类目匹配数据模块;
类目匹配数据模块,用于对未匹配数据进行二次清洗同时对其进行自动校验得到校验成功数据和校验未成功数据,并对校验成功数据进行商品类目匹配,对校验未成功数据进行存储;
精准匹配数据模块,用于获取到传输的匹配数据同时将其通过显示设备进行展示。
2.根据权利要求1所述的线下医疗数据匹配系统,其特征在于,所述数据清洗模块对基准库的清洗方式为:
获取到所有的基准库并对其中的重复数据和不能识别数据进行筛选,且重复数据表示为相似度超过95%的数据,且重复数据的识别方式为:
S1:获取到存在两个及以上相同数据的基准库数据,接着对该基准库数据进行比较匹配,当进行比较的基准库数据相似度值超过95%,则将进行比较的基准库数据标记为重复数据,反之则不进行处理;
S2:获取到重复数据并对其进行筛选,筛选的标准为根据录入时间,并选取最新录入时间的重复数据作为标准,且最新录入时间表示距离当前时间节点最小的时间值。
3.根据权利要求1所述的线下医疗数据匹配系统,其特征在于,所述数据清洗模块对商品数据进行清洗的具体方式为:
通过对商品数据的核心属性进行提取得到待匹配数据,其中核心属性包括:通用名、规格、单位、生产厂家、条形码和批准文号。
4.根据权利要求1所述的线下医疗数据匹配系统,其特征在于,所述数据匹配模块根据基准库对待匹配数据的条形码匹配的方式为:
P1:判断商品是否存在条形码信息,若存在则生成条形码匹配信号,反之则生成批准文号匹配信号;
P2:获取到条形码匹配信号,并采用以条形码+通用名+商品规格的形式匹配和以条形码+商品名+商品规格的形式进行匹配的方式对商品数据进行匹配得到匹配数据或批准文号匹配信号。
5.根据权利要求1所述的线下医疗数据匹配系统,其特征在于,所述数据匹配模块根据基准库对批准文号匹配信号的处理方式如下:
采用批准文号+通用名+商品规格匹配和批准文号+商品名+商品规格进行匹配得到匹配数据和中药饮片判断信号。
6.根据权利要求1所述的线下医疗数据匹配系统,其特征在于,所述数据匹配模块根据基准库对中药饮片判断信号的处理方式如下:
A1:获取到中药饮片判断信号,并根据判断规则生成对应的匹配信号,且匹配信号包括匹配成功信号和通用名匹配信号,判断规则为:满足包括单位与商品规格任一条件则为中药饮片;
A2:当通用名与基准库的中药饮片通用名或别名一致时,则匹配成功并生成中药饮片匹配成功信号,反之则生成养生中药匹配信号;
A3:当通用名与基准库的养生中药通用名或别名一致时,则生成养生中药匹配成功信号,反之则生成通用名匹配信号。
7.根据权利要求1所述的线下医疗数据匹配系统,其特征在于,所述数据匹配模块对通用名匹配信号的具体处理方式如下:
通过以通用名+商品规格+生产厂家的形式进行匹配,若匹配成功则生成匹配通用名匹配成功信号,反之则生成未匹配数据。
8.根据权利要求1所述的线下医疗数据匹配系统,其特征在于,所述类目匹配数据模块对未匹配数据的分析为:
将预先制定好通用名、商品名、规格、生产厂家、包装单位、条形码、批准文号、剂型字段入库规则标准,将符合规则标准的数据则进行商品类目匹配,将不符合规则标准的数据存储到模糊数据表。
9.执行权利要求1-8任一所述的线下医疗数据匹配系统的匹配算法,其特征在于,该算法具体包括以下步骤:
步骤一:对商品数据的核心数据属性进行数据清洗得到待匹配数据;
步骤二:将待匹配数据与基准库的条形码进行匹配,得到匹配数据和批准文号匹配信号;
步骤三:获取到批准文号匹配信号并根据商品批准文号进行匹配得到匹配数据和中药饮片判断信号;
步骤四:获取到中药饮片判断信号并根据通用名进行匹配的搭配匹配数据和未匹配数据;
步骤五:获取到未匹配数据并进行二次清洗得到二次清洗数据,接着对其进行自动校验得到校验成功数据和校验未成功数据;
步骤六:对校验成功数据进行商品类目匹配,对校验未成功数据进行存储。
CN202311630924.5A 2023-12-01 2023-12-01 线下医疗数据匹配算法及系统 Active CN117332284B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311630924.5A CN117332284B (zh) 2023-12-01 2023-12-01 线下医疗数据匹配算法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311630924.5A CN117332284B (zh) 2023-12-01 2023-12-01 线下医疗数据匹配算法及系统

Publications (2)

Publication Number Publication Date
CN117332284A true CN117332284A (zh) 2024-01-02
CN117332284B CN117332284B (zh) 2024-02-09

Family

ID=89277788

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311630924.5A Active CN117332284B (zh) 2023-12-01 2023-12-01 线下医疗数据匹配算法及系统

Country Status (1)

Country Link
CN (1) CN117332284B (zh)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110173149A1 (en) * 2010-01-13 2011-07-14 Ab Initio Technology Llc Matching metadata sources using rules for characterizing matches
US20200098457A1 (en) * 2018-09-22 2020-03-26 Mikael NAYGAUZ System and method for vial amount selection and dosage verification for modularly assembled medicaments
KR20210130993A (ko) * 2020-04-23 2021-11-02 한국전자통신연구원 약품 조제 자동화 시스템을 위한 포장지 정품 인식 장치 및 방법
CN113722377A (zh) * 2021-08-30 2021-11-30 武汉海云健康科技股份有限公司 一种药品标准库的搭建方法及系统
CN115983869A (zh) * 2022-12-05 2023-04-18 上海视塔软件有限公司 定点医药机构erp药品与国家医保目录智能全量对码的方法
CN116168848A (zh) * 2022-09-08 2023-05-26 武汉海云健康科技股份有限公司 一种基于Faiss算法的药品信息匹配方法及装置
CN116313151A (zh) * 2023-03-24 2023-06-23 康键信息技术(深圳)有限公司 一种药品上架方法、系统、计算机设备和存储介质
CN116681461A (zh) * 2023-06-01 2023-09-01 广州中康数字科技有限公司 一种基于线下药品零售市场分层分级放大方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110173149A1 (en) * 2010-01-13 2011-07-14 Ab Initio Technology Llc Matching metadata sources using rules for characterizing matches
US20200098457A1 (en) * 2018-09-22 2020-03-26 Mikael NAYGAUZ System and method for vial amount selection and dosage verification for modularly assembled medicaments
KR20210130993A (ko) * 2020-04-23 2021-11-02 한국전자통신연구원 약품 조제 자동화 시스템을 위한 포장지 정품 인식 장치 및 방법
CN113722377A (zh) * 2021-08-30 2021-11-30 武汉海云健康科技股份有限公司 一种药品标准库的搭建方法及系统
CN116168848A (zh) * 2022-09-08 2023-05-26 武汉海云健康科技股份有限公司 一种基于Faiss算法的药品信息匹配方法及装置
CN115983869A (zh) * 2022-12-05 2023-04-18 上海视塔软件有限公司 定点医药机构erp药品与国家医保目录智能全量对码的方法
CN116313151A (zh) * 2023-03-24 2023-06-23 康键信息技术(深圳)有限公司 一种药品上架方法、系统、计算机设备和存储介质
CN116681461A (zh) * 2023-06-01 2023-09-01 广州中康数字科技有限公司 一种基于线下药品零售市场分层分级放大方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
黄凯: "基于信息系统的医技科室用药闭环管理", 《中医药管理杂志》, vol. 28, no. 15, pages 68 - 69 *

Also Published As

Publication number Publication date
CN117332284B (zh) 2024-02-09

Similar Documents

Publication Publication Date Title
US6259354B1 (en) System and methods for vehicle identification number validation
CN113722377A (zh) 一种药品标准库的搭建方法及系统
US20200111555A2 (en) Synchronization of hierarchical data
CN107368765A (zh) 一种包装材料批次可追溯管理的方法及系统
US8019759B2 (en) Conversion of data from a first file type to a second file type for use by a telecommunications equipment inventory system
CN115223730A (zh) 一种解决商品基本信息标准化的方法和对应的装置
CN112667695A (zh) 一种保险数据信息的生成方法、装置、服务器及存储介质
CN117332284B (zh) 线下医疗数据匹配算法及系统
CN112801621A (zh) 一种bom物料清单整理核准方法、系统及计算机可读存储介质
CN108053000A (zh) 一种烟草原料检验核对方法
US20020107834A1 (en) Quality assurance of data extraction
CN114493335A (zh) 用于产品质量追溯的系统
US20030055843A1 (en) Server system and method for providing online multi-dimensional production data report
CN112987679A (zh) 调试控制系统中现场装置的方法、系统和计算机程序产品
CN115983869A (zh) 定点医药机构erp药品与国家医保目录智能全量对码的方法
CN108897556B (zh) 机顶盒生产数据写入方法
CN115374082A (zh) 涉税数据库的分析方法、设备及存储介质
CN114676054A (zh) 一种测试数据生成方法、装置、设备、介质及产品
CN112100202A (zh) 一种产品识别及产品信息补全方法、存储介质及机器人
CN107766444B (zh) 星地协同遥测信息智能转换系统
WO2015077710A1 (en) Method and apparatus to synchronize drug information
CN115145990B (zh) 一种用于海关电子申报的数据处理方法及相关设备
CN117573727B (zh) 一种从业人员健康体检信息检索系统
CN110570206A (zh) 一种商品的溯源方法及装置
CN110781661B (zh) 一种基于聊天记录的统计数据生成方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant