CN112925819A - 药品中标信息挖掘方法和装置 - Google Patents

药品中标信息挖掘方法和装置 Download PDF

Info

Publication number
CN112925819A
CN112925819A CN202011522523.4A CN202011522523A CN112925819A CN 112925819 A CN112925819 A CN 112925819A CN 202011522523 A CN202011522523 A CN 202011522523A CN 112925819 A CN112925819 A CN 112925819A
Authority
CN
China
Prior art keywords
information
standard
drug
price
winning
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011522523.4A
Other languages
English (en)
Other versions
CN112925819B (zh
Inventor
蒋建华
林济延
许瑞彬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Huabin Licheng Technology Co ltd
Original Assignee
Shanghai Yaohui Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Yaohui Information Technology Co ltd filed Critical Shanghai Yaohui Information Technology Co ltd
Priority to CN202011522523.4A priority Critical patent/CN112925819B/zh
Publication of CN112925819A publication Critical patent/CN112925819A/zh
Application granted granted Critical
Publication of CN112925819B publication Critical patent/CN112925819B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/90335Query processing
    • G06F16/90344Query processing by using string matching techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/215Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2282Tablespace storage structures; Management thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2465Query processing support for facilitating data mining operations in structured databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/242Dictionaries
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Fuzzy Systems (AREA)
  • Probability & Statistics with Applications (AREA)
  • Quality & Reliability (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本申请提出一种药品中标信息挖掘方法和装置,涉及数据处理技术领域,其中,方法包括:获取招标平台的药品信息;计算药品信息和预先建立的上市药品标准表中标准药品信息的目标匹配度;根据目标匹配度确定上市药品标准表中的目标索引值,并根据目标索引值对应的药品信息列表存入标准中标药品信息表。由此,能够获取完整规范的中标药品信息,以便及时且准确的了解各地区药品中标信息详情。

Description

药品中标信息挖掘方法和装置
技术领域
本申请涉及数据处理技术领域,尤其涉及一种药品中标信息挖掘方法和装置。
背景技术
从20世纪末开始,我国开展招标采购模式的探索,时至今日药品集中采购已进入多元化的时代。通过药品集中采购的各项政策支撑,能切实的规范药品采购价格,纠正药品购销过程中的不良之风,减轻群众用药负担,保障用药安全。
在药品集中采购过程中,企业可以通过药品的中标数据来了解行业发展趋势,分析企业的竞争能力,利于各企业把握市场动态、预测行业走向。同时能更好地定位企业产品,为产品进入市场提供参考。
相关技术中,中标数据的主要来源是各省的药品采购平台,没有统一的查询途径。且由于各省药品采购平台提供的药品招采数据存在诸如药品信息表达不统一或者缺失,提供的企业信息不完善或者企业信息未及时更新,各省公布药品价格信息的颗粒度不统一(单位包装价格、最小剂量价格、包装盒价格等),难以进行横向比较等问题,导致获取的中标数据不全面、不规范,都需要人工进一步解读。
发明内容
本申请旨在至少在一定程度上解决相关技术中的技术问题之一。
为此,本申请的第一个目的在于提出一种药品中标信息挖掘方法,以能够获取完整规范的中标药品信息,以便及时且准确的了解各地区药品中标信息详情。
本申请的第二个目的在于提出一种药品中标信息挖掘装置。
为达上述目的,本申请第一方面实施例提出了一种药品中标信息挖掘方法,包括:
获取招标平台的药品信息;
计算所述药品信息和预先建立的上市药品标准表中标准药品信息的目标匹配度;
根据所述目标匹配度确定所述上市药品标准表中的目标索引值,并根据所述目标索引值对应的药品信息列表存入标准中标药品信息表。
本申请实施例的药品中标信息挖掘方法,通过获取招标平台的药品信息;计算药品信息和预先建立的上市药品标准表中标准药品信息的目标匹配度;根据目标匹配度确定上市药品标准表中的目标索引值,并根据目标索引值对应的药品信息列表存入标准中标药品信息表。由此,能够获取完整规范的中标药品信息,以便及时且准确的了解各地区药品中标信息详情。
在本申请的一个实施例中,所述计算所述药品信息和预先建立的上市药品标准表中标准药品信息的目标匹配度,包括:
对所述药品信息中原始通用名信息进行清洗后,根据通用名-成分名关联关系图谱,获取成分名信息;
对所述药品信息中原始企业信息进行清洗后在企业字典中进行匹配,获取企业名信息;
分别对所述成分名信息、所述企业名信息与所述上市药品标准表中的成分名信息、企业名信息进行编辑距离计算,获取第一匹配度值和第二匹配度值;
对所述药品信息中原始剂型信息进行清洗后与所述上市药品标准表中的剂型信息进行字符串匹配,获取第三匹配度值;
对所述药品信息中原始规格进行转换后与所述上市药品标准表中的规格信息进行字符串匹配,获取第四匹配度值;
对所述药品信息中原始商品名信息进行清洗后与所述上市药品标准表中的商品名信息进行编辑距离计算,获得第五匹配度值;
根据所述第一匹配度值、所述第二匹配度值、所述第三匹配度值、所述第四匹配度值和所述第五匹配度值、以及每个匹配度值对应的权重系数进行计算获取所述目标匹配度。
在本申请的一个实施例中,所述的药品中标信息挖掘方法,还包括:
获取上市药品的药品原始信息;
对所述药品原始信息进行分析,生成上市药品标准表。
在本申请的一个实施例中,所述对所述药品原始信息进行分析,生成上市药品标准表,包括:
将药品名称进行清洗后在药品字典中进行匹配,获取标准药品名称信息;
将药品生产企业信息进行清洗后在企业字典中进行匹配,获取标准企业名信息;
将药品剂型信息进行清洗后转换成标准剂型,获取标准剂型信息;
根据药品名称-通用名-成分名关联关系图谱,获取药品名称对应的标准通用名信息和标准成分名信息;
根据标准药品名称信息、标准企业名信息、标准剂型信息、标准通用名信息、标准成分名信息、规格信息、商品名信息和索引值生成所述上市药品标准表。
在本申请的一个实施例中,所述的药品中标信息挖掘方法,还包括:
从所述标准中标药品信息表中获取与新增中标药品数据成分名相同的转换比信息集一,以及获取与新增中标药品数据成分名相同且企业名相同的转换比信息集二;
计算新增中标药品的转换比在转换比信息集一中的第一出现比例;
计算新增中标药品的转换比在转换比信息集二中的第二出现比例;
根据所述第一出现比例、所述第二出现比例和预设阈值确定转换比信息是否异常出现比例。
在本申请的一个实施例中,所述的药品中标信息挖掘方法,其特征在于,还包括:
获取转换比标记为异常的数据,并获取异常数据的成分名、剂型、规格相同且企业类型相同的第一价格信息集;
若所述第一价格信息集为空,获取与所述异常数据的成分名相同且企业类型相同的第二价格信息集;
在所述第二价格信息集中获取与所述异常数据的价格差值小于价格阈值的目标价格信息,并将所述目标价格信息对应的转换比信息设置为所述异常数据的转换比信息,并清除异常标记。
在本申请的一个实施例中,所述的药品中标信息挖掘方法,还包括:
获取与新增中标数据商品名信息相同的数据的原始价格信息集、转换比信息集,基于单位价格=价格/转换比获取单位价格信息集,从所述单位价格信息集中获取数值中位数作为标准价格。
在本申请的一个实施例中,所述的药品中标信息挖掘方法,还包括:
将新增数据中标数据价格、单位价格分别与所述标准价格进行对比,获取与所述标准价格相差小于预设价格差值的价格作为目标单位价格。
在本申请的一个实施例中,所述的药品中标信息挖掘方法,还包括:
若所述目标单位价格与所述标准价格的差值与所述标准价格的比值大于预设阈值,则重新计算所述目标单位价格与所述标准价格。
为达上述目的,本申请第二方面实施例提出了一种药品中标信息挖掘装置,包括:
获取模块,用于获取招标平台的药品信息;
计算模块,用于计算所述药品信息和预先建立的上市药品标准表中标准药品信息的目标匹配度;
处理模块,用于根据所述目标匹配度确定所述上市药品标准表中的目标索引值,并根据所述目标索引值对应的药品信息列表存入标准中标药品信息表。
本申请实施例的药品中标信息挖掘装置,通过获取招标平台的药品信息;计算药品信息和预先建立的上市药品标准表中标准药品信息的目标匹配度;根据目标匹配度确定上市药品标准表中的目标索引值,并根据目标索引值对应的药品信息列表存入标准中标药品信息表。由此,能够获取完整规范的中标药品信息,以便及时且准确的了解各地区药品中标信息详情。
为达上述目的,本申请第三方面实施例提出了一种计算机设备,包括:处理器;用于存储所述处理器可执行指令的存储器;其中,所述处理器通过读取存储器中存储的可执行程序代码来运行与可执行程序代码对应的程序,用于执行第一方面实施例所述的药品中标信息挖掘方法。
为了实现上述目的,本申请第四方面实施例提出了一种非临时性计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如本申请第一方面实施例所述的药品中标信息挖掘方法。
为了实现上述目的,本申请第五方面实施例提出了一种计算机程序产品,当所述计算机程序产品中的指令处理器执行时实现如本申请第一方面实施例所述的药品中标信息挖掘方法。
本申请附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本申请的实践了解到。
附图说明
本申请上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1为本申请实施例一所提供的一种药品中标信息挖掘方法的流程示意图;
图2a-2e为本申请实施例所提供的药品中标信息挖掘的示例图;
图3为本申请实施例二所提供的一种药品中标信息挖掘方法的流程示意图;
图4为本申请实施例所提供的药品中标信息挖掘的示例图;
图5为本申请实施例所提供的一种药品中标信息挖掘装置的结构示意图;以及
图6示出了适于用来实现本申请实施方式的示例性计算机设备的框图。
具体实施方式
下面详细描述本申请的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本申请,而不能理解为对本申请的限制。
下面参考附图描述本申请实施例的药品中标信息挖掘方法和装置。
图1为本申请实施例一所提供的一种药品中标信息挖掘方法的流程示意图。
如图1所示,该药品中标信息挖掘方法包括以下步骤:
步骤101,获取招标平台的药品信息。
步骤102,计算药品信息和预先建立的上市药品标准表中标准药品信息的目标匹配度。
步骤103,根据目标匹配度确定上市药品标准表中的目标索引值,并根据目标索引值对应的药品信息列表存入标准中标药品信息表。
在本申请实施例中,获取各省级药品集中采购招标平台获取药品信息,包括但不限于: 药品通用名,药品生产企业,药品剂型,药品规格,价格等信息,比如图2a所示。
在本申请实施例中,对药品信息中原始通用名信息进行清洗后,根据通用名-成分名关联关系图谱,获取成分名信息;对药品信息中原始企业信息进行清洗后在企业字典中进行匹配,获取企业名信息;分别对成分名信息、企业名信息与上市药品标准表中的成分名信息、企业名信息进行编辑距离计算,获取第一匹配度值和第二匹配度值;对药品信息中原始剂型信息进行清洗后与上市药品标准表中的剂型信息进行字符串匹配,获取第三匹配度值;对药品信息中原始规格进行转换后与上市药品标准表中的规格信息进行字符串匹配,获取第四匹配度值;对药品信息中原始商品名信息进行清洗后与上市药品标准表中的商品名信息进行编辑距离计算,获得第五匹配度值;根据第一匹配度值、第二匹配度值、第三匹配度值、第四匹配度值和第五匹配度值、以及每个匹配度值对应的权重系数进行计算获取目标匹配度。
具体地,将获取的原始通用名信息进行清洗,根据通用名-成分名关联关系图谱,得到对应的成分名信息,将获取的原始生产企业信息进行清洗并于企业字典中进行匹配得到企业名信息,得到的成分名与企业名信息与“上市药品标准表”中成分名、企业名信息通过编辑距离函数计算编辑距离值Lev,数值范围:0-1,基于匹配度P=1-Lev,得到成分名信息、企业名信息匹配度值,获取P成分名≥0.95且P企业名≥0.95的上市标准药品表信息子集,如图2b所示。
具体地,对获取的原始剂型信息进行清洗,将清洗后的剂型信息与上述上市标准药品表信息子集中的剂型信息进行字符串匹配,获得匹配度值P剂型(数值范围:0-1),对获取的原始规格信息如图2c所示及上述上市标准药品表信息子集如图2d所示的规格信息基于正则提取质量规格(mg)、体积规格(mL)、活性规格(iu)及百分比规格(per)等规格信息,并换算到标准规格信息(如:质量规格为1g,换算为质量规格1000mg)。
具体地,对每种规格中的数值进行字符串匹配,得到Pmg,Pml,Pper,Piu值(0or 1),四种规格设置权重,P规格=Wmg*Pmg+Wml*Pml+Wper*Pper+Wiu*Piu
具体地,对获取的原始商品名信息进行清洗,对清洗后的商品名信息基于编辑距离函数与上市标准药品表信息子集中商品名信息计算编辑距离Lev值(0-1),P商品名=1-Lev。
具体地,对商品名、成分名、企业名、剂型、规格赋予权重值,权重值大小(W商品名>W成分名>W企业名>W剂型>W规格),总匹配度P=W商品名*P商品名+W成分名*P成分名+W企业名*P企业名+W剂型 *P剂型+W规格*P规格,获取P最大值,并返回P最大值对应的上市药品标准表中的索引值。
进一步地,获取索引值代表的详细药品信息,生成标准中标药品信息,存储于标准中标药品信息表中如图2e所示。
本申请实施例的药品中标信息挖掘方法,通过获取招标平台的药品信息;计算药品信息和预先建立的上市药品标准表中标准药品信息的目标匹配度;根据目标匹配度确定上市药品标准表中的目标索引值,并根据目标索引值对应的药品信息列表存入标准中标药品信息表。由此,能够获取完整规范的中标药品信息,以便及时且准确的了解各地区药品中标信息详情。
基于上述实施例的描述,本申请预先建立标准中标药品信息表,具体如图3所示,包括:
步骤201,获取上市药品的药品原始信息;
步骤202,对药品原始信息进行分析,生成上市药品标准表。
在本申请实施例中,从包括但不限于国家药品监督管理局获取上市药品的药品名称,商品名,生产企业,剂型,规格等原始信息。
在本申请实施例中,对药品原始信息进行分析,生成上市药品标准表,包括:将药品名称进行清洗后在药品字典中进行匹配,获取标准药品名称信息;将药品生产企业信息进行清洗后在企业字典中进行匹配,获取标准企业名信息;将药品剂型信息进行清洗后转换成标准剂型,获取标准剂型信息;根据药品名称-通用名-成分名关联关系图谱,获取药品名称对应的标准通用名信息和标准成分名信息;根据标准药品名称信息、标准企业名信息、标准剂型信息、标准通用名信息、标准成分名信息、规格信息、商品名信息和索引值生成上市药品标准表。
具体地,对上述药品名称信息进行清洗(如:去除特殊字符,字符转换,转小写等处理),将清洗后的数据于药品字典中进行匹配,得到标准药品名称信息,对上述生产企业信息进行清洗(如:去除特殊字符,字符转换,转小写等处理),将清洗后的数据于企业字典中进行匹配,得到标准药品名称信息,及企业标签(内资or外资),对剂型信息进行清洗 (如:1、英文名转换成中文名(‘TAB’:‘片剂’,‘CAP’:‘胶囊’,‘DRP’:‘滴剂’,‘PILL’:‘丸剂’等),2、不同表达的剂型转换成标准剂型(‘普通口服片’:‘片剂’,‘液体制剂’:‘注射剂’,‘片剂(含片)(无糖型)’:‘含片’等)),得到标准剂型信息,根据药品名称-通用名-成分名关联关系图谱,获取药品名称对应的通用名信息,成分名信息;将上述信息按照原始抓取信息对应关系重新组合,生成上市药品标准表,每条数据生成唯一索引值如图4所示。
基于上述实施例,本申请还包括:从标准中标药品信息表中获取与新增中标药品数据成分名相同的转换比信息集一,以及获取与新增中标药品数据成分名相同且企业名相同的转换比信息集二;计算新增中标药品的转换比在转换比信息集一中的第一出现比例;计算新增中标药品的转换比在转换比信息集二中的第二出现比例;根据第一出现比例、第二出现比例和预设阈值(根据应用需要设置)确定转换比信息是否异常出现比例。
具体地,从标准中标药品信息表中获取与新增中标药品数据成分名相同的转换比信息集一,获取与新增中标药品数据成分名相同且企业名相同的转换比信息集二;计算新增中标药品的转换比在转换比信息集一中的出现比例,计为比例1;计算新增中标药品的转换比在转换比信息集二中的出现比例,计为比例2;若比例1<5%且比例2<5%,对此条信息的转换比信息标记为异常。
基于上述实施例,本申请还包括:获取转换比标记为异常的数据,并获取异常数据的成分名、剂型、规格相同且企业类型相同的第一价格信息集;若第一价格信息集为空,获取与异常数据的成分名相同且企业类型相同的第二价格信息集;在第二价格信息集中获取与所述异常数据的价格差值小于价格阈值的目标价格信息,并将目标价格信息对应的转换比信息设置为异常数据的转换比信息,并清除异常标记。
具体地,获取转换比标记为异常的数据,获取与此条数据成分名、剂型、规格相同且企业类型相同(内资or外资)的价格信息集(过滤其中有异常标记的数据),若该信息集为空,获取与此条数据成分名相同且企业类型相同的价格信息集,在上述价格信息集中获取与此条异常数据价格最接近的价格信息,并将此价格信息对应的转换比信息设为此异常数据的转换比信息,并清除异常标记。
基于上述实施例,本申请还包括:获取与新增中标数据商品名信息相同的数据的原始价格信息集、转换比信息集,基于单位价格=价格/转换比获取单位价格信息集,从所述单位价格信息集中获取数值中位数作为标准价格;将新增数据中标数据价格、单位价格分别与所述标准价格进行对比,获取与标准价格相差小于预设价格差值(根据应用需要设置) 的价格作为目标单位价格,若目标单位价格与标准价格的差值与标准价格的比值大于预设阈值,则重新计算目标单位价格与所述标准价格。
具体地,获取与新增中标数据商品名信息相同的数据的原始价格信息集、转换比信息集,基于单位价格=价格/转换比获取单位价格信息集,于上述单位价格信息集中获取数值中位数作为标准价格,将新增数据中标数据价格、单位价格分别与标准价格进行对比,取最接近标准价格的数值作为最终单位价格,若(|最终单位价格-标准价格|)/标准价格>0.75,重新上述步骤计算目标单位价格与所述标准价格。
由此,通过建立一套记录链接算法,将各省级药品招采平台获取的中标药品信息与国家上市药品信息进行记录链接,得到完整规范的中标药品信息;其次我们对中标药品的价格信息统一处理值最小包装单位(片/粒/支)价格;减少人工,提高了数据处理速度及准确度。
为了实现上述实施例,本申请还提出一种药品中标信息挖掘装置。
图5为本申请实施例提供的一种药品中标信息挖掘装置的结构示意图。
如图5所示,该药品中标信息挖掘装置包括:获取模块510、计算模块520和处理模块530。
获取模块510,用于获取招标平台的药品信息。
计算模块520,用于计算所述药品信息和预先建立的上市药品标准表中标准药品信息的目标匹配度。
处理模块530,用于根据所述目标匹配度确定所述上市药品标准表中的目标索引值,并根据所述目标索引值对应的药品信息列表存入标准中标药品信息表。
本申请实施例的药品中标信息挖掘装置,通过获取招标平台的药品信息;计算药品信息和预先建立的上市药品标准表中标准药品信息的目标匹配度;根据目标匹配度确定上市药品标准表中的目标索引值,并根据目标索引值对应的药品信息列表存入标准中标药品信息表。由此,能够获取完整规范的中标药品信息,以便及时且准确的了解各地区药品中标信息详情。
需要说明的是,前述对药品中标信息挖掘方法实施例的解释说明也适用于该实施例的药品中标信息挖掘装置,此处不再赘述。
为了实现上述实施例,本申请还提出一种计算机设备,包括:处理器,以及用于存储所述处理器可执行指令的存储器。
其中,所述处理器通过读取所述存储器中存储的可执行程序代码来运行与所述可执行程序代码对应的程序,以用于实现如本申请前述实施例提出的药品中标信息挖掘方法。
为了实现上述实施例,本申请还提出一种非临时性计算机可读存储介质,当所述存储介质中的指令由处理器被执行时,使得处理器能够执行本申请前述实施例提出的药品中标信息挖掘方法。
为了实现上述实施例,本申请还提出一种计算机程序产品,当所述计算机程序产品中的指令由处理器执行时,执行实现本申请前述实施例提出的药品中标信息挖掘方法。
图6示出了适于用来实现本申请实施方式的示例性计算机设备的框图。图6显示的计算机设备12仅仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。
如图6所示,计算机设备12以通用计算设备的形式表现。计算机设备12的组件可以包括但不限于:一个或者多个处理器或者处理单元16,系统存储器28,连接不同系统组件(包括系统存储器28和处理单元16)的总线18。
总线18表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(Industry StandardArchitecture;以下简称:ISA)总线,微通道体系结构(Micro Channel Architecture;以下简称:MAC)总线,增强型ISA总线、视频电子标准协会(Video Electronics StandardsAssociation;以下简称: VESA)局域总线以及外围组件互连(Peripheral ComponentInterconnection;以下简称:PCI) 总线。
计算机设备12典型地包括多种计算机系统可读介质。这些介质可以是任何能够被计算机设备12访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
存储器28可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器 (Random Access Memory;以下简称:RAM)30和/或高速缓存存储器32。计算机设备12 可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统34可以用于读写不可移动的、非易失性磁介质(图6未显示,通常称为“硬盘驱动器”)。尽管图6中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如:光盘只读存储器(Compact Disc Read OnlyMemory;以下简称:CD-ROM)、数字多功能只读光盘(Digital Video Disc Read OnlyMemory;以下简称:DVD-ROM)或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线18相连。存储器28可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本申请各实施例的功能。
具有一组(至少一个)程序模块42的程序/实用工具40,可以存储在例如存储器28中,这样的程序模块42包括但不限于操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块42通常执行本申请所描述的实施例中的功能和/或方法。
计算机设备12也可以与一个或多个外部设备14(例如键盘、指向设备、显示器24等) 通信,还可与一个或者多个使得用户能与该计算机系统/服务器12交互的设备通信,和/或与使得该计算机系统/服务器12能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口22进行。并且,计算机设备12还可以通过网络适配器20与一个或者多个网络(例如局域网(Local AreaNetwork;以下简称:LAN),广域网(Wide Area Network;以下简称:WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器20通过总线18与计算机设备12的其它模块通信。应当明白,尽管图中未示出,可以结合计算机设备12使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
处理单元16通过运行存储在系统存储器28中的程序,从而执行各种功能应用以及数据处理,例如实现前述实施例中提及的药品中标信息挖掘方法。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本申请的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本申请的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现定制逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本申请的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本申请的实施例所属技术领域的技术人员所理解。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
应当理解,本申请的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。如,如果用硬件来实现和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本申请各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
上述提到的存储介质可以是只读存储器,磁盘或光盘等。尽管上面已经示出和描述了本申请的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本申请的限制,本领域的普通技术人员在本申请的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims (10)

1.一种药品中标信息挖掘方法,其特征在于,包括以下步骤:
获取招标平台的药品信息;
计算所述药品信息和预先建立的上市药品标准表中标准药品信息的目标匹配度;
根据所述目标匹配度确定所述上市药品标准表中的目标索引值,并根据所述目标索引值对应的药品信息列表存入标准中标药品信息表。
2.如权利要求1所述的药品中标信息挖掘方法,其特征在于,所述计算所述药品信息和预先建立的上市药品标准表中标准药品信息的目标匹配度,包括:
对所述药品信息中原始通用名信息进行清洗后,根据通用名-成分名关联关系图谱,获取成分名信息;
对所述药品信息中原始企业信息进行清洗后在企业字典中进行匹配,获取企业名信息;
分别对所述成分名信息、所述企业名信息与所述上市药品标准表中的成分名信息、企业名信息进行编辑距离计算,获取第一匹配度值和第二匹配度值;
对所述药品信息中原始剂型信息进行清洗后与所述上市药品标准表中的剂型信息进行字符串匹配,获取第三匹配度值;
对所述药品信息中原始规格进行转换后与所述上市药品标准表中的规格信息进行字符串匹配,获取第四匹配度值;
对所述药品信息中原始商品名信息进行清洗后与所述上市药品标准表中的商品名信息进行编辑距离计算,获得第五匹配度值;
根据所述第一匹配度值、所述第二匹配度值、所述第三匹配度值、所述第四匹配度值和所述第五匹配度值、以及每个匹配度值对应的权重系数进行计算获取所述目标匹配度。
3.如权利要求1所述的药品中标信息挖掘方法,其特征在于,还包括:
获取上市药品的药品原始信息;
对所述药品原始信息进行分析,生成上市药品标准表。
4.如权利要求3所述的药品中标信息挖掘方法,所述对所述药品原始信息进行分析,生成上市药品标准表,包括:
将药品名称进行清洗后在药品字典中进行匹配,获取标准药品名称信息;
将药品生产企业信息进行清洗后在企业字典中进行匹配,获取标准企业名信息;
将药品剂型信息进行清洗后转换成标准剂型,获取标准剂型信息;
根据药品名称-通用名-成分名关联关系图谱,获取药品名称对应的标准通用名信息和标准成分名信息;
根据标准药品名称信息、标准企业名信息、标准剂型信息、标准通用名信息、标准成分名信息、规格信息、商品名信息和索引值生成所述上市药品标准表。
5.如权利要求1所述的药品中标信息挖掘方法,其特征在于,还包括:
从所述标准中标药品信息表中获取与新增中标药品数据成分名相同的转换比信息集一,以及获取与新增中标药品数据成分名相同且企业名相同的转换比信息集二;
计算新增中标药品的转换比在转换比信息集一中的第一出现比例;
计算新增中标药品的转换比在转换比信息集二中的第二出现比例;
根据所述第一出现比例、所述第二出现比例和预设阈值确定转换比信息是否异常出现比例。
6.如权利要求5所述的药品中标信息挖掘方法,其特征在于,还包括:
获取转换比标记为异常的数据,并获取异常数据的成分名、剂型、规格相同且企业类型相同的第一价格信息集;
若所述第一价格信息集为空,获取与所述异常数据的成分名相同且企业类型相同的第二价格信息集;
在所述第二价格信息集中获取与所述异常数据的价格差值小于价格阈值的目标价格信息,并将所述目标价格信息对应的转换比信息设置为所述异常数据的转换比信息,并清除异常标记。
7.如权利要求1所述的药品中标信息挖掘方法,其特征在于,还包括:
获取与新增中标数据商品名信息相同的数据的原始价格信息集、转换比信息集,基于单位价格=价格/转换比获取单位价格信息集,从所述单位价格信息集中获取数值中位数作为标准价格。
8.如权利要求7所述的药品中标信息挖掘方法,其特征在于,还包括:
将新增数据中标数据价格、单位价格分别与所述标准价格进行对比,获取与所述标准价格相差小于预设价格差值的价格作为目标单位价格。
9.如权利要求8所述的药品中标信息挖掘方法,其特征在于,还包括:
若所述目标单位价格与所述标准价格的差值与所述标准价格的比值大于预设阈值,则重新计算所述目标单位价格与所述标准价格。
10.一种药品中标信息挖掘装置,其特征在于,包括:
获取模块,用于获取招标平台的药品信息;
计算模块,用于计算所述药品信息和预先建立的上市药品标准表中标准药品信息的目标匹配度;
处理模块,用于根据所述目标匹配度确定所述上市药品标准表中的目标索引值,并根据所述目标索引值对应的药品信息列表存入标准中标药品信息表。
CN202011522523.4A 2020-12-21 2020-12-21 药品中标信息挖掘方法和装置 Active CN112925819B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011522523.4A CN112925819B (zh) 2020-12-21 2020-12-21 药品中标信息挖掘方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011522523.4A CN112925819B (zh) 2020-12-21 2020-12-21 药品中标信息挖掘方法和装置

Publications (2)

Publication Number Publication Date
CN112925819A true CN112925819A (zh) 2021-06-08
CN112925819B CN112925819B (zh) 2023-05-19

Family

ID=76162694

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011522523.4A Active CN112925819B (zh) 2020-12-21 2020-12-21 药品中标信息挖掘方法和装置

Country Status (1)

Country Link
CN (1) CN112925819B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113722377A (zh) * 2021-08-30 2021-11-30 武汉海云健康科技股份有限公司 一种药品标准库的搭建方法及系统

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140316924A1 (en) * 2013-04-18 2014-10-23 International Businiess Machines Corporation Method, Apparatus and Program Product Facilitating Contract Formation With Labor Component
CN107818124A (zh) * 2017-03-03 2018-03-20 平安医疗健康管理股份有限公司 数据匹配方法及装置
JP2018181370A (ja) * 2018-07-19 2018-11-15 富士フイルム株式会社 薬剤名出力装置および薬剤名出力方法並びに薬剤名出力プログラム
CN109215771A (zh) * 2018-05-29 2019-01-15 平安医疗健康管理股份有限公司 医疗映射关系库建立方法、装置、计算机设备和存储介质
CN109255013A (zh) * 2018-08-14 2019-01-22 平安医疗健康管理股份有限公司 理赔决策方法、装置、计算机设备和存储介质
CN110289058A (zh) * 2019-06-06 2019-09-27 北京市天元网络技术股份有限公司 一种电子病历规范化匹配方法以及装置
CN110992155A (zh) * 2019-11-28 2020-04-10 珠海采筑电子商务有限公司 竞标入围处理方法及相关产品
WO2020114221A1 (zh) * 2018-12-04 2020-06-11 平安医疗健康管理股份有限公司 基于生物特征识别的定点医药机构的监管方法及相关设备

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140316924A1 (en) * 2013-04-18 2014-10-23 International Businiess Machines Corporation Method, Apparatus and Program Product Facilitating Contract Formation With Labor Component
CN107818124A (zh) * 2017-03-03 2018-03-20 平安医疗健康管理股份有限公司 数据匹配方法及装置
CN109215771A (zh) * 2018-05-29 2019-01-15 平安医疗健康管理股份有限公司 医疗映射关系库建立方法、装置、计算机设备和存储介质
JP2018181370A (ja) * 2018-07-19 2018-11-15 富士フイルム株式会社 薬剤名出力装置および薬剤名出力方法並びに薬剤名出力プログラム
CN109255013A (zh) * 2018-08-14 2019-01-22 平安医疗健康管理股份有限公司 理赔决策方法、装置、计算机设备和存储介质
WO2020114221A1 (zh) * 2018-12-04 2020-06-11 平安医疗健康管理股份有限公司 基于生物特征识别的定点医药机构的监管方法及相关设备
CN110289058A (zh) * 2019-06-06 2019-09-27 北京市天元网络技术股份有限公司 一种电子病历规范化匹配方法以及装置
CN110992155A (zh) * 2019-11-28 2020-04-10 珠海采筑电子商务有限公司 竞标入围处理方法及相关产品

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113722377A (zh) * 2021-08-30 2021-11-30 武汉海云健康科技股份有限公司 一种药品标准库的搭建方法及系统

Also Published As

Publication number Publication date
CN112925819B (zh) 2023-05-19

Similar Documents

Publication Publication Date Title
CN111475686A (zh) 一种药品分类方法、装置、存储介质和智能设备
US7984069B2 (en) Computer algorithms and methods for product safety
US20080306984A1 (en) System and method for semantic normalization of source for metadata integration with etl processing layer of complex data across multiple data sources particularly for clinical research and applicable to other domains
CN108630322A (zh) 药物相互作用建模与风险评估方法、终端设备及存储介质
US20190355081A1 (en) Method and apparatus for the unified evaluation, presentation and modification of healthcare regimens
Weenen et al. Food-Pharma convergence in medical nutrition–best of both worlds?
Salleron et al. Effectiveness research in inflammatory bowel disease: a necessity and a methodological challenge
CN112925819A (zh) 药品中标信息挖掘方法和装置
Slyer et al. A systematic review of the effectiveness of nurse coordinated transitioning of care on readmission rates for patients with heart failure
Hedenmalm et al. A European multicentre drug utilisation study of the impact of regulatory measures on prescribing of codeine for pain in children
CN114342001A (zh) 包含与高血压治疗相关的专业知识在内的人工智能系统
McBride et al. Using Australian medicines terminology (AMT) and SNOMED CT-AU to better support clinical research.
Khan et al. Assessing the impact of policy measures in reducing the COVID-19 pandemic: a case study of south Asia
CN115101186B (zh) 基于大数据的医院就诊信息管理方法及装置
JP6473219B1 (ja) 在庫管理装置、在庫管理システム、在庫管理方法、および在庫管理プログラム
CN115775635A (zh) 基于深度学习模型的药品风险识别方法、装置及终端设备
CN114724693A (zh) 异常诊疗行为的检测方法及装置、电子设备和存储介质
CN113990427A (zh) 目标数据确定方法、装置、电子设备及存储介质
CN113689924A (zh) 相似病历检索方法、装置、电子设备及可读存储介质
CN112527830A (zh) 数据查询方法、装置、设备及存储介质
CN112667721A (zh) 数据分析方法、装置、设备及存储介质
CN111477294A (zh) 一种智能诊所系统药品单位切换的处理方法
US20210019296A1 (en) System and method for data de-duplication and augmentation
Jaguste Medication package inserts: Complete, accurate, and up-to-date
JPH11161704A (ja) 処方区分の入力方法及び処方区分の入力装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20240105

Address after: Room 403, 4th Floor, Building 11, No. 8 Heying Road, Science and Technology Park, Changping District, Beijing, 102299

Patentee after: Beijing Huabin Licheng Technology Co.,Ltd.

Address before: 200070 room 178, 4th floor, building 1, 5199 Gonghexin Road, Baoshan District, Shanghai

Patentee before: Shanghai Yaohui Information Technology Co.,Ltd.