CN107766397B - 数据库更新方法和装置 - Google Patents

数据库更新方法和装置 Download PDF

Info

Publication number
CN107766397B
CN107766397B CN201710125137.3A CN201710125137A CN107766397B CN 107766397 B CN107766397 B CN 107766397B CN 201710125137 A CN201710125137 A CN 201710125137A CN 107766397 B CN107766397 B CN 107766397B
Authority
CN
China
Prior art keywords
medical material
content
field
detail
database
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710125137.3A
Other languages
English (en)
Other versions
CN107766397A (zh
Inventor
张亚刚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Ping An Medical Health Technology Service Co Ltd
Original Assignee
Ping An Medical and Healthcare Management Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Medical and Healthcare Management Co Ltd filed Critical Ping An Medical and Healthcare Management Co Ltd
Priority to CN201710125137.3A priority Critical patent/CN107766397B/zh
Publication of CN107766397A publication Critical patent/CN107766397A/zh
Application granted granted Critical
Publication of CN107766397B publication Critical patent/CN107766397B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/23Updating
    • G06F16/2365Ensuring data consistency and integrity
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computer Security & Cryptography (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本发明涉及一种数据库更新方法和装置,该方法包括获取待入库的医用材料明细;判断待入库的医用材料明细的核心字段的内容是否与数据库中的医用材料明细的核心字段的内容相对应;若是,则判断待入库的医用材料明细的关键字段的内容是否与数据库中的医用材料明细的关键字段的内容相同;若是,则将待入库的医用材料明细添加到数据库中的相应的医用材料明细的分类下。上述数据库更新方法和装置,首先通过判断核心字段的内容来判断医用材料明细是否为新增的,在医用材料明细为新增时,通过关键字段的内容来确定该新增的医用材料明细应该存放在数据库的位置,从而可以实现新增的医用材料明细的自动入库,节省了人力物力,提高了匹配效率。

Description

数据库更新方法和装置
技术领域
本发明涉及数据处理领域,特别是涉及一种数据库更新方法和装置。
背景技术
当前医用材料的品种繁多、各类产品技术特点复杂、组成结构差异大,且随着时间的变化,在国家食品药品监督管理总局上注册医用材料的数量越来越多,这使得各个地方或公司的医用材料库需要针对于国家食品药品监督管理总局上注册的医用材料的增加而进行更新,传统中该项工作通常是人工进行,效率低下。
发明内容
基于此,有必要针对上述人工更新医用材料库所造成的效率低下的问题,提供一种数据库更新方法和装置。
一种数据库更新方法,所述方法包括:
获取待入库的医用材料明细;
判断所述待入库的医用材料明细的核心字段的内容是否与数据库中的医用材料明细的核心字段的内容相对应;
当所述待入库的医用材料明细的核心字段的内容与数据库中的医用材料明细的核心字段的内容不相对应时,则判断所述待入库的医用材料明细的关键字段的内容是否与所述数据库中的医用材料明细的关键字段的内容相同;
当所述待入库的医用材料明细的关键字段的内容与所述数据库中的医用材料明细的关键字段的内容相同时,则将所述待入库的医用材料明细添加到所述数据库中的相应的医用材料明细的分类下,所述相应的医用材料明细的关键字段的内容与所述待入库的医用材料明细的关键字段的内容相同。
在其中一个实施例中,所述将所述待入库的医用材料明细添加到所述数据库中的相应的医用材料明细的分类下的步骤之后,还包括:
判断所述待入库的医用材料明细入库后,是否存在无内容的字段;
当所述待入库的医用材料明细入库后存在无内容的字段时,则根据所述相应的医用材料明细的相应字段的内容填充所述无内容的字段的内容。
在其中一个实施例中,所述根据所述相应的医用材料明细的相应字段的内容填充所述无内容的字段的内容的步骤,包括:
判断所述待入库的医用材料明细的核心字段的内容中是否存在预设字符串;
当所述待入库的医用材料明细的核心字段的内容中存在预设字符串时,则根据所述待入库的医用材料明细的核心字段的内容中、除所述预设字符串以外的内容,遍历所述数据库中的医用材料明细的核心字段的内容;
当在所述数据库中遍历到相关医用材料明细,则根据所述相关医用材料明细的相应字段中的内容填充所述无内容的字段,所述相关医用材料明细的核心字段的内容与所述待入库的医用材料明细的核心字段的内容相对应。
在其中一个实施例中,所述判断所述待入库的医用材料明细的关键字段的内容是否与所述数据库中的医用材料明细的关键字段的内容相同的步骤,包括:
获取分词逻辑;
根据所述分词逻辑对所述待入库的医用材料明细的关键字段的内容进行分词处理以形成待判断数据;
根据所述分词逻辑对所述数据库中的医用材料明细的关键字段的内容进行分词处理以形成标准数据;
判断所述标准数据是否与所述待判断数据相同;
当所述标准数据与所述待判断数据相同时,则返回所述待入库的医用材料明细的关键字段的内容与所述数据库中的医用材料明细的关键字段的内容相同的结果;
当所述标准数据与所述待判断数据不相同时,则返回所述待入库的医用材料明细的关键字段的内容未与所述数据库中的医用材料明细的关键字段的内容不相同的结果。
在其中一个实施例中,所述方法还包括:
获取字段标化逻辑,所述字段标化逻辑包括所述待入库的医用材料明细的每一字段名称与所述数据库中的医用材料明细的每一字段名称的映射关系;
所述获取待入库的医用材料明细的步骤之后,还包括:
获取待入库的医用材料明细的各个字段的名称;
根据所述字段标化逻辑,对所述待入库的医用材料明细的各个字段的名称进行标准化处理。
在其中一个实施例中,所述方法还包括:
获取所述相应的医用材料明细的编码;
根据所述相应的医用材料的编码,对所述待入库的医用材料明细进行编码。
一种数据库更新装置,所述装置包括:
数据获取模块,用于获取待入库的医用材料明细;
核心字段判断模块,用于判断所述待入库的医用材料明细的核心字段的内容是否与数据库中的医用材料明细的核心字段的内容相对应;
关键字段判断模块,用于在所述待入库的医用材料明细的核心字段的内容,与数据库中的医用材料明细的核心字段的内容不相对应时,则判断所述待入库的医用材料明细的关键字段的内容是否与所述数据库中的医用材料明细的关键字段的内容相同;
入库模块,用于在所述待入库的医用材料明细的关键字段的内容与所述数据库中的医用材料明细的关键字段的内容相同时,则将所述待入库的医用材料明细添加到所述数据库中的相应的医用材料明细的分类下,所述相应的医用材料明细的关键字段的内容与所述待入库的医用材料明细的关键字段的内容相同。
在其中一个实施例中,所述装置还包括:
内容判断模块,用于判断所述待入库的医用材料明细入库后,是否存在无内容的字段;
内容填充模块,用于在存在所述无内容字段时,根据所述相应的医用材料明细的相应字段的内容填充所述无内容的字段的内容。
在其中一个实施例中,所述内容补充模块包括:
预设字符串判断单元,用于判断所述待入库的医用材料明细的核心字段的内容中是否存在预设字符串;
遍历单元,用于在所述待入库的医用材料明细的核心字段的内容中存在预设字符串时,则根据所述待入库的医用材料明细的核心字段的内容中、除所述预设字符串以外的内容,遍历所述数据库中的医用材料明细的核心字段的内容;
填充单元,用于当在所述数据库中遍历到相关医用材料明细,则根据所述相关医用材料明细的相应字段中的内容填充所述无内容的字段,所述相关医用材料明细的核心字段的内容与所述待入库的医用材料明细的核心字段的内容相对应。
在其中一个实施例中,所述匹配模块包括:
分词逻辑获取单元,用于获取分词逻辑;
待匹配数据形成单元,用于根据所述分词逻辑对所述待入库的医用材料明细的关键字段的内容进行分词处理以形成待判断数据;
标准数据形成单元,用于根据所述分词逻辑对所述数据库中的医用材料明细的关键字段的内容进行分词处理以形成标准数据;
判断单元,用于判断所述标准数据是否与所述待判断数据相同,且若所述标准数据与所述待查询数据相同,则返回所述待入库的医用材料明细的关键字段的内容与所述数据库中的医用材料明细的关键字段的内容相同的结果;若所述标准数据与所述待查询数据不相同,则返回所述待入库的医用材料明细的关键字段的内容未与所述数据库中的医用材料明细的关键字段的内容不相同的结果。
上述数据库更新方法和装置,首先通过判断核心字段的内容是否与数据库中的医用材料明细的核心字段的内容相同来判断医用材料明细是否为新增的,在医用材料明细为新增的时,则通过关键字段的内容来确定该新增的医用材料明细应该存放在数据库的何处,从而可以实现新增的医用材料明细的自动入库,节省了人力物力,提高了匹配效率。
附图说明
图1为一实施例中数据库更新方法的流程图;
图2为一实施例中填充步骤的流程图;
图3为一实施例中数据库的部分数据示意图;
图4为图2所示实施例中的步骤S204的流程图;
图5为一实施例中变更前的医用材料明细的示意图;
图6为图5所对应的医用材料明细变更后的示意图;
图7为图1所示实施例中的步骤S106的流程图;
图8为一实施例中字段标化逻辑的示意图;
图9为一实施例中数据库更新装置的结构示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用于解释本发明,并不用于限定本发明。
在详细说明根据本发明的实施例前,应该注意到的是,所述的实施例主要在于与数据排序方法和装置相关的步骤和系统组件的组合。因此,所属系统组件和方法步骤已经在附图中通过常规符号在适当的位置表示出来了,并且只示出了与理解本发明的实施例有关的细节,以免因对于得益于本发明的本领域普通技术人员而言显而易见的那些细节模糊了本发明的公开内容。
在本文中,诸如左和右,上和下,前和后,第一和第二之类的关系术语仅仅用来区分一个实体或动作与另一个实体或动作,而不一定要求或暗示这种实体或动作之间的任何实际的这种关系或顺序。术语“包括”、“包含”或任何其他变体旨在涵盖非排他性的包含,由此使得包括一系列要素的过程、方法、物品或者设备不仅包含这些要素,而且还包含没有明确列出的其他要素,或者为这种过程、方法、物品或者设备所固有的要素。
请参阅图1所示,图1为一实施例中数据库更新方法的流程图,在该实施例中,该数据库更新方法可以包括:
S102:获取待入库的医用材料明细。
具体地,医用材料明细包含若干个字段,每一个字段都存储有该医用材料的相关内容,例如其可以包括注册证号字段、产品项目名称字段、生产厂商字段、生产厂地址字段、生产场所字段、是否进口字段、产品标准字段、单位字段、规格型号字段、产品性能结构及组成字段、产品使用范围字段、批准日期字段、有效期截止日字段、变更日期字段、是否启用字段、注册代理字段、售后服务机构字段、备注字段等。
实际使用中,政府、医院或者一些厂商等为了能够对医用材料的制造、使用的过程中进行监督,会建立医用材料明细库,但是由于随着时间的推移在食品药品监督管理总局注册的医用材料会越来越多,因此为了使得已建立的医用材料明细库更加地完善,需要随着时间的推移来更新已建立的医用材料明细库,从而该步骤中获取待入库的医用材料明细可以是从食品药品监督管理总局的官网上获取到的医用材料明细,其可以通过下载的方式或者是通过爬虫程序抓取相关的内容。
S104:判断待入库的医用材料明细的核心字段的内容是否与数据库中的医用材料明细的核心字段的内容相对应。
具体地,由于已建立的医用材料库中已经存储有大量的医用材料明细,因此将从食品药品监督管理总局的官网上获取到的医用材料明细入库之前,需要判断已建立的医用材料明细库中是否已存储有该待入库的医用材料明细,如果已建立的医用材料明细库中已存储有该待入库的医用材料明细,则不再需要将该医用材料明细入库,只有已建立的医用材料库中未存储有该待入库的医用材料明细的时候,才将该待入库的医用材料明细入库。
上述的医用材料明细的核心字段是可以唯一指示该医用材料明细的字段,其可以是注册证号字段,也就可以是上述的其他字段。
当核心字段为注册证号字段时,判断注册证号字段的内容是否已记载在已建立的医用材料明细库的注册证号字段中的步骤可以是判断待入库的医用材料明细是否为新的。需要注意的是,注册证号一般是由文字加数字构成的,其包括新增加的医用材料明细的注册证号和变更后的医用材料明细的注册证号,变更后的医用材料明细可以是以变更前的医用材料明细为基础,改变医用材料明细中某些字段的内容等,例如生产地址字段等。在本技术方案中,上述新增加的医用材料明细的注册证号和变更后的医用材料明细的注册证号均被认为新的注册证号,例如新增加的医用材料明细的注册证号的格式可以为“国食药监械(进)字2013第2223362号”,变更后的医用材料明细的注册证号的格式可以为“国食药监械(进)字2013第2223362号(变更文件)”,即变更后的医用材料明细的注册证号可以是在变更之前的医用材料明细的注册证号之后添加“(变更文件)”的字样。
在判断待入库的医用材料明细的核心字段的内容是否与数据库中的医用材料明细的核心字段的内容相对应时,可以是判断待入库的医用材料明细的核心字段的内容是否与数据库中的医用材料明细的核心字段的内容相同,即判断待入库的医用材料明细的注册证号字段的内容是否已存在于数据库中,即使数据库中已存在有“国食药监械(进)字2013第2223362号”的注册证号,带有“变更文件”的注册证号“国食药监械(进)字2013第2223362号(变更文件)”也会被认为是新的注册证号,即数据库中不存在该注册证号,从而与该注册证号相对应的医用材料明细需要入库。
所述待入库的医用材料明细的核心字段的内容与数据库中的医用材料明细的核心字段的内容相对应时,即数据库中已经存在有该待入库的医用材料明细,则该待入库的医用材料明细不再需要入库,从而继续获取下一待入库的医用材料明细,直至所有待入库的医用材料明细判断完成。
S106:当所述待入库的医用材料明细的核心字段的内容与数据库中的医用材料明细的核心字段的内容不相对应时,则判断待入库的医用材料明细的关键字段的内容是否与数据库中的医用材料明细的关键字段的内容相同。
具体地,在步骤S104中是为了确定待入库的医用材料明细是否确定要入库,而本步骤S106是为了确定需要入库的待入库医用材料明细入库后的具体位置。在本技术方案中数据库中存储的医用材料明细是按照一定的逻辑进行存储的,这样在后续的调用、查询等利用该数据库的过程中,可以大大减少工作量。
其中关键字段可以是指能够唯一确定待入库医用材料明细入库后的具体存储位置的字段,其可以是指产品项目名称字段,也可以是上文中所提到的其他字段。
当关键字段是指产品项目名称字段时,由于在食品药品监督管理总局中注册的医用材料明细的产品项目名称字段可能存在多个,例如一个中文产品名称和一个英文产品名称,此时在判断的时候,可以既通过该中文产品名称进行判断,又通过英文产品名称进行判断,也可以仅通过中文产品名称进行判断。
S108:当所述待入库的医用材料明细的关键字段的内容与所述数据库中的医用材料明细的关键字段的内容相同时则将待入库的医用材料明细添加到数据库中的相应的医用材料明细的分类下,相应的医用材料明细的关键字段的内容与待入库的医用材料明细的关键字段的内容相同。
具体地,在上文中已提到,数据库中存储的医用材料明细均是按照一定的逻辑进行存储的,通过关键字段的内容可以确定待入库的医用材料明细的相应的存储的位置,即找到与待入库的医用材料明细的关键字段的内容相同的、已存储在数据库中的医用材料明细,将待入库的医用材料明细存储到其分类下即可。
S110:当所述待入库的医用材料明细的关键字段的内容与所述数据库中的医用材料明细的关键字段的内容不相同时,则在屏幕上显示该医用材料明细,以引入人工干预。
具体地,当数据库中的医用材料明细的关键字段的内容均与待入库的医用材料明细的关键字段的内容不相同时,则可以在屏幕上显示该医用材料明细,以引入人工干预,由用户来进行分类,以确定该医用材料明细在数据库中存储的位置。
上述数据库更新方法,首先通过判断核心字段的内容是否与数据库中的医用材料明细的核心字段的内容相同来判断医用材料明细是否为新增的,在医用材料明细为新增的时,则通过关键字段的内容来确定该新增的医用材料明细应该存放在数据库的何处,从而可以实现新增的医用材料明细的自动入库,节省了人力物力,提高了匹配效率。
在其中一个实施例中,请参阅图2所示,图2为一实施例中填充步骤的流程图,该填充步骤是在上文中的将待入库的医用材料明细添加到数据库中的相应的医用材料明细的分类下的步骤,即步骤S108之后的,该填充步骤可以包括:
S202:判断待入库的医用材料明细入库后,是否存在无内容的字段。
具体地,请参阅图3所示,图3为一实施例中数据库的部分数据示意图,在该实施例中,数据库中存储的医用材料明细划分为六级,第一级分类至第四级分类为结构分类,其中第一级分类中,划分了九大类,第二级分类主要以功能区分,第三级分类是次级细化分类,第四级分类是以解剖结构区分,第五级分类是通用名,第六级分类是商品名,在上文中关键字段具体可以是指商品名字段。
在待入库的医用材料明细入库后,还可以判断该医用材料入库后是否存在无内容的字段,如图3所示,最后一条医用材料明细入库后存在大量的无内容字段,例如生产厂商字段、生产地址字段、生产场所字段、是否进口字段、产品标准字段等,如果该些字段空缺的话,则会导致该医用材料明细的内容不完整,在后续的调用和使用的过程中均会出现错误,因此在本实施例中将对该些无内容的字段进行填充。
S204:当所述待入库的医用材料明细入库后存在无内容的字段时,则根据相应的医用材料明细的相应字段的内容填充无内容的字段的内容。
具体地,在判断待入库的医用材料明细的具体入库的位置时,根据关键字段的内容进行了判断,例如上述的最后一条医用材料明细在入库时,可以获取到倒数第三条和倒数第二条的医用材料明细的位置,此时可以根据该倒数第三条医用材料明细或倒数第二条医用材料明细的具体位置来存储最后一条的医用材料明细,且在最后一条医用材料明细入库后,可以根据倒数第三条医用材料明细和倒数第二条医用材料明细的相关字段填充最后一条医用材料明细的无内容的字段,例如备注字段的内容等,或者可以由用户预先设定可以通过倒数第三条医用材料明细和倒数第二条医用材料明细来填充的字段,例如,可以预先设置数据库中的前五级的内容,以及第六级中的医保报销、报销类型、支付比例等相关字段的内容可以直接根据倒数第三条医用材料明细和倒数第二条医用材料明细来填充,而其他的字段的内容如果仍不完整,则可以输出显示,以提示用户来进行补充等。
当所述待入库的医用材料明细入库后不存在无内容的字段时,则等待下一待入库的医用材料明细入库后,判断待入库的医用材料明细是否存在无内容的字段,即继续步骤S202。
上述实施例中,在待入库的医用材料明细入库后,又根据数据库中已存储的医用材料明细对刚入库的医用材料明细的相关字段进行填充,进一步完善了数据库中医用材料明细的内容,为后续数据库的使用提供了便利。
请参阅图4所示,图4为图2所示实施例中的步骤S204的流程图,在该实施例中,步骤S204根据相应的医用材料明细的相应字段的内容填充无内容的字段的内容,还可以包括:
S402:判断待入库的医用材料明细的核心字段的内容中是否存在预设字符串。
具体地,该步骤主要是为了寻找到变更前的医用材料明细,以便根据变更前的医用材料明细更新变更后的医用材料明细的相关字段的内容,具体可以参阅图5和图6所示,图5为一实施例中变更前的医用材料明细的示意图,图6为图5所对应的医用材料明细变更后的示意图,由图5和图6可以看出,在变更后的医用材料明细中可能会省略未变更的字段的内容,而仅标识出变更字段的内容,从而在变更后的医用材料明细入库后,可以根据变更前的医用材料明细的相关字段进行字段内容的填充。
其中预设字符串可以是“(更)”、“(变更)”“(变更文本)”等标识了医用材料明细为基于原先注册的医用材料明细进行变更后的医用材料明细。
S404:当所述待入库的医用材料明细的核心字段的内容中存在预设字符串时,则根据待入库的医用材料明细的核心字段的内容中、除预设字符串以外的内容,遍历数据库中的医用材料明细的核心字段的内容。
具体地,可以参阅图5和图6所示,变更前的医用材料明细的核心字段,即注册证号字段的内容为“国食药监械(准)字2008第3461016号”,变更后的注册证号字段的内容为“国食药监械(准)字2008第3461016号(更)”,两者之间仅相差“(更)”,因此在去除掉预设字符串“(更)”之后,便可以查询到变更前的医用材料明细。
S406:当在数据库中遍历到相关医用材料明细,则根据相关医用材料明细的相应字段中的内容填充无内容的字段,相关医用材料明细的核心字段的内容与待入库的医用材料明细的核心字段的内容相对应。
具体地,如图5和图6所示,变更前的医用材料明细和变更后的医用材料明细仅注册证号字段和规格型号字段的内容发生了变化,所以在遍历到变更前的医用材料明细之后,可以根据变更前的医用材料明细的其他字段来填充变更后的医用材料明细的其他字段,以使得入库后的医用材料明细的每一个字段都存储有相关内容,从而可以方便后续的查询等。
S408:当所述待入库的医用材料明细的核心字段的内容中不存在预设字符串时,则输出显示,以提示用户来进行补充。
上述实施例中,通过变更前的医用材料明细的相关字段的内容填充了变更后的医用材料明细的相关字段的内容,使得入库后的医用材料明细的每一个字段都存储有相关内容,进一步完善了数据库中医用材料明细的内容,为后续数据库的使用提供了便利。
在其中一个实施例中,请参阅图7所示,图7为图1所示实施例中的步骤S106的流程图,在该实施例中,判断待入库的医用材料明细的关键字段的内容是否与数据库中的医用材料明细的关键字段的内容相同的步骤可以包括:
S702:获取分词逻辑。
具体地,分词逻辑是由用户自行预设的,该分词逻辑一般可以预先进行存储。
S704:根据分词逻辑对待入库的医用材料明细的关键字段的内容进行分词处理以形成待判断数据。
具体地,待判断数据是根据分词逻辑对关键字段的内容划分的包括若干个标准医学术语的数据。
S706:根据分词逻辑对数据库中的医用材料明细的关键字段的内容进行分词处理以形成标准数据。
具体地,标准数据是根据分词逻辑对关键字段的内容划分的包括若干个标准医学术语的数据。
上述的“医学标准术语”是指具有独立语义的术语,其不受其之后或之前的文字的影响,仅通过术语内容的文字即可以确定完整的医学专业概念。例如,“气管支架”其可以被划分为“气管”和“支架”两个词,因为该两个词都具有独立的语义。同理“食道支架”也被划分为两个词“食道”和“支架”。
S708:判断标准数据是否与待判断数据相同。
该过程是一个匹配过程,即假设待判断数据被划分为第一分词、第二分词和第三分词,则首先用第一分词去匹配标准数据得到第一结果,假设第一结果中存在100条医用材料明细,则再用第二分词去匹配该100条医用材料明细得到第二结果,假设第二结果中存在10条医用材料明细,则再用第三分词去匹配第二结果中的10条医用材料名字,得到最后的结果。
当最后结果中也存在多个医用材料明细,且该多个医用材料明细的产品项目名称字段的内容不一样时,则显示最后结果中的多个医用材料明细,由用户选择其中一个。最后结果中也存在多个医用材料明细,且该多个医用材料明细的产品项目名称字段的内容一样时,则该多个医用材料明细一定是在同一分类下,因此随机选取其中的一个即可,不需要引入用户干预。
S710:当所述标准数据与所述待判断数据相同时,则返回待入库的医用材料明细的关键字段的内容与数据库中的医用材料明细的关键字段的内容相同的结果。
具体地,当存在与待判断数据相同的标准数据时,则返回待入库的医用材料明细的关键字段的内容与数据库中的医用材料明细的关键字段的内容相同的结果,从而可以根据该标准数据所对应的医用材料明细的分类将待入库的医用材料明细入库。
S712:当所述标准数据与所述待判断数据不相同时,则返回待入库的医用材料明细的关键字段的内容未与数据库中的医用材料明细的关键字段的内容不相同的结果。
具体地,当不存在与待判断数据相同的标准数据时,则返回待入库的医用材料明细的关键字段的内容与数据库中的医用材料明细的关键字段的内容相同的结果,从而输出显示待入库的医用材料明细,由用户来手动将待入库的医用材料明细入库。
上述实施例中,通过采用同一分词逻辑对待入库的医用材料明细的关键字段的内容和数据库中的医用材料明细的关键字段的内容进行分词后,自动判断待入库的医用材料明细是否已存在于数据库中,节省了人力物力,提高了效率。
在其中一个实施例中,数据库更新方法还可以包括:获取字段标化逻辑,字段标化逻辑包括待入库的医用材料明细的每一字段名称与数据库中的医用材料明细的每一字段名称的映射关系,具体可以参见图8所示,图8为一实施例中字段标化逻辑的示意图。
获取待入库的医用材料明细的步骤之后,还包括:获取待入库的医用材料明细的各个字段的名称。根据字段标化逻辑,对待入库的医用材料明细的各个字段的名称进行标准化处理。
其中,结合图8所示,数据库中的字段“产品项目名称(商品名)”对应的食品药品监督管理总局的官网上的进口材料字段为“产品名称(中文)”和“产品名称(英文)”两项。在显示为数据库中的字段时应为“产品中文名(产品英文名)。例如,某进口产品食品药品监督管理总局的官网上的对应字段中“产品名称(中文)”为“宫腔镜及附件”,“产品名称(英文)”为“HYSTEROSCOPY AND ACCESSORIES”,则在数据库中的字段中应显示为“宫腔镜及附件(HYSTEROSCOPY AND ACCESSORIES)。
“生产厂商”在食品药品监督管理总局的官网上的原始字段对应为“生产厂商名称(中文)”和“注册人名称”,在数据库中则将“生产厂商名称(中文)”—“德国爱克曼有限公司”和“注册人名称”—“Ackermann Instrumente GmbH”,显示为“德国爱克曼有限公司(Ackermann Instrumente GmbH)”。
“备注”字段对应的食品药品监督管理总局的官网上的原始项目字段为多项时,则将各对应项合并,并以“;”作分割,即在通过爬虫程序抓取应该存储在备注字段的内容时,不同的内容之间用一预设的标点符号隔开,在该实施例中采用的是“;”。
“是否进口(Y/N)”字段在食品药品监督管理总局的官网上的数据中属于进口产品时直接显示为“Y”,属于国产产品时直接显示为“N”。
“单位”字段设置为爬虫后用户可手动添加。
“是否启用(N/Y)”,全部默认为“Y”,可人工平台上修改。
在上述实施例中,获取待入库的医用材料明细的各个字段的名称后,可以根据上述的字段标化逻辑,对待入库的医用材料明细的各个字段的名称进行标准化处理,以方便待入库的医用材料明细入库。
在其中一个实施例中,数据库更新方法还可以包括以下步骤:获取相应的医用材料明细的编码。根据相应的医用材料的编码,对待入库的医用材料明细进行编码。
请结合图3所示,图3中最后一条医用材料明细在入库后,还会根据相应的医用材料明细的编码进行编码,即获取到相应的医用材料明细的编码,然后获取相应的医用材料明细所在分类下的最大编码,根据该最大编码再进行编码,如图3所示,倒数第二条医用材料明细的编码为“M.PL010100A020001”,则刚入库的最后一条医用材料明细的编码为“M.PL010100A020002”,这样可以保证入库后的医用材料明细均存在唯一的编码,以方便后续的使用。
上述实施例中,通过对入库后的医用材料明细进行编码,使得医用材料明细具有唯一的编码,即一码对应一条医用材料明细,这样在后续的使用过程中,可以更加方便。
上述的各个实施例中所获取的医用材料明细的各个字段均可以是通过爬虫程序进行抓取的,例如,可以先通过爬虫程序抓取核心字段的内容,待确认核心字段的内容为新时,则再通过爬虫程序抓取关键字段的内容,待根据关键字段的内容判断出待入库的医用材料明细在数据库中的具体位置时,则再通过爬虫程序抓取其他字段的内容并存入数据库中。
请参阅图9所示,图9为一实施例中数据库更新装置的结构示意图,该装置可以包括:
数据获取模块100,用于获取待入库的医用材料明细。
核心字段判断模块200,用于判断待入库的医用材料明细的核心字段的内容是否与数据库中的医用材料明细的核心字段的内容相对应。
关键字段判断模块300,用于在待入库的医用材料明细的核心字段的内容,与数据库中的医用材料明细的核心字段的内容不相对应时,则判断待入库的医用材料明细的关键字段的内容是否与数据库中的医用材料明细的关键字段的内容相同。
入库模块400,用于在待入库的医用材料明细的关键字段的内容与数据库中的医用材料明细的关键字段的内容相同时,则将待入库的医用材料明细添加到数据库中的相应的医用材料明细的分类下,相应的医用材料明细的关键字段的内容与待入库的医用材料明细的关键字段的内容相同。
在其中一个实施例中,该装置还可以包括:
内容判断模块,用于判断待入库的医用材料明细入库后,是否存在无内容的字段。
内容填充模块,用于在存在无内容字段时,根据相应的医用材料明细的相应字段的内容填充无内容的字段的内容。
在其中一个实施例中,该内容补充模块可以包括:
预设字符串判断单元,用于判断待入库的医用材料明细的核心字段的内容中是否存在预设字符串。
遍历单元,用于在待入库的医用材料明细的核心字段的内容中存在预设字符串时,则根据待入库的医用材料明细的核心字段的内容中、除预设字符串以外的内容,遍历数据库中的医用材料明细的核心字段的内容。
填充单元,用于当在数据库中遍历到相关医用材料明细,则根据相关医用材料明细的相应字段中的内容填充无内容的字段,相关医用材料明细的核心字段的内容与待入库的医用材料明细的核心字段的内容相对应。
在其中一个实施例中,该匹配模块可以包括:
分词逻辑获取单元,用于获取分词逻辑。
待匹配数据形成单元,用于根据分词逻辑对待入库的医用材料明细的关键字段的内容进行分词处理以形成待判断数据。
标准数据形成单元,用于根据分词逻辑对数据库中的医用材料明细的关键字段的内容进行分词处理以形成标准数据。
判断单元,用于判断标准数据是否与待判断数据相同,且若标准数据与待查询数据相同,则返回待入库的医用材料明细的关键字段的内容与数据库中的医用材料明细的关键字段的内容相同的结果;若标准数据与待查询数据不相同,则返回待入库的医用材料明细的关键字段的内容未与数据库中的医用材料明细的关键字段的内容不相同的结果。
在其中一个实施例中,该装置还可以包括:字段标化逻辑获取模块,用于获取字段标化逻辑,字段标化逻辑包括待入库的医用材料明细的每一字段名称与数据库中的医用材料明细的每一字段名称的映射关系。
数据获取模块100还用于在获取待入库的医用材料明细之后,获取待入库的医用材料明细的各个字段的名称。
所述装置还包括:字段标化模块,用于根据字段标化逻辑,对待入库的医用材料明细的各个字段的名称进行标准化处理。
在其中一个实施例中,所述装置还包括编码模块,用于获取相应的医用材料明细的编码,并根据相应的医用材料的编码,对待入库的医用材料明细进行编码。
上述关于数据库更新装置的具体限定可以参阅上文中队于数据库更新方法的限定,在此不再赘述。
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。

Claims (10)

1.一种数据库更新方法,其特征在于,所述方法包括:
获取待入库的医用材料明细;
判断所述待入库的医用材料明细的核心字段的内容是否与数据库中的医用材料明细的核心字段的内容相对应;
当所述待入库的医用材料明细的核心字段的内容与数据库中的医用材料明细的核心字段的内容不相对应时,则判断所述待入库的医用材料明细的关键字段的内容是否与所述数据库中的医用材料明细的关键字段的内容相同;
当所述待入库的医用材料明细的关键字段的内容与所述数据库中的医用材料明细的关键字段的内容相同时,则将所述待入库的医用材料明细添加到所述数据库中的相应的医用材料明细的分类下,所述相应的医用材料明细的关键字段的内容与所述待入库的医用材料明细的关键字段的内容相同。
2.根据权利要求1所述的方法,其特征在于,所述将所述待入库的医用材料明细添加到所述数据库中的相应的医用材料明细的分类下的步骤之后,还包括:
判断所述待入库的医用材料明细入库后,是否存在无内容的字段;
当所述待入库的医用材料明细入库后存在无内容的字段时,则根据所述相应的医用材料明细的相应字段的内容填充所述无内容的字段的内容。
3.根据权利要求2所述的方法,其特征在于,所述根据所述相应的医用材料明细的相应字段的内容填充所述无内容的字段的内容的步骤,包括:
判断所述待入库的医用材料明细的核心字段的内容中是否存在预设字符串;
当所述待入库的医用材料明细的核心字段的内容中存在预设字符串时,则根据所述待入库的医用材料明细的核心字段的内容中、除所述预设字符串以外的内容,遍历所述数据库中的医用材料明细的核心字段的内容;
当在所述数据库中遍历到相关医用材料明细,则根据所述相关医用材料明细的相应字段中的内容填充所述无内容的字段,所述相关医用材料明细的核心字段的内容与所述待入库的医用材料明细的核心字段的内容相对应。
4.根据权利要求1所述的方法,其特征在于,所述判断所述待入库的医用材料明细的关键字段的内容是否与所述数据库中的医用材料明细的关键字段的内容相同的步骤,包括:
获取分词逻辑;
根据所述分词逻辑对所述待入库的医用材料明细的关键字段的内容进行分词处理以形成待判断数据;
根据所述分词逻辑对所述数据库中的医用材料明细的关键字段的内容进行分词处理以形成标准数据;
判断所述标准数据是否与所述待判断数据相同;
当所述标准数据与所述待判断数据相同时,则返回所述待入库的医用材料明细的关键字段的内容与所述数据库中的医用材料明细的关键字段的内容相同的结果;
当所述标准数据与所述待判断数据不相同时,则返回所述待入库的医用材料明细的关键字段的内容未与所述数据库中的医用材料明细的关键字段的内容不相同的结果。
5.根据权利要求1至4任一项所述的方法,其特征在于,所述方法还包括:
获取字段标化逻辑,所述字段标化逻辑包括所述待入库的医用材料明细的每一字段名称与所述数据库中的医用材料明细的每一字段名称的映射关系;
所述获取待入库的医用材料明细的步骤之后,还包括:
获取待入库的医用材料明细的各个字段的名称;
根据所述字段标化逻辑,对所述待入库的医用材料明细的各个字段的名称进行标准化处理。
6.根据权利要求1至4任一项所述的方法,其特征在于,所述方法还包括:
获取所述相应的医用材料明细的编码;
根据所述相应的医用材料的编码,对所述待入库的医用材料明细进行编码。
7.一种数据库更新装置,其特征在于,所述装置包括:
数据获取模块,用于获取待入库的医用材料明细;
核心字段判断模块,用于判断所述待入库的医用材料明细的核心字段的内容是否与数据库中的医用材料明细的核心字段的内容相对应;
关键字段判断模块,用于在所述待入库的医用材料明细的核心字段的内容,与数据库中的医用材料明细的核心字段的内容不相对应时,则判断所述待入库的医用材料明细的关键字段的内容是否与所述数据库中的医用材料明细的关键字段的内容相同;
入库模块,用于在所述待入库的医用材料明细的关键字段的内容与所述数据库中的医用材料明细的关键字段的内容相同时,则将所述待入库的医用材料明细添加到所述数据库中的相应的医用材料明细的分类下,所述相应的医用材料明细的关键字段的内容与所述待入库的医用材料明细的关键字段的内容相同。
8.根据权利要求7所述的装置,其特征在于,所述装置还包括:
内容判断模块,用于判断所述待入库的医用材料明细入库后,是否存在无内容的字段;
内容填充模块,用于在存在所述无内容字段时,根据所述相应的医用材料明细的相应字段的内容填充所述无内容的字段的内容。
9.根据权利要求8所述的装置,其特征在于,所述内容填充模块包括:
预设字符串判断单元,用于判断所述待入库的医用材料明细的核心字段的内容中是否存在预设字符串;
遍历单元,用于在所述待入库的医用材料明细的核心字段的内容中存在预设字符串时,则根据所述待入库的医用材料明细的核心字段的内容中、除所述预设字符串以外的内容,遍历所述数据库中的医用材料明细的核心字段的内容;
填充单元,用于当在所述数据库中遍历到相关医用材料明细,则根据所述相关医用材料明细的相应字段中的内容填充所述无内容的字段,所述相关医用材料明细的核心字段的内容与所述待入库的医用材料明细的核心字段的内容相对应。
10.根据权利要求7所述的装置,其特征在于,所述核心字段判断模块包括:
分词逻辑获取单元,用于获取分词逻辑;
待匹配数据形成单元,用于根据所述分词逻辑对所述待入库的医用材料明细的关键字段的内容进行分词处理以形成待判断数据;
标准数据形成单元,用于根据所述分词逻辑对所述数据库中的医用材料明细的关键字段的内容进行分词处理以形成标准数据;
判断单元,用于判断所述标准数据是否与所述待判断数据相同,且若所述标准数据与所述待判断数据相同,则返回所述待入库的医用材料明细的关键字段的内容与所述数据库中的医用材料明细的关键字段的内容相同的结果;若所述标准数据与所述待判断数据不相同,则返回所述待入库的医用材料明细的关键字段的内容未与所述数据库中的医用材料明细的关键字段的内容不相同的结果。
CN201710125137.3A 2017-03-03 2017-03-03 数据库更新方法和装置 Active CN107766397B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710125137.3A CN107766397B (zh) 2017-03-03 2017-03-03 数据库更新方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710125137.3A CN107766397B (zh) 2017-03-03 2017-03-03 数据库更新方法和装置

Publications (2)

Publication Number Publication Date
CN107766397A CN107766397A (zh) 2018-03-06
CN107766397B true CN107766397B (zh) 2020-01-31

Family

ID=61264934

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710125137.3A Active CN107766397B (zh) 2017-03-03 2017-03-03 数据库更新方法和装置

Country Status (1)

Country Link
CN (1) CN107766397B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112668641B (zh) * 2020-12-28 2024-05-10 平安科技(深圳)有限公司 外部医用材料目录的匹配方法、装置、设备及存储介质
CN117009998A (zh) * 2023-08-29 2023-11-07 上海倍通医药科技咨询有限公司 一种数据检验方法及系统

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5995980A (en) * 1996-07-23 1999-11-30 Olson; Jack E. System and method for database update replication
CN1487414A (zh) * 2002-09-30 2004-04-07 �Ҵ���˾ 具有可扩展功能的元目录代理
CN101789108A (zh) * 2010-03-31 2010-07-28 上海康德莱企业发展集团有限公司 一种用于医疗器械设备的库存处理系统及其控制方法
CN102346785A (zh) * 2011-11-15 2012-02-08 北京创腾科技有限公司 一种用于直接对数据库实现自定义字段的方法和装置
CN102651098A (zh) * 2011-02-24 2012-08-29 悦康健康管理顾问科技股份有限公司 病况的在线整合系统
CN103455608A (zh) * 2013-09-05 2013-12-18 广东医药价格协会 一种基于药品编码的管理及查询系统
CN103810568A (zh) * 2014-01-26 2014-05-21 南京中医药大学 基于物联网技术的中药饮片质量管理系统
CN106203894A (zh) * 2015-04-30 2016-12-07 阿里巴巴集团控股有限公司 商品对象的库存信息的处理方法及系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060173718A1 (en) * 2005-02-02 2006-08-03 Murphy Daniel J Medical information card and system and method for using same

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5995980A (en) * 1996-07-23 1999-11-30 Olson; Jack E. System and method for database update replication
CN1487414A (zh) * 2002-09-30 2004-04-07 �Ҵ���˾ 具有可扩展功能的元目录代理
CN101789108A (zh) * 2010-03-31 2010-07-28 上海康德莱企业发展集团有限公司 一种用于医疗器械设备的库存处理系统及其控制方法
CN102651098A (zh) * 2011-02-24 2012-08-29 悦康健康管理顾问科技股份有限公司 病况的在线整合系统
CN102346785A (zh) * 2011-11-15 2012-02-08 北京创腾科技有限公司 一种用于直接对数据库实现自定义字段的方法和装置
CN103455608A (zh) * 2013-09-05 2013-12-18 广东医药价格协会 一种基于药品编码的管理及查询系统
CN103810568A (zh) * 2014-01-26 2014-05-21 南京中医药大学 基于物联网技术的中药饮片质量管理系统
CN106203894A (zh) * 2015-04-30 2016-12-07 阿里巴巴集团控股有限公司 商品对象的库存信息的处理方法及系统

Also Published As

Publication number Publication date
CN107766397A (zh) 2018-03-06

Similar Documents

Publication Publication Date Title
CN107992506B (zh) 信息处理方法及装置
CN107766397B (zh) 数据库更新方法和装置
CN111047419B (zh) 一种车型标准化方法及相关装置
KR102153806B1 (ko) 데이터 처리 방법 및 디바이스
CN108304531B (zh) 一种数字对象标识符引用关系的可视化方法及装置
CN103678262A (zh) 一种文本处理方法和文本处理装置
CN111026753A (zh) 基于树形结构的标签存储方法及装置
CN104836896A (zh) 对电话号码进行纠错提示的方法及装置
CN115292344A (zh) 数据字典构建方法、装置、电子设备及存储介质
CN107451280B (zh) 数据打通方法、装置及电子设备
KR101102629B1 (ko) 구조화된 문서들의 코딩 방법
CN109003012B (zh) 货位推荐链路信息获取方法、货位推荐方法、装置及系统
CN103927168B (zh) 一种面向对象的数据模型持久化的方法及装置
CA3142579A1 (en) Method and apparatus for validation of event tracking acquired data
CN116680278B (zh) 数据处理方法、装置、电子设备及存储介质
US8949282B1 (en) Efficient storage of non-searchable attributes
CN104750834A (zh) 一种规则的存储方法、匹配方法及装置
CN106569986B (zh) 字符串替换方法和装置
CN110472019A (zh) 舆情搜索方法及装置
US8171006B1 (en) Retrieval of searchable and non-searchable attributes
CN112862573A (zh) 衍生对象的身份标识信息生成方法、装置及存储介质
CN115146148A (zh) 一种推荐内容数据的方法及装置
CN111930759A (zh) 数据更新方法、装置、设备及计算机可读介质
CN115495911B (zh) 模型重命名的方法、设备及存储介质
CN116227456B (zh) 合同生成方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20220525

Address after: 518048 China Aviation Center 2901, No. 1018, Huafu Road, Huahang community, Huaqiang North Street, Futian District, Shenzhen, Guangdong Province

Patentee after: Shenzhen Ping An medical and Health Technology Service Co.,Ltd.

Address before: Room 12G, Area H, 666 Beijing East Road, Huangpu District, Shanghai 200001

Patentee before: PING AN MEDICAL AND HEALTHCARE MANAGEMENT Co.,Ltd.