CN114637737A - 一种在线医疗主题库构建方法及装置 - Google Patents

一种在线医疗主题库构建方法及装置 Download PDF

Info

Publication number
CN114637737A
CN114637737A CN202210256774.5A CN202210256774A CN114637737A CN 114637737 A CN114637737 A CN 114637737A CN 202210256774 A CN202210256774 A CN 202210256774A CN 114637737 A CN114637737 A CN 114637737A
Authority
CN
China
Prior art keywords
hospital
online medical
doctors
online
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210256774.5A
Other languages
English (en)
Inventor
阮潘
单震
张帆
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chaozhou Zhuoshu Big Data Industry Development Co Ltd
Original Assignee
Chaozhou Zhuoshu Big Data Industry Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chaozhou Zhuoshu Big Data Industry Development Co Ltd filed Critical Chaozhou Zhuoshu Big Data Industry Development Co Ltd
Priority to CN202210256774.5A priority Critical patent/CN114637737A/zh
Publication of CN114637737A publication Critical patent/CN114637737A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/211Schema design and management
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H40/00ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices
    • G16H40/20ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices for the management or administration of healthcare resources or facilities, e.g. managing hospital staff or surgery rooms

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Health & Medical Sciences (AREA)
  • General Business, Economics & Management (AREA)
  • Business, Economics & Management (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Biomedical Technology (AREA)
  • Epidemiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Primary Health Care (AREA)
  • Public Health (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本发明涉及在线医疗技术领域,具体提供了一种在线医疗主题库构建方法,具有如下步骤:S1、对在线医疗平台的医院和医生公开数据进行采集;S2、对不同平台的医院和医生进行匹配识别,给医院和医生打上唯一的代码;S3、按照相应的数据标准对已采集的在线医疗数据进行清洗处理和标准化处理;S4、构建在线医疗主题库并将经标准化处理后的数据入库。与现有技术相比,本发明通过对在线医疗数据的采集,对医院和医生识别匹配,标准化数据,构建在线医疗主题数据库,显示在线医疗现状及发展趋势,提高医疗资源利用效率、改善患者就医体验。

Description

一种在线医疗主题库构建方法及装置
技术领域
本发明涉及在线医疗技术领域,具体提供一种在线医疗主题库构建方法及装置。
背景技术
近些年来,在线医疗发展迅速。通过各类平台以在线形式为相关患者服务推广互联网医疗的使用习惯。但是现有在线医疗平台多、数据体量大、使用难度高,需要建立主题库来支持应用。
如何对在线医疗数据进行处理,使其既能清晰明了的显示在线医疗情况,又能支持医院合理分配资源是迫切需要解决的问题。
发明内容
本发明是针对上述现有技术的不足,提供一种实用性强,设计合理,安全适用的在线医疗主题库构建方法。
本发明进一步的技术任务是提供一种设计合理,安全适用的在线医疗主题库构建装置。
本发明解决其技术问题所采用的技术方案是:
一种在线医疗主题库构建方法,具有如下步骤:
S1、对在线医疗平台的医院和医生公开数据进行采集;
S2、对不同平台的医院和医生进行匹配识别,给医院和医生打上唯一的代码;
S3、按照行业的数据标准对已采集的在线医疗数据进行清洗处理和标准化处理;
S4、构建在线医疗主题库并将经标准化处理后的数据入库。
进一步的,在步骤S1中,利用爬虫技术,获取不同平台的在线医疗公开数据,所述的公开数据包括医生代码、医生名称、医生科室、医生职称、在线问诊量、医生开通的在线问诊服务方式及价格、预约挂号数、患者评价、医生所属医院、医院代码、医院所属省份和城市、医院经纬度和医院地址。
进一步的,在步骤S2中,综合平台的医院省市县信息,不断补充医院的省市县,步骤如下:
S201、在线医疗平台采集到医院省市县的,直接使用采集到的省市县;
S202、未采集到医院省市县,但有采集到医院经纬度的,根据百度地图接口返回省市县;
S203、未采集到医院省市县和经纬度的,根据医院地址截取出医院省市县;
S204、未采集到步骤S101到S103信息的,根据医院名称中含有省市县进行截取补充。
进一步的,在步骤S2中,根据标准化后的平台医生信息给医院打上唯一的代码,不同平台的医院名称相同且医院所属省份一致判定为同一家医院或者医院地址完全一致的也判定为同一家医院;
一家医院的医生可能存在重名的情况,所以结合医生所属科室来判定医生,同一家医院名称同一个科室名称的同一位医生名称判定为同一位医生。
进一步的,在步骤S3中,所述在线医疗数据清洗处理包括对重复数据的清洗,取最新采集的一条记录,对补采后关键信息为空的记录进行删除。
进一步的,在步骤S3中,所述在线医疗数据进行标准化处理包括对医院省市县使用最新的行政区划代码,医院科室使用最新的医疗机构诊疗科目名录。
进一步的,在步骤S4中,构建在线医疗主题库并将经标准化处理后的数据入库,根据医院和医生匹配识别,对同一医院和同一医生打上唯一的代码,为医院综合管理和分配在线医疗资源提供重要的科学指导。
一种在线医疗主题库构建装置,包括:至少一个存储器和至少一个处理器;
所述至少一个存储器,用于存储机器可读程序;
所述至少一个处理器,用于调用所述机器可读程序,执行一种在线医疗主题库构建方法。
本发明的一种在线医疗主题库构建方法及装置和现有技术相比,具有以下突出的有益效果:
本发明通过对在线医疗数据的采集,对医院和医生识别匹配,标准化数据,构建在线医疗主题数据库,显示在线医疗现状及发展趋势,提高医疗资源利用效率、改善患者就医体验。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
附图1是一种在线医疗主题库构建方法的流程示意图;
附图2是一种在线医疗主题库构建方法中步骤S2的流程示意图。
具体实施方式
为了使本技术领域的人员更好的理解本发明的方案,下面结合具体的实施方式对本发明作进一步的详细说明。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例都属于本发明保护的范围。
下面给出一个最佳实施例:
如图1-2所示,本实施例中的一种在线医疗主题库构建方法,具有如下步骤:
S1、对在线医疗平台的医院和医生公开数据进行采集:
利用爬虫技术,获取不同平台的在线医疗公开数据,包含医生代码,医生名称,医生科室,医生职称,在线问诊量,医生开通的在线问诊服务方式及价格,预约挂号数,患者评价,医生所属医院,医院代码,医院所属省份和城市,医院经纬度,医院地址等。
S2、对不同平台的医院和医生进行匹配识别,给医院和医生打上唯一的代码:首先,综合各平台的医院省市县信息,不断补充医院的省市县:
S201、在线医疗平台采集到医院省市县的,直接使用采集到的省市县;
S202、未采集到医院省市县,但有采集到医院经纬度的,根据百度地图接口返回省市县;
S203、未采集到医院省市县和经纬度的,根据医院地址截取出医院省市县;
S204、未采集到以上信息的,根据医院名称中含有省市县进行截取补充。
其次,根据标准化后的各平台医生信息给医院打上唯一的代码,不同平台的医院名称相同且医院所属省份一致判定为同一家医院或者医院地址完全一致的也判定为同一家医院;最后,一家医院的医生可能存在重名的情况,所以结合医生所属科室来判定医生,同一家医院名称同一个科室名称的同一位医生名称判定为同一位医生。
S3、按照行政区划标准和科室标准的数据标准对已采集的在线医疗数据进行清洗处理和标准化处理:
按照相应的数据标准对已采集的在线医疗数据进行清洗处理和标准化处理,数据清洗包括对重复数据的清洗,取最新采集的一条记录;对补采后关键信息(医院名称、医生名称)为空的记录进行删除;
标准化包括对医院省市县使用最新的行政区划代码,医院科室使用最新的医疗机构诊疗科目名录。
S4、构建在线医疗主题库并将经标准化处理后的数据入库:
构建在线医疗主题库并将经标准化处理后的数据入库,形成多维度的涵盖医院、医生、科室、问诊量,挂号数,问诊方式,问诊价格,各问诊方式销售额等指标的大数据,且根据医院和医生匹配识别,对同一医院和同一医生打上唯一的代码,为医院综合管理和分配在线医疗资源提供重要的科学指导。
一种在线医疗主题库构建装置,包括:至少一个存储器和至少一个处理器;
所述至少一个存储器,用于存储机器可读程序;
所述至少一个处理器,用于调用所述机器可读程序,执行一种在线医疗主题库构建方法。
上述具体的实施方式仅是本发明具体的个案,本发明的专利保护范围包括但不限于上述具体的实施方式,任何符合本发明的一种在线医疗主题库构建方法及装置权利要求书的且任何所述技术领域普通技术人员对其做出的适当变化或者替换,皆应落入本发明的专利保护范围。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。

Claims (8)

1.一种在线医疗主题库构建方法,其特征在于,具有如下步骤:
S1、对在线医疗平台的医院和医生公开数据进行采集;
S2、对不同平台的医院和医生进行匹配识别,给医院和医生打上唯一的代码;
S3、按照行业的数据标准对已采集的在线医疗数据进行清洗处理和标准化处理;
S4、构建在线医疗主题库并将经标准化处理后的数据入库。
2.根据权利要求1所述的一种在线医疗主题库构建方法,其特征在于,在步骤S1中,利用爬虫技术,获取不同平台的在线医疗公开数据,所述的公开数据包括医生代码、医生名称、医生科室、医生职称、在线问诊量、医生开通的在线问诊服务方式及价格、预约挂号数、患者评价、医生所属医院、医院代码、医院所属省份和城市、医院经纬度和医院地址。
3.根据权利要求2所述的一种在线医疗主题库构建方法,其特征在于,在步骤S2中,综合平台的医院省市县信息,不断补充医院的省市县,步骤如下:
S201、在线医疗平台采集到医院省市县的,直接使用采集到的省市县;
S202、未采集到医院省市县,但有采集到医院经纬度的,根据百度地图接口返回省市县;
S203、未采集到医院省市县和经纬度的,根据医院地址截取出医院省市县;
S204、未采集到步骤S101到S103信息的,根据医院名称中含有省市县进行截取补充。
4.根据权利要求3所述的一种在线医疗主题库构建方法,其特征在于,在步骤S2中,根据标准化后的平台医生信息给医院打上唯一的代码,不同平台的医院名称相同且医院所属省份一致判定为同一家医院或者医院地址完全一致的也判定为同一家医院;
一家医院的医生可能存在重名的情况,所以结合医生所属科室来判定医生,同一家医院名称同一个科室名称的同一位医生名称判定为同一位医生。
5.根据权利要求4所述的一种在线医疗主题库构建方法,其特征在于,在步骤S3中,所述在线医疗数据清洗处理包括对重复数据的清洗,取最新采集的一条记录,对补采后关键信息为空的记录进行删除。
6.根据权利要求5所述的一种在线医疗主题库构建方法,其特征在于,在步骤S3中,所述在线医疗数据进行标准化处理包括对医院省市县使用最新的行政区划代码,医院科室使用最新的医疗机构诊疗科目名录。
7.根据权利要求6所述的一种在线医疗主题库构建方法,其特征在于,在步骤S4中,构建在线医疗主题库并将经标准化处理后的数据入库,根据医院和医生匹配识别,对同一医院和同一医生打上唯一的代码,为医院综合管理和分配在线医疗资源提供重要的科学指导。
8.一种在线医疗主题库构建装置,其特征在于,包括:至少一个存储器和至少一个处理器;
所述至少一个存储器,用于存储机器可读程序;
所述至少一个处理器,用于调用所述机器可读程序,执行权利要求1至7中任一所述的方法。
CN202210256774.5A 2022-03-16 2022-03-16 一种在线医疗主题库构建方法及装置 Pending CN114637737A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210256774.5A CN114637737A (zh) 2022-03-16 2022-03-16 一种在线医疗主题库构建方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210256774.5A CN114637737A (zh) 2022-03-16 2022-03-16 一种在线医疗主题库构建方法及装置

Publications (1)

Publication Number Publication Date
CN114637737A true CN114637737A (zh) 2022-06-17

Family

ID=81947397

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210256774.5A Pending CN114637737A (zh) 2022-03-16 2022-03-16 一种在线医疗主题库构建方法及装置

Country Status (1)

Country Link
CN (1) CN114637737A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115423530A (zh) * 2022-09-27 2022-12-02 浪潮卓数大数据产业发展有限公司 一种网络零售活跃店铺主题库的构建方法及工具

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017012201A1 (zh) * 2015-07-18 2017-01-26 深圳市前海颐老科技有限公司 基于电子诊疗单的科室识别方法和网络医院平台
CN106503119A (zh) * 2016-10-17 2017-03-15 广州薏生网络科技有限公司 一种移动问诊平台垂直搜索结果的排序方法
CN106709269A (zh) * 2017-03-13 2017-05-24 山东众阳软件有限公司 一种医疗大数据仓库的创建方法及系统
CN109448807A (zh) * 2018-10-12 2019-03-08 成都数联易康科技有限公司 一种基于医生医疗服务行为分析的患者就医导向实现方法
CN111897796A (zh) * 2020-06-30 2020-11-06 医途(杭州)科技有限公司 用于医院引流的数据库构建方法及医院引流方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017012201A1 (zh) * 2015-07-18 2017-01-26 深圳市前海颐老科技有限公司 基于电子诊疗单的科室识别方法和网络医院平台
CN106503119A (zh) * 2016-10-17 2017-03-15 广州薏生网络科技有限公司 一种移动问诊平台垂直搜索结果的排序方法
CN106709269A (zh) * 2017-03-13 2017-05-24 山东众阳软件有限公司 一种医疗大数据仓库的创建方法及系统
CN109448807A (zh) * 2018-10-12 2019-03-08 成都数联易康科技有限公司 一种基于医生医疗服务行为分析的患者就医导向实现方法
CN111897796A (zh) * 2020-06-30 2020-11-06 医途(杭州)科技有限公司 用于医院引流的数据库构建方法及医院引流方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115423530A (zh) * 2022-09-27 2022-12-02 浪潮卓数大数据产业发展有限公司 一种网络零售活跃店铺主题库的构建方法及工具

Similar Documents

Publication Publication Date Title
EP2534596B1 (en) Method and apparatus for managing physician profiles
US7836065B2 (en) Searching multiple repositories in a digital information system
US20110010195A1 (en) Medical history system
WO2005008558A2 (en) Terminology management system
EP2102744A1 (en) Method and apparatus for creating a configurable browser-based forms application
Taksler et al. Opportunities, pitfalls, and alternatives in adapting electronic health records for health services research
US20230154582A1 (en) Dynamic database updates using probabilistic determinations
Dans Looking for answers in all the wrong places
CN113113138A (zh) 一种带辅助诊疗能力的便携式移动诊疗系统
CN114637737A (zh) 一种在线医疗主题库构建方法及装置
Lillard et al. Linking Medicare and national survey data
Gardner et al. Incorporating a location-based socioeconomic index into a de-identified i2b2 clinical data warehouse
US20150100349A1 (en) Untethered Community-Centric Patient Health Portal
US20170017758A1 (en) Integrated system for obtaining information from electronic medical records and method of use
EP2050017A2 (en) System and method for uniformly pricing items
Leventhal et al. Information management in the emergency department
CN115544050A (zh) 操作日志记录方法、装置、设备及存储介质
US20150220690A1 (en) Systems and methods for determining and communicating a benefit response message
Batra et al. Mining standardized semantic interoperable electronic healthcare records
US11107560B1 (en) Methods, systems and apparatus for processing and displaying community patient data alongside native patient data
US20030220816A1 (en) System and method for managing interactions between machine-generated and user-defined patient lists
CN108154935B (zh) 一种临床事件存储方法及装置
US20190198139A1 (en) Systems and methods for securing electronic data that includes personally identifying information
McFarlane et al. Facility registries: Metadata for where care is delivered
JP5055581B2 (ja) 予約処理装置、予約方法、およびコンピュータプログラム

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20220617