CN111708949B - 医疗资源的推荐方法及装置、电子设备、存储介质 - Google Patents

医疗资源的推荐方法及装置、电子设备、存储介质 Download PDF

Info

Publication number
CN111708949B
CN111708949B CN202010570982.3A CN202010570982A CN111708949B CN 111708949 B CN111708949 B CN 111708949B CN 202010570982 A CN202010570982 A CN 202010570982A CN 111708949 B CN111708949 B CN 111708949B
Authority
CN
China
Prior art keywords
data
medical resource
user
medical
resource data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010570982.3A
Other languages
English (en)
Other versions
CN111708949A (zh
Inventor
郭家军
刘磊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Weiyiyun Hangzhou Holding Co ltd
Original Assignee
Weiyiyun Hangzhou Holding Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Weiyiyun Hangzhou Holding Co ltd filed Critical Weiyiyun Hangzhou Holding Co ltd
Priority to CN202010570982.3A priority Critical patent/CN111708949B/zh
Publication of CN111708949A publication Critical patent/CN111708949A/zh
Application granted granted Critical
Publication of CN111708949B publication Critical patent/CN111708949B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H40/00ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices
    • G16H40/20ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices for the management or administration of healthcare resources or facilities, e.g. managing hospital staff or surgery rooms
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • General Business, Economics & Management (AREA)
  • Business, Economics & Management (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Biomedical Technology (AREA)
  • Epidemiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Primary Health Care (AREA)
  • Public Health (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请提供一种医疗资源的推荐方法及装置、电子设备、存储介质,该方法包括:接收携带目标业务场景和用户标识的推荐请求;从所述用户标识对应的召回数据集中,筛选出与所述目标业务场景对应的医疗需求信息匹配的第一医疗资源数据;根据从医疗资源库获取的与所述医疗需求信息匹配的第二医疗资源数据,融合所述第一医疗资源数据和第二医疗资源数据,得到待排序医疗资源数据;基于排序算法对所述待排序医疗资源数据进行排序,得到已排序医疗资源数据;向所述推荐请求的发起方返回所述已排序医疗资源数据。本申请实施例,通过对第一医疗资源数据和第二医疗资源数据排序并返回,可向用户推荐能够满足用户需求的医疗资源数据。

Description

医疗资源的推荐方法及装置、电子设备、存储介质
技术领域
本申请涉及计算机技术领域,特别涉及一种医疗资源的推荐方法及装置、电子设备、计算机可读存储介质。
背景技术
互联网应用服务逐渐渗透到生活的各个方面,越来越多的人开始通过互联网的医疗平台与医生进行沟通、挂号、以及在平台上了解关于疾病的信息。医疗平台集成了大量线下医院、医生等医疗资源,为人们寻医问药提供了极大的便利性。医疗平台在响应用户在业务场景的推荐请求时,必须从海量的数据中选择最符合用户需求的数据推荐给用户。医疗平台亟需一种准确、高效的医疗资源推荐方法。
发明内容
本申请实施例的目的在于提供一种医疗资源的推荐方法及装置、电子设备、计算机可读存储介质,用以向用户推荐符合需求的医疗资源。
一方面,本申请提供了一种医疗资源的推荐方法,包括:
接收携带目标业务场景和用户标识的推荐请求;
从所述用户标识对应的召回数据集中,筛选出与所述目标业务场景对应的医疗需求信息匹配的第一医疗资源数据;
根据从医疗资源库获取的与所述医疗需求信息匹配的第二医疗资源数据,融合所述第一医疗资源数据和第二医疗资源数据,得到待排序医疗资源数据;
基于排序算法对所述待排序医疗资源数据进行排序,得到已排序医疗资源数据;
向所述推荐请求的发起方返回所述已排序医疗资源数据。
在一实施例中,在所述从所述用户标识对应的召回数据集中,筛选出与所述目标业务场景对应的医疗需求信息匹配的第一医疗资源数据之前,包括:
判断是否存在与所述用户标识对应的召回数据集;
如果存在,执行所述筛选出与所述目标业务场景对应的医疗需求信息匹配的第一医疗资源数据的步骤。
在一实施例中,所述方法还包括:
如果不存在,基于所述推荐请求中用户标识查找用户数据;
基于所述用户数据中的基础用户特征,生成基础特征组合;
查找与所述基础特征组合对应的群体冷启动推荐数据;
从所述群体冷启动推荐数据中筛选与所述医疗需求信息匹配的所述第一医疗资源数据。
在一实施例中,所述方法还包括:
从目标用户的用户数据中确定用户特征、医疗资源特征和所述目标用户的偏好数据;
基于推荐算法对所述用户特征和所述医疗资源特征进行计算,获得所述目标用户的潜在偏好数据;
基于所述偏好数据和所述潜在偏好数据生成所述目标用户的召回数据集;
建立所述目标用户的用户标识与所述召回数据集的关联关系。
在一实施例中,所述基于推荐算法对所述用户特征和所述医疗资源特征进行计算,获得所述目标用户的潜在偏好数据,包括:
基于所述目标用户的用户特征和医疗资源特征,以及,其它用户的用户特征和医疗资源特征,计算用户相似度;
筛选出用户相似度大于预设相似度阈值的用户;
基于筛选出用户的用户数据确定对应的偏好数据,并将所述偏好数据作为所述目标用户的潜在偏好数据。
在一实施例中,所述方法还包括:
依据用户数据中的基础用户特征,生成多种基础特征组合;
针对每一基础特征组合,获取所述基础特征组合对应用户的偏好数据,作为与所述基础特征组合对应的群体冷启动推荐数据;
建立所述基础特征组合和所述群体冷启动推荐数据的关联关系。
在一实施例中,在所述融合所述第一医疗资源数据和第二医疗资源数据之前,所述方法还包括:
依据与所述目标业务场景对应的所述医疗需求信息确定对应的可选医疗资源数据;
基于所述目标业务场景对应的评分策略,对所述可选医疗资源数据进行评分;
基于评分结果对所述可选医疗资源数据进行筛选,获得所述第二医疗资源数据。
另一方面,本申请还提供了一种医疗资源的推荐装置,包括:
接收模块,用于接收携带目标业务场景和用户标识的推荐请求;
筛选模块,用于从所述用户标识对应的召回数据集中,筛选出与所述目标业务场景对应的医疗需求信息匹配的第一医疗资源数据;
融合模块,用于根据从医疗资源库获取的与所述医疗需求信息匹配的第二医疗资源数据,融合所述第一医疗资源数据和第二医疗资源数据,得到待排序医疗资源数据;
排序模块,用于基于排序算法对所述待排序医疗资源数据进行排序,得到已排序医疗资源数据;
返回模块,用于向所述推荐请求的发起方返回所述已排序医疗资源数据。
进一步,本申请还提供了一种电子设备,所述电子设备包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为执行上述医疗资源的推荐方法。
另外,本申请还提供了一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序可由处理器执行上述医疗资源的推荐方法。
在本申请实施例中,接收推荐请求后,可以依据与该推荐请求中目标业务场景对应的医疗需求信息,从召回数据集中筛选出第一医疗资源数据,并依据医疗需求信息获取第二医疗资源数据;对第一医疗资源数据和第二医疗资源数据排序后,可以返回已排序医疗资源数据;
由于召回数据集包括基于用户数据确定的用户偏好的医疗资源数据,从中筛选出的第一医疗资源数据满足用户需求的可能性很高;而第二医疗资源数据是基于医疗需求信息实时获取的,弥补召回数据集数据量较小的缺陷;在这种情况下,对第一医疗资源数据和第二医疗资源数据排序并返回后,可向用户推荐能够满足用户需求的医疗资源数据。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例中所需要使用的附图作简单地介绍。
图1为本申请一实施例提供的医疗资源的推荐方法的应用场景示意图;
图2为本申请一实施例提供的电子设备的结构示意图;
图3为本申请一实施例提供的医疗资源的推荐方法的流程示意图;
图4为本申请一实施例提供的召回数据集的生成方法的流程示意图;
图5为本申请一实施例提供的群体冷启动推荐数据的生成方法的流程示意图;
图6为本申请一实施例提供的医疗资源的推荐装置的框图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行描述。
相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。同时,在本申请的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
图1为本申请实施例提供的医疗资源的推荐方法的应用场景示意图。如图1所示,该应用场景包括服务端30和客户端20,客户端20可以是可访问医疗平台的应用软件、网页,可向服务端30发送推荐请求,服务端30可以是服务器、服务器集群或者云计算中心,服务端30可以解析客户端20发起的推荐请求,向客户端20返回医疗资源数据。
如图2所示,本实施例提供一种电子设备1,包括:至少一个处理器11和存储器12,图2中以一个处理器11为例。处理器11和存储器12通过总线10连接,存储器12存储有可被处理器11执行的指令,指令被处理器11执行,以使电子设备1可执行下述的实施例中方法的全部或部分流程。在一实施例中,电子设备1可以是上述服务端30。
存储器12可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(Static Random Access Memory,简称SRAM),电可擦除可编程只读存储器(Electrically Erasable Programmable Read-Only Memory,简称EEPROM),可擦除可编程只读存储器(Erasable Programmable Read Only Memory,简称EPROM),可编程只读存储器(Programmable Red-Only Memory,简称PROM),只读存储器(Read-Only Memory,简称ROM),磁存储器,快闪存储器,磁盘或光盘。
本申请还提供了一种计算机可读存储介质,存储介质存储有计算机程序,计算机程序可由处理器11执行以完成本申请提供的医疗资源的推荐方法。
参见图3,为本申请一实施例提供的医疗资源的推荐方法的流程示意图,如图3所示,该方法可以包括以下步骤310-步骤350。
步骤310:接收携带目标业务场景和用户标识的推荐请求。
目标业务场景是指医疗平台提供业务服务的页面。比如,如果用户通过手机上医疗平台的客户端或HTML5(Hyper Text Markup Language 5,第五代超级文本标记语言)网页访问医疗平台,目标业务场景可以是客户端上提供医院查询服务、医生查询服务、疾病科普资料查询服务的页面。如果用户通过电脑网页访问医疗平台,目标业务场景可以是医疗平台网站上提供医院查询服务、医生查询服务、疾病科普资源查询服务的页面。推荐请求可通过携带目标业务场景的标识或业务标识来指示目标业务场景。
用户标识可以是医疗平台为每一用户账号分配的区分其他用户的标识,用户标识可以是用户账号。
推荐请求是指用户查询医疗资源的请求。推荐请求可以是用户在搜索框输入关键词查询时产生的,也可以在用户点击提供业务服务的入口时产生。比如:用户在页面上点击提供“专家问诊”服务的入口图标时,可以产生推荐请求。
步骤320:从用户标识对应的召回数据集中,筛选出与目标业务场景对应的医疗需求信息匹配的第一医疗资源数据。
医疗需求信息用于指示用户所请求的医疗资源。如果推荐请求由用户执行搜索操作产生,该推荐请求中携带用户输入的关键词和目标业务场景的信息。服务端可以基于关键词和用户执行搜索操作的页面确定用户所请求的医疗资源是页面限定的范围内与关键词有关的医疗资源。比如:如果用户在“专家问诊”页面的搜索框输入“咳嗦”,服务端可以确定用户的医疗需求信息是查询治疗症状包括“咳嗽”的疾病的专家。
如果推荐请求由用户点击提供业务服务的入口产生,该推荐请求携带目标业务场景的信息和点击操作命令。服务端可以根据目标业务场景的信息和点击操作命令确定用户所需求的医疗资源是目标业务场景内相关的医疗资源。比如:如果用户点击进入专病专科的页面(比如:点击进入“呼吸科”的页面),服务端可以根据推荐请求中专病专科的信息和点击操作命令,确定用户的医疗需求信息是查看与专病专科相关的医生、科普文章等医疗资源。
第一医疗资源数据是符合医疗需求信息要求的医疗资源数据。第一医疗资源从召回数据集或群体冷启动推荐数据中筛选得到。
服务端可以从推荐请求中解析医疗需求信息,并从召回数据集中筛选出与医疗需求信息匹配的医疗资源数据。在一实施例中,服务端可以判断推荐请求中用户标识是否存在对应的召回数据集。服务端可以基于用户标识在预设的召回数据集库中查找对应的召回数据集。其中,召回数据集库包括大量已建立关联关系的用户标识和召回数据集。
如果存在召回数据集,服务端可以直接从召回数据集中筛选与目标业务场景对应的医疗需求信息匹配的第一医疗资源数据。服务端可以获取召回数据集中医疗资源数据的医疗资源特征,并依据该医疗资源特征判断医疗资源数据是否符合医疗需求信息,从而筛选出满足医疗需求信息的第一医疗资源。
其中,医疗资源特征包括但不限于医生的特征、医院的特征、疾病科普文章的特征,医生的特征可以包括医生的等级、从业年限、所属科室、所属科室是否为国家重点科室、擅长的疾病、执业地点、历史问诊数量、患者好评率等,医院的特征可以包括医院的等级、地点、所包含的科室、历史问诊数量等,疾病科普文章的特征可以包括浏览数、点赞数、疾病类别、收藏数等。
如果不存在召回数据集,服务端可以基于推荐请求中用户标识,查找用户数据。用户数据可以包括用户基础数据和日志数据,用户基础数据可以包括性别、年龄、所在地点等,日志数据可以包括浏览记录、收藏记录、点赞记录、搜索记录、评分记录等。
服务端可以确定查找到的用户数据中的基础用户特征,并生成基础特征组合。这里,基础用户特征指从用户基础数据中提取到的用户特征,或者,从用户基础数据和少量日志数据中提取到的用户特征。对于新用户或者不活跃的老用户而言,医疗平台的服务端上的用户数据较为有限,因此,当无法查找到召回数据集时,服务端可以从用户数据中提取基础用户特征,用以选择医疗资源数据。
对于不同的用户而言,服务端从用户数据中提取的基础用户特征的数量可能存在差异。比如:一些用户的用户数据中存在性别、年龄、所在地点、少量浏览记录,另一些用户的用户数据中存在性别和年龄,另一些用户的用户数据中仅存在年龄。服务端可以从用户数据中提取尽可能多的基础用户特征,并根据提取到的基础用户特征生成基础特征组合。示例性的,基础特征组合可以是“性别+年龄+所在地点”、“年龄+浏览记录中的病症信息”、“性别+搜索记录中的病症信息”。
服务端可以在预设冷启动数据库中查找与基础特征组合对应的群体冷启动推荐数据。其中,群体冷启动推荐数据是根据基础特征组合划分的用户群体偏好的医疗资源数据,用以实现推荐功能的冷启动。冷启动数据库包括大量已建立关联关系的基础特征组合和群体冷启动推荐数据。在查找到群体冷启动推荐数据后,服务端可以从群体冷启动推荐数据中筛选与医疗需求信息匹配的第一医疗资源数据。
步骤330:根据从医疗资源库获取的与医疗需求信息匹配的第二医疗资源数据,融合所述第一医疗资源数据和第二医疗资源数据,得到待排序医疗资源数据。
其中,医疗资源库可以是存储医疗平台全部的医疗资源数据的数据库,或者,存储医疗平台全部医疗资源数据的搜索应用服务器(比如:Solr、Elasticsearch)。
服务端在执行步骤330之前,可以从医疗资源库中查找与医疗需求信息匹配的第二医疗资源数据。
在一实施例中,服务端可以依据医疗需求信息确定对应的可选医疗资源数据。在该实施例中,服务端可以将依据医疗需求信息从所有医疗资源数据中筛选出的医疗资源数据,作为可选医疗资源数据。
服务端可以基于目标业务场景对应的评分策略,对可选医疗资源数据进行评分。对于不同类别的医疗资源数据,可以存在不同的评分策略。针对每一类别的医疗资源数据,服务端可以获取医疗资源数据的医疗资源特征,并选择对应的评分策略对上述医疗资源特征计算,从而得到评分结果。示例性的,如果医疗资源数据是疾病科普文章,服务端可以根据推荐请求中的关键词,计算TF-IDF(Term Frequency–Inverse Document Frequency,词频-逆文本频率指数)值,并以该IT-IDF值与点赞数、收藏数进行加权求和,从而获得评分结果。
服务端可以基于评分结果对可选医疗资源数据进行筛选。在一实施例中,服务端可以筛选出评分结果达到指定分值阈值的可选医疗资源数据。这里,不同类别的医疗资源数据对应的指定分值阈值可以不同。在一实施例中,服务端可以筛选出评分结果排名靠前的指定数量的可选医疗资源数据。服务端可以将筛选出的可选医疗资源数据作为第二医疗资源数据。
在获得第二医疗资源数据后,服务端可以将第一医疗资源数据和第二医疗资源数据进行融合,去除重合的医疗资源数据,获得待排序医疗资源数据。
步骤340:基于排序算法对待排序医疗资源数据进行排序,得到已排序医疗资源数据。
步骤350:向推荐请求的发起方返回已排序医疗资源数据。
其中,排序算法可以包括随机森林(Random Forest)算法、逻辑回归(LogisticRegressive)算法、梯度提升迭代决策树(Gradient Boosting Decision Tree)等任意一种。
服务端可以依据排序算法的特征需求,获取待排序医疗资源数据对应的医疗资源特征,并依据指定数据结构对医疗资源特征进行处理。其中,特征需求是排序算法所需的特征;指定数据结构是排序算法可以处理的数据结构。对于不同类别的医疗资源数据,服务端可以选择不同的排序算法进行处理。
服务端根据排序算法对处理成指定数据结构的医疗资源特征进行计算,并依据计算结果对待排序医疗资源数据进行排序,从而得到已排序医疗资源数据。服务端可以将已排序医疗资源数据返回推荐请求的发起方,使得客户端或页面可以展示已排序医疗资源数据。
在一实施例中,排序算法为逻辑回归算法,对于医疗资源为医生的逻辑回归算法,对应的医疗资源特征可以包括的医生的等级、所属科室、所属科室是否为国家重点科室、擅长的疾病、执业地点、患者好评率。指定数据结构为指定医疗资源特征的排列次序的特征向量。服务端将医疗资源数据的医疗资源特征转换为特征向量后,通过逻辑回归算法对该特征向量进行计算,从而获得该医疗资源数据为用户所需的置信度。服务端对医生的待排序医疗资源数据计算之后,可以依据置信度从大到小的次序对待排序医疗资源数据进行排序,得到已排序医疗资源数据。
根据目标业务场景的需求,服务端可以依据相同的方式对其它类别的待排序医疗资源数据进行排序,最终按照预设的类别次序,返回多个类别的已排序医疗资源数据。示例性的,目标业务场景为“专家问诊”页面,待排序医疗资源数据为医生的医疗资源数据,服务端仅对一种类别的医疗资源数据进行排序,并返回已排序医疗资源数据。目标业务场景为“呼吸科”页面,待排序医疗资源数据可以包括医生、疾病科普文章等类别的医疗资源数据,服务端可以分别对多种类别的医疗资源数据进行排序,并依据医生的医疗资源数据在前、文章的医疗资源数据在后的次序,返回已排序医疗资源数据。
在该实施例中,服务端可以首先对逻辑回归算法进行训练。服务端可以从日志数据中确定用户的偏好数据。其中,偏好数据是用户偏好的医疗资源数据。比如:可从日志数据中的问诊记录和评分记录,确定用户满意的医生,从而将医生的医疗资源数据作为用户的偏好数据。可从日志数据中的浏览记录、点赞记录、收藏记录,确定用户偏好的疾病科普文章,从而将疾病科普文章的医疗资源数据作为用户的偏好数据。
服务端可以基于日志数据和医疗平台热门的医疗资源数据,确定用户的非偏好数据。其中,非偏好数据是用户不满意的医疗资源数据。比如:可从日志数据中的问诊记录和评分记录,确定用户不满意的医生,从而将医生的医疗资源数据作为用户的非偏好数据。可从日志数据中的浏览记录和热门的医疗资源数据确定用户忽略的医疗资源数据,从而将被忽略的医疗资源数据作为用户的非偏好数据。
服务端可以将偏好数据按照指定数据结构转化为特征向量,并添加正样本标签(比如:数字1),作为正样本;将非偏好数据按照指定数据结果转化为特征向量,并添加负样本标签(比如:数字0),作为负样本。通过正样本和负样本对逻辑回归算法进行训练后,可以得到能实现排序的逻辑回归算法。
在一实施例中,服务端在执行步骤310-步骤350的医疗资源的推荐方法之前,可以为用户生成召回数据集。参见图4,为本申请一实施例提供的召回数据集的生成方法,如图4所示,该方法可以包括以下步骤410-步骤440。
步骤410:从目标用户的用户数据中确定用户特征、医疗资源特征和目标用户的偏好数据。
目标用户是被服务端选中以生成召回数据集的用户。在一实施例中,服务端可以将用户数据达到预设数据量阈值的用户,作为目标用户。
服务端可以从目标用户的用户数据(包括用户基础数据和日志数据)中提取用户特征和医疗资源特征,并基于日志数据确定目标用户的偏好数据。
在一实施例中,服务端执行步骤410之前,可以对目标用户的用户数据进行数据清洗,数据清理的方式可以包括缺失值的处理、特征归一化处理、连续特征离散化、类别特征独热编码、特征降维等。
此外,服务端在生成召回数据集时,处理的日志数据可以是当前时间前一天的历史日志数据。
步骤420:基于推荐算法对用户特征和医疗资源特征进行计算,获得目标用户的潜在偏好数据。
推荐算法可以包括协同滤波(Collaborative Filtering)算法和矩阵分解(Factorization Machine)算法等,其中,协同滤波算法可以包括基于用户的协同滤波算法和基于医疗资源的协同滤波算法。
潜在偏好数据为目标用户可能偏好的医疗资源数据。
在一实施例中,推荐算法为基于用户的协同滤波算法,服务端可以基于目标用户的用户特征和医疗资源特征,以及,其它用户的用户特征和医疗资源特征,计算用户相似度,并筛选出用户相似度大于预设相似度阈值的用户。服务端可以基于这些用户的用户数据确定对应的偏好数据,并将这些偏好数据作为目标用户的潜在偏好数据。
步骤430:基于偏好数据和潜在偏好数据生成目标用户的召回数据集。
步骤440:建立目标用户的用户标识与召回数据集的关联关系。
服务端可以融合偏好数据和潜在偏好数据,从而获得目标用户的召回数据集。服务端可以建立目标用户的用户标识和召回数据集的关联关系,并将该关联关系存入召回数据集库中。
在一实施例中,服务端在执行步骤310-步骤350的医疗资源的推荐方法之前,可以生产群体冷启动推荐数据。参见图5,为本申请一实施例提供的群体冷启动推荐数据的生成方法的流程示意图,如图5所示,该方法可以包括以下步骤510-步骤530。
步骤510:依据用户数据中的基础用户特征,生成多种基础特征组合。
服务端根据可以从用户数据中提取到的基础用户特征,生成多种基础特征组合。如前所述,不同用户的用户数据的丰富程度不同,为保证后续执行医疗资源的推荐方法时可以为各种用户提供群体冷启动推荐数据,服务端可以生成不同层级的基础特征组合。层级越高,基础特征组合中的基础用户特征的数量越多。
示例性的,层级最低的基础特征组合中仅包括基础用户特征“性别”,基于性别可分为两个基础特征组合“男性”和“女性”。包含较多基础用户特征的基础特征组合可以是“性别+年龄+所在地点”,服务端可以基于每一基础用户特征中的特征值,划分出多个基础特征组合。“性别+年龄+所在地点”可以划分出“男性+30至34岁+上海”、“男性+35至39岁+上海”、“女性+30至34岁+上海”等多个组合。
步骤520:针对每一基础特征组合,获取基础特征组合对应用户的偏好数据,作为与基础特征组合对应的群体冷启动推荐数据。
针对每一基础特征组合,服务端可以查找该基础特征组合对应的用户数据,从而查找到满足该基础特征组合的多个用户的用户数据。服务端可以分别依据每一用户的用户数据确定用户的偏好数据。当与任一偏好数据对应的用户数量达到预设用户数阈值时,服务端可以将该偏好数据作为基础特征组合对应的用户共有的偏好数据,并将该偏好数据作为与基础特征组合对应的群体冷启动推荐数据。
步骤530:建立基础特征组合和群体冷启动推荐数据的关联关系。
在为任一基础特征组合确定出所有群体冷启动推荐数据后,服务端可以建立基础特征组合和群体冷启动推荐数据的关联关系,并将该关联关系存入上述冷启动数据库。
图6为本申请一实施例提供的医疗资源的推荐装置的框图,如图6所示,该装置可以包括:
接收模块610,用于接收携带目标业务场景和用户标识的推荐请求;
筛选模块620,用于从所述用户标识对应的召回数据集中,筛选出与所述目标业务场景对应的医疗需求信息匹配的第一医疗资源数据;
融合模块630,用于根据从医疗资源库获取的与所述医疗需求信息匹配的第二医疗资源数据,融合所述第一医疗资源数据和第二医疗资源数据,得到待排序医疗资源数据;
排序模块640,用于基于排序算法对所述待排序医疗资源数据进行排序,得到已排序医疗资源数据;
返回模块650,用于向所述推荐请求的发起方返回所述已排序医疗资源数据。
上述装置中各个模块的功能和作用的实现过程具体详见上述医疗资源的推荐方法中对应步骤的实现过程,在此不再赘述。
在本申请所提供的几个实施例中,所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本申请的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
另外,在本申请各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,RandomAccess Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

Claims (8)

1.一种医疗资源的推荐方法,其特征在于,包括:
接收携带目标业务场景和用户标识的推荐请求;
判断是否存在与所述用户标识对应的召回数据集;
如果存在,从所述用户标识对应的召回数据集中,筛选出与所述目标业务场景对应的医疗需求信息匹配的第一医疗资源数据;
如果不存在,基于所述推荐请求中用户标识查找用户数据;基于所述用户数据中的基础用户特征,生成基础特征组合;查找与所述基础特征组合对应的群体冷启动推荐数据;从所述群体冷启动推荐数据中筛选与所述医疗需求信息匹配的所述第一医疗资源数据;
根据从医疗资源库获取的与所述医疗需求信息匹配的第二医疗资源数据,融合所述第一医疗资源数据和第二医疗资源数据,得到待排序医疗资源数据;
基于排序算法对所述待排序医疗资源数据进行排序,得到已排序医疗资源数据;
向所述推荐请求的发起方返回所述已排序医疗资源数据。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
从目标用户的用户数据中确定用户特征、医疗资源特征和所述目标用户的偏好数据;
基于推荐算法对所述用户特征和所述医疗资源特征进行计算,获得所述目标用户的潜在偏好数据;
基于所述偏好数据和所述潜在偏好数据生成所述目标用户的召回数据集;
建立所述目标用户的用户标识与所述召回数据集的关联关系。
3.根据权利要求2所述的方法,其特征在于,所述基于推荐算法对所述用户特征和所述医疗资源特征进行计算,获得所述目标用户的潜在偏好数据,包括:
基于所述目标用户的用户特征和医疗资源特征,以及,其它用户的用户特征和医疗资源特征,计算用户相似度;
筛选出用户相似度大于预设相似度阈值的用户;
基于筛选出用户的用户数据确定对应的偏好数据,并将所述偏好数据作为所述目标用户的潜在偏好数据。
4.根据权利要求1所述的方法,其特征在于,所述方法还包括:
依据用户数据中的基础用户特征,生成多种基础特征组合;
针对每一基础特征组合,获取所述基础特征组合对应用户的偏好数据,作为与所述基础特征组合对应的群体冷启动推荐数据;
建立所述基础特征组合和所述群体冷启动推荐数据的关联关系。
5.根据权利要求1所述的方法,其特征在于,在所述融合所述第一医疗资源数据和第二医疗资源数据之前,所述方法还包括:
依据与所述目标业务场景对应的所述医疗需求信息确定对应的可选医疗资源数据;
基于所述目标业务场景对应的评分策略,对所述可选医疗资源数据进行评分;
基于评分结果对所述可选医疗资源数据进行筛选,获得所述第二医疗资源数据。
6.一种医疗资源的推荐装置,其特征在于,包括:
接收模块,用于接收携带目标业务场景和用户标识的推荐请求;
筛选模块,用于判断是否存在与所述用户标识对应的召回数据集;如果存在,从所述用户标识对应的召回数据集中,筛选出与所述目标业务场景对应的医疗需求信息匹配的第一医疗资源数据;如果不存在,基于所述推荐请求中用户标识查找用户数据;基于所述用户数据中的基础用户特征,生成基础特征组合;查找与所述基础特征组合对应的群体冷启动推荐数据;从所述群体冷启动推荐数据中筛选与所述医疗需求信息匹配的所述第一医疗资源数据;
融合模块,用于根据从医疗资源库获取的与所述医疗需求信息匹配的第二医疗资源数据,融合所述第一医疗资源数据和第二医疗资源数据,得到待排序医疗资源数据;
排序模块,用于基于排序算法对所述待排序医疗资源数据进行排序,得到已排序医疗资源数据;
返回模块,用于向所述推荐请求的发起方返回所述已排序医疗资源数据。
7.一种电子设备,其特征在于,所述电子设备包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为执行权利要求1-5任意一项所述的医疗资源的推荐方法。
8.一种计算机可读存储介质,其特征在于,所述存储介质存储有计算机程序,所述计算机程序可由处理器执行以完成权利要求1-5任意一项所述的医疗资源的推荐方法。
CN202010570982.3A 2020-06-19 2020-06-19 医疗资源的推荐方法及装置、电子设备、存储介质 Active CN111708949B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010570982.3A CN111708949B (zh) 2020-06-19 2020-06-19 医疗资源的推荐方法及装置、电子设备、存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010570982.3A CN111708949B (zh) 2020-06-19 2020-06-19 医疗资源的推荐方法及装置、电子设备、存储介质

Publications (2)

Publication Number Publication Date
CN111708949A CN111708949A (zh) 2020-09-25
CN111708949B true CN111708949B (zh) 2023-07-25

Family

ID=72541514

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010570982.3A Active CN111708949B (zh) 2020-06-19 2020-06-19 医疗资源的推荐方法及装置、电子设备、存储介质

Country Status (1)

Country Link
CN (1) CN111708949B (zh)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112185588A (zh) * 2020-09-30 2021-01-05 微医云(杭州)控股有限公司 一种推荐平台和方法
CN112364251B (zh) * 2020-12-03 2021-08-17 腾讯科技(深圳)有限公司 数据推荐方法、装置、电子设备及存储介质
CN112542237B (zh) * 2020-12-18 2024-03-26 微医云(杭州)控股有限公司 在线任务派发方法、装置、电子设备及存储介质
CN112668743A (zh) * 2020-12-28 2021-04-16 上海领健信息技术有限公司 预约时间的智能推荐方法、装置、存储介质及终端
CN112860997A (zh) * 2021-02-09 2021-05-28 挂号网(杭州)科技有限公司 医疗资源推荐方法、装置、设备及存储介质
CN113421622A (zh) * 2021-06-23 2021-09-21 深圳大学 一种医疗教学系统、方法及存储介质
CN113539457A (zh) * 2021-07-16 2021-10-22 挂号网(杭州)科技有限公司 医疗资源的推荐方法及装置、电子设备、存储介质
CN114242224A (zh) * 2021-12-28 2022-03-25 新瑞鹏宠物医疗集团有限公司 医生推荐方法、装置、电子设备及存储介质
CN114566269B (zh) * 2022-03-09 2023-04-07 四川大学 医疗资源请求方法、装置、电子设备以及存储介质
CN117112729B (zh) * 2023-08-21 2024-05-31 北京科文思数据管理有限公司 基于人工智能的医疗资源对接方法及系统
CN116895358B (zh) * 2023-09-11 2023-11-28 江苏泰德医药有限公司 一种基于云平台医疗资源智能管理系统及方法

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108921624A (zh) * 2018-07-27 2018-11-30 百度在线网络技术(北京)有限公司 广告融合方法、装置、存储介质和终端设备
CN110083688A (zh) * 2019-05-10 2019-08-02 北京百度网讯科技有限公司 搜索结果召回方法、装置、服务器及存储介质
CN110413868A (zh) * 2018-11-06 2019-11-05 腾讯科技(深圳)有限公司 信息推荐方法、装置、系统及存储介质
WO2020007028A1 (zh) * 2018-07-04 2020-01-09 平安科技(深圳)有限公司 问诊数据推荐方法、装置、计算机设备和存储介质
CN110765309A (zh) * 2019-10-09 2020-02-07 上海麦克风文化传媒有限公司 一种基于参数配置的推荐系统召回方法及系统
CN111009311A (zh) * 2019-11-05 2020-04-14 泰康保险集团股份有限公司 一种医疗资源推荐方法、装置、介质和设备
CN111143689A (zh) * 2019-12-31 2020-05-12 青梧桐有限责任公司 根据用户需求和用户画像构建推荐引擎的方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8943070B2 (en) * 2010-07-16 2015-01-27 International Business Machines Corporation Adaptive and personalized tag recommendation
US20150012294A1 (en) * 2012-02-24 2015-01-08 Peter Casady Real-time recall inventory matching system
US10945012B2 (en) * 2018-06-28 2021-03-09 Pandora Media, Llc Cold-start podcast recommendations

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020007028A1 (zh) * 2018-07-04 2020-01-09 平安科技(深圳)有限公司 问诊数据推荐方法、装置、计算机设备和存储介质
CN108921624A (zh) * 2018-07-27 2018-11-30 百度在线网络技术(北京)有限公司 广告融合方法、装置、存储介质和终端设备
CN110413868A (zh) * 2018-11-06 2019-11-05 腾讯科技(深圳)有限公司 信息推荐方法、装置、系统及存储介质
CN110083688A (zh) * 2019-05-10 2019-08-02 北京百度网讯科技有限公司 搜索结果召回方法、装置、服务器及存储介质
CN110765309A (zh) * 2019-10-09 2020-02-07 上海麦克风文化传媒有限公司 一种基于参数配置的推荐系统召回方法及系统
CN111009311A (zh) * 2019-11-05 2020-04-14 泰康保险集团股份有限公司 一种医疗资源推荐方法、装置、介质和设备
CN111143689A (zh) * 2019-12-31 2020-05-12 青梧桐有限责任公司 根据用户需求和用户画像构建推荐引擎的方法

Also Published As

Publication number Publication date
CN111708949A (zh) 2020-09-25

Similar Documents

Publication Publication Date Title
CN111708949B (zh) 医疗资源的推荐方法及装置、电子设备、存储介质
US11663254B2 (en) System and engine for seeded clustering of news events
US7912816B2 (en) Adaptive archive data management
CN109190043B (zh) 推荐方法及装置,存储介质,电子设备及推荐系统
CN108959618B (zh) 互联网信息收集及处理方法和装置
JP6144427B2 (ja) データ分析システムおよびデータ分析方法並びにデータ分析プログラム
US20100145954A1 (en) Role Based Search
Quarati et al. Do researchers use open research data? Exploring the relationships between usage trends and metadata quality across scientific disciplines from the Figshare case
Kovacevic et al. Using data mining to improve digital library services
CN110851729A (zh) 资源信息推荐方法、装置、设备及计算机存储介质
CN114238573B (zh) 基于文本对抗样例的信息推送方法及装置
Ortega et al. Artificial intelligence scientific documentation dataset for recommender systems
CN111429161B (zh) 特征提取方法、特征提取装置、存储介质及电子设备
US20080147631A1 (en) Method and system for collecting and retrieving information from web sites
Pérez-Gallardo et al. Collective intelligence as mechanism of medical diagnosis: The iPixel approach
CA2956627A1 (en) System and engine for seeded clustering of news events
CN112632405A (zh) 一种推荐方法、装置、设备及存储介质
Hutterer Enhancing a job recommender with implicit user feedback
CN111696656A (zh) 一种互联网医疗平台的医生评价方法、装置
US20120059786A1 (en) Method and an apparatus for matching data network resources
CN116431895A (zh) 安全生产知识个性化推荐方法及系统
CN113961811B (zh) 基于事件图谱的话术推荐方法、装置、设备及介质
Foote et al. A computational analysis of social media scholarship
KR102454261B1 (ko) 사용자 정보 기반 협업 파트너 추천 시스템 및 그 방법
CN113539457A (zh) 医疗资源的推荐方法及装置、电子设备、存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant