CN114582472A - 信息的推荐方法、装置、设备及存储介质 - Google Patents

信息的推荐方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN114582472A
CN114582472A CN202011385179.9A CN202011385179A CN114582472A CN 114582472 A CN114582472 A CN 114582472A CN 202011385179 A CN202011385179 A CN 202011385179A CN 114582472 A CN114582472 A CN 114582472A
Authority
CN
China
Prior art keywords
information
disease
doctor
preset
determining
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011385179.9A
Other languages
English (en)
Inventor
刘胜涛
李超
何明
张李秋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Mobile Communications Group Co Ltd
China Mobile Chengdu ICT Co Ltd
Original Assignee
China Mobile Communications Group Co Ltd
China Mobile Chengdu ICT Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Mobile Communications Group Co Ltd, China Mobile Chengdu ICT Co Ltd filed Critical China Mobile Communications Group Co Ltd
Priority to CN202011385179.9A priority Critical patent/CN114582472A/zh
Publication of CN114582472A publication Critical patent/CN114582472A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H40/00ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices
    • G16H40/20ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices for the management or administration of healthcare resources or facilities, e.g. managing hospital staff or surgery rooms
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Public Health (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Epidemiology (AREA)
  • Data Mining & Analysis (AREA)
  • Primary Health Care (AREA)
  • Business, Economics & Management (AREA)
  • General Business, Economics & Management (AREA)
  • Databases & Information Systems (AREA)
  • Pathology (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本申请实施例提供了一种信息的推荐方法、装置、设备及存储介质,该信息的推荐方法包括:获取用户输入的疾病描述信息;根据疾病描述信息确定疾病类型和病情程度信息;根据疾病类型确定医生信息;根据医生信息、医生信息对应的第一评分信息和病情程度信息,确定目标评分信息;其中,第一评分信息表征医生的受欢迎程度,目标评分信息表征医生与疾病类型的匹配程度;本申请实施例能够解决现有网上挂号时在线推荐医生的方法推荐的医生与用户提供的疾病描述信息匹配合理性较低的问题。

Description

信息的推荐方法、装置、设备及存储介质
技术领域
本申请属于人工智能领域,尤其涉及一种信息的推荐方法、装置、设备及存储介质。
背景技术
卫生部颁布的《关于在公立医院施行预约诊疗服务工作的意见》提出:网络挂号,即在线挂号,是公立医院以病人为中心开展医疗服务的重要改革措施,对于方便群众就医、提高医疗服务水平具有重大意义。在公立医院率先施行预约诊疗服务工作,有利于患者进行就医咨询,提前安排就医计划,减少候诊时间,也有利于医院提升管理水平,提高工作效率和医疗质量,降低医疗安全风险。
随着互联网技术的发展越来越多的医院都推出了自己的在线挂号系统,由于在线挂号的方便性越来越多的人的也开始习惯在在线挂号,在在线挂号方便了大众生活的同时,也同样面临着用户不知道该挂哪个医生的号这样的问题。
现有技术中,已有在线挂号时在线推荐医生的方法,但是推荐的医生与用户提供的疾病描述信息匹配合理性较低。
发明内容
本申请实施例提供一种在信息的推荐方法、装置、设备及存储介质,能够解决现有网上挂号时在线推荐医生的方法推荐的医生与用户提供的疾病描述信息匹配合理性较低的问题。
第一方面,本申请实施例提供一种信息的推荐方法,该方法包括:
获取用户输入的疾病描述信息;
根据疾病描述信息确定疾病类型和病情程度信息;
根据疾病类型确定医生信息;
根据医生信息、医生信息对应的第一评分信息和病情程度信息,确定目标评分信息;其中,第一评分信息表征医生的受欢迎程度,目标评分信息表征医生与疾病类型的匹配程度。
进一步地,在一种实施例中,根据疾病描述信息确定疾病类型和病情程度信息,包括:
将疾病描述信息输入预设词向量化模型,得到疾病描述信息对应的疾病向量特征;
根据疾病向量特征确定疾病类型以及病情程度信息。
进一步地,在一种实施例中,根据疾病向量特征确定疾病类型以及病情程度信息,包括:
计算疾病向量特征与多个预设疾病向量特征的相似度,预设疾病向量特征映射有相应的疾病类型及对应的疾病症状;
显示相似度超过预设阈值的预设疾病向量特征相应的疾病类型及对应的疾病症状,以供用户选择;
获取用户选择的疾病类型;
将疾病向量特征输入预设的病情程度分类模型,输出病情程度信息。
进一步地,在一种实施例中,在根据医生信息、医生信息对应的第一评分信息和病情程度信息,确定目标评分信息前,方法还包括:
根据预设时间段内用户的历史挂号数量确定第一评分信息。
进一步地,在一种实施例中,第一评分信息S通过如下公式计算得出:
Figure BDA0002810816800000021
其中,n为预设时间段内当前医生放出的预约号总数,Mi为当前医生在预设时间段内第i批次放出的预约号的数量,mi为第i批次预约号的截止时间前已被预约的预约号数量,ti第i批次预约号的可预约时间跨度,ki为医第i批预约号放出时间与获取用户输入的疾病描述信息的时间的差值,K为预设时间段的时间跨度。
进一步地,在一种实施例中,根据医生信息、医生信息对应的第一评分信息和病情程度信息,确定目标评分信息,包括:
当病情程度信息表征出疾病描述信息对应重症时:
医生信息表征出的专家医生的目标评分信息U通过如下公式确定:
Figure BDA0002810816800000031
医生信息表征出的普通医生的目标评分信息U通过如下公式确定:
Figure BDA0002810816800000032
其中,j为专家级别,S为第一评分信息,z为看诊时间距离获取用户输入的疾病描述信息的时间的差值。
进一步地,在一种实施例中,根据医生信息、医生信息对应的第一评分信息和病情程度信息,确定目标评分信息,包括:
当病情程度信息表征出疾病描述信息对应轻症时:
医生信息表征出的专家医生的目标评分信息U通过如下公式确定:
Figure BDA0002810816800000033
医生信息表征出的普通医生的目标评分信息U通过如下公式确定:
Figure BDA0002810816800000034
其中,j为专家级别,S为第一评分信息,z为看诊时间距离获取用户输入的疾病描述信息的时间的差值。
第二方面,本申请实施例提供一种信息的推荐装置,该装置包括:
获取模块,用于获取用户输入的疾病描述信息;
确定模块,用于根据疾病描述信息确定疾病类型和病情程度信息;
确定模块,还用于根据疾病类型确定医生信息;
确定模块,还用于根据医生信息、医生信息对应的第一评分信息和病情程度信息,确定目标评分信息;其中,第一评分信息表征医生的受欢迎程度,目标评分信息表征医生与疾病类型的匹配程度。
进一步地,在一种实施例中,确定模块,包括:
输入单元,将疾病描述信息输入预设词向量化模型,得到疾病描述信息对应的疾病向量特征;
确定单元,根据疾病向量特征确定疾病类型以及病情程度信息。
进一步地,在一种实施例中,确定单元,具体用于:
计算疾病向量特征与多个预设疾病向量特征的相似度,预设疾病向量特征映射有相应的疾病类型及对应的疾病症状;
显示相似度超过预设阈值的预设疾病向量特征相应的疾病类型及对应的疾病症状,以供用户选择;
获取用户选择的疾病类型;
将疾病向量特征输入预设的病情程度分类模型,输出病情程度信息。
第三方面,本申请实施例提供一种信息的推荐设备,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,计算机程序被处理器执行时实现上述信息的推荐方法。
第四方面,本申请实施例提供一种计算机可读存储介质,计算机可读存储介质上存储有信息传递的实现程序,程序被处理器执行时实现上述信息的推荐方法。
本申请实施例的信息的推荐方法、装置、设备及存储介质,基于用户输入的疾病描述信息确定疾病类型及病情程度信息,进而确定该疾病类型对应的医生信息,能够推荐擅长处理该疾病类型的医生,并且得到了根据医生信息、表征了医生受欢迎程度的第一评分信息和病情程度信息确定的目标评分信息,使得目标评分信息能够表征出各医生与该疾病类型的匹配程度,能够使推荐的医生信息与用户提供的疾病描述信息匹配合理性较高。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例中所需要使用的附图作简单的介绍,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的一种信息的推荐方法的流程示意图;
图2是本申请实施例提供的一种信息的推荐装置的结构示意图;
图3是本申请实施例提供的一种信息的推荐设备的结构示意图;
图4是本申请实施例提供的资源库系统结构示意图;
图5是本申请实施例提供的医生推荐系统;
图6是本申请实施例提供的Skip-gram模型的基本网络结构图。
具体实施方式
下面将详细描述本申请的各个方面的特征和示例性实施例,为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及具体实施例,对本申请进行进一步详细描述。应理解,此处所描述的具体实施例仅被配置为解释本申请,并不被配置为限定本申请。对于本领域技术人员来说,本申请可以在不需要这些具体细节中的一些细节的情况下实施。下面对实施例的描述仅仅是为了通过示出本申请的示例来提供对本申请更好的理解。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
随着互联网技术的发展,越来越多的医院都推出了自己的网上挂号系统,由于网上挂号的方便性越来越多的人的也开始习惯在网上挂号,网上挂号确实方便,但是现有的网上挂号方法推荐的医生与用户提供的疾病描述信息匹配合理性较低。
为了解决现有技术问题,本申请实施例提供了一种信息的推荐方法、装置、设备及存储介质。本申请基于用户输入的疾病描述信息确定疾病类型及病情程度信息,进而确定该疾病类型对应的医生信息,能够推荐擅长处理该疾病类型的医生,并且得到了根据医生信息、表征了医生受欢迎程度的第一评分信息和病情程度信息确定的目标评分信息,使得目标评分信息能够表征出各医生与该疾病类型的匹配程度,能够使推荐的医生信息与用户提供的疾病描述信息匹配合理性较高。下面首先对本申请实施例所提供的信息的推荐方法进行介绍。
图1示出了本申请一个实施例提供的信息的推荐方法的流程示意图。如图1所示,该方法可以包括以下步骤:
S100,获取用户输入的疾病描述信息。
疾病描述信息通过用户输入而获得。
S102,根据疾病描述信息确定疾病类型和病情程度信息。
在一种实施例中,S102可以包括:
S1020,将疾病描述信息输入预设词向量化模型,得到疾病描述信息对应的疾病向量特征。
在一种实施例中,S1020可以包括:
将疾病描述信息输入预设分词模型,输出表征经分词后的疾病描述信息的第一特征。
预设分词模型可以选用jieba模型。
例如,疾病描述信息为“有点发烧头疼啊”,则将疾病描述信息输入预设分词模型后输出的第一特征为【有点,发烧,头疼,啊】。
通过删除第一特征中符合预设停用词表记载的单词以得到第二特征。
预设停用词表记载了对于理解描述属于哪一种疾病没有帮助的词语及各种符号的词语,如啊、哎、其次。例如,预设停用词表记载了“啊”为停用词,则第二特征为【有点,发烧,头疼】。
筛选出第二特征中符合预设关键词表记载的单词以确定第三特征。
关键词表记载了对于理解描述属于哪一种疾病至关重要的词语,如发烧、咳嗽、头晕;例如,预设关键词表记载了“发烧”、“头疼”为关键词,则确定“发烧”、“头疼”为第三特征。
将第二特征中的第三特征个数增加预设倍数后,得到第四特征。
例如,预设倍数为3,则第四特征为【有点,发烧,发烧,发烧,头疼,头疼,头疼】。
将第四特征输入预设词向量化模型,得到疾病描述信息对应的疾病向量特征。
例如对于第四特征为【有点,发烧,发烧,发烧,头疼,头疼,头疼】的疾病描述,统计其词的个数为7,使用Skip-gram模型对该词列表中各个词进行向量化后形成的向量分别为L1,L2,L2,L2,L3,L3,L3,则得到的疾病描述信息对应的疾病向量特征LP为
Figure BDA0002810816800000071
预设词向量化模型可以选为Skip-gram模型或者TF-IDF模型,优选使用Skip-gram模型,并可将该Skip-gram模型的维度设为200,相比TF-IDF模型,Skip-gram模型具有以下优点:
首先,TF-IDF模型表示出的词向量维度与词表的大小成正比,是一种高维稀疏的表示方法,这种表示方法在计算上具有较低的效率,而词向量化方法Skip-gram可以表示出低维稠密的词向量,具有较高的计算效率。
其次,TF-IDF模型这种表示方式追踪不到词与词之间的关联关系,而Skip-gram则运用了具有相同上下文的词语包含相似的语义这一思想,使得语义相近的词在映射到欧式空间中具有较高的余弦相似度。
S1022,根据疾病向量特征确定疾病类型以及病情程度信息。
在一种实施例中,S1022可以包括:
计算疾病向量特征与多个预设疾病向量特征的相似度,预设疾病向量特征映射有相应的疾病类型及对应的疾病症状;显示相似度超过预设阈值的预设疾病向量特征相应的疾病类型及对应的疾病症状,以供用户选择;获取用户选择的疾病类型。
疾病症状映射有疾病类型,预设疾病向量特征可通过将疾病症状输入预设词向量化模型得到。
例如,疾病症状为【发烧,头疼】,词的个数为2,使用预设的Skip-gram模型对疾病症状的各个词进行向量化后形成的向量分别为L2,L3,则得到的疾病描述信息对应的疾病向量特征LZ为
Figure BDA0002810816800000072
可以通过计算LZ与LP的余弦值作为相似度,以与预设阈值比较,余弦值为:
Figure BDA0002810816800000081
余弦值越大说明LZ与LP越相似。
例如,可以预设阈值为α,从余弦值大于α的预设疾病向量特征中取相似度最大的三个预设疾病向量特征,向用户推荐该三个预设疾病向量特征对应的疾病类型及对应的疾病症状,不足三个的则有几个取几个。
将疾病向量特征输入预设的疾病分类模型,输出病情程度信息。
该预设的病情程度分类模型可以是xgboost模型。对于每一种疾病类型互联网上都会存在相应的疾病描述信息,对于每一种疾病描述信息进行标记,得到标签数据,具体可以标记为0或者1的标签,其中0代表该疾病描述信息对应的病情程度信息为轻症,1代表该疾病描述信息对应的病情程度信息为重症。即可根据上述疾病描述信息和标签数据训练得到各疾病类型的病情程度分类模型。
例如,对于一种疾病类型如感冒,首先通过预设词向量化模型将其对应的疾病描述信息进行向量化,然后用各疾病描述信息对应的向量及标签数据训练一个xgboost分类模型。
将疾病向量特征输入对应的疾病类型的预设的病情程度分类模型,即可输出病情程度信息。
在一种实施例中,该方法还包括:
S103,根据预设时间段内用户的历史挂号数量确定第一评分信息。
在一种实施例中,第一评分信息S可以通过如下公式计算得出:
Figure BDA0002810816800000082
其中,n为预设时间段内当前医生放出的预约号总数,Mi为当前医生在预设时间段内第i批次放出的预约号的数量,mi为第i批次预约号的截止时间前已被预约的预约号数量,ti第i批次预约号的可预约时间跨度,一个医生的预约号被放出来之后越快被预约完则ti的值越小,ki为医第i批预约号放出时间与获取用户输入的疾病描述信息的时间的差值,K为预设时间段的时间跨度,
Figure BDA0002810816800000083
为时间衰减函数,能够使得越是最近的预约情况对医生的受欢迎程度评分的贡献越大。
S104,根据疾病类型确定医生信息。
医院数据库记录有医生可诊断疾病类型以及医生所在科室信息,基于医院数据库即可根据疾病类型确定医生信息。
S106,根据医生信息、医生信息对应的第一评分信息和病情程度信息,确定目标评分信息。
其中,第一评分信息表征医生的受欢迎程度,目标评分信息表征医生与疾病类型的匹配程度。
在一种实施例中,S106可以包括:
当病情程度信息表征出疾病描述信息对应重症时:
医生信息表征出的专家医生的目标评分信息U通过如下公式确定:
Figure BDA0002810816800000091
医生信息表征出的普通医生的目标评分信息U通过如下公式确定:
Figure BDA0002810816800000092
其中,j为专家级别,S为第一评分信息,z为看诊时间距离获取用户输入的疾病描述信息的时间的差值。
例如,专家级别可以分为一级专家、二级专家、三级专家;普通医生即为没有专家职称的医生。
在一种实施例中,S106还可以包括:
当病情程度信息表征出疾病描述信息对应轻症时:
医生信息表征出的专家医生的目标评分信息U通过如下公式确定:
Figure BDA0002810816800000093
医生信息表征出的普通医生的目标评分信息U通过如下公式确定:
Figure BDA0002810816800000094
其中,j为专家级别,S为第一评分信息,z为看诊时间距离获取用户输入的疾病描述信息的时间的差值。
本申请基于用户输入的疾病描述信息确定疾病类型及病情程度信息,进而确定该疾病类型对应的医生信息,能够推荐擅长处理该疾病类型的医生,并且得到了根据医生信息、表征了医生受欢迎程度的第一评分信息和病情程度信息确定的目标评分信息,使得目标评分信息能够表征出各医生与该疾病类型的匹配程度,并且通过目标评分信息的计算手段实现了病患资源与医疗资源的合理推荐,即对于重症疾病类型患者专家医生的目标评分机制使得目标评分较高,对于重症疾病类型患者普通医生的目标评分机制使得目标评分较低,对于轻症疾病类型患者专家医生的目标评分机制使得目标评分较低,对于轻症疾病类型患者普通医生的目标评分机制使得目标评分较高。由于用户通常会优先选择目标评分较高的医生,进而实现了医疗资源与患病类型的合理分配。
图1描述了信息的推荐方法,下面结合附图2和附图3描述本申请实施例提供的装置。
图2示出了本申请一个实施例提供的信息的推荐装置的结构示意图,图2所示装置中各模块具有实现图1中各个步骤的功能,并能达到其相应技术效果。如图2所示,该装置可以包括:
获取模块200,用于获取用户输入的疾病描述信息。
疾病描述信息通过用户输入而获得。
确定模块202,用于根据疾病描述信息确定疾病类型和病情程度信息。
在一种实施例中,确定模块202可以包括:
输入单元2020,用于将疾病描述信息输入预设词向量化模型,得到疾病描述信息对应的疾病向量特征。
在一种实施例中,输入单元2020可以具体用于:
将疾病描述信息输入预设分词模型,输出表征经分词后的疾病描述信息的第一特征。
预设分词模型可以选用jieba模型。
例如,疾病描述信息为“有点发烧头疼啊”,则将疾病描述信息输入预设分词模型后输出的第一特征为【有点,发烧,头疼,啊】。
通过删除第一特征中符合预设停用词表记载的单词以得到第二特征。
预设停用词表记载了对于理解描述属于哪一种疾病没有帮助的词语及各种符号的词语,如啊、哎、其次。例如,预设停用词表记载了“啊”为停用词,则第二特征为【有点,发烧,头疼】。
筛选出第二特征中符合预设关键词表记载的单词以确定第三特征。
关键词表记载了对于理解描述属于哪一种疾病至关重要的词语,如发烧、咳嗽、头晕;例如,预设关键词表记载了“发烧”、“头疼”为关键词,则确定“发烧”、“头疼”为第三特征。
将第二特征中的第三特征个数增加预设倍数后,得到第四特征。
例如,预设倍数为3,则第四特征为【有点,发烧,发烧,发烧,头疼,头疼,头疼】。
将第四特征输入预设词向量化模型,得到疾病描述信息对应的疾病向量特征。
例如对于第四特征为【有点,发烧,发烧,发烧,头疼,头疼,头疼】的疾病描述,统计其词的个数为7,使用Skip-gram模型对该词列表中各个词进行向量化后形成的向量分别为L1,L2,L2,L2,L3,L3,L3,则得到的疾病描述信息对应的疾病向量特征LP为
Figure BDA0002810816800000111
预设词向量化模型可以选为Skip-gram模型或者TF-IDF模型,优选使用Skip-gram模型,并可将该Skip-gram模型的维度设为200,相比TF-IDF模型,Skip-gram模型具有以下优点:
首先,TF-IDF模型表示出的词向量维度与词表的大小成正比,是一种高维稀疏的表示方法,这种表示方法在计算上具有较低的效率,而词向量化方法Skip-gram可以表示出低维稠密的词向量,具有较高的计算效率。
其次,TF-IDF模型这种表示方式追踪不到词与词之间的关联关系,而Skip-gram则运用了具有相同上下文的词语包含相似的语义这一思想,使得语义相近的词在映射到欧式空间中具有较高的余弦相似度。
确定单元2022,用于根据疾病向量特征确定疾病类型以及病情程度信息。
在一种实施例中,确定单元2022可以具体用于:
计算疾病向量特征与多个预设疾病向量特征的相似度,预设疾病向量特征映射有相应的疾病类型及对应的疾病症状;显示相似度超过预设阈值的预设疾病向量特征相应的疾病类型及对应的疾病症状,以供用户选择;获取用户选择的疾病类型。
疾病症状映射有疾病类型,预设疾病向量特征可通过将疾病症状输入预设词向量化模型得到。
例如,疾病症状为【发烧,头疼】,词的个数为2,使用预设的Skip-gram模型对疾病症状的各个词进行向量化后形成的向量分别为L2,L3,则得到的疾病描述信息对应的疾病向量特征LZ为
Figure BDA0002810816800000121
可以通过计算LZ与LP的余弦值作为相似度,以与预设阈值比较,余弦值为:
Figure BDA0002810816800000122
余弦值越大说明LZ与LP越相似。
例如,可以预设阈值为α,从余弦值大于α的预设疾病向量特征中取相似度最大的三个预设疾病向量特征,向用户推荐该三个预设疾病向量特征对应的疾病类型及对应的疾病症状,不足三个的则有几个取几个。
将疾病向量特征输入预设的疾病分类模型,输出病情程度信息。
该预设的病情程度分类模型可以是xgboost模型。对于每一种疾病类型互联网上都会存在相应的疾病描述信息,对于每一种疾病描述信息进行标记,得到标签数据,具体可以标记为0或者1的标签,其中0代表该疾病描述信息对应的病情程度信息为轻症,1代表该疾病描述信息对应的病情程度信息为重症。即可根据上述疾病描述信息和标签数据训练得到各疾病类型的病情程度分类模型。
例如,对于一种疾病类型如感冒,首先通过预设词向量化模型将其对应的疾病描述信息进行向量化,然后用各疾病描述信息对应的向量及标签数据训练一个xgboost分类模型。
将疾病向量特征输入对应的疾病类型的预设的病情程度分类模型,即可输出病情程度信息。
在一种实施例中,确定模块202还可以用于:
根据预设时间段内用户的历史挂号数量确定第一评分信息。
在一种实施例中,第一评分信息S可以通过如下公式计算得出:
Figure BDA0002810816800000123
其中,n为预设时间段内当前医生放出的预约号总数,Mi为当前医生在预设时间段内第i批次放出的预约号的数量,mi为第i批次预约号的截止时间前已被预约的预约号数量,ti第i批次预约号的可预约时间跨度,一个医生的预约号被放出来之后越快被预约完则ti的值越小,ki为医第i批预约号放出时间与获取用户输入的疾病描述信息的时间的差值,K为预设时间段的时间跨度,
Figure BDA0002810816800000131
为时间衰减函数,能够使得越是最近的预约情况对医生的受欢迎程度评分的贡献越大。
确定模块202,还用于根据疾病类型确定医生信息。
医院数据库记录有医生可诊断疾病类型以及医生所在科室信息,基于医院数据库即可根据疾病类型确定医生信息。
确定模块202,还用于根据医生信息、医生信息对应的第一评分信息和病情程度信息,确定目标评分信息。
其中,第一评分信息表征医生的受欢迎程度,目标评分信息表征医生与疾病类型的匹配程度。
在一种实施例中,确定模块202可以具体用于:
当病情程度信息表征出疾病描述信息对应重症时:
医生信息表征出的专家医生的目标评分信息U通过如下公式确定:
Figure BDA0002810816800000132
医生信息表征出的普通医生的目标评分信息U通过如下公式确定:
Figure BDA0002810816800000133
其中,j为专家级别,S为第一评分信息,z为看诊时间距离获取用户输入的疾病描述信息的时间的差值。
例如,专家级别可以分为一级专家、二级专家、三级专家;普通医生即为没有专家职称的医生。
在一种实施例中,确定模块202可以具体用于:
当病情程度信息表征出疾病描述信息对应轻症时:
医生信息表征出的专家医生的目标评分信息U通过如下公式确定:
Figure BDA0002810816800000134
医生信息表征出的普通医生的目标评分信息U通过如下公式确定:
Figure BDA0002810816800000141
其中,j为专家级别,S为第一评分信息,z为看诊时间距离获取用户输入的疾病描述信息的时间的差值。
本申请基于用户输入的疾病描述信息确定疾病类型及病情程度信息,进而确定该疾病类型对应的医生信息,能够推荐擅长处理该疾病类型的医生,并且得到了根据医生信息、表征了医生受欢迎程度的第一评分信息和病情程度信息确定的目标评分信息,使得目标评分信息能够表征出各医生与该疾病类型的匹配程度,并且通过目标评分信息的计算手段实现了病患资源与医疗资源的合理推荐,即对于重症疾病类型患者专家医生的目标评分机制使得目标评分较高,对于重症疾病类型患者普通医生的目标评分机制使得目标评分较低,对于轻症疾病类型患者专家医生的目标评分机制使得目标评分较低,对于轻症疾病类型患者普通医生的目标评分机制使得目标评分较高。由于用户通常会优先选择目标评分较高的医生,进而实现了医疗资源与患病类型的合理分配。
图3示出了本申请一个实施例提供的信息的推荐设备的结构示意图。如图3所示,该设备可以包括处理器301以及存储有计算机程序指令的存储器302。
具体地,上述处理器301可以包括中央处理器(Central Processing Unit,CPU),或者特定集成电路(Application Specific Integrated Circuit,ASIC),或者可以被配置成实施本申请实施例的一个或多个集成电路。
存储器302可以包括用于数据或指令的大容量存储器。举例来说而非限制,存储器302可包括硬盘驱动器(Hard Disk Drive,HDD)、软盘驱动器、闪存、光盘、磁光盘、磁带或通用串行总线(Universal Serial Bus,USB)驱动器或者两个或更多个以上这些的组合。在一个实例中,存储器302可以包括可移除或不可移除(或固定)的介质,或者存储器302是非易失性固态存储器。存储器302可在综合网关容灾设备的内部或外部。
在一个实例中,存储器302可以是只读存储器(Read Only Memory,ROM)。在一个实例中,该ROM可以是掩模编程的ROM、可编程ROM(PROM)、可擦除PROM(EPROM)、电可擦除PROM(EEPROM)、电可改写ROM(EAROM)或闪存或者两个或更多个以上这些的组合。
处理器301通过读取并执行存储器302中存储的计算机程序指令,以实现图1所示实施例中的方法,并达到图1所示实例执行其方法达到的相应技术效果,为简洁描述在此不再赘述。
在一个示例中,该信息的推荐设备还可包括通信接口303和总线310。其中,如图3所示,处理器301、存储器302、通信接口303通过总线310连接并完成相互间的通信。
通信接口303,主要用于实现本申请实施例中各模块、装置、单元和/或设备之间的通信。
总线310包括硬件、软件或两者,将在线数据流量计费设备的部件彼此耦接在一起。举例来说而非限制,总线可包括加速图形端口(Accelerated Graphics Port,AGP)或其他图形总线、增强工业标准架构(Extended Industry Standard Architecture,EISA)总线、前端总线(Front Side Bus,FSB)、超传输(Hyper Transport,HT)互连、工业标准架构(Industry Standard Architecture,ISA)总线、无限带宽互连、低引脚数(LPC)总线、存储器总线、微信道架构(MCA)总线、外围组件互连(PCI)总线、PCI-Express(PCI-X)总线、串行高级技术附件(SATA)总线、视频电子标准协会局部(VLB)总线或其他合适的总线或者两个或更多个以上这些的组合。在合适的情况下,总线310可包括一个或多个总线。尽管本申请实施例描述和示出了特定的总线,但本申请考虑任何合适的总线或互连。
该信息的推荐设备可以执行本申请实施例中的信息的推荐方法,从而实现图1描述的信息的推荐方法的相应技术效果。
图4示出了本申请一个实施例提供的资源库系统结构示意图,该资源库系统400用于为本申请的上述方法实施例步骤提供数据来源,如图4所示,该资源库系统包括:
疾病描述词库,用于存储疾病名称及其对应的疾病向量特征以及疾病描述信息;医生信息库,用于存储医生信息、医生可诊断疾病类型以及医生所在科室信息;识别信息库,用于存储预设停用词表和预设关键词表。
图5示出了本申请一个实施例提供的医生推荐系统,如图5所示,该医生推荐系统包括本申请上述实施例的获取模块200、确定模块202、以及资源库系统400。
图6示出了本申请上述实施例提供的Skip-gram模型的基本网络结构图,如图6所示,Skip-gram模型的基本网络包括:
输入向量Input Vector层,输入向量层设有10000个位置positions,“1”为目标词汇所在位置。
隐含层Hidden Layer,可以是线性神经元Linear Neurons,包含300个神经元neurons。
输出层Output Layer,可以是Softmax分类器Classifier,包含10000个神经元。
另外,结合上述实施例中的信息的推荐方法,本申请实施例可提供一种计算机存储介质来实现。该计算机存储介质上存储有计算机程序指令;该计算机程序指令被处理器执行时实现上述实施例中的任意一种信息的推荐方法。
需要明确的是,本申请并不局限于上文所描述并在图中示出的特定配置和处理。为了简明起见,这里省略了对已知方法的详细描述。在上述实施例中,描述和示出了若干具体的步骤作为示例。但是,本申请的方法过程并不限于所描述和示出的具体步骤,本领域的技术人员可以在领会本申请的精神后,作出各种改变、修改和添加,或者改变步骤之间的顺序。
以上所述的结构框图中所示的功能块可以实现为硬件、软件、固件或者它们的组合。当以硬件方式实现时,其可以例如是电子电路、专用集成电路(Application SpecificIntegrated Circuit,ASIC)、适当的固件、插件、功能卡等等。当以软件方式实现时,本申请的元素是被用于执行所需任务的程序或者代码段。程序或者代码段可以存储在机器可读介质中,或者通过载波中携带的数据信号在传输介质或者通信链路上传送。“机器可读介质”可以包括能够存储或传输信息的任何介质。机器可读介质的例子包括电子电路、半导体存储器设备、ROM、闪存、可擦除ROM(EROM)、软盘、CD-ROM、光盘、硬盘、光纤介质、射频(RadioFrequency,RF)链路,等等。代码段可以经由诸如因特网、内联网等的计算机网络被下载。
还需要说明的是,本申请中提及的示例性实施例,基于一系列的步骤或者装置描述一些方法或系统。但是,本申请不局限于上述步骤的顺序,也就是说,可以按照实施例中提及的顺序执行步骤,也可以不同于实施例中的顺序,或者若干步骤同时执行。
上面参考根据本申请的实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述了本申请的各方面。应当理解,流程图和/或框图中的每个方框以及流程图和/或框图中各方框的组合可以由计算机程序指令实现。这些计算机程序指令可被提供给通用计算机、专用计算机、或其它可编程数据处理装置的处理器,以产生一种机器,使得经由计算机或其它可编程数据处理装置的处理器执行的这些指令使能对流程图和/或框图的一个或多个方框中指定的功能/动作的实现。这种处理器可以是但不限于是通用处理器、专用处理器、特殊应用处理器或者现场可编程逻辑电路。还可理解,框图和/或流程图中的每个方框以及框图和/或流程图中的方框的组合,也可以由执行指定的功能或动作的专用硬件来实现,或可由专用硬件和计算机指令的组合来实现。
以上所述,仅为本申请的具体实施方式,所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的系统、模块和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。应理解,本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本申请的保护范围之内。

Claims (12)

1.一种信息的推荐方法,其特征在于,包括:
获取用户输入的疾病描述信息;
根据所述疾病描述信息确定疾病类型和病情程度信息;
根据所述疾病类型确定医生信息;
根据所述医生信息、所述医生信息对应的第一评分信息和所述病情程度信息,确定目标评分信息;其中,所述第一评分信息表征医生的受欢迎程度,所述目标评分信息表征医生与所述疾病类型的匹配程度。
2.如权利要求1所述的信息的推荐方法,其特征在于,所述根据所述疾病描述信息确定疾病类型和病情程度信息,包括:
目标评分将所述疾病描述信息输入预设词向量化模型,得到所述疾病描述信息对应的疾病向量特征;
根据所述疾病向量特征确定所述疾病类型以及所述病情程度信息。
3.如权利要求2所述的信息的推荐方法,其特征在于,所述根据所述疾病向量特征确定所述疾病类型以及所述病情程度信息,包括:
计算所述疾病向量特征与多个预设疾病向量特征的相似度,所述预设疾病向量特征映射有相应的疾病类型及对应的疾病症状;
显示所述相似度超过预设阈值的所述预设疾病向量特征相应的疾病类型及对应的疾病症状,以供用户选择;
获取用户选择的所述疾病类型;
将所述疾病向量特征输入预设的病情程度分类模型,输出所述病情程度信息。
4.如权利要求1所述的信息的推荐方法,其特征在于,在所述根据所述医生信息、所述医生信息对应的第一评分信息和所述病情程度信息,确定目标评分信息前,所述方法还包括:
根据预设时间段内用户的历史挂号数量确定所述第一评分信息。
5.如权利要求4所述的信息的推荐方法,其特征在于,所述第一评分信息S通过如下公式计算得出:
Figure FDA0002810816790000021
其中,n为所述预设时间段内当前医生放出的预约号总数,Mi为当前医生在所述预设时间段内第i批次放出的预约号的数量,mi为第i批次预约号的截止时间前已被预约的预约号数量,ti第i批次预约号的可预约时间跨度,ki为医第i批预约号放出时间与获取用户输入的疾病描述信息的时间的差值,K为所述预设时间段的时间跨度。
6.如权利要求1所述的信息的推荐方法,其特征在于,所述根据所述医生信息、所述医生信息对应的第一评分信息和所述病情程度信息,确定目标评分信息,包括:
当所述病情程度信息表征出所述疾病描述信息对应重症时:
所述医生信息表征出的专家医生的目标评分信息U通过如下公式确定:
Figure FDA0002810816790000022
所述医生信息表征出的普通医生的目标评分信息U通过如下公式确定:
Figure FDA0002810816790000023
其中,j为专家级别,S为所述第一评分信息,z为看诊时间距离获取用户输入的疾病描述信息的时间的差值。
7.如权利要求1所述的信息的推荐方法,其特征在于,所述根据所述医生信息、所述医生信息对应的第一评分信息和所述病情程度信息,确定目标评分信息,包括:
当所述病情程度信息表征出所述疾病描述信息对应轻症时:
所述医生信息表征出的专家医生的目标评分信息U通过如下公式确定:
Figure FDA0002810816790000024
所述医生信息表征出的普通医生的目标评分信息U通过如下公式确定:
Figure FDA0002810816790000025
其中,j为专家级别,S为所述第一评分信息,z为看诊时间距离获取用户输入的疾病描述信息的时间的差值。
8.一种信息的推荐装置,其特征在于,包括:
获取模块,用于获取用户输入的疾病描述信息;
确定模块,用于根据所述疾病描述信息确定疾病类型和病情程度信息;
所述确定模块,还用于根据所述疾病类型确定医生信息;
所述确定模块,还用于根据所述医生信息、所述医生信息对应的第一评分信息和所述病情程度信息,确定目标评分信息;其中,所述第一评分信息表征医生的受欢迎程度,所述目标评分信息表征医生与所述疾病类型的匹配程度。
9.如权利要求8所述的信息的推荐装置,其特征在于,所述确定模块,包括:
输入单元,将所述疾病描述信息输入预设词向量化模型,得到所述疾病描述信息对应的疾病向量特征;
确定单元,根据所述疾病向量特征确定所述疾病类型以及所述病情程度信息。
10.如权利要求9所述的信息的推荐装置,其特征在于,所述确定单元,具体用于:
计算所述疾病向量特征与多个预设疾病向量特征的相似度,所述预设疾病向量特征映射有相应的疾病类型及对应的疾病症状;
显示所述相似度超过预设阈值的所述预设疾病向量特征相应的疾病类型及对应的疾病症状,以供用户选择;
获取用户选择的所述疾病类型;
将所述疾病向量特征输入预设的病情程度分类模型,输出所述病情程度信息。
11.一种信息的推荐设备,其特征在于,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如权利要求1至7中任一项所述的信息的推荐方法。
12.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有信息传递的实现程序,所述程序被处理器执行时实现如权利要求1至7中任一项所述的信息的推荐方法。
CN202011385179.9A 2020-12-01 2020-12-01 信息的推荐方法、装置、设备及存储介质 Pending CN114582472A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011385179.9A CN114582472A (zh) 2020-12-01 2020-12-01 信息的推荐方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011385179.9A CN114582472A (zh) 2020-12-01 2020-12-01 信息的推荐方法、装置、设备及存储介质

Publications (1)

Publication Number Publication Date
CN114582472A true CN114582472A (zh) 2022-06-03

Family

ID=81767490

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011385179.9A Pending CN114582472A (zh) 2020-12-01 2020-12-01 信息的推荐方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN114582472A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116913493A (zh) * 2023-07-24 2023-10-20 北京同仁堂互联网医院管理有限公司 一种医患的匹配方法、装置、设备及可读介质

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116913493A (zh) * 2023-07-24 2023-10-20 北京同仁堂互联网医院管理有限公司 一种医患的匹配方法、装置、设备及可读介质

Similar Documents

Publication Publication Date Title
KR102088980B1 (ko) 사용자 맞춤형 의료정보 제공 시스템 및 이의 구동방법
Choi et al. Machine learning-based prediction of Korean triage and acuity scale level in emergency department patients
Aggarwal et al. Automated COVID‐19 detection in chest X‐ray images using fine‐tuned deep learning architectures
US4667292A (en) Medical reimbursement computer system
Gligorijevic et al. Deep attention model for triage of emergency department patients
CN113051905A (zh) 训练医疗命名实体识别模型及医疗命名实体识别的方法
CN107833603A (zh) 电子病历文档分类方法、装置、电子设备及存储介质
CN111724136A (zh) 病案首页信息的录入方法、装置及计算机设备
CN112183026A (zh) Icd编码方法、装置、电子设备和存储介质
CN110688478B (zh) 一种答案排序方法、装置及存储介质
CN113901236A (zh) 基于人工智能的目标识别方法、装置、电子设备及介质
CN113223656A (zh) 一种基于深度学习的药物组合预测方法
Johnson et al. Encoding high-dimensional procedure codes for healthcare fraud detection
Falissard et al. Neural translation and automated recognition of ICD-10 medical entities from natural language: Model development and performance assessment
Elhence et al. Enabling cost-effective and secure minor medical teleconsultation using artificial intelligence and blockchain
CN108492886A (zh) 微创手术相似病案推荐方法、装置、设备及介质
CN114582472A (zh) 信息的推荐方法、装置、设备及存储介质
CN112435745B (zh) 就诊策略推荐方法、装置、电子设备及存储介质
Memarzadeh et al. A study into patient similarity through representation learning from medical records
CN111640517B (zh) 病历编码方法、装置、存储介质及电子设备
CN112802598A (zh) 基于语音诊疗数据的实时辅助诊疗方法及系统
Kumar et al. A fast unsupervised assignment of ICD codes with clinical notes through explanations
CN116564539A (zh) 基于信息抽取和实体归一的医学相似病例推荐方法和系统
CN113052199A (zh) 病情检测模型的训练方法、装置、设备及计算机存储介质
CN114596958B (zh) 基于级联分类的病理数据分类方法、装置、设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination