CN114664421A - 一种医患匹配方法、装置、电子设备、介质及产品 - Google Patents

一种医患匹配方法、装置、电子设备、介质及产品 Download PDF

Info

Publication number
CN114664421A
CN114664421A CN202210307399.2A CN202210307399A CN114664421A CN 114664421 A CN114664421 A CN 114664421A CN 202210307399 A CN202210307399 A CN 202210307399A CN 114664421 A CN114664421 A CN 114664421A
Authority
CN
China
Prior art keywords
doctor
information
sign
user
label
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210307399.2A
Other languages
English (en)
Inventor
欧阳宇
白亚楠
刘子航
王锴睿
封晔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN202210307399.2A priority Critical patent/CN114664421A/zh
Publication of CN114664421A publication Critical patent/CN114664421A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H40/00ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices
    • G16H40/20ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices for the management or administration of healthcare resources or facilities, e.g. managing hospital staff or surgery rooms
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/242Query formulation
    • G06F16/243Natural language query formulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2452Query translation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9532Query formulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Artificial Intelligence (AREA)
  • Public Health (AREA)
  • Business, Economics & Management (AREA)
  • General Business, Economics & Management (AREA)
  • Epidemiology (AREA)
  • Primary Health Care (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biophysics (AREA)
  • Evolutionary Computation (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Pathology (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本公开提供了一种医患匹配方法、装置、电子设备、介质及产品,涉及数据处理技术领域,尤其涉及大健康、医疗健康和数字医疗技术领域。具体实现方案为:对用户输入的查询语句进行解析,得到用户对应的医疗实体信息、科室预测标签和体征异常预测标签。然后将用户对应的医疗实体信息、科室预测标签和体征异常预测标签与医生集合中各医生的医疗实体信息、科室信息和擅长治疗信息进行匹配,得到与用户匹配的多个备选医生。之后计算查询语句与每个备选医生的擅长治疗信息的相关性,基于计算得到的相关性为用户推荐医生。从而提高医患匹配的准确性。

Description

一种医患匹配方法、装置、电子设备、介质及产品
技术领域
本公开涉及数据处理技术领域,尤其涉及大健康、医疗健康和数字医疗技术领域。
背景技术
目前,患者在线问诊或者挂号时,患者输入问诊需求后,在线问诊或挂号平台可以为患者推荐医生。
发明内容
本公开提供了一种医患匹配方法、装置、电子设备、介质及产品。
本公开实施例的第一方面,提供了一种医患匹配方法,包括:
对用户输入的查询语句进行解析,得到所述用户对应的医疗实体信息、科室预测标签和体征异常预测标签;
将所述用户对应的医疗实体信息、科室预测标签和体征异常预测标签与医生集合中各医生的医疗实体信息、科室信息和擅长治疗信息进行匹配,得到与所述用户匹配的多个备选医生;
计算所述查询语句与每个备选医生的擅长治疗信息的相关性,基于计算得到的相关性为所述用户推荐医生。
本公开实施例的第二方面,提供了一种医患匹配装置,包括:
解析模块,用于对用户输入的查询语句进行解析,得到所述用户对应的医疗实体信息、科室预测标签和体征异常预测标签;
匹配模块,用于将所述解析模块解析的所述用户对应的医疗实体信息、科室预测标签和体征异常预测标签与医生集合中各医生的医疗实体信息、科室信息和擅长治疗信息进行匹配,得到与所述用户匹配的多个备选医生;
推荐模块,用于计算所述查询语句与每个备选医生的擅长治疗信息的相关性,基于计算得到的相关性为所述用户推荐医生。
本公开实施例的第三方面,提供了一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行第一方面中任一项所述的方法。
本公开实施例的第四方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行第一方面中任一项所述的方法。
本公开实施例的第五方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现第一方面中任一项所述的方法。
应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
附图用于更好地理解本方案,不构成对本公开的限定。其中:
图1是本公开实施例提供的一种医患匹配方法的流程示意图;
图2是本公开实施例提供的一种解析查询语句的方法的流程示意图;
图3是本公开实施例提供的一种挖掘医生数据的方法的流程示意图;
图4是本公开实施例提供的另一种医患匹配方法的流程示意图;
图5是本公开实施例提供的一种医患匹配装置的结构示意图;
图6是用来实现本公开实施例的医患匹配方法的电子设备的框图。
具体实施方式
以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
由于大众对异常体征的认知不足以及就医习惯固化等限制,使得目前对医疗资源的利用不够合理,患者往往不知道需要找什么医生,同时医生也难以服务到真正有对口需求的患者。
在用户有就医需求时,如果可以为用户推荐与其需求匹配的医生,则能方便用户快速挂号,也提高了治愈的可能。
已有的医患匹配方式是:通过匹配用户的就医需求和医院科室,得到与用户的就医需求匹配的科室,从而将该科室的医生推荐给用户。或者,根据用户的就医需求确定用户可能存在的异常体征,然后将擅长治疗这种异常体征的医生推荐给用户。
但是,不同医院的科室设置存在一定的区别,相同科室的医生可治疗的异常体征存在差异,可能存在用户匹配的科室内的医生不能治疗该用户异常体征的情况。并且,用户对于就医需求的描述不够专业,比如多种异常体征均存在用户描述的一种症状,导致难以为用户精准地匹配科室或医生。例如,肚子痛这一症状,可能匹配到消化内科、妇科或者普通外科。
目前的医患匹配方法难以准确地向用户推荐对口的医生。
为了提高医患匹配方法的准确性,本公开实施例提供了一种医患匹配方法,该方法可以应用于电子设备,例如,电子设备可以是服务器或者台式计算机等具备数据处理能力的设备。如图1所示,该方法包括如下步骤:
S101、对用户输入的查询语句进行解析,得到用户对应的医疗实体信息、科室预测标签和体征异常预测标签。
其中,查询(query)语句指用户需要被推荐医生时,输入的需要查询的内容。查询语句包括医生需要具备的条件和/或用户对异常体征的描述。例如,查询语句可以包括:异常体征关键词、科室关键词、医生名关键词、地点关键词和医院关键词中的任意一项或多项。相应的,从查询语句中解析出的实体信息可以包括:异常体征、科室、医生名、医院名、城市和医院类型中的任意一项或多项。其中,异常体征可以指疾病以及症状,例如咳嗽、打喷嚏和流鼻涕等。
特别地,本公开实施例还适用于在线问诊场景,在线问诊场景指的是用户利用终端线上寻找医生,以便线上与医生交流的场景。本公开实施例中,在线问诊场景下,用户打开终端中安装的用于在线问诊的应用程序(application,APP),在该APP的问诊界面内输入查询语句,此时这些查询语句可以称为主诉信息。本公开实施例还可以应用在其他场景,例如为用户推荐医生,以便用户线下就医的场景。本公开实施例对此不作具体限定。
科室预测标签,表示预测得到的能够满足用户需求的科室。
体征异常预测标签,表示预测得到的查询语句所针对的异常体征。
S102、将用户对应的医疗实体信息、科室预测标签和体征异常预测标签与医生集合中各医生的医疗实体信息、科室信息和擅长治疗信息进行匹配,得到与用户匹配的多个备选医生。
其中,医生的医疗实体信息包括:异常体征、医生名、医院名、城市和医院类型中的任意一项或多项。
科室信息表示医生所在的医院科室。
擅长治疗信息表示医生擅长治疗的异常体征。
一种实现方式中,可以将用户对应的医疗实体信息与各医生的医疗实体信息进行匹配、将用户对应的科室预测标签与各医生的科室信息进行匹配、以及将用户对应的体征异常预测标签与各医生的擅长治疗信息进行匹配,将与用户对应的医疗实体信息、科室预测标签和体征异常预测标签均匹配的医生,作为备选医生。
S103、计算查询语句与每个备选医生的擅长治疗信息的相关性,基于计算得到的相关性为用户推荐医生。
一种实现方式中,可以按照相关性从高到低的顺序,为每个备选医生进行排序,并按照排序结果为用户推荐医生。
可选的,可以针对每个备选医生,将查询语句与该医生的擅长治疗信息输入相关性分档模型,得到相关性分档模型输出的相关性分档。其中,相关性分档共存在4档,例如,相关性分档包括1档、2档、3档和4档,分档越高表示查询语句与医生的相关性越高。相关性分档模型每次针对输入的查询语句与医生的擅长治疗信息,输出其中一个分档。
训练相关性分档模型的方式为:收集历史上在线问诊中的查询语句,以及回答查询语句的医生的擅长治疗信息,将查询语句与医生的擅长治疗信息对应,作为一个样本,并对该样本标注分档。利用各样本和样本的标注,用知识集成增强表达能力(EnhancedRepresentation through Knowledge Integration,ERNIE)-微调(fine-tune)的方式,训练得到相关性分档模型。
本公开实施例不仅仅基于科室或者异常体征进行匹配,而是结合用户的医疗实体信息、科室预测标签和体征异常预测标签,以及医生的医疗实体信息、科室信息和擅长治疗信息,匹配用户和医生。与仅依据科室或异常体征匹配的方式相比,本公开实施例增加了匹配维度,使得匹配得到的医生所在科室以及能够治疗的异常体征均与用户匹配,从而解决了仅根据科室或异常体征匹配医生不准确的问题,提高了匹配的准确度。而且,本公开实施例还根据用户的查询语句与每个备选医生的擅长治疗信息的相关性,为用户推荐医生,从而向用户推荐与其需求相关性更高的医生,进一步提高了向用户推荐的医生的准确性。
由于用户输入的查询语句比较简单或不够专业,因此需要对用户的查询语句进行深度的解析和挖掘,从而充分理解用户的需求,方便后续向用户推荐更符合用户需求的医生。
在本公开的一个实施例中,如图2所示,上述S101解析查询语句的方式,可以包括如下步骤:
S201、对查询语句进行解析,得到查询语句中包括的医疗实体信息。
一种实现方式中,可以将查询语句与实体词典进行匹配,得到查询语句包括的存在于实体词典中的第一实体信息。将查询语句输入预先训练的实体识别模型,获取实体识别模型输出的第二实体信息。将第二实体信息中除第一实体信息之外的实体信息和第一实体信息,作为医疗实体信息。
第一实体信息和第二实体信息存在交集,由于第一实体信息和第二实体信息中包括重复的实体信息,因此需要对重复的实体信息进行去重。例如,第一实体信息包括咳嗽、AA医生和XX医院。第二实体信息包括咳嗽、流鼻涕和呼吸内科。对咳嗽进行去重,并将咳嗽、AA医生、XX医院、流鼻涕和呼吸内科作为查询语句中包括的医疗实体信息。
其中,可以对查询语句进行实体识别,得到查询语句包括的各实体,然后确定查询语句包括的每个实体是否存在于实体词典中,得到存在于实体词典中的第一实体信息。实体词典可以是预先设置的与医疗有关的实体集合。实体词典包括但不限于:异常体征、科室、医院名、医生名、城市、医院类型等实体。
可选的,实体识别模型可以是通过ERNIE-fine-tune的方式训练得到的模型。
通过将查询语句与实体词典匹配得到第一实体信息,能够保证从查询语句中提取实体信息的准确性。而通过实体识别模型识别查询语句中的第二实体信息,具备一定的泛化能力,即能够得到更多的医疗实体信息。因此本公开实施例结合实体词典的匹配和实体识别模型的识别,既提高了确定的实体信息的准确性,又提高了泛化能力。
可选的,也可以仅通过实体词典的匹配的方式,得到第一实体信息,并将第一实体信息作为查询语句中包括的医疗实体信息。或者,仅通过实体识别模型的识别,得到第二实体信息,并将第二实体信息作为查询语句中包括的医疗实体信息。
S202、基于查询语句为用户推荐体征异常标签,将用户选择的体征异常标签作为体征异常澄清标签。
由于用户对异常体征不够了解,因此对异常体征的描述可能不够准确、不够专业,即查询语句中不一定包含准确的异常体征的描述。本公开实施例可以向用户推荐体征异常标签,以进一步引导用户明确自身的需求,从而收集到更准确的用户需求,进而更准确地为用户推荐医生。
一种实现方式中,可以向用户推荐与查询语句相关的体征异常标签,并接收用户选择的体征异常标签,作为体征异常澄清标签。
S203、基于医疗实体信息和体征异常澄清标签,确定用户的体征异常预测标签。
一种实现方式中,可以将医疗实体信息和体征异常澄清标签输入预先训练的体征异常预测模型,得到体征异常预测模型输出的体征异常预测标签。其中,体征异常预测模型输出的是多个体征异常标签的概率,可以将概率大于预设概率的体征异常标签,作为体征异常预测标签。
可选的,训练体征异常预测模型的方式,可以实现为:收集历史上各医生的科普内容以及医生回答过的问诊咨询数据,将每条科普内容作为一个查询语句,并将科普内容针对的异常体征作为该查询语句的训练标签。将医生诊断过的用户问诊咨询数据作为一个查询语句,并将医生回答的异常体征作为该查询语句的训练标签。利用查询语句和训练标签,训练神经网络模型,从而得到体征异常预测模型。
在一些情况下,用户输入的查询语句中包含的异常体征可能不明确,而体征异常澄清标签是用户选择的明确的异常体征,因此利用体征异常澄清标签辅助医疗实体信息,有利于体征异常预测模型更准确地确定用户的体征异常预测标签。
S204、将查询语句输入科室分类模型,基于科室分类模型的输出结果确定科室预测标签。
一种实现方式中,可以将查询语句输入科室分类模型,得到科室分类模型输出的各科室的概率,将概率大于阈值的科室,作为科室预测标签。
可选的,训练科室分类模型的方式,可以实现为:从历史就诊记录中提取查询语句,为每个查询语句标记科室标签。利用查询语句和科室标签训练神经网络模型,得到科室分类模型。
本公开实施例中,对用户的查询语句进行精细化理解,得到与查询语句相关的体征异常标签,并引导用户从这些体征异常标签中选择体征异常澄清标签,以进一步明确用户需求。并通过科室分类模型扩大对与查询语句相关的科室的覆盖,有利于提高对与用户匹配的医生的召回。而且基于用户的体征异常澄清标签和查询语句通过体征异常预测模型预测用户针对的异常体征,即通过收集到的更明确的用户搜索需求,强化并提高预测异常体征的准确度。可见,本公开实施例可以深度挖掘用户需求,使得后续能够提高为用户推荐医生的准确性。
在本公开的一个实施例中,上述S202确定体征异常澄清标签的方式,可以包括以下步骤:
步骤一、将查询语句输入预先训练的相关性模型,获取相关性模型输出的与查询语句相关的多个体征异常标签列表。
一种实现方式中,可以将查询语句转换为语义向量,并利用相关性模型计算该语义向量与人工神经网络(Artificial Neural Network,ANN)索引库中存储的体征异常标签列表(list)集合中的各体征异常标签list的语义向量的相关性,得到与查询语句相关性大于阈值的体征异常标签list。其中,每个体征异常标签list包括多个体征异常标签,每个体征异常标签可以表示异常体征、年龄或性别等。
可选的,训练相关性模型的方式包括:提取历史上每个用户在线问诊对话涉及的异常体征以及该用户的用户画像信息,得到多个体征异常标签,将这些体征异常标签作为一个体征异常标签list,得到离线挖掘的多个体征异常标签list,组成体征异常标签list集合。将从在线问诊对话中提取的每个体征异常标签list与在线问诊对话中用户的查询语句对应,作为一个正样本。并将查询语句与随机选择的一个体征异常标签list对应,作为一个负样本。利用这些正负样本训练神经网络,得到相关性模型。
步骤二、计算体征异常标签列表中每个体征异常标签在多个体征异常标签列表中出现的频次。
通过步骤一获得的与查询语句相关的体征异常标签list存在多个,且体征异常标签list之间可能存在重复的体征异常标签,因此可以统计多个体征异常标签list中每个体征异常标签出现的频次。
步骤三、按照出现频次从高到低的顺序,向用户显示体征异常标签。
由于与查询语句相关的体征异常标签list中,体征异常标签的出现频次越高,表示该体征异常标签与查询语句的相关性越高,因此可以按照出现频次从高到低的顺序,向用户显示各体征异常标签列表中每个体征异常标签。
例如,在用户输入查询语句后,可以向用户展示弹窗,弹窗中显示与查询语句相关的体征异常标签list中的每个体征异常标签,且各体征异常标签按照出现频次从高到低的顺序排序。
可选的,若存在多个体征异常标签的出现频次相同,则这多个体征异常标签之间的顺序可以随机设置或者按照其他方式设置,本公开实施例对此不作具体限定。
在本公开实施例中,由于与查询语句相关的体征异常标签list中可能包含相同的体征异常标签,为了不向用户展示重复的体征异常标签,在统计各体征异常标签的出现频次后,可以对体征异常标签进行去重。
例如,与查询语句相关性大于阈值的体征异常标签list包括:标签list1(咳嗽&打喷嚏&头痛&鼻塞)和标签list2(咳嗽&发热&流涕)。其中,咳嗽出现频次为2、打喷嚏、头痛、鼻塞、发热和流涕的出现频次均为1。因此对这些体征异常标签进行去重,即删除一个咳嗽,并按照出现频次排序,得到:咳嗽、打喷嚏、头痛、鼻塞、发热、流涕。
步骤四、获取用户从显示的体征异常标签中选择的体征异常标签,作为体征异常澄清标签。
一种实现方式中,可以接收用户从显示的各体征异常标签中选定的体征异常标签,并在检测到用户点击确认或点击提交后,将用户选择的所有体征异常标签,作为体征异常澄清标签。
由于各用户对异常体征的了解水平参差不齐,可能存在查询语句中对用户需求的描述不详尽或者不够准确的情况,因此本公开实施例向用户推荐与查询语句相关的体征异常标签,以引导用户提供更明确的需求,方便后续根据更准确的用户需求,进行医生推荐。
由于图1所示的方式进行医生推荐时,需要用到各医生的医疗实体信息、科室信息和擅长治疗信息,因此在利用图1的方式进行医生推荐之前,如图3所示,本公开实施例还需要预先挖掘各医生的医疗实体信息、科室信息和擅长治疗信息,包括以下步骤:
S301、从多个数据源中获取医生数据。
一种实现方式中,可以获取全网公开的各医生的信息。例如,可以从医院官网获取医生信息、利用搜索引擎索引公开的医生信息以及从服务型医疗健康站点中获取公开的医生信息等。
例如,从多个数据源中获取医生的简介、历史在线问诊记录、科普内容、挂号就医评价与其对应的异常体征等。
S302、对从多个数据源中获取到的医生数据进行融合和去重,得到一个医生集合,以及医生集合中每个医生对应的医生数据。
由于本公开实施例从多个数据源获取医生数据,使得获取到的多条数据可能属于同一个医生,因此需要对获取到的医生数据进行融合。即,对于收集到的各医生数据,采集名字分桶的方式,将医生姓名相同的医生数据分为一组。之后,对于一组医生数据,基于医院别名和同义词,确定相同医院的医生数据;基于科室同义词,确定相同科室的医生数据。其中,医院别名和同义词、以及科室同义词可以是预先设置的。并通过图像识别的方式计算医生头像的相似度;计算医生擅长治疗的异常体征之间的相似度。将相同医院、相同科室、头像相似度高于阈值且擅长治疗的异常体征相似度高于阈值的医生,确定为同一个医生,并对该医生的医生数据进行融合并去重。
S303、分别对每个医生的医生数据进行解析,得到每个医生的医疗实体信息、科室信息和擅长治疗信息。
一种实现方式中,可以分别对每个医生对应的医生数据进行实体识别,得到每个医生对应的医疗实体信息、科室信息以及每个医生的候选擅长信息。然后针对每个医生,基于词袋(Bag-of-words,BOW)模型生成该医生的每个候选擅长信息的向量,并基于BOW模型生成该医生的每个提报擅长信息的向量。再计算该医生的每个候选擅长信息的向量与每个提报擅长信息的向量两两之间的相似度。将各提报擅长信息和相似度高于预设阈值的候选擅长信息作为擅长治疗信息。
其中,提报擅长信息为医生提报的自身擅长治疗的异常体征,候选擅长信息为挖掘出的医生可能擅长治疗的异常体征。例如可以将从医生数据中进行实体识别得到的每个表示异常体征的实体,作为该医生的一个擅长候选信息。
可选的,由于同一种异常体征可能存在不同的描述,因此可以对医生的擅长治疗信息进行归一,即,将表示同一种异常体征的多个实体转换为一个表示该异常体征的实体。例如,将发热和发烧归一为发烧。
由于从各渠道收集的医生数据中可能存在多种异常体征的描述,但这些异常体征不一定都是医生擅长治疗的,因此本公开实施例需要对医生的候选擅长信息进行清洗,筛选出置信度较高的候选擅长信息,从而提高挖掘出的医生的擅长治疗信息的准确度。而且由于本公开实施例在医生的提报擅长信息的基础上,将筛选出的候选擅长信息也作为医生的擅长治疗信息,从而实现了对医生的擅长治疗信息的泛化,进一步扩大了医生的擅长治疗信息的覆盖,从而充分挖掘出医生的擅长治疗信息,有利于后续在进行医生推荐时,为用户匹配到更多的医生。
具体的,候选擅长信息的向量是BOW模型识别的中间结果,而不是BOW模型最终的输出结果。
其中,BOW模型的训练方式包括:针对每个医生,将该医生的每个提报擅长信息两两分组,并将每组提报擅长信息作为一个正样本,从其他科室的医生的提报擅长信息中抽取提报擅长信息,将抽取的每两个提报擅长信息作为一个负样本。利用这些正负样本训练BOW模型,得到训练好的BOW模型。
由于本公开实施例从多个数据源充分获取医生数据,并对医生数据进行融合和去重,使得得到的每个医生的医生数据覆盖范围更广,覆盖的维度更多,使得挖掘得到的每个医生的医疗实体信息、科室信息和擅长治疗信息更准确且更丰富。
此外,如果将用户的查询语句与各种异常体征进行匹配,得到与查询语句匹配的异常体征,并将擅长治疗这种异常体征的医生推荐给用户,由于用户的表达不够专业,使得用户的查询语句与专业的异常体征的描述有一定的出入。而且,仅能够找到主动提报擅长治疗这种异常体征的医生,然而医生一般没有全部提报自己擅长治疗的所有异常体征,使得能够找到的擅长治疗这种异常体征的医生较少,存在召回不足的情况。而本公开实施例中,通过从收集到的医生的信息中,挖掘医生的候选擅长信息,即可能擅长治疗的异常体征,从而充分获得医生擅长治疗的异常体征。使得后续进行医生推荐时,能够基于充分挖掘出的医生擅长治疗的异常体征,匹配到更多的医生。
在本公开的一个实施例中,上述S102确定备选医生的方式,可以实现为:从结构化存储的各医生的医疗实体信息、科室信息和擅长治疗信息中,查找与用户对应的医疗实体信息、科室预测标签和体征异常预测标签匹配的多个备选医生。
一种实现方式中,可以预先针对每个医生,将该医生的医疗实体信息、科室信息和擅长治疗信息进行结构化索引,得到医生结构化索引。之后,对查询语句进行结构化索引,得到患者结构化索引,然后将患者结构化索引与医生结构化索引进行匹配,得到多个备选医生。
可选的,由于对相同信息可能存在不同的表达,因此在进行结构化索引之前,还可以对科室和异常体征等数据进行归一,从而将表示相同信息的数据统一为一种描述。例如,将呼吸内科、呼吸科和发热门诊,归一为呼吸内科。
对医疗实体信息、科室预测标签和体征异常预测标签进行结构化索引,并匹配医生的结构化索引,能够提高匹配的准确度。而且基于索引检索能够提升检索备选医生的速度,从而提高确定备选医生的效率。
由于通过结构化索引的方式确定备选医生能够有效提高确定备选医生的准确性,但是存在泛化能力不足的问题。因此在上述通过结构化索引的方式确定备选医生之后,还可以执行:将查询语句转化为查询语句特征向量,然后从预设的ANN索引库中搜索与查询语句特征向量匹配的医生,加入与用户匹配的备选医生。其中,预设的ANN索引库中包括每个医生的擅长治疗信息的特征向量。
一种实现方式中,可以将查询语句转化为查询语句特征向量,利用相关性模型确定查询语句特征向量与ANN索引库中每个医生的擅长治疗信息的特征向量进行之间的相似度,得到与查询语句特征向量之间的相似度大于预设相似度的医生的擅长治疗信息的特征向量,将得到的擅长治疗信息的特征向量对应的医生加入备选医生。
可选的,训练相关性模型的方式为:将各医生擅长治疗信息的特征向量组成ANN索引库。收集历史上各医生公开的科普内容的标题(title)以及回答过的查询语句。针对每个医生,将该医生的科普内容title与该医生擅长治疗信息的特征向量对应,作为一个正样本;将该医生回答过的查询语句与该医生擅长治疗信息的特征向量对应,作为一个正样本;将该医生擅长治疗信息的特征向量与随机选择的其他title或查询语句对应,作为一个负样本。利用这些正负样本训练神经网络模型,从而得到相关性模型。
本公开实施例通过向量化索引的方式增加备选医生,能够减少结构化索引的方式确定备选医生存在的泛化不足的问题,从而匹配出更多的备选医生,扩大了与查询语句匹配的医生的覆盖,减少对备选医生的遗漏情况。
另外,可能存在用户由于不能准确地判断异常体征,而通过描述症状表达搜索需求的情况。然而不同的异常体征可能存在相同的症状,因此用户搜索需求可能与多个异常体征相关,从而匹配到多个科室,但这多个科室的医生不一定都能满足该用户的就医需求。另外,即使只匹配到一个科室,但同一科室的各医生存在差异,不一定都能满足该用户的就医需求,难以做到精准的医生匹配。而本公开实施例通过医疗实体信息、科室预测标签和体征异常预测标签,匹配用户和每个医生的信息,实现了多角度精细化匹配医生,提高了为用户推荐医生的准确性。
在本公开的一个实施例中,上述S103为用户推荐医生的方式包括以下步骤:
步骤1、获取每个备选医生的权威度和排序特征。
其中,权威度表示医生的诊疗权威能力。一种实施方式中,可以针对每个备选医生,根据预先设置的各数据的级别与分数的对应关系,确定该医生的医生数据包括的每项数据的级别对应的分数,然后将各分数的总和,作为该医生的权威度。
例如,医生数据的级别包括以下信息中的任意一项或多项:医院级别(三甲、三级、二甲和二级等)、医生的职称等级(医师、主治医师、副主任医师和主任医师等)、医院的复旦榜排名、科室的复旦榜排名、科室的重点等级(国家重点、省重点和市重点等)、医院所处行政区的等级(一线城市、省会城市和县级城市等)、学历等级(本科、硕士和博士等)、获得奖项等级(国家级、省级和市级等)、发表的论文等级(特种刊物论文、权威核心刊物论文、重要核心刊物论文和一般核心刊物论文等)、执业年限等级(五年、十年和二十年等)。同一项数据的各级别对应的分数不同,级别越高对应的分数越高。
本公开实施例中,排序特征用于表征医生的历史接诊能力和/或医生与用户的距离。
一种实现方式中,可以针对每个备选医生,收集医生公开的异常体征科普内容质量、科普内容分发量、线上服务质量、好评率、投诉率、线上挂号和就医评价、接诊时间、用户评价锦旗量、搜索热度和/或医生所在医院与用户之间的距离,作为该医生的综合特征。
结合医生的综合特征为匹配得到的医生进行排序,从多方面对医生的排序进行考量,使得获得的排序结果更合理。
可选的,备选医生的权威度和排序特征可以预先确定,或者,也可以在进行医生推荐的过程中实时计算。
步骤2、将每个备选医生的权威度和排序特征以及计算得到的相关性输入预先训练的排序模型,得到排序模型输出的各备选医生的排序分数。
医生的权威度越高,表示专业能力越强,满足用户需求的可能性越高。排序特征表示了医生的综合能力。查询语句与备选医生的擅长治疗信息的相关性,表示了医生与查询语句针对的异常体征对口的可能性。因此通过权威度、排序特征以及相关性确定备选医生的排序分数,综合了多方面因素,使得确定的排序分数更合理。
可选的,排序模型的训练方式包括:针对每个医生,获取历史在线问诊时的用户的查询语句,然后计算查询语句与该医生的相关性。将该医生的权威度、排序特征和与该相关性作为一个样本,并标记排序分数。针对每个医生,获取其他医生历史在线问诊时的用户的查询语句,然后计算查询语句与该医生的相关性。将该医生的权威度、排序特征和与该相关性作为一个样本,并标记排序分数。利用这些样本训练神经网络模型,得到排序模型。
步骤3、基于各备选医生的排序分数为用户推荐医生。
一种实现方式中,按照各备选医生的排序分数从高到低的顺序,显示给备选医生的信息,供用户选择。
本公开实施例结合医生的权威度、排序特征以及查询语句和医生的擅长治疗信息的相关性,确定备选医生的排序分数,实现了从多角度为用户确定更符合查询语句的医生,提高了为用户推荐医生的准确度。
在本公开的一个实施例中,在上述基于各备选医生的排序分数为用户推荐医生之后,本公开实施例还允许用户根据自身的诉求,调整备选医生的显示顺序,包括:接收用户选择的筛选诉求优先级,基于筛选诉求优先级和各备选医生的排序分数,显示为用户推荐的各备选医生。
其中,筛选诉求优先级包括:权威度优先、线上诊疗服务能力优先、可问诊挂号优先、线上服务评价优先、科普知识普及情况优先、线下寻医热度优先和线下就医评价优先中的任意一项或多项。
一种实现方式中,可以对各备选医生按照筛选诉求优先级排序,并在筛选诉求优先级相同时,按照排序分数排序。之后按照排序结果显示各备选医生以及备选医生的推荐信息。
例如,用户选择权威度优先时,按照权威度从高到低的顺序,为各备选医生进行排序,对于权威度相同的医生,按照排序分数从高到低的顺序排序。
本公开实施例中,可以充分地允许用户按照自身的诉求,调整备选医生的排序,让用户更有决策权的感知,方便用户更快速地确定满足自身需求的医生。
本公开实施例中,在为用户推荐各备选医生时,可以显示每个备选医生的推荐信息,各备选医生的推荐信息中显示有各备选医生的权威度标签、在线服务信息、在线科普信息和寻医热度中的至少一项。
其中,权威度标签可以为:医生所在医院科室在全国复旦榜的综合排名、专科排名,是否是国家省市级重点专科、医生领域奖项、医生职称、教育职称、学术情况或执业年限等。
在线服务信息可以为:接诊量、好评率、接诊率、接诊速度、好评标签、不同科室维度下的排名、是否可通过指定医疗平台进行问诊挂号或号源情况等。
在线科普信息可以为:科普量、科普内容的阅读量、直播量或在不同科室下的排名等。
寻医热度可以为:在指定医疗平台的被搜索热度、在各平台的评价量、好评量,在指定医疗平台收到的定向赠送的锦旗数或在不同科室下的医生排名等。
通过对各方面的推荐信息的展示,能够让用户更直观地得到推荐对医生的推荐理由,更方便用户进行决策,进一步加强用户的决策信任感。
在本公开的一个实施例中,在为用户提供推荐理由的同时,本公开实施例还聚合了医生的相关数据来佐证推荐理由,并辅助用户强化决策。例如,通过聚合备选医生的简介信息中的擅长信息,佐证备选医生的权威度和诊疗能力。通过聚合备选医生的服务信息和授权后得到的历史在线问诊信息,佐证备选医生的在线服务能力。通过聚合历史上用户对备选医生的评价信息,佐证备选医生的受认可度,从而通过用户视角说明备选医生的诊疗和服务能力。通过聚合备选医生在全网公开的科普内容和直播等科普信息,实现通过备选医生在医疗领域的知识深度,佐证备选医生在医疗领域的专业程度。
推荐理由相关的佐证信息可以在检测到用户点击推荐理由时展示,或者可以在检测到光标移动到推荐理由附近时展示,或者还可以以其他形式展示,本公开实施例对此不作具体限定。
通过聚合全方位的佐证信息,并向用户展示,能够让用户对备选医生进行全方位的认识和理解,加强了用户对推荐理由的信任感,加强用户的就医决策。
从上述本公开实施例提供的医患匹配方法可以看出,本公开实施例提供了一个全面的医生推荐系统,能够深度挖掘用户的查询语句,挖掘医生的擅长与权威,从多角度匹配用户和医生,为用户推荐医生以及推荐理由。实现了从查询语句的获取、决策推荐医生到辅助用户决策的全方面流程,满足用户线上、线下的问诊需求。
结合图4,以下对本公开实施例提供的医患匹配方法的整体流程进行说明:
为了实现本公开实施例提供的医患匹配方法,首先需要进行医生理解,包括:从多个数据源中获取医生数据,然后对这些医生数据进行融合和去重,得到一个医生集合,以及医生集合中每个医生对应的医生数据。然后分别对每个医生的医生数据进行挖掘和理解,得到每个医生的医疗实体信息、科室信息和擅长治疗信息并存储。
在基础上,当接收到用户输入的查询语句时进行用户需求理解,包括:对查询语句进行解析,得到用户对应的医疗实体信息、科室预测标签和体征异常预测标签。
然后,召回系统通过结构化索引的方式,查找与用户对应的医疗实体信息、科室预测标签和体征异常预测标签匹配的多个备选医生。然后通过向量化索引的方式,从预设的ANN索引库中搜索与查询语句特征向量匹配的医生,加入与用户匹配的备选医生。之后计算查询语句与每个备选医生的擅长治疗信息的相关性,并向排序系统发送计算的相关性。
排序系统接收召回系统发送的相关性,并获取每个备选医生的权威度和排序特征。其中排序特征包括:异常体征科普内容质量、线上服务质量、好评率、医生所在医院与用户之间的距离和寻医热度等。将每个备选医生的权威度和排序特征以及计算的相关性输入排序模型,得到各备选医生的排序分数。之后向决策系统发送备选医生的排序分数。
决策系统接收排序系统发送的排序分数,并基于各备选医生的排序分数为用户推荐医生。同时允许用户从多个诉求优先级中选择筛选诉求优先级,基于筛选诉求优先级和各备选医生的排序分数,显示为用户推荐的各备选医生、各备选医生的推荐理由以及推荐理由的佐证。
基于相同的发明构思,对应用于上述方法实施例,本公开实施例提供了一种医患匹配装置,如图5所示,该装置包括:解析模块501、匹配模块502和推荐模块503;
解析模块501,用于对用户输入的查询语句进行解析,得到用户对应的医疗实体信息、科室预测标签和体征异常预测标签;
匹配模块502,用于将解析模块501解析的用户对应的医疗实体信息、科室预测标签和体征异常预测标签与医生集合中各医生的医疗实体信息、科室信息和擅长治疗信息进行匹配,得到与用户匹配的多个备选医生;
推荐模块503,用于计算查询语句与匹配模块502得到的每个备选医生的擅长治疗信息的相关性,基于计算得到的相关性为用户推荐医生。
在本公开的一个实施例中,其中,解析模块501,具体用于:
对查询语句进行解析,得到查询语句中包括的医疗实体信息;
基于查询语句为用户推荐体征异常标签,将用户选择的体征异常标签作为体征异常澄清标签;
基于医疗实体信息和体征异常澄清标签,确定用户的体征异常预测标签;
将查询语句输入科室分类模型,基于科室分类模型的输出结果确定科室预测标签。
在本公开的一个实施例中,其中,解析模块501,具体用于:
将查询语句与实体词典进行匹配,得到查询语句包括的存在于实体词典中的第一实体信息;
将查询语句输入预先训练的实体识别模型,获取实体识别模型输出的第二实体信息;
将第二实体信息中除第一实体信息之外的实体信息和第一实体信息,作为医疗实体信息。
在本公开的一个实施例中,其中,解析模块501,具体用于:
将查询语句输入预先训练的相关性模型,获取相关性模型输出的与查询语句相关的多个体征异常标签列表;
计算体征异常标签列表中每个体征异常标签在多个体征异常标签列表中出现的频次;
按照出现频次从高到低的顺序,向用户显示体征异常标签;
获取用户从显示的体征异常标签中选择的体征异常标签,作为体征异常澄清标签。
在本公开的一个实施例中,其中,解析模块501,具体用于:
将医疗实体信息和体征异常澄清标签输入预先训练的体征异常预测模型,得到体征异常预测模型输出的体征异常预测标签。
在本公开的一个实施例中,装置还包括:获取模块和融合模块;
获取模块,用于在对用户输入的查询语句进行解析之前,从多个数据源中获取医生数据;
融合模块,用于对获取模块从多个数据源中获取到的医生数据进行融合和去重,得到一个医生集合,以及医生集合中每个医生对应的医生数据;
解析模块501,还用于分别对融合模块得到的每个医生的医生数据进行解析,得到每个医生的医疗实体信息、科室信息和擅长治疗信息。
在本公开的一个实施例中,其中,解析模块501,具体用于:
分别对每个医生对应的医生数据进行实体识别,得到每个医生对应的医疗实体信息、科室信息以及每个医生的候选擅长信息;
针对每个医生,基于BOW模型生成该医生的每个候选擅长信息的向量,并基于BOW模型生成该医生的每个提报擅长信息的向量;
计算该医生的每个候选擅长信息的向量与每个提报擅长信息的向量两两之间的相似度;
将各提报擅长信息和相似度高于预设阈值的候选擅长信息作为擅长治疗信息。
在本公开的一个实施例中,其中,匹配模块502,具体用于:
从结构化存储的各医生的医疗实体信息、科室信息和擅长治疗信息中,查找与用户对应的医疗实体信息、科室预测标签和体征异常预测标签匹配的多个备选医生。
在本公开的一个实施例中,装置还包括:转化模块和加入模块;
转化模块,用于在从结构化存储的各医生的医疗实体信息、科室信息和擅长治疗信息中,查找与用户对应的医疗实体信息、科室预测标签和体征异常预测标签匹配的多个备选医生之后,将查询语句转化为查询语句特征向量;
加入模块,用于从预设的ANN索引库中搜索与查询语句特征向量匹配的医生,加入与用户匹配的备选医生;其中,预设的ANN索引库中包括每个医生的擅长治疗信息的特征向量。
在本公开的一个实施例中,其中,推荐模块503,具体用于:
获取每个备选医生的权威度和排序特征,排序特征用于表征医生的历史接诊能力和/或医生与用户的距离;
将每个备选医生的权威度和排序特征以及计算得到的相关性输入预先训练的排序模型,得到排序模型输出的各备选医生的排序分数;
基于各备选医生的排序分数为用户推荐医生。
在本公开的一个实施例中,装置还包括:接收模块和显示模块;
接收模块,用于在基于各备选医生的排序分数为用户推荐医生之后,接收用户选择的筛选诉求优先级;
显示模块,用于基于接收模块接收的筛选诉求优先级和各备选医生的排序分数,显示为用户推荐的各备选医生。
在本公开的一个实施例中,其中,各备选医生的推荐信息中显示有各备选医生的权威度标签、在线服务信息、在线科普信息和寻医热度中的至少一项。
本公开的技术方案中,所涉及的医生信息和用户信息的收集、存储、使用、加工、传输、提供和公开等处理,均符合相关法律法规的规定,且不违背公序良俗。
需要说明的是,本实施例中的医生数据可以来自于公开数据集。
根据本公开的实施例,本公开还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。
图6示出了可以用来实施本公开的实施例的示例电子设备600的示意性框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本公开的实现。
如图6所示,电子设备600包括计算单元601,其可以根据存储在只读存储器(ROM)602中的计算机程序或者从存储单元608加载到随机访问存储器(RAM)603中的计算机程序,来执行各种适当的动作和处理。在RAM 603中,还可存储电子设备600操作所需的各种程序和数据。计算单元601、ROM 602以及RAM 603通过总线604彼此相连。输入/输出(I/O)接口605也连接至总线604。
电子设备600中的多个部件连接至I/O接口605,包括:输入单元606,例如键盘、鼠标等;输出单元607,例如各种类型的显示器、扬声器等;存储单元608,例如磁盘、光盘等;以及通信单元609,例如网卡、调制解调器、无线通信收发机等。通信单元609允许电子设备600通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
计算单元601可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元601的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元601执行上文所描述的各个方法和处理,例如医患匹配方法。例如,在一些实施例中,医患匹配方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元608。在一些实施例中,计算机程序的部分或者全部可以经由ROM 602和/或通信单元609而被载入和/或安装到电子设备600上。当计算机程序加载到RAM 603并由计算单元601执行时,可以执行上文描述的医患匹配方法的一个或多个步骤。备选地,在其他实施例中,计算单元601可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行医患匹配方法。
本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、复杂可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)和互联网。
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,也可以为分布式系统的服务器,或者是结合了区块链的服务器。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本公开公开的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本公开保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等,均应包含在本公开保护范围之内。

Claims (20)

1.一种医患匹配方法,包括:
对用户输入的查询语句进行解析,得到所述用户对应的医疗实体信息、科室预测标签和体征异常预测标签;
将所述用户对应的医疗实体信息、科室预测标签和体征异常预测标签与医生集合中各医生的医疗实体信息、科室信息和擅长治疗信息进行匹配,得到与所述用户匹配的多个备选医生;
计算所述查询语句与每个备选医生的擅长治疗信息的相关性,基于计算得到的相关性为所述用户推荐医生。
2.根据权利要求1所述的方法,其中,所述对用户输入的查询语句进行解析,得到所述用户对应的医疗实体信息、科室预测标签和体征异常预测标签,包括:
对所述查询语句进行解析,得到所述查询语句中包括的所述医疗实体信息;
基于所述查询语句为所述用户推荐体征异常标签,将所述用户选择的体征异常标签作为体征异常澄清标签;
基于所述医疗实体信息和所述体征异常澄清标签,确定所述用户的体征异常预测标签;
将所述查询语句输入科室分类模型,基于科室分类模型的输出结果确定所述科室预测标签。
3.根据权利要求2所述的方法,其中,所述对所述查询语句进行解析,得到所述查询语句中包括的所述医疗实体信息,包括:
将所述查询语句与实体词典进行匹配,得到所述查询语句包括的存在于所述实体词典中的第一实体信息;
将所述查询语句输入预先训练的实体识别模型,获取所述实体识别模型输出的第二实体信息;
将所述第二实体信息中除所述第一实体信息之外的实体信息和所述第一实体信息,作为所述医疗实体信息。
4.根据权利要求2所述的方法,其中,所述基于所述查询语句为所述用户推荐体征异常标签,将所述用户选择的体征异常标签作为体征异常澄清标签,包括:
将所述查询语句输入预先训练的相关性模型,获取所述相关性模型输出的与所述查询语句相关的多个体征异常标签列表;
计算所述体征异常标签列表中每个体征异常标签在所述多个体征异常标签列表中出现的频次;
按照出现频次从高到低的顺序,向所述用户显示体征异常标签;
获取所述用户从显示的体征异常标签中选择的体征异常标签,作为所述体征异常澄清标签。
5.根据权利要求2所述的方法,其中,所述基于所述医疗实体信息和所述体征异常澄清标签,确定所述用户的体征异常预测标签,包括:
将所述医疗实体信息和所述体征异常澄清标签输入预先训练的体征异常预测模型,得到所述体征异常预测模型输出的体征异常预测标签。
6.根据权利要求1所述的方法,在所述对用户输入的查询语句进行解析之前,所述方法还包括:
从多个数据源中获取医生数据;
对从多个数据源中获取到的医生数据进行融合和去重,得到一个医生集合,以及所述医生集合中每个医生对应的医生数据;
分别对每个医生的医生数据进行解析,得到每个医生的医疗实体信息、科室信息和擅长治疗信息。
7.根据权利要求6所述的方法,其中,所述分别对每个医生的医生数据进行解析,得到每个医生的医疗实体信息、科室信息和擅长治疗信息,包括:
分别对每个医生对应的医生数据进行实体识别,得到每个医生对应的医疗实体信息、科室信息以及每个医生的候选擅长信息;
针对每个医生,基于BOW模型生成该医生的每个候选擅长信息的向量,并基于BOW模型生成该医生的每个提报擅长信息的向量;
计算该医生的每个候选擅长信息的向量与每个提报擅长信息的向量两两之间的相似度;
将各提报擅长信息和相似度高于预设阈值的候选擅长信息作为所述擅长治疗信息。
8.根据权利要求1所述的方法,其中,所述将所述用户对应的医疗实体信息、科室预测标签和体征异常预测标签与医生集合中各医生的医疗实体信息、科室信息和擅长治疗信息进行匹配,得到与所述用户匹配的多个备选医生,包括:
从结构化存储的各医生的医疗实体信息、科室信息和擅长治疗信息中,查找与所述用户对应的医疗实体信息、科室预测标签和体征异常预测标签匹配的多个备选医生。
9.根据权利要求8所述的方法,在从结构化存储的各医生的医疗实体信息、科室信息和擅长治疗信息中,查找与所述用户对应的医疗实体信息、科室预测标签和体征异常预测标签匹配的多个备选医生之后,所述方法还包括:
将所述查询语句转化为查询语句特征向量;
从预设的ANN索引库中搜索与所述查询语句特征向量匹配的医生,加入与所述用户匹配的备选医生;其中,所述预设的ANN索引库中包括每个医生的所述擅长治疗信息的特征向量。
10.根据权利要求1所述的方法,其中,所述计算所述查询语句与每个备选医生的擅长治疗信息的相关性,基于计算得到的相关性为所述用户推荐医生,包括:
获取每个备选医生的权威度和排序特征,所述排序特征用于表征医生的历史接诊能力和/或医生与所述用户的距离;
将每个备选医生的权威度和排序特征以及计算得到的相关性输入预先训练的排序模型,得到所述排序模型输出的各备选医生的排序分数;
基于各备选医生的排序分数为所述用户推荐医生。
11.根据权利要求10所述的方法,在所述基于各备选医生的排序分数为所述用户推荐医生之后,所述方法还包括:
接收所述用户选择的筛选诉求优先级;
基于所述筛选诉求优先级和各备选医生的排序分数,显示为所述用户推荐的各备选医生。
12.根据权利要求10或11所述的方法,其中,各备选医生的推荐信息中显示有各备选医生的权威度标签、在线服务信息、在线科普信息和寻医热度中的至少一项。
13.一种医患匹配装置,包括:
解析模块,用于对用户输入的查询语句进行解析,得到所述用户对应的医疗实体信息、科室预测标签和体征异常预测标签;
匹配模块,用于将所述解析模块解析的所述用户对应的医疗实体信息、科室预测标签和体征异常预测标签与医生集合中各医生的医疗实体信息、科室信息和擅长治疗信息进行匹配,得到与所述用户匹配的多个备选医生;
推荐模块,用于计算所述查询语句与所述匹配模块得到的每个备选医生的擅长治疗信息的相关性,基于计算得到的相关性为所述用户推荐医生。
14.根据权利要求13所述的装置,其中,所述解析模块,具体用于:
对所述查询语句进行解析,得到所述查询语句中包括的所述医疗实体信息;
基于所述查询语句为所述用户推荐体征异常标签,将所述用户选择的体征异常标签作为体征异常澄清标签;
基于所述医疗实体信息和所述体征异常澄清标签,确定所述用户的体征异常预测标签;
将所述查询语句输入科室分类模型,基于科室分类模型的输出结果确定所述科室预测标签。
15.根据权利要求14所述的装置,其中,所述解析模块,具体用于:
将所述查询语句与实体词典进行匹配,得到所述查询语句包括的存在于所述实体词典中的第一实体信息;
将所述查询语句输入预先训练的实体识别模型,获取所述实体识别模型输出的第二实体信息;
将所述第二实体信息中除所述第一实体信息之外的实体信息和所述第一实体信息,作为所述医疗实体信息。
16.根据权利要求14所述的装置,其中,所述解析模块,具体用于:
将所述查询语句输入预先训练的相关性模型,获取所述相关性模型输出的与所述查询语句相关的多个体征异常标签列表;
计算所述体征异常标签列表中每个体征异常标签在所述多个体征异常标签列表中出现的频次;
按照出现频次从高到低的顺序,向所述用户显示体征异常标签;
获取所述用户从显示的体征异常标签中选择的体征异常标签,作为所述体征异常澄清标签。
17.根据权利要求14所述的装置,其中,所述解析模块,具体用于:
将所述医疗实体信息和所述体征异常澄清标签输入预先训练的体征异常预测模型,得到所述体征异常预测模型输出的体征异常预测标签。
18.一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-12中任一项所述的方法。
19.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据权利要求1-12中任一项所述的方法。
20.一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现根据权利要求1-12中任一项所述的方法。
CN202210307399.2A 2022-03-25 2022-03-25 一种医患匹配方法、装置、电子设备、介质及产品 Pending CN114664421A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210307399.2A CN114664421A (zh) 2022-03-25 2022-03-25 一种医患匹配方法、装置、电子设备、介质及产品

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210307399.2A CN114664421A (zh) 2022-03-25 2022-03-25 一种医患匹配方法、装置、电子设备、介质及产品

Publications (1)

Publication Number Publication Date
CN114664421A true CN114664421A (zh) 2022-06-24

Family

ID=82033096

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210307399.2A Pending CN114664421A (zh) 2022-03-25 2022-03-25 一种医患匹配方法、装置、电子设备、介质及产品

Country Status (1)

Country Link
CN (1) CN114664421A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116913493A (zh) * 2023-07-24 2023-10-20 北京同仁堂互联网医院管理有限公司 一种医患的匹配方法、装置、设备及可读介质

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116913493A (zh) * 2023-07-24 2023-10-20 北京同仁堂互联网医院管理有限公司 一种医患的匹配方法、装置、设备及可读介质

Similar Documents

Publication Publication Date Title
Castillo-Sánchez et al. Suicide risk assessment using machine learning and social networks: a scoping review
CN107644011B (zh) 用于细粒度医疗实体提取的系统和方法
US9721205B2 (en) Clarification of submitted questions in a question and answer system
CN104699741B (zh) 用于改善对输入问题的回答的方法和装置
WO2020243732A1 (en) Systems and methods of clinical trial evaluation
WO2020243846A1 (en) System and method for automated file reporting
CN113345577B (zh) 诊疗辅助信息的生成方法、模型训练方法、装置、设备以及存储介质
CN113724848A (zh) 基于人工智能的医疗资源推荐方法、装置、服务器及介质
WO2022160454A1 (zh) 医疗文献的检索方法、装置、电子设备及存储介质
CN113707299A (zh) 基于问诊会话的辅助诊断方法、装置及计算机设备
CN112579750A (zh) 相似病案的检索方法、装置、设备及存储介质
CN114664421A (zh) 一种医患匹配方法、装置、电子设备、介质及产品
CN111428478B (zh) 一种词条同义判别的寻证方法、装置、设备和存储介质
CN116402166A (zh) 一种预测模型的训练方法、装置、电子设备及存储介质
CN111126034A (zh) 医学变量关系的处理方法及装置、计算机介质和电子设备
WO2019192122A1 (zh) 文档主题参数提取方法、产品推荐方法、设备及存储介质
CN113870998A (zh) 问诊方法、装置、电子设备和存储介质
CN115862840A (zh) 关节疼痛疾病的智能辅助诊断方法和装置
CN115719640A (zh) 中医主次症状识别系统、装置、电子设备及其存储介质
US20230072155A1 (en) Method and system for incorporating patient information
CN114969371A (zh) 一种联合知识图谱的热度排序方法及装置
CN113326438A (zh) 信息查询方法、装置、电子设备以及存储介质
CN114068028A (zh) 医疗问诊数据处理方法及装置、可读存储介质及电子设备
CN114117082B (zh) 用于对待校正数据校正的方法、设备和介质
CN112182069B (zh) 代理人留存预测方法、装置、计算机设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination