CN117520508A - 医药对话答案生成方法、装置、电子设备和存储介质 - Google Patents

医药对话答案生成方法、装置、电子设备和存储介质 Download PDF

Info

Publication number
CN117520508A
CN117520508A CN202311548418.1A CN202311548418A CN117520508A CN 117520508 A CN117520508 A CN 117520508A CN 202311548418 A CN202311548418 A CN 202311548418A CN 117520508 A CN117520508 A CN 117520508A
Authority
CN
China
Prior art keywords
medical
entity
answer
knowledge
question
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202311548418.1A
Other languages
English (en)
Other versions
CN117520508B (zh
Inventor
谢方敏
周峰
郭陟
伍世志
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Fangzhou Information Technology Co ltd
Original Assignee
Guangzhou Fangzhou Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Fangzhou Information Technology Co ltd filed Critical Guangzhou Fangzhou Information Technology Co ltd
Priority to CN202311548418.1A priority Critical patent/CN117520508B/zh
Publication of CN117520508A publication Critical patent/CN117520508A/zh
Application granted granted Critical
Publication of CN117520508B publication Critical patent/CN117520508B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • G06F40/295Named entity recognition
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Databases & Information Systems (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种医药对话答案生成方法、装置、电子设备和存储介质,包括:确定目标答案生成模型,接收用户的医药咨询问题,并将医药咨询问题输入预置的医药实体提取模型中得到医药实体以及医药实体的类别,根据类别加载医药实体的医药知识,采用医药咨询问题和医药知识生成第一问答提示信息,将第一问答提示信息输入目标答案生成模型中得到医药咨询问题的目标答案,使得目标答案生成模型可以采用医药知识生成医药咨询问题的答案,解决了目标答案生成模型缺乏医药专业知识难以生成准确答案或者是编造答案的问题,可以为医药咨询问题生成准确的具有医药专业知识的答案,适用于医药问答场景,提高用户咨询医药问题的体验。

Description

医药对话答案生成方法、装置、电子设备和存储介质
技术领域
本发明涉及人工智能技术领域,尤其涉及一种医药对话答案生成方法、装置、电子设备和存储介质。
背景技术
在医药商品销售平台中通常设置对话机器人为用户服务,以回答用户对药品、疾病、症状所提出的医药问题。
目前在训练医药对话答案生成模型时,由于医药方面的训练样本稀疏,获取大量医药方面的训练样本直接训练医药对话答案生成模型成本高,为解决此问题,采用非医药方面的训练样本训练模型,所训练的答案生成模型可以在提示信息下生成问题的答案,然而,由于答案生成模型采用非医药方面的训练样本训练,模型缺乏医药方面的专业知识,在回答用户关于医药方面的问题时难以给出准确答案或者是编造答案,难以应用于医药商品销售中医药问题咨询场景,降低了用户体验。
发明内容
本发明提供了一种医药对话答案生成方法、装置、电子设备和存储介质,以解决现有的问题答案生成模型由于缺乏医药专业知识,所生成的医药问题答案准确度低的问题。
第一方面,本发明提供了一种医药对话答案生成方法,包括:
确定目标答案生成模型;
接收用户的医药咨询问题,并将所述医药咨询问题输入预置的医药实体提取模型中,得到医药实体以及医药实体的类别;
根据所述类别加载所述医药实体的医药知识;
采用所述医药咨询问题和所述医药知识生成第一问答提示信息;
将所述第一问答提示信息输入所述目标答案生成模型中,得到所述医药咨询问题的目标答案。
可选的,确定目标答案生成模型,包括:
构建医药推理数据集,所述医药推理数据集包括多条第一医药推理文本;
对每条第一医药推理文本中的至少一个字进行掩盖处理得到第二医药推理文本;
确定多个候选答案生成模型,并将所述第二医药推理文本输入各个候选答案生成模型中,通过每个候选答案生成模型输出的第三医药推理文本;
采用所述第一医药推理文本和所述第三医药推理文本计算每个候选答案生成模型的准确度;
将准确度最大的候选答案生成模型确定为目标答案生成模型。
可选的,采用所述第一医药推理文本和所述第三医药推理文本计算每个候选答案生成模型的准确度,包括:
计算所输入的每个问题的第一医药推理文本和第三医药推理文本的相似度;
计算相似度的平均值作为所述候选答案生成模型的准确度。
可选的,医药实体提取模型通过以下方式训练:
构建医药实体数据集,所述医药实体数据集包括每个字标注了第一标签的训练文本;
从所述医药实体数据集中随机提取训练文本输入医药实体提取模型中,得到所述训练文本中每个字的第二标签;
采用所述第一标签和所述第二标签计算损失值;
判断是否满足停止训练条件;
若是,确定所述医药实体提取模型完成训练;
若否,根据所述损失值调整所述医药实体提取模型的模型参数,并返回从所述医药实体数据集中随机提取训练文本输入医药实体提取模型中的步骤。
可选的,根据所述类别加载所述医药实体的医药知识,包括:
在所述医药实体的类别为药品时加载所述医药实体的药品说明书,得到第一医药知识;
在所述医药实体的类别为疾病或疾病症状时,从预置的医药知识图谱中查找所述医药实体的第二医药知识;
将所述第一医药知识和/或所述第二医药知识确定为所述医药实体的医药知识。
可选的,在所述医药实体的类别为疾病或疾病症状时,从预置的医药知识图谱中查找所述医药实体的第二医药知识,包括:
在存储医药知识图谱的图数据库中确定出医药实体;
将图数据库中与所述医药实体存在关系的数据实体的内容确定为所述医药实体的第二医药知识。
可选的,采用所述医药咨询问题和所述医药知识生成第一问答提示信息,包括:
将所述医药知识填充到预置的提示模型的上下文区域,以及将所述医药咨询问题填充到所述提示模型的问题区域,得到第一问答提示信息。
第二方面,本发明提供了一种医药对话答案生成装置,包括:
答案生成模型确定模块,用于确定目标答案生成模型;
医药实体提取模块,用于接收用户的医药咨询问题,并将所述医药咨询问题输入预置的医药实体提取模型中,得到医药实体以及医药实体的类别;
医药知识加载模块,用于根据所述类别加载所述医药实体的医药知识;
第一问答提示信息生成模块,用于采用所述医药咨询问题和所述医药知识生成第一问答提示信息;
答案生成模块,用于将所述第一问答提示信息输入所述目标答案生成模型中,得到所述医药咨询问题的目标答案。
第三方面,本发明提供了一种电子设备,所述电子设备包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行本发明第一方面任一项所述的医药对话答案生成方法。
第四方面,本发明提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使处理器执行时实现本发明第一方面任一项所述的医药对话答案生成方法。
本发明实施例在确定目标答案生成模型和接收用户的医药咨询问题后,将医药咨询问题输入预置的医药实体提取模型中得到医药实体以及医药实体的类别,根据类别加载医药实体的医药知识,采用医药咨询问题和医药知识生成第一问答提示信息,将第一问答提示信息输入目标答案生成模型中,得到医药咨询问题的目标答案,实现了通过医药实体提取模型提取医药咨询问题中的医药实体,并加载医药实体的医药知识后与医药咨询问题组成问答提示信息,以使得目标答案生成模型可以采用医药知识生成医药咨询问题的答案,解决了目标答案生成模型缺乏医药专业知识难以生成准确答案或者是编造答案的问题,可以为医药咨询问题生成准确的具有医药专业知识的答案,适用于医药对话场景,提高用户咨询医药问题的体验。
应当理解,本部分所描述的内容并非旨在标识本发明的实施例的关键或重要特征,也不用于限制本发明的范围。本发明的其它特征将通过以下的说明书而变得容易理解。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例一提供的一种医药对话答案生成方法的流程图;
图2是本发明实施例二提供的一种医药对话答案生成方法的流程图;
图3为医药实体数据集中一条训练文本的示意图;
图4为医药知识图谱的示意图;
图5为提示模板的示意图;
图6是本发明实施例三提供的一种医药对话答案生成装置的结构示意图;
图7是本发明实施例四提供的电子设备的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
实施例一
图1为本发明实施例一提供的一种医药对话答案生成方法的流程图,本实施例可适用于生成医药问题的答案的情况,该方法可以由医药对话答案生成装置来执行,该医药对话答案生成装置可以采用硬件和/或软件的形式实现并配置于电子设备中。如图1所示,该医药对话答案生成方法包括:
S101、确定目标答案生成模型。
目标答案生成模块可以是输入问题和提示信息后,采用提示信息生成问题的答案的模型,示例性的,目标答案生成模型可以是各种基于prompt(提示)的对话模型、Mask语言模型、GPT等模型。
本实施例可以获取现有的多个答案生成模型,并构建医药推理数据集,该医药推理数据集包括多条医药推理文本,将每条医药推理文本中的部分实体掩盖后输入多个答案生成模型中后预测被掩盖的实体,通过所预测的实体与被掩盖的真实实体对各个问题答案生成模型的准确度进行评估,将准确度最高的模型确定为目标答案生成模型。
S102、接收用户的医药咨询问题,并将医药咨询问题输入预置的医药实体提取模型中,得到医药实体以及医药实体的类别。
本实施例可以预先训练医药实体提取模型,该医药实体提取模型用于提取文本中的医药实体,医药实体可以是药品、疾病、疾病症状的实体的名称,类别可以是指实体属于药品、疾病、疾病症状中的至少一类。
在一个场景中,在药品销售平台上,用户浏览药品销售页面需要咨询某个药品的功能、用量或者是服用禁忌时,会在药品销售平台上与对话机器人对话,又或者是询问某种疾病的症状时与对话机器人对话,对话机器人可以接收到用户的医药咨询问题,对话机器人可以将医药咨询问题输入到医药实体提取模型中,以提取出医药咨询问题中的医药实体和医药实体的类别,比如,对于医药咨询问题“服用阿莫西林需要注意什么”,所提取出的医药实体为“阿莫西林”,类别为药品。
S103、根据类别加载医药实体的医药知识。
不同类别的医药实体的医药知识不同,可以根据类别加载医药实体的医药知识,以医药实体为药品作为示例,可以加载药品的说明书作为医药知识,对于医药实体为疾病或症状时,可以从预置的知识图谱中查找与医药实体存在关系的实体的内容作为医药知识,在实施本发明时,本领域技术人员可以预置医药实体的医药知识,以提取到医药咨询问题中的医药实体后加载相应的医药知识。
S104、采用医药咨询问题和医药知识生成第一问答提示信息。
问答提示信息可以包括问题和提示信息,以使得目标答案生成模型基于提示信息生成问题的答案,本实施例可以预先设置提示模型该提示模型中包括问题区域和提示信息区域,可以将所接收到的用户的医药咨询问题填充到问题区域,以及将加载到的医药知识填充到提示信息区域得到第一问答提示信息。
S105、将第一问答提示信息输入目标答案生成模型中,得到医药咨询问题的目标答案。
由于目标答案生成模型是经过训练后能够采用提示信息生成问题答案的模型,在将第一问答提示信息输入目标答案生成模型后,目标答案生成模型可以采用第一问答提示信息中的医药知识生成医药咨询问题的目标答案,可以采用目标答案回复用户,比如以文本形式显示目标答案,或者以语音方式播报目标答案。
本发明实施例在确定目标答案生成模型和接收用户的医药咨询问题后,将医药咨询问题输入预置的医药实体提取模型中得到医药实体以及医药实体的类别,根据类别加载医药实体的医药知识,采用医药咨询问题和医药知识生成第一问答提示信息,将第一问答提示信息输入目标答案生成模型中,得到医药咨询问题的目标答案,实现了通过医药实体提取模型提取医药咨询问题中的医药实体,并加载医药实体的医药知识后与医药咨询问题组成问答提示信息,以使得目标答案生成模型可以采用医药知识生成医药咨询问题的答案,解决了目标答案生成模型缺乏医药专业知识难以生成准确答案或者是编造答案的问题,可以为医药咨询问题生成准确的具有医药专业知识的答案,适用于医疗问答对话的场景,提高用户咨询医药问题的体验。
实施例二
图2为本发明实施例二提供的一种医药对话答案生成方法的流程图,本发明实施例在上述实施例一的基础上进行优化,如图2所示,该医药对话答案生成方法包括:
S201、构建医药推理数据集,医药推理数据集包括多条第一医药推理文本。
本实施例中医药推理数据集可以是医药技术领域中表示医药实体之间存在因果关系、条件关系、上下位关系的文本,即医药推理数据集可以包括多条第一医药推理文本,该第一医药推理文本中各个医药实体存在因果关系、条件关系或上下位关系。
比如,第一医药推理文本可以是“人体的胃肠道功能紊乱,导致患者吸收能力变差”,其中“胃肠道功能紊乱”是“吸收能力变差”的一个直接原因,“吸收能力变差”是“胃肠功能紊乱”的直接结果。
第一医药推理文本可以是“对阿莫西林过敏的患者不可以使用,服用阿莫西林可能会引起皮疹、药物热和哮喘等过敏反应,因此使用前一定要做青霉素皮试试验”,其中,“对阿莫西林过敏”是“服用阿莫西林”导致“皮疹”的条件。
第一医药推理文本可以是“阿尔茨海默症是一种精神类疾病,生活中比较常见”,其中,“阿尔茨海默症”是“精神类疾病”的一种,阿尔茨海默症与精神类疾病构成了上下位关系。
以上仅仅是其中的几个示例,在实际应用中,本领域技术人员可以构建更多类型的第一医药推理文本。
S202、对每条第一医药推理文本中的至少一个字进行掩盖处理得到第二医药推理文本。
本实施例中,可以对第一医药推理文本中的部分实体进行掩盖处理,得到缺失被掩盖的实体的第二医药推理文本,以第一医药推理文本为“人体的胃肠道功能紊乱,导致患者吸收能力变差”作为示例,可以对“胃肠道功能紊乱”进行掩盖,得到第二医药推理文本为“人体的_____紊乱,导致患者吸收能力变差”,又或者是对“吸收能力”进行掩盖,得到第二医药推理文本为“人体的胃肠道功能紊乱,导致患者______变差”,本领域技术人员可以设置对第一医药推理文本中的实体进行随机掩盖处理,本实施例对掩盖处理得到第二医药推理文本的方式不作限制。
S203、确定多个候选答案生成模型,并将第二医药推理文本输入各个候选答案生成模型中,通过每个候选答案生成模型输出的第三医药推理文本。
本实施例可以将现有技术中训练好的基于prompt(提示)的对话模型、Mask语言模型、GPT等模型作为候选答案生成模型,并采用掩盖部分实体后的第二医药推理文本评估各个候选答案生成模型对基础医药知识的理解能力。
具体的,可以将第二医药推理文本输入各个候选答案生成模型中,通过每个候选答案生成模型输出的第三医药推理文本,该第三医药推理文本为候选答案生成模型预测并补全第二医药推理文本中被掩盖的实体后的文本。
S204、采用第一医药推理文本和第三医药推理文本计算每个候选答案生成模型的准确度。
在一个实施例中,可以计算所输入的每个问题的第一医药推理文本和第三医药推理文本的相似度,并计算相似度的平均值作为候选答案生成模型的准确度,其中,相似度可以是预先相似度、欧氏距离、曼哈顿距离等。
当然,也可以计算被掩盖的真实实体的内容与被掩盖的实体的预测内容的相似度。
S205、将准确度最大的候选答案生成模型确定为目标答案生成模型。
准确度越大,表明候选答案生成模型对基础医药知识理解更为准确,可以将准确度最大的候选答案生成模型确定为目标答案生成模型。
本实施例通过构建医药推理数据集后,对医药推理数据集中的第一医药推理文本中的部分实体进行掩盖处理得到第二医药推理文本,并输入到多个候选答案生成模型中得到第三医药推理文本,通过第一医药推理文本和第三医药推理文本评估各个候选答案生成模型的准确度,将准确度最高的确定为目标答案生成模型,可以筛子出对基础医药知识理解准确度最高的目标答案生成模型。
S206、接收用户的医药咨询问题,并将医药咨询问题输入预置的医药实体提取模型中,得到医药实体以及医药实体的类别。
本实施例可以预先训练医药实体提取模型,该医药实体提取模型可以提取文本中的医药实体,在一个可选实施例中,可以构建医药实体数据集,该医药实体数据集包括每个字标注了第一标签的训练文本,然后从医药实体数据集中随机提取训练文本输入医药实体提取模型中,得到训练文本中每个字的第二标签,采用第一标签和第二标签计算损失值,判断是否满足停止训练条件,若是,确定医药实体提取模型完成训练,若否,根据损失值调整医药实体提取模型的模型参数,并返回从医药实体数据集中随机提取训练文本输入医药实体提取模型中的步骤。
如图3所示为训练文本标注第一标签的一个示例,在图3所示的标注方式采用BIO(B:beigin,I:inside,O:other,E:end)方式标注,图3中-dis为疾病实体的BIE标签,-cls为疾病类别的BIE标签,O为其他标签,在图3中,“阿尔茨海默病”为疾病实体,其标签为-dis,“精神类疾病”是疾病类别,其标签为-cls。
在对训练文本标注第一标签后,可以将训练文本输入医药实体提取模型中,得到训练文本中每个字的第二标签,通过第一标签和第二标签计算损失值,在一个示例中,可以采用均方差损失函数计算损失值,在另一个示例中,可以采用CRF(ConditionalRandomField,条件随机场)损失函数计算损失值,本实施例对计算损失值的方式不作限制,并在损失值小于预设阈值,或者是迭代训练次数达到预设次数后,停止训练,否则,采用损失值计算梯度后,对模型参数进行梯度下降后继续训练。
在医药实体提取模型完成训练后,若接收到用户的医药咨询问题,可以将医药咨询问题输入医药实体提取模型中,得到医药咨询问题中的医药实体以及类别,以用户咨询问题为“偏头痛有什么症状?”作为示例,提取出医药实体“偏头痛”,类别为疾病。
S207、在医药实体的类别为药品时加载医药实体的药品说明书,得到第一医药知识。
在一个实施例中,医药实体的类别为药品时,医药知识主要是药品说明书,则可以采用药品的名称或者批号查找药品说明书,并加载该药品说明书。
S208、在医药实体的类别为疾病或疾病症状时,从预置的医药知识图谱中查找医药实体的第二医药知识。
本实施例可以预置医药知识图谱,该医药知识图谱中包括多个类别的实体以及实体之间的关系,比如可以包括疾病、症状、药品等实体,以及各个实体之间的关系,如图5所示为知识图谱的一个示例图,该示例中包括了疾病偏头痛、头疼等实体以及各个实体之间的关系,知识图谱中关系以实体之间的边来表示。
在医药实体的类别为疾病或者疾病症状时,可以在存储医药知识图谱的图数据库中确定出医药实体,并将图数据库中与医药实体存在关系的数据实体的内容确定为医药实体的第二医药知识。
如图4所示,知识图谱中实体之间的关系可以用三元组(A,B,Re)表示,即实体A和实体B之间存在关系Re,知识图谱存储在图数据库中,在图数据库中可以使用类似于SQL的查询语言来查询出需要的数据,以查询“偏头痛”相关的症状作为示例,可以使用以下的语句进行查询:
MATCH(dis:Disease{name:‘偏头
痛’})-[:CAUSE_SYMPTOM]->(sym:Symptom)
RETURNsym.name
其中,MATCH部分查出name为“偏头痛”的疾病(Disease)实体,->代表关系,关系的类型为CAUSE_SYMPTOM(引起症状),后面的宾实体类型为症状(Symptom),RETURN部分为所需要返回的内容,返回的是关联症状的name,在图4中疾病偏头痛的症状包括易怒、疲乏、畏光等。
S209、将第一医药知识和/或第二医药知识确定为医药实体的医药知识。
在获得各个医药实体的医药知识后,对各个医药实体的医药知识进行汇总,并加载汇总所得的医药知识。
S210、将医药知识填充到预置的提示模型的上下文区域,以及将医药咨询问题填充到提示模型的问题区域,得到第一问答提示信息。
本实施例可以预置提示模板,该提示模板包括上下文区域和问题区域,如图5所示为提示模板的示意图,在图5中包括上下文区域context,以及问题区域question,以用户咨询“偏头痛会出现畏光的症状吗?”作为示例,可以将问题“偏头痛会出现畏光的症状吗?”填充到问题区域question,以及将从知识图谱中查找到的偏头痛的症状“偏头痛的症状包括:疲乏、畏光、听力障碍..”填充到context区域,得到第一问答提示信息。
若咨询问题是关于药品,可以将药品说明书填充到context区域即可,在此不再以示例说明。
S211、将第一问答提示信息输入目标答案生成模型中,得到医药咨询问题的目标答案。
具体的,可以将第一问答提示信息输入所确定的目标答案生成模型中,在目标答案生成模型中以第一问答提醒信息中的上下文区域中的信息生成医药咨询问题的答案,以图5用户咨询“偏头痛会出现畏光的症状吗?”作为示例,可以生成答案“是的,畏光是偏头痛的症状之一”。
本实施例通过确定目标答案生成模型,并在接收用户的医药咨询问题,并将医药咨询问题输入预置的医药实体提取模型中,得到医药实体以及医药实体的类别,在医药实体的类别为药品时加载医药实体的药品说明书作为医药知识,在医药实体的类别为疾病或疾病症状时,从预置的医药知识图谱中查找医药实体的医药知识,并将医药知识和医药咨询问题填充到提示模板中得到问答提示信息,将问答提示信息输入目标答案生成模型中得到医药咨询问题的目标答案,实现了基于医药咨询问题加载药品的说明书,或者是从知识图谱中加载疾病、症状的医药知识生成问答提示信息,使得目标答案生成模型基于药品说明书或者疾病、症状的医药知识生成答案,为医药咨询问题生成准确的具有医药专业知识的答案,适用于医疗问答对话场景,提高用户咨询医药问题的体验。
实施例三
图6为本发明实施例三提供的一种医药对话答案生成装置的结构示意图。如图6所示,该医药对话答案生成装置包括:
答案生成模型确定模块601,用于确定目标答案生成模型;
医药实体提取模块602,用于接收用户的医药咨询问题,并将所述医药咨询问题输入预置的医药实体提取模型中,得到医药实体以及医药实体的类别;
医药知识加载模块603,用于根据所述类别加载所述医药实体的医药知识;
第一问答提示信息生成模块604,用于采用所述医药咨询问题和所述医药知识生成第一问答提示信息;
答案生成模块605,用于将所述第一问答提示信息输入所述目标答案生成模型中,得到所述医药咨询问题的目标答案。
可选的,答案生成模型确定模块601包括:
医药推理数据集构建单元,用于构建医药推理数据集,所述医药推理数据集包括多条第一医药推理文本;
文本掩盖处理单元,用于对每条第一医药推理文本中的至少一个字进行掩盖处理得到第二医药推理文本;
文本推理单元,用于确定多个候选答案生成模型,并将所述第二医药推理文本输入各个候选答案生成模型中,通过每个候选答案生成模型输出的第三医药推理文本;
模型准确度计算单元,用于采用所述第一医药推理文本和所述第三医药推理文本计算每个候选答案生成模型的准确度;
目标模型确定单元,用于将准确度最大的候选答案生成模型确定为目标答案生成模型。
可选的,模型准确度计算单元包括:
相似度计算子单元,用于计算所输入的每个问题的第一医药推理文本和第三医药推理文本的相似度;
准确度计算子单元,用于计算相似度的平均值作为所述候选答案生成模型的准确度。
可选的,医药实体提取模型通过以下模块训练:
医药实体数据集构建模块,用于构建医药实体数据集,所述医药实体数据集包括每个字标注了第一标签的训练文本;
训练文本输入模块,用于从所述医药实体数据集中随机提取训练文本输入医药实体提取模型中,得到所述训练文本中每个字的第二标签;
损失值计算模块,用于采用所述第一标签和所述第二标签计算损失值;
训练条件判断模块,用于判断是否满足停止训练条件,若是,执行完成训练确定模块,若否,执行模型参数调整模块;
完成训练确定模块,用于确定所述医药实体提取模型完成训练;
模型参数调整模块,用于根据所述损失值调整所述医药实体提取模型的模型参数,并返回训练文本输入模块。
可选的,医药知识加载模块603包括:
药品说明书加载单元,用于在所述医药实体的类别为药品时加载所述医药实体的药品说明书,得到第一医药知识;
知识图谱加载单元,用于在所述医药实体的类别为疾病或疾病症状时,从预置的医药知识图谱中查找所述医药实体的第二医药知识;
医药知识确定单元,用于将所述第一医药知识和/或所述第二医药知识确定为所述医药实体的医药知识。
可选的,知识图谱加载单元包括:
医药实体确定子单元,用于在存储医药知识图谱的图数据库中确定出医药实体;
第二医药知识确定子单元,用于将图数据库中与所述医药实体存在关系的数据实体的内容确定为所述医药实体的第二医药知识。
可选的,第一问答提示信息生成模块604包括:
提示模板填充单元,用于将所述医药知识填充到预置的提示模型的上下文区域,以及将所述医药咨询问题填充到所述提示模型的问题区域,得到第一问答提示信息。
本发明实施例所提供的医药对话答案生成装置可执行本发明任意实施例所提供的医药对话答案生成方法,具备执行方法相应的功能模块和有益效果。
实施例四
图7示出了可以用来实施本发明的实施例的电子设备70的结构示意图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备(如头盔、眼镜、手表等)和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本发明的实现。
如图7所示,电子设备70包括至少一个处理器71,以及与至少一个处理器71通信连接的存储器,如只读存储器(ROM)72、随机访问存储器(RAM)73等,其中,存储器存储有可被至少一个处理器执行的计算机程序,处理器71可以根据存储在只读存储器(ROM)72中的计算机程序或者从存储单元78加载到随机访问存储器(RAM)73中的计算机程序,来执行各种适当的动作和处理。在RAM73中,还可存储电子设备70操作所需的各种程序和数据。处理器71、ROM72以及RAM73通过总线74彼此相连。输入/输出(I/O)接口75也连接至总线74。
电子设备70中的多个部件连接至I/O接口75,包括:输入单元76,例如键盘、鼠标等;输出单元77,例如各种类型的显示器、扬声器等;存储单元78,例如磁盘、光盘等;以及通信单元79,例如网卡、调制解调器、无线通信收发机等。通信单元79允许电子设备70通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
处理器71可以是各种具有处理和计算能力的通用和/或专用处理组件。处理器71的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的处理器、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。处理器71执行上文所描述的各个方法和处理,例如医药对话答案生成方法。
在一些实施例中,医药对话答案生成方法可被实现为计算机程序,其被有形地包含于计算机可读存储介质,例如存储单元78。在一些实施例中,计算机程序的部分或者全部可以经由ROM72和/或通信单元79而被载入和/或安装到电子设备70上。当计算机程序加载到RAM73并由处理器71执行时,可以执行上文描述的医药对话答案生成方法的一个或多个步骤。备选地,在其他实施例中,处理器71可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行医药对话答案生成方法。
本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、现场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、复杂可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
用于实施本发明的方法的计算机程序可以采用一个或多个编程语言的任何组合来编写。这些计算机程序可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器,使得计算机程序当由处理器执行时使流程图和/或框图中所规定的功能/操作被实施。计算机程序可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本发明的上下文中,计算机可读存储介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的计算机程序。计算机可读存储介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。备选地,计算机可读存储介质可以是机器可读信号介质。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
为了提供与用户的交互,可以在电子设备上实施此处描述的系统和技术,该电子设备具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给电子设备。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)、区块链网络和互联网。
计算系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,又称为云计算服务器或云主机,是云计算服务体系中的一项主机产品,以解决了传统物理主机与VPS服务中,存在的管理难度大,业务扩展性弱的缺陷。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发明中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本发明的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本发明保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明保护范围之内。

Claims (10)

1.一种医药对话答案生成方法,其特征在于,包括:
确定目标答案生成模型;
接收用户的医药咨询问题,并将所述医药咨询问题输入预置的医药实体提取模型中,得到医药实体以及医药实体的类别;
根据所述类别加载所述医药实体的医药知识;
采用所述医药咨询问题和所述医药知识生成第一问答提示信息;
将所述第一问答提示信息输入所述目标答案生成模型中,得到所述医药咨询问题的目标答案。
2.如权利要求1所述的医药对话答案生成方法,其特征在于,确定目标答案生成模型,包括:
构建医药推理数据集,所述医药推理数据集包括多条第一医药推理文本;
对每条第一医药推理文本中的至少一个字进行掩盖处理得到第二医药推理文本;
确定多个候选答案生成模型,并将所述第二医药推理文本输入各个候选答案生成模型中,通过每个候选答案生成模型输出的第三医药推理文本;
采用所述第一医药推理文本和所述第三医药推理文本计算每个候选答案生成模型的准确度;
将准确度最大的候选答案生成模型确定为目标答案生成模型。
3.如权利要求2所述的医药对话答案生成方法,其特征在于,采用所述第一医药推理文本和所述第三医药推理文本计算每个候选答案生成模型的准确度,包括:
计算所输入的每个问题的第一医药推理文本和第三医药推理文本的相似度;
计算相似度的平均值作为所述候选答案生成模型的准确度。
4.如权利要求1-3任一项所述的医药对话答案生成方法,其特征在于,医药实体提取模型通过以下方式训练:
构建医药实体数据集,所述医药实体数据集包括每个字标注了第一标签的训练文本;
从所述医药实体数据集中随机提取训练文本输入医药实体提取模型中,得到所述训练文本中每个字的第二标签;
采用所述第一标签和所述第二标签计算损失值;
判断是否满足停止训练条件;
若是,确定所述医药实体提取模型完成训练;
若否,根据所述损失值调整所述医药实体提取模型的模型参数,并返回从所述医药实体数据集中随机提取训练文本输入医药实体提取模型中的步骤。
5.如权利要求1-3任一项所述的医药对话答案生成方法,其特征在于,根据所述类别加载所述医药实体的医药知识,包括:
在所述医药实体的类别为药品时加载所述医药实体的药品说明书,得到第一医药知识;
在所述医药实体的类别为疾病或疾病症状时,从预置的医药知识图谱中查找所述医药实体的第二医药知识;
将所述第一医药知识和/或所述第二医药知识确定为所述医药实体的医药知识。
6.如权利要求1-3任一项所述的医药对话答案生成方法,其特征在于,在所述医药实体的类别为疾病或疾病症状时,从预置的医药知识图谱中查找所述医药实体的第二医药知识,包括:
在存储医药知识图谱的图数据库中确定出医药实体;
将图数据库中与所述医药实体存在关系的数据实体的内容确定为所述医药实体的第二医药知识。
7.如权利要求1-3任一项所述的医药对话答案生成方法,其特征在于,采用所述医药咨询问题和所述医药知识生成第一问答提示信息,包括:
将所述医药知识填充到预置的提示模型的上下文区域,以及将所述医药咨询问题填充到所述提示模型的问题区域,得到第一问答提示信息。
8.一种医药对话答案生成装置,其特征在于,包括:
答案生成模型确定模块,用于确定目标答案生成模型;
医药实体提取模块,用于接收用户的医药咨询问题,并将所述医药咨询问题输入预置的医药实体提取模型中,得到医药实体以及医药实体的类别;
医药知识加载模块,用于根据所述类别加载所述医药实体的医药知识;
第一问答提示信息生成模块,用于采用所述医药咨询问题和所述医药知识生成第一问答提示信息;
答案生成模块,用于将所述第一问答提示信息输入所述目标答案生成模型中,得到所述医药咨询问题的目标答案。
9.一种电子设备,其特征在于,所述电子设备包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-7中任一项所述的医药对话答案生成方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使处理器执行时实现权利要求1-7中任一项所述的医药对话答案生成方法。
CN202311548418.1A 2023-11-20 2023-11-20 医药对话答案生成方法、装置、电子设备和存储介质 Active CN117520508B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311548418.1A CN117520508B (zh) 2023-11-20 2023-11-20 医药对话答案生成方法、装置、电子设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311548418.1A CN117520508B (zh) 2023-11-20 2023-11-20 医药对话答案生成方法、装置、电子设备和存储介质

Publications (2)

Publication Number Publication Date
CN117520508A true CN117520508A (zh) 2024-02-06
CN117520508B CN117520508B (zh) 2024-05-28

Family

ID=89749078

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311548418.1A Active CN117520508B (zh) 2023-11-20 2023-11-20 医药对话答案生成方法、装置、电子设备和存储介质

Country Status (1)

Country Link
CN (1) CN117520508B (zh)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110008473A (zh) * 2019-04-01 2019-07-12 云知声(上海)智能科技有限公司 一种基于迭代方法的医疗文本命名实体识别标注方法
CN112259260A (zh) * 2020-11-18 2021-01-22 中国科学院自动化研究所 基于智能穿戴设备的智能医疗问答方法、系统及装置
CN113569023A (zh) * 2021-07-06 2021-10-29 浙江工业大学 一种基于知识图谱的中文医药问答系统及方法
CN113707303A (zh) * 2021-08-30 2021-11-26 康键信息技术(深圳)有限公司 基于知识图谱的医疗问题解答方法、装置、设备及介质
CN115438162A (zh) * 2022-09-05 2022-12-06 中国科学技术大学 基于知识图谱的疾病问答方法、系统、设备及存储介质
US20230044106A1 (en) * 2020-02-25 2023-02-09 Boe Technology Group Co., Ltd. Method and apparatus for querying questions, device, and storage medium
US20230177363A1 (en) * 2021-12-03 2023-06-08 International Business Machines Corporation Generation of query templates for knowledge-graph based question answering system
CN117077786A (zh) * 2023-07-07 2023-11-17 南京邮电大学 一种基于知识图谱的数据知识双驱动智能医疗对话系统和方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110008473A (zh) * 2019-04-01 2019-07-12 云知声(上海)智能科技有限公司 一种基于迭代方法的医疗文本命名实体识别标注方法
US20230044106A1 (en) * 2020-02-25 2023-02-09 Boe Technology Group Co., Ltd. Method and apparatus for querying questions, device, and storage medium
CN112259260A (zh) * 2020-11-18 2021-01-22 中国科学院自动化研究所 基于智能穿戴设备的智能医疗问答方法、系统及装置
CN113569023A (zh) * 2021-07-06 2021-10-29 浙江工业大学 一种基于知识图谱的中文医药问答系统及方法
CN113707303A (zh) * 2021-08-30 2021-11-26 康键信息技术(深圳)有限公司 基于知识图谱的医疗问题解答方法、装置、设备及介质
US20230177363A1 (en) * 2021-12-03 2023-06-08 International Business Machines Corporation Generation of query templates for knowledge-graph based question answering system
CN115438162A (zh) * 2022-09-05 2022-12-06 中国科学技术大学 基于知识图谱的疾病问答方法、系统、设备及存储介质
CN117077786A (zh) * 2023-07-07 2023-11-17 南京邮电大学 一种基于知识图谱的数据知识双驱动智能医疗对话系统和方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
曹依依;周应华;申发海;李智星;: "基于CNN-CRF的中文电子病历命名实体识别研究", 重庆邮电大学学报(自然科学版), no. 06, 15 December 2019 (2019-12-15) *
谢刚;吴高巍;任俊宏;张似衡;牛景昊;张文生;: "面向患者的智能医生框架研究", 计算机科学与探索, no. 09, 27 June 2018 (2018-06-27) *
饶林尚;吴怡;冯前进;: "面向医疗设备的深度问答系统的设计", 计算机应用与软件, no. 06, 12 June 2019 (2019-06-12) *

Also Published As

Publication number Publication date
CN117520508B (zh) 2024-05-28

Similar Documents

Publication Publication Date Title
CN108417272B (zh) 带时序约束的相似病例推荐方法及装置
WO2018201772A1 (zh) 医疗文本的潜在疾病推断方法、系统及可读存储介质
CN109065139A (zh) 医疗随访方法、装置、计算机设备和存储介质
CN111159770A (zh) 文本数据脱敏方法、装置、介质及电子设备
CN115169364B (zh) 智能问答方法、装置、设备以及存储介质
CN112786144B (zh) 知识图谱的方法、医嘱质控的方法、装置、设备和介质
US20220198358A1 (en) Method for generating user interest profile, electronic device and storage medium
CN113420542B (zh) 对话生成方法、装置、电子设备及存储介质
US20230186212A1 (en) System, method, electronic device, and storage medium for identifying risk event based on social information
CN112906368A (zh) 行业文本增量方法、相关装置及计算机程序产品
CN117520508B (zh) 医药对话答案生成方法、装置、电子设备和存储介质
CN115905497B (zh) 确定答复语句的方法、装置、电子设备和存储介质
CN115292467B (zh) 信息处理与模型训练方法、装置、设备、介质及程序产品
CN114238611B (zh) 用于输出信息的方法、装置、设备以及存储介质
CN113033179B (zh) 知识获取方法、装置、电子设备及可读存储介质
CN115840867A (zh) 数学解题模型的生成方法、装置、电子设备和存储介质
CN112560466A (zh) 链接实体关联方法、装置、电子设备和存储介质
CN117556232B (zh) 评分模型训练方法、药品问答方法及相关装置
CN116089459B (zh) 数据检索方法、装置、电子设备及存储介质
CN112863627B (zh) 医疗质控信息检测方法、系统以及存储介质
CN115510203B (zh) 问题答案确定方法、装置、设备、存储介质及程序产品
CN114861639B (zh) 提问信息生成方法、装置、电子设备及存储介质
CN117786075A (zh) 医疗文本意图识别方法、装置、电子设备和存储介质
CN117556232A (zh) 评分模型训练方法、药品问答方法及相关装置
CN117747036A (zh) 基于大模型的病历生成方法、病历的大模型的生成方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant