CN118132729B - 基于医疗知识图谱的答案生成方法及装置 - Google Patents
基于医疗知识图谱的答案生成方法及装置 Download PDFInfo
- Publication number
- CN118132729B CN118132729B CN202410519666.1A CN202410519666A CN118132729B CN 118132729 B CN118132729 B CN 118132729B CN 202410519666 A CN202410519666 A CN 202410519666A CN 118132729 B CN118132729 B CN 118132729B
- Authority
- CN
- China
- Prior art keywords
- candidate
- user
- triplet
- model
- entity
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 35
- 239000013598 vector Substances 0.000 claims description 34
- 230000004927 fusion Effects 0.000 claims description 19
- 238000012512 characterization method Methods 0.000 claims description 14
- 238000012545 processing Methods 0.000 claims description 6
- 230000011218 segmentation Effects 0.000 claims description 4
- 238000004590 computer program Methods 0.000 claims description 3
- 206010011224 Cough Diseases 0.000 description 18
- 230000008569 process Effects 0.000 description 9
- 238000013461 design Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 238000012549 training Methods 0.000 description 5
- 206010035664 Pneumonia Diseases 0.000 description 4
- 208000006673 asthma Diseases 0.000 description 4
- 206010006451 bronchitis Diseases 0.000 description 4
- 208000021302 gastroesophageal reflux disease Diseases 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 3
- 239000013589 supplement Substances 0.000 description 3
- 206010019233 Headaches Diseases 0.000 description 2
- 230000001427 coherent effect Effects 0.000 description 2
- 201000010099 disease Diseases 0.000 description 2
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 231100000869 headache Toxicity 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 208000024891 symptom Diseases 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000001502 supplementing effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/02—Knowledge representation; Symbolic representation
- G06N5/022—Knowledge engineering; Knowledge acquisition
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H10/00—ICT specially adapted for the handling or processing of patient-related medical or healthcare data
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Epidemiology (AREA)
- Primary Health Care (AREA)
- Public Health (AREA)
- Medical Informatics (AREA)
- Evolutionary Computation (AREA)
- Computing Systems (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Software Systems (AREA)
- Human Computer Interaction (AREA)
- Databases & Information Systems (AREA)
- Medical Treatment And Welfare Office Work (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本说明书实施例提供一种基于医疗知识图谱的答案生成方法及装置,可以结合知识图谱为用户问题生成答案。具体地,从用户问题中识别出候选实体,然后根据候选实体从知识图谱中获取相应的候选三元组集。进一步地,利用预先训练的判别模型判断召回的三元组集是否可以用于用户问题对应的信息,并根据判别结果为用户问题生成相应答案。如此,可以灵活利用知识图谱数据,提高所生成的答案的准确性。
Description
技术领域
本说明书一个或多个实施例涉及计算机技术领域,尤其涉及一种基于医疗知识图谱的答案生成方法及装置。
背景技术
语言大模型(Large Language Model,LLM),即大规模语言模型,或称为大模型,通常具有较大的参数量级,如十亿级。语言大模型是一种基于深度学习的自然语言处理模型,它能够学习到自然语言的语法和语义,从而可以生成人类可读的文本。语言大模型由于其庞大的语料库,可以作为预训练模型用于各种语言处理类场景,例如问答场景、推送场景、生成场景等。这些场景涉及各个应用领域,如问答场景可以是医疗领域、学术领域等等。在医疗问答场景下,可以基于现有的多轮对话语料或者通过智能体Agent的形式模拟医生与患者的问答来生成语料,进而对大模型进行微调训练等使用医疗问答建议这一任务。在做医疗单轮问诊时,可能出现患者提供的上下文信息不足以支持LLM回答问题的情形。此时,可以引入医疗知识图谱来增强LLM对医疗QA问题的回答正确性。在其他问答场景中,也可以引入知识图谱数据。
知识图谱(Knowledge Graph)是结构化的语义知识库,用于以符号形式描述物理世界中的概念及其相互关系,其基本组成单位是“实体—关系—实体”三元组,以及实体及其相关属性—值对,实体间通过关系相互联结,构成网状的知识结构。知识图谱(KG)包含大量结构化的、精确的事实知识,常规技术中,试图通过检索增强方法,将KG中的相关知识结合到查询中,来解决LLM中的事实知识不足问题,从而增强LLM的能力。然而,这些研究大多数是在知识图谱问答(KGQA)任务上进行的,这种任务的问题是基于KG精心设计的,意味着问题的答案必须来自KG。这并不完全符合LLM的实际使用情况。例如在医疗的问答场景里,问题完全不是基于KG特别设计的,而是用户自主询问的。这种情况下,将KG知识注入LLM将变得更加复杂,因为KG可能不会直接包含问题对应的答案实体,而只能提供辅助信息补充,甚至可能引入噪声。
因此,如何充分利用知识图谱数据对问答场景进行补充,是值得研究的重要技术问题。
发明内容
本说明书一个或多个实施例描述了一种基于知识图谱的答案生成方法及装置,用以解决背景技术提到的一个或多个问题。
根据第一方面,提供一种基于知识图谱的答案生成方法,所述知识图谱包括多个三元组,单个三元组对应两个实体以及用于描述两个实体之间的关联类型的连接关系;所述方法包括:从用户问题中识别至少一个候选实体;根据所述至少一个候选实体,从所述知识图谱中获取各个候选三元组集;通过预先训练的判别模型判别各个候选三元组集是否适用于作为所述用户问题对应的数据,其中,针对单个候选三元组集,所述判别模型的输入数据基于所述用户问题以及通过以下方式得到的融合结果确定:通过大模型将其中的各个候选三元组分别进行重写从而转换成各个候选句子;对各个候选句子进行融合,得到所述融合结果;基于判别结果,为所述用户问题生成相应答案。
在一个实施例中,所述从用户问题中识别至少一个候选实体包括:对用户问题进行切词处理,得到多个候选词汇;将各个候选词汇与预设的实体词典进行匹配;根据匹配结果确定所述至少一个候选实体。
在一个实施例中,所述根据所述至少一个候选实体,从所述知识图谱中获取各个候选三元组集包括:针对单个候选实体,从所述多个三元组中检索,并将对应的两个实体中的一个与所述单个候选实体一致的三元组作为候选三元组加入相应的候选三元组集。
在一个实施例中,所述对各个候选句子进行融合包括:利用总结大模型将所述各个候选句子生成自然语言描述的文本段落。
在一个实施例中,所述通过预先训练的判别模型判别各个候选三元组集是否适用于作为所述用户问题对应的数据包括:对单个候选三元组集对应的融合结果和所述用户问题分别进行编码,得到单个候选三元组集表征向量与所述用户问题对应的问题表征向量;将所述单个候选三元组集表征向量与所述用户问题对应的问题表征向量一起作为所述判别模型的输入数据,以供所述判别模型判别所述单个候选三元组集是否适用于作为所述用户问题对应的数据。
在一个实施例中,各个候选三元组集包括第一三元组集;所述基于判别结果,为所述用户问题生成相应答案包括:在所述判别结果包括所述第一三元组集适用于作为所述用户问题对应的数据的情况下,将所述第一三元组集与所述用户问题一起经由生成大模型生成所述答案。
根据第二方面,提供一种基于知识图谱的答案生成装置,所述知识图谱包括多个三元组,单个三元组对应两个实体以及用于描述两个实体之间的关联类型的连接关系;所述装置包括:
识别单元,配置为从用户问题中识别至少一个候选实体;
检索单元,配置为根据所述至少一个候选实体,从所述知识图谱中获取各个候选三元组集;
判别单元,配置为通过预先训练的判别模型判别各个候选三元组集是否适用于作为所述用户问题对应的数据,其中,针对单个候选三元组集,所述判别模型的输入数据基于所述用户问题以及通过以下方式得到的融合结果确定:通过大模型将其中的各个候选三元组分别进行重写从而转换成各个候选句子;对各个候选句子进行融合,得到所述融合结果;
生成单元,配置为基于判别结果,为所述用户问题生成相应答案。
根据第三方面,提供了一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行第一方面的方法。
根据第四方面,提供了一种计算设备,包括存储器和处理器,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现第一方面的方法。
通过本说明书实施例提供的装置和方法,在问答系统中,生成答案过程中引入相关领域的知识图谱,并通过用户问题从知识图谱中召回相应的三元组。针对召回的三元组,不直接用于答案生成,而是先通过判别模型进行判别,在判别为适用于作为所述用户问题的补充数据的情况下,将所召回的三元组和用户问题一起用于答案的生成。由于引入了判别架构,本说明书提供的方法和装置可以灵活运用知识图谱数据,既能丰富用户问题中的信息,又可以避免过度使用导致的噪声,从而提高答案生成的准确性。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1本说明书技术构思下的一个具体实施架构示意图;
图2示出了根据本说明书实施例的基于知识图谱的答案生成流程示意图;
图3示出了一个具体例子的基于知识图谱的答案生成流程的操作框示意图;
图4示出了根据本说明书一个实施例的基于知识图谱的答案生成装置的结构框图。
具体实施方式
下面结合附图,对本说明书提供的方案进行描述。
图1示出了本说明书的一个具体实施架构示意图。如图1所示,在本说明书提供的实施架构中,包括用户终端和服务端。用户终端可以是智能手机、笔记本电脑、平板电脑、智能手表等各种可以与用户进行人机交互的终端设备。用户终端可以安装并运行各种终端应用。例如信息推送类应用、新闻类应用、购物类应用、外卖平台应用、问答平台应用等等。服务端可以为终端应用提供业务支持,例如为问答平台应用提供业务支持。服务端可以在本地设置有计算平台,或者连接其他设备上的计算平台。其他设备可以通过具有一定计算能力的计算机、服务器等实现。
以问答类应用为例,用户终端可以通过人机交互获取用户输入的问题描述信息,并将用户描述信息上传至服务端。服务端的计算平台获取用户问题描述信息,并从中提取知识图谱中的三元组。另一方面,计算平台可以预先连接有相关领域的知识图谱。经由从用户问题中提取的三元组与知识图谱中的三元组的匹配,可以召回多个候选三元组。然后,经由一个判别器对候选三元组进行判断,以确定其是否适用于作为当前用户问题对应的信息。在判断为适合作为当前用户问题对应的信息,可以将其与从用户问题中提取的三元组一起输入到预先经过相关业务领域样本微调的语言大模型,由语言大模型的输出确定用户问题对应的答案,并经由服务端反馈至用户终端。
值得说明的是,图1示出的实施架构仅为一个示例。实践中,计算平台也可以设于用户终端,或者一部分设于用户终端,另一部分设于服务端,在此不做限定。另外,图1中的用户终端数量可以是任意可能的数量,例如10万个等。
通过图1示出的实施架构可知,在本说明书的技术构思下,在基于知识图谱进行答案生成过程中,对于召回的三元组,经由一个判别器加以判断,从而确定召回的三元组是否适用于作为答案生成的辅助信息。如此,可以对知识图谱中的召回数据在使用前进行过滤,避免知识图谱数据成为用户问题的噪音,提高基于知识图谱的答案生成准确性。
下面结合图2示出的实施例,详细描述本说明书的技术构思。本说明书中以医疗问答场景为例进行说明,但不排除相关方案应用于其他问答场景的可能性。
图2示出了根据一个实施例的基于知识图谱的答案生成流程示意图。该流程的执行主体可以是具有一定计算能力的计算机、设备、服务器,更具体地,例如为图1示出的计算平台。如图2所示,本说明书实施例提供的基于知识图谱的答案生成流程可以包括:步骤201,从用户问题中识别至少一个候选实体;步骤202,根据至少一个候选实体,从知识图谱中获取各个候选三元组集;步骤203,通过预先训练的判别模型判别各个候选三元组集是否适用于作为用户问题对应的数据,其中,针对单个候选三元组集,判别模型的输入数据基于用户问题以及通过以下方式得到的融合结果确定:通过大模型将其中的各个候选三元组分别进行重写从而转换成各个候选句子;对各个候选句子进行融合,得到融合结果;步骤204,基于判别结果,为用户问题生成相应答案。
首先,在步骤201中,从用户问题中识别至少一个候选实体。
其中,当前用户问题可以是基于用户输入确定的向问答系统请求答案的问题,例如医疗问诊的症状描述信息等。当前用户问题的输入方式可以是语音、图像、文字、表格等各种方式,相应方式下的输入内容可以称为当前用户问题的描述信息。在语音和文字输入方式下,当前用户问题可以基于自然语言进行描述。在表格输入方式下则可以通过列表中的字段值进行描述。这里的图像可以是描述信息图像,也可以是各种光片、检查结果图像等,在此不做限定。
在本说明书的实施例中,为了更好地回答用户问题,可以引入相关领域的知识图谱数据。例如,当前问答系统为医疗问答系统,用户问题为症状或检查结果的描述信息,则可以引入医疗领域的知识图谱。为此,可以对用户问题进行语义识别,从而识别出至少一个实体作为候选实体。这里,实体可以通过相应词汇(记为实体词)描述,因此,识别实体的过程也是识别词汇的过程。根据一个实施例,可以对用户问题进行切词、去除停用词等处理,从而获得多个有效词汇作为候选词汇,再将各个候选词汇与预先设置的实体词典进行匹配,从而获取与词典词汇匹配的若干个候选词汇,各个候选词汇分别对应各个候选实体。作为一个具体例子,用户问题为“咳嗽、乏力、头疼怎么办”,可以识别出“咳嗽”、“乏力”、“头疼”三个候选实体。
接着,经由步骤202,根据至少一个候选实体,从知识图谱中获取各组候选三元组。
其中,知识图谱可以由多个三元组构成。单个三元组对应两个实体(在知识图谱中可以通过节点表示)以及两个实体之间的连接关系。对于三元组而言,在记录中可以区分头实体、尾实体,在有向图中,连接边(对应连接关系)通常是头实体指向尾实体的,而在无向图中,头实体和尾实体没有指向性区分。
对于单个候选实体而言,其在知识图谱中可能有至少一个一阶邻居实体。单个候选实体和其一阶邻居实体以及它们之间的连接关系构成三元组。单个候选实体在知识图谱中对应着若干三元组,这些三元组可以用于补充相应的候选实体。例如,“咳嗽”作为候选实体,其一阶邻居实体可能包括“感冒”、“肺炎”、“哮喘”、“支气管炎”、“胃食管返流”等等。其中的连接关系可以为“被引起”,也就是说这些疾病可以引起咳嗽这种症状。于是,“咳嗽”这个候选实体对应的三元组可以包括“咳嗽被引起感冒”、“咳嗽被引起肺炎”、“咳嗽被引起哮喘”、“咳嗽被引起支气管炎”、“咳嗽被引起胃食管返流”等等。
这里,单个候选实体对应的三元组可以称为候选三元组,单个候选实体对应的若干三元组可以构成单个候选三元组集。之所以称为候选三元组,是因为这些三元组是否用于补充相应的候选实体信息,是待定的。实践中,可以将单个候选实体对应的三元组全部加入其对应的候选三元组集,也可以按照预定规则从中选择部分三元组加入其对应的候选三元组集。这里的预定规则例如是随机选择、按照存储顺序选择,等等。
然后,在步骤203中,通过预先训练的判别模型判别各个候选三元组集是否适用于作为用户问题对应的数据。
这里,用户问题对应的数据,可以是对用户问题进行补充的补充数据,也可以是代替用户问题中的相应部分用于答案生成的数据,在此不做限定。
其中,判别模型针对单个候选三元组集,可以输出一个是否适用于作为用户问题对应的数据的概率值,或者是/否适用于作为用户问题对应的数据的判别结果。在输出概率值的情况下,可以基于概率值和阈值的对比确定判别结果。例如,概率值大于预定阈值的情况下,判定为适用于作为用户问题对应的数据,否则,概率值小于预定阈值的情况下,判定为不适用于作为用户问题对应的数据。对于各个候选三元组集,可以分别得到各个判别结果。判别模型的选择是多样化的,例如可以是基于BERT[4]等小型模型的分类网络,也可以是经由语言大模型(LLM)设计提示来完成判断,本说明书对此不做限定。在经由语言大模型设计提示的情况下,可以给出利用三元组集判别是否适用于作为用户问题对应的数据的少量样例(few shot)作为提示,结合给定的大模型任务,由大模型输出判别结果。
根据一个可能的设计,可以将各个候选三元组集中的候选三元组序列直接作为判别模型的输入,由判别模型处理候选三元组序列,得到判别结果。
根据另一个可能的设计,可以将各个候选三元组集对应的表征向量融合后作为判别模型的输入,由判别模型处理候选三元组集对应的表征向量,得到判别结果。在一个实施例中,单个候选三元组中的实体和连接关系分别可以经由节点向量和边向量表示,三元组的表征向量可以是三元组中的实体对应的节点向量及边向量经由拼接、加权求和、加权平均等至少一种方式融合在一起得到的向量。单个候选三元组集对应的表征向量可以是其中各个三元组的表征向量经由拼接、加权求和、加权平均等至少一种方式融合在一起得到的向量。
根据又一个可能的设计,判别模型可以经由语言大模型(LLM)实现,在假设与离散的三元组序列相比,语义连贯的自然语言段落能让语言大模型(LLM)更好地理解知识图谱(KG)中的内容的情况下,对于单个三元组,可以将其重写成一个连贯的句子,然后将单个候选三元组集中的候选三元组对应的句子压缩成一个有限长度的自然语言段落,并将自然语言段落作为判别模块的输入,由判别模型处理候选三元组集对应的表征向量,得到判别结果。如此,可以防止语言模型在记忆和理解较长文本时出现不足。例如,候选三元组“咳嗽被引起感冒”改写成句子可以是“感冒可以引起咳嗽”,候选三元组集“咳嗽被引起感冒”、“咳嗽被引起肺炎”、“咳嗽被引起哮喘”、“咳嗽被引起支气管炎”、“咳嗽被引起胃食管返流”压缩成的自然语言段落可以为“感冒、肺炎、哮喘、支气管炎、胃食管返流等等疾病均可以引起咳嗽”。
在一些可选的实施例中,将单个三元组重写成句子的过程可以经由重写大模型(Rewrite-LLM)来完成。重写大模型可以是在预训练的现有大模型基础上,通过多个三元组作为输入数据,相应的重写结果作为标签数据微调训练而得到,也可以是调用大模型进行句子到段落的重写。在调用大模型的情况下,可以通过输入少量样例,同时输入三元组序列,并输入请求大模型按顺序返回各个三元组的重写结果的任务,以供大模型参考少量样例,对输入的三元组序列进行句子重写。
在另一些可选的实施例中,将单个候选三元组集中的候选三元组对应的句子压缩成一个有限长度的自然语言段落可以经由总结大模型(Summary-LLM)来完成。与重写大模型类似地,总结大模型可以是在预训练的现有大模型基础上,通过多个句子序列作为输入数据,相应的段落总结结果作为标签数据微调训练而得到,也可以是常规调用大模型。在常规调用大模型的情况下,可以通过输入少量总结样例,同时输入句子序列,并向大模型请求按顺序返回各个句子序列形成的段落总结结果的任务,以供大模型参考少量样例,对输入的句子序列进行融合得到自然语言段落作为融合结果。
在一些实施例中,判别模型的输入数据可以是单个候选三元组集表征向量和用户问题对应的问题表征向量。其中,单个候选三元组集表征向量可以通过对作为融合结果的自然语言段落编码得到,问题表征向量可以通过对用户问题编码得到。这里的编码可以通过BERT之类的常规语义编码模型或者自己训练的语义编码模型实现,在此不再赘述。
在更多可能的设计中,判别模型的输入数据还可以是其他基于用户问题以及针对单个候选三元组集得到的融合结果确定的数据,在此不再一一列举。
另外,判别模型可以单独训练,也可以和答案生成模型一起训练。在单独训练的情况下,可以经由专家经验或其他方式预先标注是否适用作为用户问题对应的数据的标签,并基于输入数据获取判别结果,将判别结果与标签进行对比,并基于对比差异确定模型损失,从而向模型损失减小的方向调整判别模型中的待定参数。这里,生成标签的其他方式例如是将整个问题-答案生成流程中通过知识图谱扩充用户问题(即:将从知识图谱中确定的三元组集作为用户问题对应的数据)和不通过知识图谱扩充用户问题两种情况下的答案生成准确度进行比较,根据准确度较高时是否通过知识图谱扩充用户问题作为判别结果。在可选的实现方式中,判别模型可以通过调用大模型实现。在调用大模型时,采用少量三元组集及相应的实体词和是否适合将三元组集用于相应实体词的扩展的标注结果,由大模型对于输入的三元组集进行是否适合用于相应实体词的扩展的判别结果。
进一步地,在步骤204中,基于判别结果,为用户问题生成相应答案。
可以理解,这里的判别结果可以是适用于作为用户问题对应的数据,也可以是不适用于作为用户问题对应的数据。在不适用于作为用户问题对应的数据的情况下,相应的候选三元组集可以舍弃。在适用于作为用户问题对应的数据的情况下,相应的候选三元组集可以与用户问题融合在一起,用于生成相应答案。其中的融合方式可以是:文本拼接、向量拼接、向量加权求和等等。
相应答案可以通过答案生成模型对用户问题的处理确定。答案生成模型可以是各种文本预测模型,例如基于BERT和注意力机制的文本生成模型,也可以是语言大模型(可以记为生成大模型),在此不再赘述。
值得说明的是,本说明书的技术构思基于医疗问答等领域的实践问题提出,但不排除应用于其他领域的问答场景的可能性。
为了更加明确本说明书的实施架构,图3示出了一个更加具体的例子。如图3所示,用户问题为问题框301示出的“Question: There is most likely going to be fogaround? A:a marsh; B:a tundra; C:the plains; D:a desert”,识别到fog等实体。然后,通过实体连接进行知识图谱召回,可以确定多个三元组集(参考信息扩展示意框302),如实体fog对应的三元组集包括以下三元组:(fog,isa,atmosphere)、(fog,part of,weather)、(fog,relatedto,cover)、(fog,relatedto,wet)等等。接着,将各个三元组集分别重写(Rewrite),得到相应的句子(参考句子示意框303),如“Fog is a type ofatmosphere.”、“Fog is part of the weather.”、“Fog is related to covering theground, sea, ocean, and forests.”等等。更进一步地,通过总结(Summary),将这些句子压缩为一个段落“Fog, a weather phenomenon consisting of atmospheric moisture,often blankets the ground, sea, and forests, particularly in valleys with wetconditions. ……”(参考段落示意框304)。
接着,将用户问题“Question: There is most likely going to be fogaround? A:a marsh; B:a tundra; C:the plains; D:a desert”作为判别器305(Discriminator )的第一个输入项(Input 1),将压缩得到的段落“Fog, a weatherphenomenon consisting of atmospheric moisture, often blankets the ground,sea, and forests, particularly in valleys with wet conditions. ……”作为第二个输入项(Input 2),经由判别器的判断,得到该段落是否作为用户问题对应的数据的判别结果。在判别结果为可以作为用户问题对应的数据(Use Info)的情况下,将用户问题和压缩得到的段落同时作为生成答案的参考信息,否则,在判别结果为不作为用户问题对应的数据(No Info)的情况下,仅将用户问题作为生成答案的参考信息,并经由生成大模型(参考示意框306)进行处理生成相应答案。
回顾以上过程,本说明书的技术构思下提供的基于知识图谱的答案生成方法,可以结合知识图谱为用户问题生成答案。具体地,从用户问题中识别出候选实体,然后根据候选实体从知识图谱中获取相应的候选三元组集。进一步地,利用预先训练的判别模型判断召回的三元组集是否可以用于用户问题对应的数据,并根据判别结果为用户问题生成相应答案。如此,可以灵活利用知识图谱数据,避免过度使用知识图谱数据带来噪声,提高所生成的答案的准确性。
根据另一方面的实施例,还提供一种基于知识图谱的答案生成装置。该装置可以设于具有一定计算能力的计算机、终端、服务器,更具体地,如图1所示的计算平台。图4示出了根据一个实施例的基于知识图谱的答案生成装置400。如图4所示,装置400可以包括:
识别单元401,配置为从用户问题中识别至少一个候选实体;
检索单元402,配置为根据至少一个候选实体,从知识图谱中获取各个候选三元组集;
判别单元403,配置为通过预先训练的判别模型判别各个候选三元组集是否适用于作为用户问题对应的数据,其中,针对单个候选三元组集,判别模型的输入数据基于用户问题以及通过以下方式得到的融合结果确定:通过大模型将其中的各个候选三元组分别进行重写从而转换成各个候选句子;对各个候选句子进行融合,得到融合结果;
生成单元404,配置为基于判别结果,为用户问题生成相应答案。
根据一个实施例,识别单元401进一步配置为:对用户问题进行切词处理,得到多个候选词汇;将各个候选词汇与预设的实体词典进行匹配;根据匹配结果确定至少一个候选实体。
在一些可能的实现中,检索单元402进一步配置为:针对单个候选实体,从多个三元组中检索,并将对应的两个实体中的一个与单个候选实体一致的三元组作为候选三元组加入相应的候选三元组集。
根据一个可能的设计,判别单元403进一步配置为:针对单个候选三元组集:
通过大模型将其中的各个候选三元组分别进行重写从而转换成各个候选句子;
对各个候选句子进行融合,并将融合结果和用户问题一起作为判别模型的输入数据,以供判别模型判别单个候选三元组集是否适用于作为用户问题对应的数据。
在一个实施例中,判别单元403配置为通过以下方式对各个候选句子进行融合:利用总结大模型将各个候选句子生成自然语言描述的文本段落。
根据另一个可能的设计,判别单元403进一步配置为:针对单个候选三元组集,将其中的各个候选三元组的表征向量进行融合,得到相应的单个三元组集表征向量,其中,单个候选三元组中的实体和连接关系分别可以经由节点向量和边向量表示,其表征向量由三元组中的两个实体对应的节点向量及边向量经由拼接、加权求和、加权平均等方式融合在一起得到;将单个三元组集表征向量与用户问题对应的问题表征向量一起作为判别模型的输入数据,以供判别模型判别单个候选三元组集是否适用于作为用户问题对应的数据。
在一个实施例中,假设各个候选三元组集中的任一个记为第一三元组集;则生成单元404进一步配置为:在判别结果包括第一三元组集适用于作为用户问题的数据的情况下,将第一三元组集与用户问题一起经由生成大模型生成相应答案。
值得说明的是,图4所示的装置400与图2描述的方法相对应,图2示出的方法实施例中的相应描述同样适用于装置400,在此不再赘述。
根据另一方面的实施例,还提供一种计算机可读存储介质,其上存储有计算机程序,当上述计算机程序在计算机中执行时,令计算机执行结合图2等所描述的方法。
根据再一方面的实施例,还提供一种计算设备,包括存储器和处理器,该存储器中存储有可执行代码,在处理器执行上述可执行代码时,实现结合图2等所描述的方法。本领域技术人员应该可以意识到,在上述一个或多个示例中,本说明书实施例所描述的功能可以用硬件、软件、固件或它们的任意组合来实现。当使用软件实现时,可以将这些功能存储在计算机可读介质中或者作为计算机可读介质上的一个或多个指令或代码进行传输。
以上所描述的具体实施方式,对本说明书的技术构思的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所描述仅为本说明书的技术构思的具体实施方式而已,并不用于限定本说明书的技术构思的保护范围,凡在本说明书实施例的技术方案的基础之上,所做的任何修改、等同替换、改进等,均应包括在本说明书的技术构思的保护范围之内。
Claims (9)
1.一种基于知识图谱的答案生成方法,所述知识图谱包括多个三元组,单个三元组对应两个实体以及用于描述两个实体之间的关联类型的连接关系;所述方法包括:
从用户问题中识别至少一个候选实体;
根据所述至少一个候选实体,从所述知识图谱中获取各个候选三元组集;
通过预先训练的判别模型判别各个候选三元组集是否适用于作为所述用户问题对应的数据,其中,针对单个候选三元组集,所述判别模型的输入数据基于所述用户问题以及通过以下方式得到的融合结果确定:通过大模型将其中的各个候选三元组分别进行重写从而转换成各个候选句子;对各个候选句子进行融合,得到所述融合结果;
基于判别结果,为所述用户问题生成相应答案。
2.如权利要求1所述的方法,所述从用户问题中识别至少一个候选实体包括:
对用户问题进行切词处理,得到多个候选词汇;
将各个候选词汇与预设的实体词典进行匹配;
根据匹配结果确定所述至少一个候选实体。
3.如权利要求1所述的方法,其中,所述根据所述至少一个候选实体,从所述知识图谱中获取各个候选三元组集包括:
针对单个候选实体,从所述多个三元组中检索,并将对应的两个实体中的一个与所述单个候选实体一致的三元组作为候选三元组加入相应的候选三元组集。
4.如权利要求1所述的方法,其中,所述对各个候选句子进行融合包括:
利用总结大模型将所述各个候选句子生成自然语言描述的文本段落。
5.如权利要求1所述的方法,其中,所述通过预先训练的判别模型判别各个候选三元组集是否适用于作为所述用户问题对应的数据包括:
对单个候选三元组集对应的融合结果和所述用户问题分别进行编码,得到单个候选三元组集表征向量与所述用户问题对应的问题表征向量;
将所述单个候选三元组集表征向量与所述用户问题对应的问题表征向量一起作为所述判别模型的输入数据,以供所述判别模型判别所述单个候选三元组集是否适用于作为所述用户问题的数据。
6.如权利要求1所述的方法,其中,各个候选三元组集包括第一三元组集;所述基于判别结果,为所述用户问题生成相应答案包括:
在所述判别结果包括所述第一三元组集适用于作为所述用户问题对应的数据的情况下,将所述第一三元组集与所述用户问题一起经由生成大模型生成所述答案。
7.一种基于知识图谱的答案生成装置,所述知识图谱包括多个三元组,单个三元组对应两个实体以及用于描述两个实体之间的关联类型的连接关系;所述装置包括:
识别单元,配置为从用户问题中识别至少一个候选实体;
检索单元,配置为根据所述至少一个候选实体,从所述知识图谱中获取各个候选三元组集;
判别单元,配置为通过预先训练的判别模型判别各个候选三元组集是否适用于作为所述用户问题对应的数据,其中,针对单个候选三元组集,所述判别模型的输入数据基于所述用户问题以及通过以下方式得到的融合结果确定:通过大模型将其中的各个候选三元组分别进行重写从而转换成各个候选句子;对各个候选句子进行融合,得到所述融合结果;
生成单元,配置为基于判别结果,为所述用户问题生成相应答案。
8.一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行权利要求1-6中任一项的所述的方法。
9.一种计算设备,包括存储器和处理器,其特征在于,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现权利要求1-6中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410519666.1A CN118132729B (zh) | 2024-04-28 | 2024-04-28 | 基于医疗知识图谱的答案生成方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410519666.1A CN118132729B (zh) | 2024-04-28 | 2024-04-28 | 基于医疗知识图谱的答案生成方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN118132729A CN118132729A (zh) | 2024-06-04 |
CN118132729B true CN118132729B (zh) | 2024-08-16 |
Family
ID=91237850
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410519666.1A Active CN118132729B (zh) | 2024-04-28 | 2024-04-28 | 基于医疗知识图谱的答案生成方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN118132729B (zh) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111949758A (zh) * | 2019-05-16 | 2020-11-17 | 北大医疗信息技术有限公司 | 医疗问答推荐方法、推荐系统和计算机可读存储介质 |
CN114077659A (zh) * | 2021-10-14 | 2022-02-22 | 山东师范大学 | 一种基于邻居交互网络的知识图谱问答方法及系统 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110502621B (zh) * | 2019-07-03 | 2023-06-13 | 平安科技(深圳)有限公司 | 问答方法、问答装置、计算机设备及存储介质 |
CN116057544A (zh) * | 2020-06-07 | 2023-05-02 | 罗杰·密德茂尔 | 使用四值逻辑的定制交互式语言学习系统 |
CN112035637A (zh) * | 2020-08-28 | 2020-12-04 | 康键信息技术(深圳)有限公司 | 医学领域意图识别方法、装置、设备及存储介质 |
EP4102385A1 (en) * | 2021-06-08 | 2022-12-14 | Siemens Aktiengesellschaft | Method and system for automated analysis of industrial cyber-security events |
CN114510558A (zh) * | 2022-01-26 | 2022-05-17 | 北京博瑞彤芸科技股份有限公司 | 一种基于中医知识图谱的问答方法及系统 |
CN116127085A (zh) * | 2022-10-31 | 2023-05-16 | 北京智谱华章科技有限公司 | 一种面向对话式知识图谱问答的问题重写方法及设备 |
CN117574921A (zh) * | 2023-11-27 | 2024-02-20 | 西安电子科技大学 | 一种中文牙科智能诊疗问答方法、电子设备及存储介质 |
CN117688189B (zh) * | 2023-12-27 | 2024-06-14 | 珠江水利委员会珠江水利科学研究院 | 一种融合知识图谱、知识库和大型语言模型的问答系统构建方法 |
-
2024
- 2024-04-28 CN CN202410519666.1A patent/CN118132729B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111949758A (zh) * | 2019-05-16 | 2020-11-17 | 北大医疗信息技术有限公司 | 医疗问答推荐方法、推荐系统和计算机可读存储介质 |
CN114077659A (zh) * | 2021-10-14 | 2022-02-22 | 山东师范大学 | 一种基于邻居交互网络的知识图谱问答方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN118132729A (zh) | 2024-06-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109522553B (zh) | 命名实体的识别方法及装置 | |
CN113672708B (zh) | 语言模型训练方法、问答对生成方法、装置及设备 | |
CN117033608A (zh) | 一种基于大语言模型的知识图谱生成式问答方法及系统 | |
CN114556328B (zh) | 数据处理方法、装置、电子设备和存储介质 | |
CN111209384A (zh) | 基于人工智能的问答数据处理方法、装置及电子设备 | |
CN112287069B (zh) | 基于语音语义的信息检索方法、装置及计算机设备 | |
CN112131883B (zh) | 语言模型训练方法、装置、计算机设备和存储介质 | |
CN106649739B (zh) | 多轮交互信息继承识别方法、装置以及交互系统 | |
CN112613293B (zh) | 摘要生成方法、装置、电子设备及存储介质 | |
CN113761124B (zh) | 文本编码模型的训练方法、信息检索方法及设备 | |
CN116955591A (zh) | 用于内容推荐的推荐语生成方法、相关装置和介质 | |
CN115714030A (zh) | 一种基于疼痛感知和主动交互的医疗问答系统及方法 | |
CN118133971A (zh) | 基于大语言模型的医疗问答方法和装置 | |
CN114510561A (zh) | 答案选择方法、装置、设备及存储介质 | |
CN110852071A (zh) | 知识点检测方法、装置、设备及可读存储介质 | |
CN114330483A (zh) | 数据处理方法及模型训练方法、装置、设备、存储介质 | |
CN111783425B (zh) | 基于句法分析模型的意图识别方法及相关装置 | |
CN117349515A (zh) | 搜索处理方法、电子设备和存储介质 | |
CN118132729B (zh) | 基于医疗知识图谱的答案生成方法及装置 | |
CN116186220A (zh) | 信息检索方法、问答处理方法、信息检索装置及系统 | |
CN113763934A (zh) | 音频识别模型的训练方法、装置和存储介质及电子设备 | |
CN111782762A (zh) | 问答应用中相似问题确定方法、装置、电子设备 | |
CN113505889B (zh) | 图谱化知识库的处理方法、装置、计算机设备和存储介质 | |
CN118132735B (zh) | 医疗规则库的生成方法和装置 | |
CN112597289B (zh) | 问询信息分类方法、模型训练方法、装置和电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |