CN113849613B - 一种食品安全问答推理方法、系统及电子设备 - Google Patents

一种食品安全问答推理方法、系统及电子设备 Download PDF

Info

Publication number
CN113849613B
CN113849613B CN202111081512.1A CN202111081512A CN113849613B CN 113849613 B CN113849613 B CN 113849613B CN 202111081512 A CN202111081512 A CN 202111081512A CN 113849613 B CN113849613 B CN 113849613B
Authority
CN
China
Prior art keywords
food safety
question
answer
reasoning
vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202111081512.1A
Other languages
English (en)
Other versions
CN113849613A (zh
Inventor
史运涛
倪晋超
董哲
王力
李书钦
雷振伍
殷翔
刘大千
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
North China University of Technology
Original Assignee
North China University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by North China University of Technology filed Critical North China University of Technology
Priority to CN202111081512.1A priority Critical patent/CN113849613B/zh
Publication of CN113849613A publication Critical patent/CN113849613A/zh
Application granted granted Critical
Publication of CN113849613B publication Critical patent/CN113849613B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Databases & Information Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Animal Behavior & Ethology (AREA)
  • Human Computer Interaction (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供一种食品安全问答推理方法、系统及电子设备,包括:获取食品安全问题;将所述食品安全问题输入至食品安全问答推理模型中,得到所述食品安全问答推理模型输出的食品安全问题的答案;其中,所述食品安全问答推理模型基于食品安全知识图谱和食品安全问答陈述向量训练得到;所述食品安全问答陈述向量通过将关于食品的安全问题的问题概念向量和与所述安全问题对应的答案的答案概念向量进行拼接得到。该方法用以解决现有技术中针对食品安全问题的回答准确度低的缺陷,通过将食品安全问题输入基于食品安全知识图谱和食品安全问答陈述向量训练得到的食品安全问答推理模型中,输出对应于所述食品安全问题精确度显著提高的答案。

Description

一种食品安全问答推理方法、系统及电子设备
技术领域
本发明涉及食品安全技术领域,尤其涉及一种食品安全问答推理方法、系统及电子设备。
背景技术
基于知识图谱的智能问答其核心在于对用户提出问题的语义的理解,也就是如何使计算机理解人类多样化、非结构化的问题表达。目前在语义网相关的问答系统方面的主要研究思路大多是基于模板的自动问答方法,即通过对用户输入自然语言的解析来生成SPARQL模板,然后将模板实例化获取查询结果。
知识图谱推理的实质是利用已有的知识来推断出新的或未知的知识,建立实体间新的关系,从而拓展和丰富知识图谱的网络结构。近年来,面向知识图谱的知识推理随着分布式表示、神经网络等技术的流行,已发展出独有的推理方法,根据推理类型划分,分为单步推理和多步推理。每类再根据方法划分,又包括基于规则的推理、基于分布式表示的推理、基于神经网络的推理以及混合推理。在食品安全研究方面,常见的用于食品安全知识推理的方法主要是基于规则的推理与基于逻辑的推理两种类别,例如已知(毒害物A,高风险,食品A)和(食品A,同类,食品B),可以推理出(毒害物A,高风险,食品B)。
然而,目前在食品安全问答系统方面的研究较少,且存在回答效果差、性能低下等问题。
例如:在展现形式上,现有的食品安全问答系统大都通过匹配问题模板的方式实现问题和答案的配对。即首先提取出问题中的关键词,通过解析结果匹配相应的问题模板并转换成相应的查询语句提交给服务器,最后从食品知识库中将匹配到的问题模板的答案返回展示给用户。这种方式需要人为定义模板,通过标注每个模板所对应知识图谱中的属性来完成属性关联,数量有限,难以覆盖表达多样的食品安全问题;同时模板答案多以大段文字文本输出,没有对相应知识做进一步处理,大大降低了对食品安全相关问题回答的效率。
在推理方法上,一方面,现有的食品安全智能问答中采用传统的基于规则推理方法和基于逻辑的推理方法,虽具有较高的准确率,但是无法获取全面的规则和本体约束,面对不断复杂的食品安全知识库,逻辑规则模型中使用的图算法计算复杂度高,可扩展性差,缺乏灵活性;另一方面,现有的食品安全智能问答大都采用单步推理方法,采用直接关系即知识图谱中的事实元组进行学习和推理,没有考虑路径特征。然而,面对日益增长的食品安全知识以及复杂多变的食品安全问题,实体间的连接关系类型多且杂,采用单步推理很难学习到知识图谱深层次的信息,推理算法对实体间的关系预测难以提供合理的解释,不能有效地解决多条复杂问题。
发明内容
本发明提供一种食品安全问答推理方法、系统及电子设备及系统,用以解决现有技术中针对食品安全问题的回答准确度低的缺陷,通过将食品安全问题输入基于食品安全知识图谱和食品安全问答陈述向量训练得到的食品安全问答推理模型中,输出对应于所述食品安全问题精确度显著提高的答案。
本发明提供一种食品安全问答推理方法,包括:
获取食品安全问题;
将所述食品安全问题输入至食品安全问答推理模型中,得到所述食品安全问答推理模型输出的食品安全问题的答案;
其中,所述食品安全问答推理模型基于食品安全知识图谱和食品安全问答陈述向量训练得到;所述食品安全问答陈述向量通过将关于食品的安全问题的问题概念向量和与所述安全问题对应的答案的答案概念向量进行拼接得到。
根据本发明所述的食品安全问答推理方法,所述食品安全知识图谱为对经预处理后的不同数据源获取的食品基础数据进行本体模型构建,确定知识图谱所需要的实体类型、关系类型以及属性类型后,根据实体类型、关系特征和属性特征构建的食品安全知识图谱。
根据本发明所述的食品安全问答推理方法,所述将所述食品安全问题输入至食品安全问答推理模型中,得到所述食品安全问答推理模型输出的食品安全问题的答案,具体包括:
所述食品安全问答推理模型的提取层将所述食品安全问题和针对所述食品安全问题可能的答案构建为陈述向量,并根据所述食品安全知识图谱提取所述食品安全问题中涉及的食品的实体信息;
所述食品安全问答推理模型的模式图构建层根据所述实体信息,通过图卷积神经网络由所述食品安全知识图谱中抽取并学习与所述食品安全问题关联的所有答案的问题答案对的多跳路径,并结合所述陈述向量构建推理模式图;
所述食品安全问答推理模型的多跳推理层利用所述推理模式图中的答案节点的特征向量与所述食品安全问答陈述向量拼接构成问题答案对向量,并由所述问题答案对向量计算得到各个路径序列的合理分数并输出;
所述食品安全问答推理模型的输出层将所述合理分数最大的问题答案对向量对应的答案作为所述食品安全问题的答案输出。
根据本发明所述的食品安全问答推理方法,所述模式图构建层根据所述实体信息,通过图卷积神经网络由所述食品安全知识图谱中抽取并学习与所述食品安全问题关联的所有答案的问题答案对的多跳路径后,结合所述陈述向量构建推理模式图,具体包括:
利用路径搜索从所述食品安全知识图谱中抽取与所述食品安全问题关联的所有答案的问题答案对的多跳路径;
通过图卷积神经网络学习所述多跳路径中的实体和关系特征嵌入,得到新的实体特征嵌入表示;
将所述新的实体特征嵌入表示所对应的问题答案对间的多条多跳路径构成推理模式图。
根据本发明所述的食品安全问答推理方法,所述多跳推理层利用所述推理模式图中的答案节点的特征向量与所述食品安全问答陈述向量拼接构成问题答案对向量前,还包括:
所述食品安全问答推理模型的概率注意力机制层对所述推理模式图中不同长度的所述多跳路径分配权重等级,用概率模型对多跳路径的权重进行建模,并计算出不同所述多跳路径序列的注意力分数后,依据所述注意力分数更新所述推理模式图中输出节点的特征嵌入表示,得到所述答案节点的特征向量。
根据本发明所述的食品安全问答推理方法,所述利用所述推理模式图中的答案节点的特征向量与所述食品安全问答陈述向量拼接构成问题答案对向量,并由所述问题答案对向量计算得到各个路径序列的合理分数,具体包括:
聚合依据所述注意力分数更新后的所述推理模式图中的不同长度的多跳路径,并通过非线性激活获得更新后的所有输出节点的嵌入向量表示;
将更新后的所有输出节点的嵌入向量表示和原实体特征嵌入表示再次学习,并使用shortcut连接和非线性激活获得最终的输出节点嵌入表示,即所述推理模式图中答案节点的特征向量表示;
由所有答案节点的特征向量构成整个所述推理模式图的特征向量表示;
将整个推理模式图的特征向量表示和陈述向量拼接构成问题答案对向量,利用多层感知器对所述问题答案对向量进行计算得到各个路径序列的合理分数。
根据本发明所述的食品安全问答推理方法,所述利用多层感知器对所述问题答案对向量进行计算得到各个路径序列的合理分数,还包括:
通过构造交叉熵损失函数,训练出最小化交叉熵损失函数的参数矩阵,使对应于所述食品安全问题的答案的路径序列的似然性分数最大化。
本发明还提供一种食品安全问答推理系统,包括:
问题获取模块,用于获取食品安全问题;
问题解答模块,用于将所述食品安全问题输入至食品安全问答推理模型中,得到所述食品安全问答推理模型输出的食品安全问题的答案;
其中,所述食品安全问答推理模型基于食品安全知识图谱和食品安全问答陈述向量训练得到;所述食品安全问答陈述向量通过将关于食品的安全问题的问题概念向量和与所述安全问题对应的答案的答案概念向量进行拼接得到。
本发明还提供一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一项所述食品安全问答推理方法的步骤。
本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上述任一项所述食品安全问答推理方法的步骤。
本发明提供的一种食品安全问答推理方法、系统及电子设备及系统,通过将获取的食品安全问题输入基于食品安全知识图谱和食品安全问答陈述向量训练得到的食品安全问答推理模型中,得到针对于所述食品安全问题的答案,即从图即食品安全知识图谱和语义即食品安全问答陈述向量,两个角度推理出问题答案对的路径,使得获得的针对于所述食品安全问题的答案精确度更高。
附图说明
为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明提供的一种食品安全问答推理方法的流程示意图之一;
图2是本发明提供的食品安全知识图谱的一个本体模型示意图;
图3是本发明提供的一个食品安全知识图谱的示例图;
图4是本发明提供的一种食品安全问答推理方法的框架流程示意图;
图5是本发明提供的食品安全问答推理模型的构建流程图;
图6是本发明提供的一种食品安全问答推理系统的结构示意图;
图7是本发明提供的电子设备的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
下面结合图1至图5描述本发明的食品安全问答推理方法,如图1所示,该方法具体包括以下步骤:
101、获取食品安全问题;
102、将所述食品安全问题输入至食品安全问答推理模型中,得到所述食品安全问答推理模型输出的食品安全问题的答案;
其中,所述食品安全问答推理模型基于食品安全知识图谱和食品安全问答陈述向量训练得到;所述食品安全问答陈述向量通过将关于食品的安全问题的问题概念向量和与所述安全问题对应的答案的答案概念向量进行拼接得到。
具体地,食品安全事件主要是指由于食品安全风险的发生而导致的事故,如食物中毒、食源性疾病等,其风险来源广泛,但从食品本身出发,主要有:食品本身含有的和外来侵入的各种风险因子,包括各种毒素、重金属、农兽药残留、添加剂等;食品由于存储不当而发生霉变,产生大量危险物质。
在食品安全中,食品原材料、食品检测项目、食品安全事件、企业机构之间具有因交互耦合而产生风险的特点,因此可以从不同数据源获取大量食品安全原始的半结构化和结构化数据,构建食品安全知识图谱,从而使食品安全知识图谱能够反映与食品安全有关的各个因素间的关联。
食品安全问答陈述向量将由多选问题中提取出的问题概念和答案概念,用文本编码器进行编码得到的问题向量和答案概念向量进行拼接得到。
更具体地,针对所提的食品安全相关问题,首先把问题中的疑问词(如what,where,how等)用空格代替,然后将备选答案选项逐一带入到问题中空格所在位置,得到食品问答的陈述表达s,而后,用bert语言编码模型将文本陈述表达转换成向量。例如,已知问题q={What is the risk level of adding cadmium to wheat flour?},答案a={High,Middle,Low};则拼接后的陈述表达s={s1={High is the risk level of addingcadmium to wheat flour},s2={High is the risk level of adding cadmium towheat flour},s3={High is the risk level of adding cadmium to wheat flour}}。
这种拼接方式对所提的食品安全问题的问答进行建模,构建问答陈述表达,充分考虑到了所提问题与答案之间的常识性语义关系。因而,通过将食品安全问答陈述向量应用于食品安全问答推理模型的训练中,从图和语义两个角度推理出问题答案对的路径,使得获得的食品安全问题的答案精确度更高。
在本发明的一个实施例中,所述食品安全知识图谱为对经预处理后的不同数据源获取的食品基础数据进行本体模型构建,确定知识图谱所需要的实体类型、关系类型以及属性类型后,根据实体类型、关系特征和属性特征构建的食品安全知识图谱。
具体地,在食品安全知识图谱的构建中,通过综合考虑导致食品安全风险事件的各种风险因素,可以从不同数据源获取食品基础数据,以保证图谱的对食品安全因素的覆盖范围,例如,基础数据可以包括食品抽检数据、食品中可添加危险毒害物数据、限量标准数据以及风险因子数据等,而后,如图2所述根据不同类型的数据信息,对食品安全知识图谱进行本体建模,以确定知识图谱所需要的实体类型、关系类型以及属性类型,从而使得构建的食品安全知识图谱具有多实体类型和多关系类型的特点,同时还能使不同的实体类型具有不同维度的属性特征。其中,知识图谱实体类型包括食品类别、食品名称、检测项目、检测结果等;关系类型主要有属于、生产、检测、含有、病理、购买、监察等;属性类型主要有生产时间、生产地址、发病速率、毒力危害、检测含量及检测标准等。
更具体地,在一个实例中,可以将所构建的食品安全知识图谱实体类型集合设为X={食品类别(FT)、食品名称(FN)、检测项目(TI)、检测结果(TR)、机构企业(OU)、食品安全事件(FC)}。根据各自不同实体类型又可以细分为具体的实体,其中食品类别可以根据食品安全国家标准(GB760—2014)主要分为市场上常见的13大类,即FT={蔬菜(FT1)、果品(FT2)、鲜肉(FT3)、禽蛋及其制品(FT4)、水产品(FT5)、调味品(FT6)、粮食及加工品(FT7)、食用油(FT8)、饮料(FT9)、干果(FT10)、糕点(FT11)、蜜饯果脯(FT12)、豆制品(FT13)};食品名称FN={食品大类中的具体食品名称FNi,其中i为具体的食品大类};检测项目TI={食品添加剂(TI1)、农药残留(TI2)、兽药残留(TI3)、重金属(TI4)、微生物(TI5)、理化特性(TI6)、生物毒素(TI7)};检测结果TR为某食品含有某种危害物的风险等级;机构企业OU={生产企业(OU1),市场监督管理局(OU2),检测部门(OU3)};食品安全事件FC={食品中毒(FC1)、食源性疾病(FC2)、食品污染(FC3)}。
关系类型可以设为主要包括食品名称和食品类别之间的属于关系(r1);生产企业和食品之间的生产关系(r2);食品和检测项目之间的检测关系(r3);监管单位与食品生产企业之间的监查关系(r4);食品和检测项目之间的含有关系(r5);各类食品与食品安全事件之间的病理关系(r6)等,其关系类型集合E={r1,r2,r3,r4,r5,r6,....}。
属性类型可以设为(AT)={生产时间(AT1)、生产地址(AT2)、发病速率(AT3)、毒力危害(AT4)、检测含量(AT5)及检测标准(AT6)等}。
最后,根据上述实例中的实体、关系和属性构建的食品安全知识图谱如图3所示。
而根据以上各种风险产生的特点,为如图3所示的食品安全知识图谱中的每个实体构建不同维度的实体属性特征向量,如食品名称(FN)={生产时间,生产地址,生产企业,规格型号,检测机构,抽检等级等},食品添加剂(TI1)={毒力危害,发病速率,病理特征等}。具体的实体类型、名称及相关特征属性总结如表1所示。
表1 本发明实例的食品安全知识图谱实体总结表
Figure BDA0003264217370000101
在本发明的另一个实施例中,所述将所述食品安全问题输入至食品安全问答推理模型中,得到所述食品安全问答推理模型输出的食品安全问题的答案,具体包括:
所述食品安全问答推理模型的提取层将所述食品安全问题和针对所述食品安全问题可能的答案构建为陈述向量,并根据所述食品安全知识图谱提取所述食品安全问题中涉及的食品的实体信息;
所述食品安全问答推理模型的模式图构建层根据所述实体信息,通过图卷积神经网络由所述食品安全知识图谱中抽取并学习与所述食品安全问题关联的所有答案的问题答案对的多跳路径,并结合所述陈述向量构建推理模式图;
所述食品安全问答推理模型的多跳推理层利用所述推理模式图中的答案节点的特征向量与所述食品安全问答陈述向量拼接构成问题答案对向量,并由所述问题答案对向量计算得到各个路径序列的合理分数并输出;
所述食品安全问答推理模型的输出层将所述合理分数最大的问题答案对向量对应的答案作为所述食品安全问题的答案输出。
具体地,首先,食品安全问答推理模型的提取层将所述食品安全问题和针对所述食品安全问题可能的答案构建为陈述向量,并根据食品安全知识图谱提取食品安全问题中涉及的食品的实体信息,作为利用所述食品安全问答推理模型进行食品安全问题的答案推理的基础,而食品安全知识图谱具有多实体类型和多关系类型的特点,且不同的实体类型还具有不同维度的实体属性特征,因此在获得了食品安全问题中涉及的食品的实体信息后,可以直接在食品安全知识图谱上对所提的食品安全问题进行问题到答案的路径推理,例如,“番茄中乙烯利的残留量是2.3mg/kg对人体伤害的风险高吗?”参照如图3所示的食品安全知识图谱,番茄属于蔬菜及其制品大类,鲜菜1这一小类,则可以得到问题到答案的路径:“鲜菜1-防腐剂1-毒力危害中”、“鲜菜1-防腐剂1-发病速率中”、“鲜菜1-防腐剂1-病理特征”、“鲜菜1-生产时间”、“鲜菜1-蔬菜及其制品”……其中出现了大量中间实体和关系,路径序列冗余且存在大量的无效路径,大大降低了路径推理的效率和精度,因此,在获得了食品实体信息和陈述向量后,通过模式图构建层根据所述实体信息,通过图卷积神经网络由所述食品安全知识图谱中抽取并学习与所述食品安全问题关联的所有答案的问题答案对的多跳路径,并结合所述陈述向量构建推理模式图,从而形成实体类型和关系相对较少的推理模式图,以利于提高路径推理的效率和精度。
然后,在提取出推理模式图的基础上,在多跳推理层上将推理模型转化为测量问题和每个答案选项之间的合理性得分模型,即计算问题答案对向量的合理分数,最后由输出层将合理分数最大的问题答案对向量对应的答案作为所述食品安全问题的答案输出。
本发明基于构建的食品安全知识图谱和食品安全陈述向量构建食品安全智能问答推理模型,设定智能问答的展现形式为多选问题,推理的任务就是找到所提问题的最佳答案。通过多跳路径推理的方式,从语义和图两个角度推理出问题答案对之间最短的路径,从而找到所提问题的最佳答案。
需要说明的是,多跳路径序列具有可被解码的特性,因而通过与所述食品安全问题关联的所有答案的问题答案对的多跳路径结合陈述向量构建推理模式图后,有推理模式图中找到该食品安全问题的答案的过程是可以被复现的,即将问题实体是如何到答案实体的过程进行呈现,例如:问题实体Q1的答案是A1,那么复现的就是(Q1→M1,M1→M2,…,Mn→Mn+1,Mn+1→A1),其中M1、M2、…、Mn和Mn+1是中间实体,这样就可以将找到答案的过程显示出来,所以,本发明可以将每对问题答案对之间的推理路径进行解码,反向复现模型预测的全过程,使模型的整个推理过程具有可解释性,为食品安全风险态势的研判提供较为合理的理论支持,积极促进对食品态势的预警把控,避免食品安全事件的发生。
进一步地,本发明的多跳推理层还利用推理模式图中的答案节点的特征向量与食品安全问答陈述向量拼接构成问题答案对向量,可以理解的是,答案节点的特征向量是通过图卷积神经网络学习得到的,即是由图的角度得到问题和答案之间的关联,而陈述向量是将答案直接带入问题中得到的,是从上下文语义的角度考虑问题和答案之间的关联,因而通过将答案节点的特征向量与食品安全问答陈述向量拼接构成问题答案对向量,是从图(符号)和语义两个角度,考虑问题和答案之间的联系,而不是单纯的通过图神经网络学习问题答案对的路径序列特征嵌入来体现,通过两者拼接后的向量得到的最佳答案更准确可靠,具有更强的说服力。
在本发明的另一个实施例中,所述模式图构建层根据所述实体信息,通过图卷积神经网络由所述食品安全知识图谱中抽取并学习与所述食品安全问题关联的所有答案的问题答案对的多跳路径后,结合所述陈述向量构建推理模式图,具体包括:
利用路径搜索从所述食品安全知识图谱中抽取与所述食品安全问题关联的所有答案的问题答案对的多跳路径;
通过图卷积神经网络学习所述多跳路径中的实体和关系特征嵌入,得到新的实体特征嵌入表示;
将所述新的实体特征嵌入表示所对应的问题答案对间的多条多跳路径构成推理模式图。
具体地,通过图卷积神经网络学习利用路径搜索从所述食品安全知识图谱中抽取与所述食品安全问题关联的所有答案的问题答案对的多跳路径,即学习了基于特定多跳路径下的邻居实体以及相应关系的特征嵌入,从而更好地聚合目标节点特征信息,提高推理的精度和效率。
更具体地,所述推理模式图的构建过程为:
先将食品安全知识图谱由GFsKG=(V,E)表示,其中,V={v1,v2,...,vN}表示实体集合,N为实体的个数;E={r1,r2,...,rm}表示关系集合,m为关系的个数;知识图谱实体类型集合由τ={τ1,τ2,...,τn},n表示实体类型的个数。
为了便于向量运算,首先需要把不同类型的实体特征映射到统一维度的特征空间中,通过对输入节点特征进行特定节点类型的线性变换,可以完成在任意实体类型下的特征聚合的向量运算,计算方式如下:
Figure BDA0003264217370000141
其中,
Figure BDA0003264217370000142
表示目标实体i初始的特征向量表示,
Figure BDA0003264217370000143
表示实体i经过线性变换后新的特征矩阵向量表示,U和b为可学习的参数矩阵,φ(i)表示目标实体i的实体类型。
然后,通过图神经网络来学习基于特定多跳路径下与目标实体相邻的实体以及相应关系的特征嵌入,并将它们进行聚合,得到特定多跳路径下的目标实体特征嵌入向量表示。
以多跳路径Pi,j[k]为例,通过循环图卷积神经网络RGCN对路径序列中的实体特征向量表示进行学习的计算方式如下:
Figure BDA0003264217370000144
其中,
Figure BDA0003264217370000145
为问题实体初始特征向量表示;
Figure BDA0003264217370000146
为经过RGCN学习后输出实体节点的特征向量表示(聚合了实体特征和关系特征);Pi,j[k]为i实体经过k跳到达j实体的路径,
Figure BDA0003264217370000147
表示对所有的路径的权重做平均化;
Figure BDA0003264217370000148
为t跳r关系的学习训练的参数矩阵,K为多跳路径的长度上限。
式2得到实体节点j在k跳路径下的特征向量表示,将不同长度的路径进行聚合得到实体节点j的特征聚合表示为:
Figure BDA0003264217370000151
其中,
Figure BDA0003264217370000152
为陈述向量,bilinear为双线性函数,softmax为非线性函数。
基于食品安全知识图谱,通过构建问题和答案之间的多跳路径,利用神经网络模型学习出路径中的实体和关系特征嵌入,得到新的实体特征嵌入表示,多条问题答案对之间的多跳路径构成了推理模式图
Figure BDA0003264217370000153
得到的推理模式图由三元组
Figure BDA0003264217370000154
表示,其中,v表示推理模式图的实体集合,且
Figure BDA0003264217370000155
ε表示推理模式图中实体之间的关系集合,且
Figure BDA0003264217370000156
Figure BDA0003264217370000157
是实体v到实体类型Γ的映射函数,
Figure BDA0003264217370000158
Figure BDA0003264217370000159
i∈V表示当节点i为问题中的实体时,输出为Eq;当节点i为答案中的实体时,输出为Ea;否则输出为EO
在食品安全问答系统中涉及到不同多跳路径下复杂的语义信息,对于某个具体的食品安全问题,每对问题答案对在不同关系路径下所含的信息不同,因此对推理正确答案的重要程度也不同。针对不同的食品安全问题,总会存在一些多跳路径比其他多跳路径更重要,所以将各条多跳路径的权重均看成是一样的,显然是不合理的,因而,在本发明的另一个实施例中,在所述多跳推理层利用所述推理模式图中的答案节点的特征向量与所述食品安全问答陈述向量拼接构成问题答案对向量前,还包括:
所述食品安全问答推理模型的概率注意力机制层对所述推理模式图中不同长度的所述多跳路径分配权重等级,用概率模型对多跳路径的权重进行建模,并计算出不同所述多跳路径序列的注意力分数后,依据所述注意力分数更新所述推理模式图中输出节点的特征嵌入表示,得到所述答案节点的特征向量。
具体地,本发明通过概率注意力机制层的构建,对不同长度的多跳推理路径分配权重等级,将重要的路径序列选择性地聚集起来,使得推理的结果更具有说服力。
更具体地,在模式图构建层中加入概率注意力机制后,通过多跳路径序列的注意力分数得到更新后的多跳路径的具体实现过程可以为:
首先把注意力分数看成陈述向量
Figure BDA0003264217370000161
前提下的概率,即:
Figure BDA0003264217370000162
采用条件随机场来对式4进行计算:
Figure BDA0003264217370000163
其中,∝表示正比于;f(·)、δ(·)和g(·)为两层参数化的多层感知器;τ(·)为m×m的转移矩阵;β(·)表示关系类型注意力模型,β(r1,...,rk,s)表示关系类型注意力分数;γ(·)表示节点类型注意力模型,γ(r1,...,rk,s)表示节点类型注意力分数。
经过加入了概率注意力机制的推理模式图构建层输出是多条更新后的多跳问题答案对路径,且每条路径具有合理的权重。结合式3和式5,对加入概率注意力机制后更新的三元组路径序列的实体节点特征进行聚合,得到不同长度下实体节点i在k跳路径下的特征表示为:
Figure BDA0003264217370000164
其中,
Figure BDA0003264217370000165
为不同路径的注意力系数;
Figure BDA0003264217370000166
为k跳i实体的路径数。
在本发明的另一个实施例中,所述利用所述推理模式图中的答案节点的特征向量与所述食品安全问答陈述向量拼接构成问题答案对向量,并由所述问题答案对向量计算得到各个路径序列的合理分数,具体包括:
聚合依据所述注意力分数更新后的所述推理模式图中的不同长度的多跳路径,并通过非线性激活获得更新后的所有输出节点的嵌入向量表示;
将更新后的所有输出节点的嵌入向量表示和原实体特征嵌入表示再次学习,并使用shortcut连接和非线性激活获得最终的输出节点嵌入表示,即所述推理模式图中答案节点的特征向量表示;
由所有答案节点的特征向量构成整个所述推理模式图的特征向量表示;
将整个推理模式图的特征向量表示和陈述向量拼接构成问题答案对向量,利用多层感知器对所述问题答案对向量进行计算得到各个路径序列的合理分数。
具体地,经过所述食品安全问答推理模型的模式图构建层和概率注意力机制层后,输出得到更新后的特定三元组路径序列实体节点特征。将不同长度的所有路径进行聚合,再通过非线性激活来获得输出节点的嵌入,得到加入注意力机制后的所有的输出节点的嵌入向量
Figure BDA0003264217370000171
为:
Figure BDA0003264217370000172
其中,
Figure BDA0003264217370000173
为更新后的不同长度下实体节点j在k跳路径下的特征表示,
Figure BDA0003264217370000174
为陈述向量,bilinear(·)为双线性函数,softmax(·)为非线性激活函数。
将学习后得到的输出实体节点嵌入和节点原始特征嵌入再做一次学习,使用shortcut连接和非线性激活来获得最终的输出节点嵌入:
Figure BDA0003264217370000175
其中,h′为最终的输出节点嵌入表示;
Figure BDA0003264217370000176
为可学习的参数矩阵;LeakyReL为非线性函数。
由式8得到的输出节点嵌入即为模式图中答案节点的特征向量表示,所有答案节点的特征向量就构成整个模式图的特征向量表示,记为
Figure BDA0003264217370000181
Figure BDA0003264217370000182
和陈述向量
Figure BDA0003264217370000183
拼接起来,用两层图神经网络来计算问题答案对之间路径序列的可信度分数:
Figure BDA0003264217370000184
其中,MLP为多层感知器,这里采用的是层数为两层的图神经网络;
Figure BDA0003264217370000185
表示两个向量的横向拼接。
在本发明的另一个实施例中,所述利用多层感知器对所述问题答案对向量进行计算得到各个路径序列的合理分数,还包括:
通过构造交叉熵损失函数,训练出最小化交叉熵损失函数的参数矩阵,使对应于所述食品安全问题的答案的路径序列的似然性分数最大化。
具体地,在两层图神经网络计算训练过程中,通过构造交叉熵损失函数,训练出最适合的参数矩阵来最小化如式10所示的交叉熵损失函数,使正确答案
Figure BDA0003264217370000186
的似然性分数最大化:
Figure BDA0003264217370000187
其中,E[·]表示求取期望值;C为实体集合。
更具体地,如图4所示,本发明的一种食品安全问答推理方法在框架流程上划分,可以分为四个步骤,即:
401、由食品安全知识图谱和食品安全多选问题提取问题概念向量和答案向量,以及通过Bert文本编码器生成陈述向量;
402、以陈述向量为前提,利用图神经网络算法和路径搜索的方式从食品安全知识图谱中抽取并学习所有问题答案对之间的路径,构建推理模式图;
403、加入概率注意力机制,对不同长度的多跳推理路径分配权重等级,用概率模型对路径的权重建模并计算出不同路径序列的注意力分数;
404、将推理转化为测量问题和每个答案选项之间的合理性得分模型,利用多层感知器计算问题答案对的合理分数,而后构造交叉熵损失函数,将计算问题答案对分数的过程转化为交叉熵损失函数的最优化问题并通过动态规划方法求解最优化问题,来达到最大化正确答案的合理分数值的目标。
可以理解的是,本发明所述的食品安全问答推理方法基于食品安全问答推理模型实现,所述食品安全问答推理模型的构建过程实质上与食品安全问答推理方法的流程类似,所以该食品安全问答推理模型的构建过程如图5所示,即具体包括:
501、流程开始;
502、输入食品安全知识图谱和食品安全问题陈述向量;
503、对输入节点特征进行特定节点类型的线性变化;
504、通过图卷积神经网络对多跳路径传递中的实体特征向量表示进行学习;
505、聚合学习后的多条多跳特征嵌入向量,构成模型的推理模式图;
506、用概率图模型对多跳路径上的注意力分数建模;
507、采用条件随机场计算注意力分数概率模型;
508、为不同长度路径分配权重,得到加入多跳注意力机制后三元组路径序列;
509、聚合不同长度的多跳路径,并将神经网络的输出与原始特征进行二次聚合,获得最终的推理模式图节点向量表示;
510、将推理模式图节点向量表示和陈述向量拼接,用多层感知器计算问题答案对之间路径序列的可信度分数;
511、构造交叉熵损失函数通过动态规划的方法来求解上述函数,得到使得正确答案的似然性分数最大的参数矩阵;
512、得到所提食品安全问题的最佳答案,以及解码后的推理路径;
513、流程结束。
本发明提出了一种食品安全问答推理方法,首先构建食品安全知识图谱,再利用基于构建的食品安全知识图谱,利用图神经网络、概率注意力机制以及多跳关系网络构建的食品安全问答推理模型对食品安全问题的答案进行推理。
本发明的食品安全问题推理方法将上下文语义关系贯穿整个推理的过程,从语义和图两个角度推理出问题答案对之间最短的路径,提取出模式图从而找到所提问题的最佳答案,推理速度更快、精确度更高。
同时,对推理路径序列之间的重要性进行分级,对于不同的多跳路径,采用概率图模型来建模,将重要的路径向量选择性地聚集起来,使得推理的结果更具有说服力。
另外,本发明可以将每对问题答案对之间的推理路径进行解码,复现模型预测的全过程,使模型的整个推理过程具有相当的高效性和可解释性,为食品安全风险态势的研判提供较为合理的理论支持,积极促进对食品态势的预警把控,避免食品安全事件的发生。
下面结合图6对本发明提供的一种食品安全问答推理系统进行描述,下文描述的食品安全问答推理系统与上文描述的食品安全问答推理方法可相互对应参照。
该系统包括问题获取模块610和问题解答模块620;其中,
问题获取模块610用于获取食品安全问题;
问题解答模块620用于将所述食品安全问题输入至食品安全问答推理模型中,得到所述食品安全问答推理模型输出的食品安全问题的答案;
其中,所述食品安全问答推理模型基于食品安全知识图谱和食品安全问答陈述向量训练得到;所述食品安全问答陈述向量通过将关于食品的安全问题的问题概念向量和与所述安全问题对应的答案的答案概念向量进行拼接得到。
具体地,该系统通过将获取的食品安全问题输入基于食品安全知识图谱和食品安全问答陈述向量训练得到的食品安全问答推理模型中,得到针对于所述食品安全问题的答案,即从图即食品安全知识图谱和语义即食品安全问答陈述向量,两个角度推理出问题答案对的路径,使得获得的针对于所述食品安全问题的答案精确度更高。
可以理解的是,在一个实施例中,所述食品安全知识图谱为对经预处理后的不同数据源获取的食品基础数据进行本体模型构建,确定知识图谱所需要的实体类型、关系类型以及属性类型后,根据实体类型、关系特征和属性特征构建的食品安全知识图谱。
在另一个实施例中,所述问题解答模块620将所述食品安全问题输入至食品安全问答推理模型中,得到所述食品安全问答推理模型输出的食品安全问题的答案,具体包括:
所述食品安全问答推理模型的提取层将所述食品安全问题和针对所述食品安全问题可能的答案构建为陈述向量,并根据所述食品安全知识图谱提取所述食品安全问题中涉及的食品的实体信息;
所述食品安全问答推理模型的模式图构建层根据所述实体信息,通过图卷积神经网络由所述食品安全知识图谱中抽取并学习与所述食品安全问题关联的所有答案的问题答案对的多跳路径,并结合所述陈述向量构建推理模式图;
所述食品安全问答推理模型的多跳推理层利用所述推理模式图中的答案节点的特征向量与所述食品安全问答陈述向量拼接构成问题答案对向量,并由所述问题答案对向量计算得到各个路径序列的合理分数并输出;
所述食品安全问答推理模型的输出层将所述合理分数最大的问题答案对向量对应的答案作为所述食品安全问题的答案输出。
在另一个实施例中,所述问题解答模块620还利用路径搜索从所述食品安全知识图谱中抽取与所述食品安全问题关联的所有答案的问题答案对的多跳路径;
通过图卷积神经网络学习所述多跳路径中的实体和关系特征嵌入,得到新的实体特征嵌入表示;
将所述新的实体特征嵌入表示所对应的问题答案对间的多条多跳路径构成推理模式图。
在另一个实施例中,所述问题解答模块620还用于通过所述食品安全问答推理模型的概率注意力机制层对所述推理模式图中不同长度的所述多跳路径分配权重等级,用概率模型对多跳路径的权重进行建模,并计算出不同所述多跳路径序列的注意力分数后,依据所述注意力分数更新所述推理模式图中输出节点的特征嵌入表示,得到所述答案节点的特征向量。
在另一个实施例中,所述问题解答模块620还用于聚合依据所述注意力分数更新后的所述推理模式图中的不同长度的多跳路径,并通过非线性激活获得更新后的所有输出节点的嵌入向量表示;
将更新后的所有输出节点的嵌入向量表示和原实体特征嵌入表示再次学习,并使用shortcut连接和非线性激活获得最终的输出节点嵌入表示,即所述推理模式图中答案节点的特征向量表示;
由所有答案节点的特征向量构成整个所述推理模式图的特征向量表示;
将整个推理模式图的特征向量表示和陈述向量拼接构成问题答案对向量,利用多层感知器对所述问题答案对向量进行计算得到各个路径序列的合理分数。
在另一个实施例中,所述问题解答模块620还用于通过构造交叉熵损失函数,训练出最小化交叉熵损失函数的参数矩阵,使对应于所述食品安全问题的答案的路径序列的似然性分数最大化。
本发明实施例提供的食品安全问答推理系统用于签署各实施例的食品安全问答推理方法、系统及电子设备。该食品安全问答推理系统包括的各模块实现相应功能的具体方法和流程详见上述食品安全问答推理方法的实施例,此处不再赘述。
本发明的食品安全问答推理系统用于前述各实施例的食品安全问答推理方法。因此,在前述各实施例中的食品安全问答推理方法中的描述和定义,可以用于本发明实施例中各执行模块的理解。
图7示例了一种电子设备的实体结构示意图,如图7所示,该电子设备可以包括:处理器(processor)710、通信接口(Communications Interface)720、存储器(memory)730和通信总线740,其中,处理器710,通信接口720,存储器730通过通信总线740完成相互间的通信。处理器710可以调用存储器730中的逻辑指令,以执行食品安全问答推理方法,该方法包括:
101、获取食品安全问题;
102、将所述食品安全问题输入至食品安全问答推理模型中,得到所述食品安全问答推理模型输出的食品安全问题的答案;
其中,所述食品安全问答推理模型基于食品安全知识图谱和食品安全问答陈述向量训练得到;所述食品安全问答陈述向量通过将关于食品的安全问题的问题概念向量和与所述安全问题对应的答案的答案概念向量进行拼接得到。
此外,上述的存储器730中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
另一方面,本发明还提供一种计算机程序产品,所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,计算机能够执行上述各方法所提供的食品安全问答推理方法,该方法包括:
101、获取食品安全问题;
102、将所述食品安全问题输入至食品安全问答推理模型中,得到所述食品安全问答推理模型输出的食品安全问题的答案;
其中,所述食品安全问答推理模型基于食品安全知识图谱和食品安全问答陈述向量训练得到;所述食品安全问答陈述向量通过将关于食品的安全问题的问题概念向量和与所述安全问题对应的答案的答案概念向量进行拼接得到。
又一方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述各方法所提供的食品安全问答推理方法,该方法包括:
101、获取食品安全问题;
102、将所述食品安全问题输入至食品安全问答推理模型中,得到所述食品安全问答推理模型输出的食品安全问题的答案;
其中,所述食品安全问答推理模型基于食品安全知识图谱和食品安全问答陈述向量训练得到;所述食品安全问答陈述向量通过将关于食品的安全问题的问题概念向量和与所述安全问题对应的答案的答案概念向量进行拼接得到。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (8)

1.一种食品安全问答推理方法,其特征在于,包括:
获取食品安全问题;
将所述食品安全问题输入至食品安全问答推理模型中,得到所述食品安全问答推理模型输出的食品安全问题的答案;
其中,所述食品安全问答推理模型基于食品安全知识图谱和食品安全问答陈述向量训练得到;所述食品安全问答陈述向量通过将关于食品的安全问题的问题概念向量和与所述安全问题对应的答案的答案概念向量进行拼接得到;所述陈述向量是将答案直接带入问题中得到的;
所述食品安全知识图谱为对经预处理后的不同数据源获取的食品基础数据进行本体模型构建,确定知识图谱所需要的实体类型、关系类型以及属性类型后,根据实体类型、关系特征和属性特征构建的食品安全知识图谱;
所述将所述食品安全问题输入至食品安全问答推理模型中,得到所述食品安全问答推理模型输出的食品安全问题的答案,具体包括:
所述食品安全问答推理模型的提取层将所述食品安全问题和针对所述食品安全问题可能的答案构建为陈述向量,并根据所述食品安全知识图谱提取所述食品安全问题中涉及的食品的实体信息;所述实体信息作为利用所述食品安全问答推理模型进行食品安全问题的答案推理的基础;
所述食品安全问答推理模型的模式图构建层根据所述实体信息,通过图卷积神经网络由所述食品安全知识图谱中抽取并学习与所述食品安全问题关联的所有答案的问题答案对的多跳路径,并结合所述陈述向量构建推理模式图;
所述食品安全问答推理模型的多跳推理层利用所述推理模式图中的答案节点的特征向量与所述食品安全问答陈述向量拼接构成问题答案对向量,并由所述问题答案对向量计算得到各个路径序列的合理分数并输出;
所述食品安全问答推理模型的输出层将所述合理分数最大的问题答案对向量对应的答案作为所述食品安全问题的答案输出。
2.根据权利要求1所述的食品安全问答推理方法,其特征在于,所述模式图构建层根据所述实体信息,通过图卷积神经网络由所述食品安全知识图谱中抽取并学习与所述食品安全问题关联的所有答案的问题答案对的多跳路径后,结合所述陈述向量构建推理模式图,具体包括:
利用路径搜索从所述食品安全知识图谱中抽取与所述食品安全问题关联的所有答案的问题答案对的多跳路径;
通过图卷积神经网络学习所述多跳路径中的实体和关系特征嵌入,得到新的实体特征嵌入表示;
将所述新的实体特征嵌入表示所对应的问题答案对间的多条多跳路径构成推理模式图。
3.根据权利要求2所述的食品安全问答推理方法,其特征在于,所述多跳推理层利用所述推理模式图中的答案节点的特征向量与所述食品安全问答陈述向量拼接构成问题答案对向量前,还包括:
所述食品安全问答推理模型的概率注意力机制层对所述推理模式图中不同长度的所述多跳路径分配权重等级,用概率模型对多跳路径的权重进行建模,并计算出不同所述多跳路径序列的注意力分数后,依据所述注意力分数更新所述推理模式图中输出节点的特征嵌入表示,得到所述答案节点的特征向量。
4.根据权利要求3所述的食品安全问答推理方法,其特征在于,所述利用所述推理模式图中的答案节点的特征向量与所述食品安全问答陈述向量拼接构成问题答案对向量,并由所述问题答案对向量计算得到各个路径序列的合理分数,具体包括:
聚合依据所述注意力分数更新后的所述推理模式图中的不同长度的多跳路径,并通过非线性激活获得更新后的所有输出节点的嵌入向量表示;
将更新后的所有输出节点的嵌入向量表示和原实体特征嵌入表示再次学习,并使用shortcut连接和非线性激活获得最终的输出节点嵌入表示,即所述推理模式图中答案节点的特征向量表示;
由所有答案节点的特征向量构成整个所述推理模式图的特征向量表示;
将整个推理模式图的特征向量表示和陈述向量拼接构成问题答案对向量,利用多层感知器对所述问题答案对向量进行计算得到各个路径序列的合理分数。
5.根据权利要求4所述的食品安全问答推理方法,其特征在于,所述利用多层感知器对所述问题答案对向量进行计算得到各个路径序列的合理分数,还包括:
通过构造交叉熵损失函数,训练出最小化交叉熵损失函数的参数矩阵,使对应于所述食品安全问题的答案的路径序列的似然性分数最大化。
6.一种食品安全问答推理系统,其特征在于,包括:
问题获取模块,用于获取食品安全问题;
问题解答模块,用于将所述食品安全问题输入至食品安全问答推理模型中,得到所述食品安全问答推理模型输出的食品安全问题的答案;
其中,所述食品安全问答推理模型基于食品安全知识图谱和食品安全问答陈述向量训练得到;所述食品安全问答陈述向量通过将关于食品的安全问题的问题概念向量和与所述安全问题对应的答案的答案概念向量进行拼接得到;所述陈述向量是将答案直接带入问题中得到的;
所述食品安全知识图谱为对经预处理后的不同数据源获取的食品基础数据进行本体模型构建,确定知识图谱所需要的实体类型、关系类型以及属性类型后,根据实体类型、关系特征和属性特征构建的食品安全知识图谱;
所述将所述食品安全问题输入至食品安全问答推理模型中,得到所述食品安全问答推理模型输出的食品安全问题的答案,具体包括:
所述食品安全问答推理模型的提取层将所述食品安全问题和针对所述食品安全问题可能的答案构建为陈述向量,并根据所述食品安全知识图谱提取所述食品安全问题中涉及的食品的实体信息;所述实体信息作为利用所述食品安全问答推理模型进行食品安全问题的答案推理的基础;
所述食品安全问答推理模型的模式图构建层根据所述实体信息,通过图卷积神经网络由所述食品安全知识图谱中抽取并学习与所述食品安全问题关联的所有答案的问题答案对的多跳路径,并结合所述陈述向量构建推理模式图;
所述食品安全问答推理模型的多跳推理层利用所述推理模式图中的答案节点的特征向量与所述食品安全问答陈述向量拼接构成问题答案对向量,并由所述问题答案对向量计算得到各个路径序列的合理分数并输出;
所述食品安全问答推理模型的输出层将所述合理分数最大的问题答案对向量对应的答案作为所述食品安全问题的答案输出。
7.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至5任一项所述食品安全问答推理方法的步骤。
8.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至5任一项所述食品安全问答推理方法的步骤。
CN202111081512.1A 2021-09-15 2021-09-15 一种食品安全问答推理方法、系统及电子设备 Active CN113849613B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111081512.1A CN113849613B (zh) 2021-09-15 2021-09-15 一种食品安全问答推理方法、系统及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111081512.1A CN113849613B (zh) 2021-09-15 2021-09-15 一种食品安全问答推理方法、系统及电子设备

Publications (2)

Publication Number Publication Date
CN113849613A CN113849613A (zh) 2021-12-28
CN113849613B true CN113849613B (zh) 2023-04-18

Family

ID=78974105

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111081512.1A Active CN113849613B (zh) 2021-09-15 2021-09-15 一种食品安全问答推理方法、系统及电子设备

Country Status (1)

Country Link
CN (1) CN113849613B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114399051B (zh) * 2021-12-29 2022-11-01 北方工业大学 食品安全智能问答推理方法及装置
CN116955592B (zh) * 2023-07-21 2024-02-09 广州拓尔思大数据有限公司 基于可视化推理结果的数据处理方法及系统

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106844368B (zh) * 2015-12-03 2020-06-16 华为技术有限公司 用于人机对话的方法、神经网络系统和用户设备
CN108509519B (zh) * 2018-03-09 2021-03-09 北京邮电大学 基于深度学习的通用知识图谱增强问答交互系统及方法
CN109271506A (zh) * 2018-11-29 2019-01-25 武汉大学 一种基于深度学习的电力通信领域知识图谱问答系统的构建方法
CN112380325B (zh) * 2020-08-15 2022-05-31 电子科技大学 基于联合知识嵌入模型和事实记忆网络的知识图谱问答系统
CN113360604B (zh) * 2021-06-23 2024-02-27 中国科学技术大学 基于认知推理的知识图谱多跳问答方法及模型

Also Published As

Publication number Publication date
CN113849613A (zh) 2021-12-28

Similar Documents

Publication Publication Date Title
Pratola et al. Heteroscedastic BART via multiplicative regression trees
Isvoranu et al. Network psychometrics with R: A guide for behavioral and social scientists
CN107563841B (zh) 一种基于用户评分分解的推荐系统
CN113849613B (zh) 一种食品安全问答推理方法、系统及电子设备
Siemens Connectivism: Learning as network-creation
Les et al. Problem solving
CN116821308B (zh) 生成方法、模型的训练方法、设备及存储介质
Fenner Machine learning with Python for everyone
CN110428010A (zh) 知识追踪方法
Chiesi et al. Applying item response theory to develop a shortened version of the need for cognition scale
Serrano Grokking machine learning
CN111737592A (zh) 一种基于异构传播协同知识感知网络的推荐方法
Zhan et al. Diagnostic classification analysis of problem-solving competence using process data: An item expansion method
Lian et al. Mutual reinforcement of academic performance prediction and library book recommendation
CN109754349A (zh) 一种在线教育智能师生匹配系统
Dash et al. Building a novel classifier based on teaching learning based optimization and radial basis function neural networks for non-imputed database with irrelevant features
Hladká et al. difNLR: Generalized Logistic Regression Models for DIF and DDF Detection.
Wright The development of multiplicative thinking and proportional reasoning: Models of conceptual learning and transfer
Grebitus et al. Analyzing semantic networks of pork quality by means of concept mapping
Xue et al. Semisupervised learning method to adjust biased item difficulty estimates caused by nonignorable missingness in a virtual learning environment
Deonovic et al. A Rasch model and rating system for continuous responses collected in large-scale learning systems
Noever et al. Numeracy from literacy: Data science as an emergent skill from large language models
Abdan Syakuran et al. Implementation of Gamification in Mathematics m-Learning Application to Creating Student Engagement
Mallikarjun Rao et al. Prediction of student’s educational performance using machine learning techniques
Xiong et al. Data‐driven Q‐matrix learning based on Boolean matrix factorization in cognitive diagnostic assessment

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant