CN111651614A - 药膳知识图谱的构建方法、系统、电子设备及存储介质 - Google Patents

药膳知识图谱的构建方法、系统、电子设备及存储介质 Download PDF

Info

Publication number
CN111651614A
CN111651614A CN202010685074.9A CN202010685074A CN111651614A CN 111651614 A CN111651614 A CN 111651614A CN 202010685074 A CN202010685074 A CN 202010685074A CN 111651614 A CN111651614 A CN 111651614A
Authority
CN
China
Prior art keywords
medicated diet
data
knowledge graph
triples
medicated
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010685074.9A
Other languages
English (en)
Inventor
袁琦
陈斌德
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ningbo Fotile Kitchen Ware Co Ltd
Original Assignee
Ningbo Fotile Kitchen Ware Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ningbo Fotile Kitchen Ware Co Ltd filed Critical Ningbo Fotile Kitchen Ware Co Ltd
Priority to CN202010685074.9A priority Critical patent/CN111651614A/zh
Publication of CN111651614A publication Critical patent/CN111651614A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3325Reformulation based on results of preceding query
    • G06F16/3326Reformulation based on results of preceding query using relevance feedback from the user, e.g. relevance feedback on documents, documents sets, document terms or passages
    • G06F16/3328Reformulation based on results of preceding query using relevance feedback from the user, e.g. relevance feedback on documents, documents sets, document terms or passages using graphical result space presentation or visualisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/34Browsing; Visualisation therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Evolutionary Computation (AREA)
  • Databases & Information Systems (AREA)
  • Computing Systems (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Software Systems (AREA)
  • Biomedical Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Probability & Statistics with Applications (AREA)
  • Animal Behavior & Ethology (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本发明公开了一种药膳知识图谱的构建方法、系统、电子设备及存储介质。其中,构建方法包括:构建药膳知识图谱的概念层;根据概念层的数据从药膳数据中抽取实例层的数据,实体层的数据包括若干三元组;根据抽取到的若干三元组推理得到若干新的三元组;利用所有三元组训练Trans模型;利用训练好的Trans模型从药膳数据中推理得到新的三元组;存储概念层的数据以及实例层的数据;接收查询指令,查询指令包括实体;根据药膳知识图谱输出查询指令中的实体所在三元组中的其他元素。本发明构建了一种药膳知识图谱,有利于药膳知识的获取,还有利于丰富所构建的药膳知识图谱的内容。

Description

药膳知识图谱的构建方法、系统、电子设备及存储介质
技术领域
本发明涉及知识图谱技术领域,尤其涉及一种药膳知识图谱的构建方法、系统、电子设备及存储介质。
背景技术
中医在我国经历了数千年的发展,积累了大量的科学知识,这其中就包括中医药膳知识,但是目前这些宝贵的知识主要还是存在于书籍与网页中,难以获取,也就没有得到很好的利用。例如,用户在想要通过中医药膳知识来达到防病治病、保健强身的目的时候,则需要在翻书或者通过搜索引擎搜索的基础上,做进一步地阅读和筛选才能获取相关的中医药膳知识,而不能快捷方便的获取。
发明内容
本发明要解决的技术问题是为了克服现有技术中中医药膳知识难以获取的缺陷,提供一种药膳知识图谱的构建方法、系统、电子设备及存储介质。
本发明是通过下述技术方案来解决上述技术问题:
一种药膳知识图谱的构建方法,包括:
构建所述药膳知识图谱的概念层;
根据所述概念层的数据从药膳数据中抽取实例层的数据,所述实例层的数据包括若干三元组,所述三元组包括实体;
根据抽取到的若干所述三元组推理得到若干新的三元组;
利用所有三元组训练Trans模型,所述Trans模型用于根据所述三元组中的两个元素输出另一个元素;
利用训练好的Trans模型从所述药膳数据中推理得到新的三元组;
存储所述概念层的数据以及实例层的数据,以构建所述药膳知识图谱;
接收查询指令,所述查询指令包括实体;
根据所述药膳知识图谱输出所述查询指令中的实体所在三元组中的其他元素。
较佳地,在所述构建所述药膳知识图谱的步骤之后还包括:
在预设时长之后更新所述药膳知识图谱。
较佳地,所述在预设时长之后更新所述药膳知识图谱的步骤包括:
在预设时长之后判断是否更新所述概念层的数据;
若是,则根据所述概念层的更新来更新所述药膳知识图谱;
和/或,
在预设时长之后获取新增的药膳数据;
根据新增的药膳数据更新所述药膳知识图谱;
和/或,
在预设时长之后统计用户反馈,所述用户反馈包括三元组中的至少一个元素错误或者所述药膳知识图谱缺少实体;
根据所述用户反馈更新所述药膳知识图谱。
较佳地,所述概念层包括若干实体类,所述根据所述概念层的数据从药膳数据中抽取实例层的数据的步骤包括:
利用BiLSTM-CRF模型根据若干所述实体类从药膳数据中抽取若干实体;
和/或,
在所述利用训练好的Trans模型从所述药膳数据中推理得到新的三元组的步骤之后还包括:
从基于Trans模型得到的三元组中过滤掉不符合过滤规则的三元组;
和/或,
所述根据所述药膳知识图谱输出所述查询指令中的实体所在三元组中的其他元素的步骤包括:
可视化展示所述查询指令中的实体所在三元组中的其他元素;
和/或,
所述概念层包括若干实体类,若干所述实体类包括:药膳食谱以及药膳药材、药膳食材、药膳功效、药膳适应症状、药膳适应节气中的至少一种;
和/或,
所述构建方法应用于厨电设备。
一种药膳知识图谱的构建系统,包括:
概念层构建模块,用于构建所述药膳知识图谱的概念层;
抽取模块,用于根据所述概念层的数据从药膳数据中抽取实例层的数据,所述实例层的数据包括若干三元组,所述三元组包括实体;
第一推理模块,用于根据抽取到的若干所述三元组推理得到若干新的三元组;
训练模块,用于利用所有三元组训练Trans模型,所述Trans模型用于根据所述三元组中的两个元素输出另一个元素;
第二推理模块,用于利用训练好的Trans模型从所述药膳数据中推理得到新的三元组;
存储模块,用于存储所述概念层的数据以及实例层的数据,以构建所述药膳知识图谱;
接收模块,用于接收查询指令,所述查询指令包括实体;
输出模块,用于根据所述药膳知识图谱输出所述查询指令中的实体所在三元组中的其他元素。
较佳地,所述构建系统还包括:
更新模块,用于在预设时长之后更新所述药膳知识图谱。
较佳地,所述更新模块包括:
第一判断单元,用于在预设时长之后判断是否更新所述概念层的数据;
若是,则调用第一更新单元,用于根据所述概念层的更新来更新所述药膳知识图谱;
和/或,
获取单元,用于在预设时长之后获取新增的药膳数据;
第二更新单元,用于根据新增的药膳数据更新所述药膳知识图谱;
和/或,
统计单元,用于在预设时长之后统计用户反馈,所述用户反馈包括三元组中的至少一个元素错误或者所述药膳知识图谱缺少实体;
第三更新单元,用于根据所述用户反馈更新所述药膳知识图谱。
较佳地,所述概念层包括若干实体类,所述抽取模块包括:
实体抽取单元,用于利用BiLSTM-CRF模型根据若干所述实体类从药膳数据中抽取若干实体;
和/或,
所述构建系统还包括:
过滤模块,用于从基于Trans模型得到的三元组中过滤掉不符合过滤规则的三元组;
和/或,
所述输出模块具体用于可视化展示所述查询指令中的实体所在三元组中的其他元素;
和/或,
所述概念层包括若干实体类,若干所述实体类包括:药膳食谱以及药膳药材、药膳食材、药膳功效、药膳适应症状、药膳适应节气中的至少一种;
和/或,
所述构建系统应用于厨电设备。
一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述任一种药膳知识图谱的构建方法。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一种药膳知识图谱的构建方法的步骤。
本发明的积极进步效果在于:本发明构建了一种药膳知识图谱,从而有利于药膳知识的获取,具体地,可以根据输入的一个实体而输出与该实体具有实体间关系的其他实体,从而有利于药膳知识的获取,进一步地,本发明中还在有限药膳数据的基础上扩充了Trans模型的训练数据,从而有利于丰富所构建的药膳知识图谱的内容。
附图说明
图1为根据本发明实施例1的药膳知识图谱的构建方法的流程图。
图2为根据本发明实施例1的药膳知识图谱的构建方法中概念层的示意图。
图3为根据本发明实施例1的药膳知识图谱的构建方法中BiLSTM-CRF模型的示意图。
图4为根据本发明实施例1的药膳知识图谱的构建方法中可视化展示的示意图。
图5为根据本发明实施例2的药膳知识图谱的构建系统的模块示意图。
图6为根据本发明实施例3的电子设备的结构示意图。
具体实施方式
下面通过实施例的方式进一步说明本发明,但并不因此将本发明限制在所述的实施例范围之中。
实施例1
本实施例提供一种药膳知识图谱的构建方法,参照图1,本实施例的构建方法包括:
S101、构建药膳知识图谱的概念层。
在本实施例中,概念层包括若干实体类以及若干类间关系,其中,类间关系用于表征两个实体类之间的关系,优选地,在本实施例中,若干实体类可以包括药膳食谱、药膳药材、药膳食材、药膳功效、药膳适应症状以及药膳适应节气,若干类间关系可以包括药膳食谱与药膳药材之间的关系、药膳食谱与药膳食材之间的关系、药膳食谱与药膳功效之间的关系、药膳食谱与药膳适应症状之间的关系、药膳食谱与药膳适应节气之间的关系。
进一步地,在本实施例中,概念层还包括与实体类对应的若干类属性,优选地,药膳食谱的类属性可以包括名称、材料、做法,药膳药材的类属性可以包括名称、药膳食材的类属性可以包括名称、别名、营养,药膳功效的类属性可以包括名称,药膳适应症状的类属性可以包括名称,药膳适应节气的类属性可以包括名称。
在本实施例中,可以根据用户的实际需求,基于对中医书籍、中医网站等所包括内容的分析,采用自上而下的方式来构建药膳知识图谱的概念层,以实现药膳知识图谱框架的构建,并对实体类以及实体类之间语义关系的进行定义,图2示出了本实施例中概念层的示意图。
S102、根据概念层的数据从药膳数据中抽取实例层的数据。
在本实施例中,药膳数据的来源例如可以是中医书籍、中医网站等,药膳数据可以是结构化数据和半结构化数据,步骤S102具体可以包括利用正则表达式根据若干实体从药膳数据中抽取若干实体的步骤,药膳数据还可是非结构化数据,步骤S102具体可以包括利用BiLSTM-CRF模型根据若干实体类从药膳数据中抽取若干实体的步骤,参照图3,在本实施例中,BiLSTM-CRF模型首先通过BiLSTM层提取词语的内在特征,之后再将向量化的词语输入CRF层。
具体地,BiLSTM-CRF模型结合了BiLSTM(Bidirectional Long Short-TermMemory,双向长短时记忆)模型和CRF(Conditional Random Fields,条件随机场)模型,其中,BiLSTM模型是一个特殊的循环神经网络,通过存储单元、输入门、遗忘门以及输出门的控制机制,能够让其利用长距离历史信息的能力大幅上升,CRF是一个序列标注算法,不仅可以使用字、词语本身和上下文特征,还可以结合词典等外部特征。
如此,BiLSTM-CRF模型既能使用BiLSTM模型提取文本信息的特征,又可以利用CRF模型衡量序列标注的联系,并且,由于CRF模型的引入,综合考虑了待标注序列中所有位置的标注得分和相邻位置的标注转移得分,可以更好地利用上下文信息,提升标注效果。与传统的机器学习算法CRF相比,BiLSTM-CRF模型能有效地提高实体识别的F值。
在本实施例中,还可以包括对抽取到的若干实体进行实体链接的步骤,以实现实体消歧,提高所要构建的药膳知识图谱的质量,具体地,实体链接可以基于实体间的语义相似度实现。例如,药膳食材的类属性包括名称A和别名B时,可以将属性值为名称A的药膳食材与属性值为别名B的药膳食材建立实体链接,以确保药膳食材实体链接的准确率。
在本实施例中,还可以包括根据若干类间关系从药膳数据中抽取若干实体对应的若干实体间关系的步骤,以实现关系抽取。具体地,可以基于半监督的Bootstrapping模型,利用少量的实例(例如,有药材关系的(莲子百合瘦肉汤,莲子))作为初始种子集合,然后在初始种子集合的基础上学习获得用于关系抽取的模板(药膳食谱A,里面有,药膳药材A),再利用用于关系抽取的模板抽取更多的实例,加入到初始种子集合中并且不断迭代,以将更多实体之间的关系抽取出来。基于此,可以将两个实体以及这两个实体之间的关系表示为三元组(实体1,实体间关系,实体2)。
在本实施例中,还可以包括根据若干类属性从药膳数据中抽取若干实体对应的实体属性以及实体属性值的步骤,以实现属性抽取。基于此,可以将实体及其对应的实体属性、实体属性值表示为三元组(实体,实体属性,实体属性值)。
S103、根据抽取到的若干三元组推理得到若干新的三元组。
在本实施例中,当前抽取到的三元组(包括三元组(实体1,实体间关系,实体2)以及三元组(实体,实体属性,实体属性值))是较为残缺、不够丰富的,对于此,可以根据抽取到的若干三元组来进行补全。例如,根据已知的三元组(药膳食材,有功效,药膳功效)以及已知的三元组(药膳食谱,有食材,药膳食材),可以得到未知的三元组(药膳食谱,有功效,药膳功效),其中,由于定义了药膳食材具有某种药膳功效,又有药膳食材属于药膳食谱,所以药膳食谱也具有药膳食材所具有的药膳功效,如此就可以发现这种当前未知的三元组,从而能够进一步获取、挖掘更多隐含而未知的三元组,以进一步丰富、扩展完善所构建的药膳知识图谱。
S104、利用所有三元组训练Trans模型。
在本实施例中,Trans模型优选TransE模型,其训练集在包括原有的三元组之外,还包括新增的三元组,扩充了训练集中的数据量,并且用于根据三元组中的两个元素输出另一个元素。
S105、利用训练好的Trans模型从药膳数据中推理得到新的三元组;
S106、从基于Trans模型得到的三元组中过滤掉不符合过滤规则的三元组。
在本实施例中,对于Trans模型推理得到的三元组,可以判断新的三元组的评分是否大于预设阈值,例如,预设阈值可以取值为0.8(具有较高的置信度),若是,则可以用于构建药膳知识图谱,否则,过滤掉。
S107、存储概念层的数据以及实例层的数据,以构建药膳知识图谱。
在本实施例中,基于概念层的构建以及实例层的构建实现了药膳知识图谱的构建,具体地,可以使用Neo4j图数据库存储概念层以及实例层的数据,其中,概念层的数据包括上述实体类、类间关系、类属性等,实例层的数据包括获取到的三元组。此外,Neo4j是一个高性能的NoSQL图形数据库,是一个嵌入式的、基于磁盘的、具备完全的事务特性的Java持久化引擎,具有成熟数据库所有的特性,其使用图相关的概念来描述数据模型,由于Neo4j创建的图用顶点和边构建一个有向图,从而可以很直接的使用图中节点和边的关系来建模,使得Neo4j图数据库存储数据要优于关系数据库。
S108、接收查询指令,查询指令包括实体;
S109、根据药膳知识图谱输出查询指令中的实体所在三元组中的其他元素。
在本实施例中,可以使用Cypher语言(一种描述性的图形查询语言)作为查询语言,进一步地,输出所基于的实体间关系可以不局限在一层。例如,在本实施例中,当查询指令包括“吃什么药膳可以治疗失眠”时,其中包括属性值为失眠的药膳适应症状实体,从而可以根据药膳食谱与药膳适应症状之间的关系输出若干药膳食谱,例如,可以输出“合欢花炖猪肝”、“甘草小麦红枣汤”、“柏子仁炖猪心”、“莲子百合瘦肉汤”,此外,还可以就输出的药膳食谱再输出其所对应的药膳适应节气等,例如,“柏子仁炖猪心”对应的药膳适应节气为立夏节气,“莲子百合瘦肉汤”对应的药膳适应节气为白露节气,以丰富输出内容的多样性与层次性。
进一步地,在本实施例中,优选可视化展示查询指令中的实体所在三元组中的其他元素,例如,上述输出示例的示意图可以参照图4。具体地,在本实施例中,可以从连接的Neo4j数据库中取出需要可视化展示的数据并将取出的数据转换成json格式,然后使用d3.js库(一种可视化库)或者echart(一种图表库)对需要可视化展示的数据进行网页端的可视化展示。
本实施例在步骤S107之后还可以包括:
S110、在预设时长之后更新药膳知识图谱。
由于人类的认知能力、知识储备以及业务需求都会随时间而不断递增,本实施例所构建的药膳知识图谱也需要不断地进行迭代更新以保持其可靠性和可用性,具体地,在本实施例中,药膳知识图谱的更新可以包括概念层的更新以及实例层的更新。
对于概念层的更新,具体可以包括在预设时长之后判断是否更新概念层的步骤,例如,是否需要新增实体类以及类间关系,以及在判断为是时根据概念层的更新来更新药膳知识图谱的步骤,例如,根据新增的实体类以及类间关系更新药膳知识图谱。又例如,可以通过自动化算法从数据源中获得新的实体类以及新的类间关系,具体地,诸如通过K-Means等聚类算法对数据源中的数据进行聚类后所得到的聚类结果,可以通过中医领域专家对聚类结果进行审核,来决定需要将哪些类别加入到药膳知识图谱的概念层中,并且同时从这些类别中归纳出新的实体类以及新的类间关系,因为有领域专家的干预,所以质量较高。
对于数据层的更新,具体可以包括在预设时长之后获取新增的药膳数据的步骤以及根据新增的药膳数据更新药膳知识图谱的步骤,例如,对于来源是中医网站的药膳数据,可以被动地借由中医网站等提供的数据变化接口来获取新增的药膳数据,也可以主动地直接前往中医网站等来获取新增的药膳数据。
根据新增的药膳数据可以获取到若干新的三元组,也即,新的知识,但是,由此获取到的新的知识并非均为于药膳知识图谱有益的知识,需要对其进行过滤筛选,以留下于药膳知识图谱有益的知识。例如,可以过滤掉不属于药膳、食材、食谱等领域的知识;也可以过滤掉与本实施例所构建的药膳知识图谱不强相关的知识,具体地,可以利用K-Means等聚类算法将获取到的新的知识进行分类,如果不属于我们的类别,也即,概念层中定义的实体类,那么则不属于我们想要的知识;又例如,可以过滤掉过时的知识,具体地,假设获取到的新的知识是药膳食谱的做法,如果新获取到的做法的产生时间早于当前知识图谱中该药膳食谱的做法,那么其于本实施例中构建的药膳知识图谱而言就是过时的知识,就可以过滤掉,而若如果新获取到的做法的产生时间晚于当前知识图谱中该药膳食谱的做法,就可以用于更新当前药膳知识图谱。
对于数据层的更新,具体还可以包括在预设时长之后统计用户反馈的步骤以及根据用户反馈更新药膳知识图谱的步骤,以完善本实施例中的药膳知识图谱。具体地,用户反馈可以包括三元组中的至少一个元素错误,例如,步骤S109输出药膳食谱的做法时,用户反馈做法的步骤顺序不对,步骤S109输出药膳食谱的材料时,用户反馈材料中缺少某种食材,步骤S109输出药膳食谱的营养时,用户反馈营养不对等,对于此,在统计用户反馈的基础上,可以对用户反馈进行分析与验证,当发现某个元素确实存在问题时,可以对药膳知识图谱进行更新,其中,可以按照元素被反馈错误的次数由多到少的顺序进行处理。此外,用户反馈还可以包括药膳知识图谱缺少某个实体,例如,步骤S109返回为空时,可以表征药膳知识图谱缺少某个实体,对于此,可以对步骤S109返回为空时所对应的查询指令进行分析,当发现药膳知识图谱确实存在缺失时,可以基于步骤S109返回为空时所对应的查询指令中所包括的实体去中医书籍、中医网站等获取与该实体相关的数据,并将获取到的数据处理成药膳知识图谱的元素,以对药膳知识图谱进行更新,其中,可以按照实体(例如药膳食谱)出现在致使步骤S109返回为空的查询指令中的次数由多到少的顺序进行处理。
进一步地,本实施例的构建方法可以应用于厨电设备,使得用户可以在厨电设备上方便快捷地使用药膳知识图谱,其中,厨电设备可以包括但不限于烤箱、蒸箱、微波炉等,当厨电设备用于根据用户的查询指令输出数据时,厨电设备优选可以对用户的查询指令进行语音识别并且优选可视化展示查询指令中的实体所在三元组中的其他元素,以方便用户在厨电设备上进行查询以及后续操作,此外,厨电设备还可以记录用户针对查询指令输出的用户反馈,以进一步完善厨电设备中所构建的药膳知识图谱,提升用户体验感。
本实施例构建了一种药膳知识图谱,从而有利于药膳知识的获取,具体地,可以根据输入的一个实体而输出与该实体具有实体间关系的其他实体,从而有利于药膳知识的获取,进一步地,本实施例还在有限药膳数据的基础上扩充了Trans模型的训练数据,从而有利于丰富所构建的药膳知识图谱的内容,此外,本实施例所构建的药膳知识图谱还可以进行可视化展示与更新,有利于提升用户体验感。
实施例2
本实施例提供一种药膳知识图谱的构建系统,参照图5,本实施例的构建系统包括:
概念层构建模块201,用于构建药膳知识图谱的概念层。
在本实施例中,概念层包括若干实体类以及若干类间关系,其中,类间关系用于表征两个实体类之间的关系,优选地,在本实施例中,若干实体类可以包括药膳食谱、药膳药材、药膳食材、药膳功效、药膳适应症状以及药膳适应节气,若干类间关系可以包括药膳食谱与药膳药材之间的关系、药膳食谱与药膳食材之间的关系、药膳食谱与药膳功效之间的关系、药膳食谱与药膳适应症状之间的关系、药膳食谱与药膳适应节气之间的关系。
进一步地,在本实施例中,概念层还包括与实体类对应的若干类属性,优选地,药膳食谱的类属性可以包括名称、材料、做法,药膳药材的类属性可以包括名称、药膳食材的类属性可以包括名称、别名、营养,药膳功效的类属性可以包括名称,药膳适应症状的类属性可以包括名称,药膳适应节气的类属性可以包括名称。
在本实施例中,可以根据用户的实际需求,基于对中医书籍、中医网站等所包括内容的分析,采用自上而下的方式来构建药膳知识图谱的概念层,以实现药膳知识图谱框架的构建,并对实体类以及实体类之间语义关系的进行定义,图2示出了本实施例中概念层的示意图。
抽取模块202,用于根据概念层的数据从药膳数据中抽取实例层的数据。
在本实施例中,药膳数据的来源例如可以是中医书籍、中医网站等,药膳数据可以是结构化数据和半结构化数据,抽取模块202具体可以包括用于利用正则表达式根据若干实体从药膳数据中抽取若干实体的第一实体抽取单元,药膳数据还可是非结构化数据,抽取模块202具体可以包括用于利用BiLSTM-CRF模型根据若干实体类从药膳数据中抽取若干实体的第二实体抽取单元,参照图3,在本实施例中,BiLSTM-CRF模型首先通过BiLSTM层提取词语的内在特征,之后再将向量化的词语输入CRF层。
具体地,BiLSTM-CRF模型结合了BiLSTM(Bidirectional Long Short-TermMemory,双向长短时记忆)模型和CRF(Conditional Random Fields,条件随机场)模型,其中,BiLSTM模型是一个特殊的循环神经网络,通过存储单元、输入门、遗忘门以及输出门的控制机制,能够让其利用长距离历史信息的能力大幅上升,CRF是一个序列标注算法,不仅可以使用字、词语本身和上下文特征,还可以结合词典等外部特征。
如此,BiLSTM-CRF模型既能使用BiLSTM模型提取文本信息的特征,又可以利用CRF模型衡量序列标注的联系,并且,由于CRF模型的引入,综合考虑了待标注序列中所有位置的标注得分和相邻位置的标注转移得分,可以更好地利用上下文信息,提升标注效果。与传统的机器学习算法CRF相比,BiLSTM-CRF模型能有效地提高实体识别的F值。
在本实施例中,构建系统还可以包括用于对抽取到的若干实体进行实体链接的实体消歧模块,以实现实体消歧,提高所要构建的药膳知识图谱的质量,具体地,实体链接可以基于实体间的语义相似度实现。例如,药膳食材的类属性包括名称A和别名B时,可以将属性值为名称A的药膳食材与属性值为别名B的药膳食材建立实体链接,以确保药膳食材实体链接的准确率。
在本实施例中,抽取模块202还可以包括用于根据若干类间关系从药膳数据中抽取若干实体对应的若干实体间关系的关系抽取单元,以实现关系抽取。具体地,可以基于半监督的Bootstrapping模型,利用少量的实例(例如,有药材关系的(莲子百合瘦肉汤,莲子))作为初始种子集合,然后在初始种子集合的基础上学习获得用于关系抽取的模板(药膳食谱A,里面有,药膳药材A),再利用用于关系抽取的模板抽取更多的实例,加入到初始种子集合中并且不断迭代,以将更多实体之间的关系抽取出来。基于此,可以将两个实体以及这两个实体之间的关系表示为三元组(实体1,实体间关系,实体2)。
在本实施例中,抽取模块202还可以包括用于根据若干类属性从药膳数据中抽取若干实体对应的实体属性以及实体属性值的属性抽取单元,以实现属性抽取。基于此,可以将实体及其对应的实体属性、实体属性值表示为三元组(实体,实体属性,实体属性值)。
第一推理模块203,用于根据抽取到的若干三元组推理得到若干新的三元组。
在本实施例中,当前抽取到的三元组(包括三元组(实体1,实体间关系,实体2)以及三元组(实体,实体属性,实体属性值))是较为残缺、不够丰富的,对于此,可以根据抽取到的若干三元组来进行补全。例如,根据已知的三元组(药膳食材,有功效,药膳功效)以及已知的三元组(药膳食谱,有食材,药膳食材),可以得到未知的三元组(药膳食谱,有功效,药膳功效),其中,由于定义了药膳食材具有某种药膳功效,又有药膳食材属于药膳食谱,所以药膳食谱也具有药膳食材所具有的药膳功效,如此就可以发现这种当前未知的三元组,从而能够进一步获取、挖掘更多隐含而未知的三元组,以进一步丰富、扩展完善所构建的药膳知识图谱。
训练模块204,用于利用所有三元组训练Trans模型。
在本实施例中,Trans模型优选TransE模型,其训练集在包括原有的三元组之外,还包括新增的三元组,扩充了训练集中的数据量,并且用于根据三元组中的两个元素输出另一个元素。
第二推理模块205,用于利用训练好的Trans模型从药膳数据中推理得到新的三元组。
过滤模块206,用于从基于Trans模型得到的三元组中过滤掉不符合过滤规则的三元组。
在本实施例中,对于Trans模型推理得到的三元组,可以判断新的三元组的评分是否大于预设阈值,例如,预设阈值可以取值为0.8(具有较高的置信度),若是,则可以用于构建药膳知识图谱,否则,过滤掉。
存储模块207,用于存储概念层的数据以及实例层的数据,以构建药膳知识图谱。
在本实施例中,基于概念层的构建以及实例层的构建实现了药膳知识图谱的构建,具体地,可以使用Neo4j图数据库存储概念层以及实例层的数据,其中,概念层的数据包括上述实体类、类间关系、类属性等,实例层的数据包括获取到的三元组。此外,Neo4j是一个高性能的NoSQL图形数据库,是一个嵌入式的、基于磁盘的、具备完全的事务特性的Java持久化引擎,具有成熟数据库所有的特性,其使用图相关的概念来描述数据模型,由于Neo4j创建的图用顶点和边构建一个有向图,从而可以很直接的使用图中节点和边的关系来建模,使得Neo4j图数据库存储数据要优于关系数据库。
接收模块208,用于接收查询指令,查询指令包括实体;
输出模块209,用于根据药膳知识图谱输出查询指令中的实体所在三元组中的其他元素。
在本实施例中,可以使用Cypher语言(一种描述性的图形查询语言)作为查询语言,进一步地,输出所基于的实体间关系可以不局限在一层。例如,在本实施例中,当查询指令包括“吃什么药膳可以治疗失眠”时,其中包括属性值为失眠的药膳适应症状实体,从而可以根据药膳食谱与药膳适应症状之间的关系输出若干药膳食谱,例如,可以输出“合欢花炖猪肝”、“甘草小麦红枣汤”、“柏子仁炖猪心”、“莲子百合瘦肉汤”,此外,还可以就输出的药膳食谱再输出其所对应的药膳适应节气等,例如,“柏子仁炖猪心”对应的药膳适应节气为立夏节气,“莲子百合瘦肉汤”对应的药膳适应节气为白露节气,以丰富输出内容的多样性与层次性。
进一步地,在本实施例中,输出模块209优选可视化展示查询指令中的实体所在三元组中的其他元素,例如,上述输出示例的示意图可以参照图4。具体地,在本实施例中,可以从连接的Neo4j数据库中取出需要可视化展示的数据并将取出的数据转换成json格式,然后使用d3.js库(一种可视化库)或者echart(一种图表库)对需要可视化展示的数据进行网页端的可视化展示。
本实施例的构建系统还可以包括:
更新模块210,用于在预设时长之后更新存储模块207存储的药膳知识图谱。
由于人类的认知能力、知识储备以及业务需求都会随时间而不断递增,本实施例所构建的药膳知识图谱也需要不断地进行迭代更新以保持其可靠性和可用性,具体地,在本实施例中,药膳知识图谱的更新可以包括概念层的更新以及实例层的更新。
对于概念层的更新,更新模块210具体可以包括用于在预设时长之后判断是否更新概念层的第一判断单元,例如,是否需要新增实体类以及类间关系,以及用于在第一判断单元判断为是时根据概念层的更新来更新药膳知识图谱的第一更新单元,例如,根据新增的实体类以及类间关系更新药膳知识图谱。又例如,可以通过自动化算法从数据源中获得新的实体类以及新的类间关系,具体地,诸如通过K-Means等聚类算法对数据源中的数据进行聚类后所得到的聚类结果,可以通过中医领域专家对聚类结果进行审核,来决定需要将哪些类别加入到药膳知识图谱的概念层中,并且同时从这些类别中归纳出新的实体类以及新的类间关系,因为有领域专家的干预,所以质量较高。
对于数据层的更新,更新模块210具体可以包括用于在预设时长之后获取新增的药膳数据的获取单元以及用于根据新增的药膳数据更新药膳知识图谱的第二更新单元,例如,对于来源是中医网站的药膳数据,可以被动地借由中医网站等提供的数据变化接口来获取新增的药膳数据,也可以主动地直接前往中医网站等来获取新增的药膳数据。
根据新增的药膳数据可以获取到若干新的三元组,也即,新的知识,但是,由此获取到的新的知识并非均为于药膳知识图谱有益的知识,需要对其进行过滤筛选,以留下于药膳知识图谱有益的知识。例如,可以过滤掉不属于药膳、食材、食谱等领域的知识;也可以过滤掉与本实施例所构建的药膳知识图谱不强相关的知识,具体地,可以利用K-Means等聚类算法将获取到的新的知识进行分类,如果不属于我们的类别,也即,概念层中定义的实体类,那么则不属于我们想要的知识;又例如,可以过滤掉过时的知识,具体地,假设获取到的新的知识是药膳食谱的做法,如果新获取到的做法的产生时间早于当前知识图谱中该药膳食谱的做法,那么其于本实施例中构建的药膳知识图谱而言就是过时的知识,就可以过滤掉,而若如果新获取到的做法的产生时间晚于当前知识图谱中该药膳食谱的做法,就可以用于更新当前药膳知识图谱。
对于数据层的更新,更新模块210具体还可以包括用于在预设时长之后统计用户反馈的统计单元以及用于根据用户反馈更新药膳知识图谱的第三更新单元,以完善本实施例中的药膳知识图谱。具体地,用户反馈可以包括三元组中的至少一个元素错误,例如,输出模块209输出药膳食谱的做法时,用户反馈做法的步骤顺序不对,输出模块209输出药膳食谱的材料时,用户反馈材料中缺少某种食材,输出模块209输出药膳食谱的营养时,用户反馈营养不对等,对于此,在统计用户反馈的基础上,可以对用户反馈进行分析与验证,当发现某个元素确实存在问题时,可以对药膳知识图谱进行更新,其中,可以按照元素被反馈错误的次数由多到少的顺序进行处理。此外,用户反馈还可以包括药膳知识图谱缺少某个实体,例如,输出模块209返回为空时,可以表征药膳知识图谱缺少某个实体,对于此,可以对输出模块209返回为空时所对应的查询指令进行分析,当发现药膳知识图谱确实存在缺失时,可以基于输出模块209返回为空时所对应的查询指令中所包括的实体去中医书籍、中医网站等获取与该实体相关的数据,并将获取到的数据处理成药膳知识图谱的元素,以对药膳知识图谱进行更新,其中,可以按照实体(例如药膳食谱)出现在致使输出模块209返回为空的查询指令中的次数由多到少的顺序进行处理。
进一步地,本实施例的构建系统可以应用于厨电设备,使得用户可以在厨电设备上方便快捷地使用药膳知识图谱,其中,厨电设备可以包括但不限于烤箱、蒸箱、微波炉等,当厨电设备用于根据用户的查询指令输出数据时,厨电设备优选可以对用户的查询指令进行语音识别并且优选可视化展示查询指令中的实体所在三元组中的其他元素,以方便用户在厨电设备上进行查询以及后续操作,此外,厨电设备还可以记录用户针对查询指令输出的用户反馈,以进一步完善厨电设备中所构建的药膳知识图谱,提升用户体验感。
本实施例构建了一种药膳知识图谱,从而有利于药膳知识的获取,具体地,可以根据输入的一个实体而输出与该实体具有实体间关系的其他实体,从而有利于药膳知识的获取,进一步地,本实施例还在有限药膳数据的基础上扩充了Trans模型的训练数据,从而有利于丰富所构建的药膳知识图谱的内容,此外,本实施例所构建的药膳知识图谱还可以进行可视化展示与更新,有利于提升用户体验感。
实施例3
本实施例提供一种电子设备,电子设备可以通过计算设备的形式表现(例如可以为服务器设备),包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其中处理器执行计算机程序时可以实现实施例1提供的药膳知识图谱的构建方法。
图6示出了本实施例的硬件结构示意图,如图6所示,电子设备9具体包括:
至少一个处理器91、至少一个存储器92以及用于连接不同系统组件(包括处理器91和存储器92)的总线93,其中:
总线93包括数据总线、地址总线和控制总线。
存储器92包括易失性存储器,例如随机存取存储器(RAM)921和/或高速缓存存储器922,还可以进一步包括只读存储器(ROM)923。
存储器92还包括具有一组(至少一个)程序模块924的程序/实用工具925,这样的程序模块924包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
处理器91通过运行存储在存储器92中的计算机程序,从而执行各种功能应用以及数据处理,例如本发明实施例1所提供的药膳知识图谱的构建方法。
电子设备9进一步可以与一个或多个外部设备94(例如键盘、指向设备等)通信。这种通信可以通过输入/输出(I/O)接口95进行。并且,电子设备9还可以通过网络适配器96与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。网络适配器96通过总线93与电子设备9的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备9使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理器、外部磁盘驱动阵列、RAID(磁盘阵列)系统、磁带驱动器以及数据备份存储系统等。
应当注意,尽管在上文详细描述中提及了电子设备的若干单元/模块或子单元/模块,但是这种划分仅仅是示例性的并非强制性的。实际上,根据本申请的实施方式,上文描述的两个或更多单元/模块的特征和功能可以在一个单元/模块中具体化。反之,上文描述的一个单元/模块的特征和功能可以进一步划分为由多个单元/模块来具体化。
实施例4
本实施例提供了一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现实施例1所提供的药膳知识图谱的构建方法的步骤。
其中,可读存储介质可以采用的更具体可以包括但不限于:便携式盘、硬盘、随机存取存储器、只读存储器、可擦拭可编程只读存储器、光存储器件、磁存储器件或上述的任意合适的组合。
在可能的实施方式中,本发明还可以实现为一种程序产品的形式,其包括程序代码,当所述程序产品在终端设备上运行时,所述程序代码用于使所述终端设备执行实现实施例1所述的药膳知识图谱的构建方法的步骤。
其中,可以以一种或多种程序设计语言的任意组合来编写用于执行本发明的程序代码,所述程序代码可以完全地在用户设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户设备上部分在远程设备上执行或完全在远程设备上执行。
虽然以上描述了本发明的具体实施方式,但是本领域的技术人员应当理解,这仅是举例说明,本发明的保护范围是由所附权利要求书限定的。本领域的技术人员在不背离本发明的原理和实质的前提下,可以对这些实施方式做出多种变更或修改,但这些变更和修改均落入本发明的保护范围。

Claims (10)

1.一种药膳知识图谱的构建方法,其特征在于,包括:
构建所述药膳知识图谱的概念层;
根据所述概念层的数据从药膳数据中抽取实例层的数据,所述实例层的数据包括若干三元组,所述三元组包括实体;
根据抽取到的若干所述三元组推理得到若干新的三元组;
利用所有三元组训练Trans模型,所述Trans模型用于根据所述三元组中的两个元素输出另一个元素;
利用训练好的Trans模型从所述药膳数据中推理得到新的三元组;
存储所述概念层的数据以及实例层的数据,以构建所述药膳知识图谱;
接收查询指令,所述查询指令包括实体;
根据所述药膳知识图谱输出所述查询指令中的实体所在三元组中的其他元素。
2.如权利要求1所述的药膳知识图谱的构建方法,其特征在于,在所述构建所述药膳知识图谱的步骤之后还包括:
在预设时长之后更新所述药膳知识图谱。
3.如权利要求2所述的药膳知识图谱的构建方法,其特征在于,所述在预设时长之后更新所述药膳知识图谱的步骤包括:
在预设时长之后判断是否更新所述概念层的数据;
若是,则根据所述概念层的更新来更新所述药膳知识图谱;
和/或,
在预设时长之后获取新增的药膳数据;
根据新增的药膳数据更新所述药膳知识图谱;
和/或,
在预设时长之后统计用户反馈,所述用户反馈包括三元组中的至少一个元素错误或者所述药膳知识图谱缺少实体;
根据所述用户反馈更新所述药膳知识图谱。
4.如权利要求1所述的药膳知识图谱的构建方法,其特征在于,所述概念层包括若干实体类,所述根据所述概念层的数据从药膳数据中抽取实例层的数据的步骤包括:
利用BiLSTM-CRF模型根据若干所述实体类从药膳数据中抽取若干实体;
和/或,
在所述利用训练好的Trans模型从所述药膳数据中推理得到新的三元组的步骤之后还包括:
从基于Trans模型得到的三元组中过滤掉不符合过滤规则的三元组;
和/或,
所述根据所述药膳知识图谱输出所述查询指令中的实体所在三元组中的其他元素的步骤包括:
可视化展示所述查询指令中的实体所在三元组中的其他元素;
和/或,
所述概念层包括若干实体类,若干所述实体类包括:药膳食谱以及药膳药材、药膳食材、药膳功效、药膳适应症状、药膳适应节气中的至少一种;
和/或,
所述构建方法应用于厨电设备。
5.一种药膳知识图谱的构建系统,其特征在于,包括:
概念层构建模块,用于构建所述药膳知识图谱的概念层;
抽取模块,用于根据所述概念层的数据从药膳数据中抽取实例层的数据,所述实例层的数据包括若干三元组,所述三元组包括实体;
第一推理模块,用于根据抽取到的若干所述三元组推理得到若干新的三元组;
训练模块,用于利用所有三元组训练Trans模型,所述Trans模型用于根据所述三元组中的两个元素输出另一个元素;
第二推理模块,用于利用训练好的Trans模型从所述药膳数据中推理得到新的三元组;
存储模块,用于存储所述概念层的数据以及实例层的数据,以构建所述药膳知识图谱;
接收模块,用于接收查询指令,所述查询指令包括实体;
输出模块,用于根据所述药膳知识图谱输出所述查询指令中的实体所在三元组中的其他元素。
6.如权利要求5所述的药膳知识图谱的构建系统,其特征在于,所述构建系统还包括:
更新模块,用于在预设时长之后更新所述药膳知识图谱。
7.如权利要求6所述的药膳知识图谱的构建系统,其特征在于,所述更新模块包括:
第一判断单元,用于在预设时长之后判断是否更新所述概念层的数据;
若是,则调用第一更新单元,用于根据所述概念层的更新来更新所述药膳知识图谱;
和/或,
获取单元,用于在预设时长之后获取新增的药膳数据;
第二更新单元,用于根据新增的药膳数据更新所述药膳知识图谱;
和/或,
统计单元,用于在预设时长之后统计用户反馈,所述用户反馈包括三元组中的至少一个元素错误或者所述药膳知识图谱缺少实体;
第三更新单元,用于根据所述用户反馈更新所述药膳知识图谱。
8.如权利要求5所述的药膳知识图谱的构建系统,其特征在于,所述概念层包括若干实体类,所述抽取模块包括:
实体抽取单元,用于利用BiLSTM-CRF模型根据若干所述实体类从药膳数据中抽取若干实体;
和/或,
所述构建系统还包括:
过滤模块,用于从基于Trans模型得到的三元组中过滤掉不符合过滤规则的三元组;
和/或,
所述输出模块具体用于可视化展示所述查询指令中的实体所在三元组中的其他元素;
和/或,
所述概念层包括若干实体类,若干所述实体类包括:药膳食谱以及药膳药材、药膳食材、药膳功效、药膳适应症状、药膳适应节气中的至少一种;
和/或,
所述构建系统应用于厨电设备。
9.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至4中任一项所述的药膳知识图谱的构建方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至4中任一项所述的药膳知识图谱的构建方法的步骤。
CN202010685074.9A 2020-07-16 2020-07-16 药膳知识图谱的构建方法、系统、电子设备及存储介质 Pending CN111651614A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010685074.9A CN111651614A (zh) 2020-07-16 2020-07-16 药膳知识图谱的构建方法、系统、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010685074.9A CN111651614A (zh) 2020-07-16 2020-07-16 药膳知识图谱的构建方法、系统、电子设备及存储介质

Publications (1)

Publication Number Publication Date
CN111651614A true CN111651614A (zh) 2020-09-11

Family

ID=72344182

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010685074.9A Pending CN111651614A (zh) 2020-07-16 2020-07-16 药膳知识图谱的构建方法、系统、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN111651614A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112836064A (zh) * 2021-02-24 2021-05-25 吉林大学 知识图谱补全方法、装置、存储介质及电子设备
CN112948547A (zh) * 2021-01-26 2021-06-11 中国石油大学(北京) 测井知识图谱构建查询方法、装置、设备及存储介质
CN112967814A (zh) * 2020-09-18 2021-06-15 青岛海洋科学与技术国家实验室发展中心 基于深度学习的新型冠状病毒患者行动追踪方法及装置
CN113268608A (zh) * 2021-05-27 2021-08-17 清华大学 知识概念构建方法和装置
EP3920074A3 (en) * 2021-02-19 2022-04-06 Beijing Baidu Netcom Science And Technology Co., Ltd. Method for industry text increment, related apparatus, and computer program product

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109669994A (zh) * 2018-12-21 2019-04-23 吉林大学 一种健康知识图谱的构建方法及系统
CN110059195A (zh) * 2019-04-10 2019-07-26 华侨大学 一种基于lis的医学检验知识图谱构建方法
CN110147450A (zh) * 2019-05-06 2019-08-20 北京科技大学 一种知识图谱的知识补全方法及装置
CN110222201A (zh) * 2019-06-26 2019-09-10 中国医学科学院医学信息研究所 一种专病知识图谱构建方法及装置
CN110275959A (zh) * 2019-05-22 2019-09-24 广东工业大学 一种面向大规模知识库的快速学习方法
CN110941723A (zh) * 2019-11-18 2020-03-31 广东宜学通教育科技有限公司 一种知识图谱的构建方法、系统及存储介质
CN111143574A (zh) * 2019-12-05 2020-05-12 大连民族大学 一种基于少数民族文化知识图谱的查询及可视化系统构建方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109669994A (zh) * 2018-12-21 2019-04-23 吉林大学 一种健康知识图谱的构建方法及系统
CN110059195A (zh) * 2019-04-10 2019-07-26 华侨大学 一种基于lis的医学检验知识图谱构建方法
CN110147450A (zh) * 2019-05-06 2019-08-20 北京科技大学 一种知识图谱的知识补全方法及装置
CN110275959A (zh) * 2019-05-22 2019-09-24 广东工业大学 一种面向大规模知识库的快速学习方法
CN110222201A (zh) * 2019-06-26 2019-09-10 中国医学科学院医学信息研究所 一种专病知识图谱构建方法及装置
CN110941723A (zh) * 2019-11-18 2020-03-31 广东宜学通教育科技有限公司 一种知识图谱的构建方法、系统及存储介质
CN111143574A (zh) * 2019-12-05 2020-05-12 大连民族大学 一种基于少数民族文化知识图谱的查询及可视化系统构建方法

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112967814A (zh) * 2020-09-18 2021-06-15 青岛海洋科学与技术国家实验室发展中心 基于深度学习的新型冠状病毒患者行动追踪方法及装置
CN112948547A (zh) * 2021-01-26 2021-06-11 中国石油大学(北京) 测井知识图谱构建查询方法、装置、设备及存储介质
CN112948547B (zh) * 2021-01-26 2024-04-09 中国石油大学(北京) 测井知识图谱构建查询方法、装置、设备及存储介质
EP3920074A3 (en) * 2021-02-19 2022-04-06 Beijing Baidu Netcom Science And Technology Co., Ltd. Method for industry text increment, related apparatus, and computer program product
CN112836064A (zh) * 2021-02-24 2021-05-25 吉林大学 知识图谱补全方法、装置、存储介质及电子设备
CN113268608A (zh) * 2021-05-27 2021-08-17 清华大学 知识概念构建方法和装置

Similar Documents

Publication Publication Date Title
CN111651614A (zh) 药膳知识图谱的构建方法、系统、电子设备及存储介质
CN111414393B (zh) 一种基于医学知识图谱的语义相似病例检索方法及设备
US20190035505A1 (en) Intelligent triage server, terminal and system based on medical knowledge base (mkb)
Zubrinic et al. The automatic creation of concept maps from documents written using morphologically rich languages
US11797585B2 (en) Data updating method and apparatus, electronic device and computer readable storage medium
CN109543034B (zh) 基于知识图谱的文本聚类方法、装置及可读存储介质
Shigarov Table understanding using a rule engine
CN110189802B (zh) 基于指标存储模型的双向映射队列研究信息系统
CN111341456A (zh) 糖尿病足知识图谱生成方法、装置及可读存储介质
CN112925901A (zh) 一种辅助在线问卷评估的评估资源推荐方法及其应用
CN111813874B (zh) 太赫兹知识图谱构建方法及系统
CN114153994A (zh) 医保信息问答方法及装置
Mulwad et al. Automatically generating government linked data from tables
CN114840685A (zh) 一种应急预案知识图谱构建方法
US9881004B2 (en) Gender and name translation from a first to a second language
WO2017033588A1 (ja) データベース管理装置およびその方法
CN111951079B (zh) 一种基于知识图谱的信用评级方法、装置及电子设备
Son et al. Web table discrimination with composition of rich structural and content information
CN116340544B (zh) 一种基于知识图谱的中医药古籍可视分析方法与系统
CN112069817A (zh) 一种学者知识抽取与融合方法及装置
US20220156611A1 (en) Method and apparatus for entering information, electronic device, computer readable storage medium
Chen et al. Entity relation extraction from electronic medical records based on improved annotation rules and BiLSTM-CRF
CN115017271A (zh) 用于智能生成rpa流程组件块的方法及系统
US11734522B2 (en) Machine learning enabled text analysis with support for unstructured data
CN115048536A (zh) 知识图谱生成方法、装置、计算机设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20200911

RJ01 Rejection of invention patent application after publication