CN112242187B - 基于知识图谱表征学习的医疗方案推荐系统及方法 - Google Patents

基于知识图谱表征学习的医疗方案推荐系统及方法 Download PDF

Info

Publication number
CN112242187B
CN112242187B CN202011153510.4A CN202011153510A CN112242187B CN 112242187 B CN112242187 B CN 112242187B CN 202011153510 A CN202011153510 A CN 202011153510A CN 112242187 B CN112242187 B CN 112242187B
Authority
CN
China
Prior art keywords
entity
recommendation
training
medical
knowledge graph
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011153510.4A
Other languages
English (en)
Other versions
CN112242187A (zh
Inventor
颜泽龙
王健宗
吴天博
程宁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Priority to CN202011153510.4A priority Critical patent/CN112242187B/zh
Priority to PCT/CN2020/136060 priority patent/WO2021189971A1/zh
Publication of CN112242187A publication Critical patent/CN112242187A/zh
Application granted granted Critical
Publication of CN112242187B publication Critical patent/CN112242187B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H20/00ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/288Entity relationship models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/216Parsing using statistical methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/242Dictionaries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Computation (AREA)
  • Animal Behavior & Ethology (AREA)
  • Epidemiology (AREA)
  • Medical Informatics (AREA)
  • Primary Health Care (AREA)
  • Public Health (AREA)
  • Probability & Statistics with Applications (AREA)
  • Measuring And Recording Apparatus For Diagnosis (AREA)

Abstract

本申请公开了一种基于知识图谱表征学习的医疗方案推荐系统及方法,涉及人工智能技术领域,可解决现有医疗推荐系统推荐的医疗信息不够精准,且容易存在潜在风险的问题。其中系统包括:提取模块,用于获取目标用户的患者数据,并提取所述患者数据中的目标实体;划分模块,用于根据所述目标实体从医疗知识图谱中划分知识图谱子图;第一确定模块,用于基于表征学习确定所述知识图谱子图对应的低维向量;获取模块,用于将所述低维向量输入到符合预设训练标准的推荐模型中,获取得到与所述患者数据匹配的医疗推荐结果。本申请适用于对医疗方案的智能化推荐。

Description

基于知识图谱表征学习的医疗方案推荐系统及方法
技术领域
本申请涉及人工智能技术领域,尤其涉及到一种基于知识图谱表征学习的医疗方案推荐系统及方法。
背景技术
随着现代信息技术的发展,为了构建与物联网、云计算、大数据、空间地理信息集成等新一代信息技术为基础的智慧城市,并且提高国民的数字化体验,各种智能系统应运而生。在医疗领域,通过配置医疗推荐系统,能够帮助病人和医生大大缩短就诊时间,节省人力物力。
目前现有的医疗推荐系统往往采用固定的搜索方式,或单纯使用医生和病人的历史交互信息作为输入,从而进行相关医疗信息的推荐,然而不能很好地通过对个人信息的全面分析以更好地推荐医疗信息,导致推荐的医疗方案不够准确,容易存在潜在风险。
发明内容
有鉴于此,本申请提供了一种基于知识图谱表征学习的医疗方案推荐系统及方法,主要解决现有医疗推荐系统推荐的医疗信息不够精准,且容易存在潜在风险的问题。
根据本申请的一个方面,提供了一种基于知识图谱表征学习的医疗方案推荐系统,该系统包括:
提取模块,用于获取目标用户的患者数据,并提取所述患者数据中的目标实体;
划分模块,用于根据所述目标实体从医疗知识图谱中划分知识图谱子图;
第一确定模块,用于基于表征学习确定所述知识图谱子图对应的低维向量;
获取模块,用于将所述低维向量输入到符合预设训练标准的推荐模型中,获取得到与所述患者数据匹配的医疗推荐结果。
优选地,所述提取模块,具体包括:
第一训练单元,用于训练用于抽取实体类的实体抽取模型;
抽取单元,用于利用符合第一预设训练标准的所述实体抽取模型抽取患者数据中的目标实体。
优选地,所述第一训练单元,具体用于:
对训练集数据中所包含的实体类进行词性标注;
将标注处理后的所述训练集数据输入至实体抽取模型中,训练所述实体抽取模型基于Jieba自然语言处理库抽取实体类;
若确定所述实体类的抽取误差小于预设阈值,则判定所述实体抽取模型通过训练;
若确定所述实体类的抽取误差大于或等于所述预设阈值,则判定所述实体抽取模型未通过训练,利用预先标注好词性的训练集数据重复修正训练所述实体抽取模型,以使所述实体抽取模型满足第一预设训练标准。
优选地,所述划分模块,具体包括:
标记单元,用于在所述目标实体中标记核心对象实体和次要对象实体;
遍历单元,用于以各个所述核心对象实体为遍历起点对医疗知识图谱进行遍历,并在遍历到所述次要对象实体时停止该方向的遍历;
划分单元,用于依据各个所述核心对象实体的遍历结果划分知识图谱子图。
优选地,所述第一确定模块,具体包括:
提取单元,用于提取所述知识图谱子图中的各个三元组;
配置单元,用于通过对所述三元组进行位置编码,为所述三元组中的实体向量配置位置向量;
编码单元,用于基于关系型网络对添加所述位置向量后的三元组进行编码处理,得到编码向量;
第二训练单元,用于利用解码器对所述编码向量进行分值评定,并利用自适应矩估计Adam优化器进行迭代训练,进一步得到所述知识图谱子图对应的低维向量。
优选地,所述系统还包括:标注模块、训练模块、第二确定模块;
所述标注模块,用于确定样本患者数据,并为所述样本患者数据标注对应的预设医疗推荐方案;
所述训练模块,用于利用所述样本患者数据对应的低维向量训练推荐模型;
所述第二确定模块,用于若判定所述推荐模型输出的医疗推荐结果符合第二预设训练标准,则确定所述推荐模型通过训练;
所述训练模块,还用于若判定所述推荐模型未通过训练,则利用所述所述样本患者数据重复训练所述推荐模型,以使所述推荐模型符合所述第二预设训练标准。
优选地,所述获取模块,具体包括:
输入单元,用于将所述低维向量输入到符合所述第二预设训练标准的推荐模型中,获取得到各个预设医疗推荐方案对应的推荐分值;
确定单元,用于将所述推荐分值最高的预设医疗推荐方案确定为所述目标用户的医疗推荐结果。
根据本申请的另一个方面,提供了一种基于知识图谱表征学习的医疗方案推荐方法,该方法包括:
获取目标用户的患者数据,并提取所述患者数据中的目标实体;
根据所述目标实体从医疗知识图谱中划分知识图谱子图;
基于表征学习确定所述知识图谱子图对应的低维向量;
将所述低维向量输入到符合预设训练标准的推荐模型中,获取得到与所述患者数据匹配的医疗推荐结果。
优选地,所述提取所述患者数据中的目标实体,具体包括:
训练用于抽取中实体类的实体抽取模型;
利用符合第一预设训练标准的所述实体抽取模型抽取患者数据中的目标实体。
优选地,所述训练用于抽取实体类的实体抽取模型,具体包括:
对训练集数据中所包含的实体类进行词性标注;
将标注处理后的所述训练集数据输入至实体抽取模型中,训练所述实体抽取模型基于Jieba自然语言处理库抽取实体类;
若确定所述实体类的抽取误差小于预设阈值,则判定所述实体抽取模型通过训练;
若确定所述实体类的抽取误差大于或等于所述预设阈值,则判定所述实体抽取模型未通过训练,利用预先标注好词性的训练集数据重复修正训练所述实体抽取模型,以使所述实体抽取模型满足第一预设训练标准。
优选地,所述根据所述目标实体从医疗知识图谱中划分知识图谱子图,具体包括:
在所述目标实体中标记核心对象实体和次要对象实体;
以各个所述核心对象实体为遍历起点对医疗知识图谱进行遍历,并在遍历到所述次要对象实体时停止该方向的遍历;
依据各个所述核心对象实体的遍历结果划分知识图谱子图。
优选地,所述基于表征学习确定所述知识图谱子图对应的低维向量,具体包括:
提取所述知识图谱子图中的各个三元组;
通过对所述三元组进行位置编码,为所述三元组中的实体向量配置位置向量;
基于关系型网络对添加所述位置向量后的三元组进行编码处理,得到编码向量;
利用解码器对所述编码向量进行分值评定,并利用自适应矩估计Adam优化器进行迭代训练,进一步得到所述知识图谱子图对应的低维向量。
优选地,在将所述低维向量输入到符合预设训练标准的推荐模型中,获取得到与所述患者数据匹配的医疗推荐结果之前,具体还包括:
确定样本患者数据,并为所述样本患者数据标注对应的预设医疗推荐方案;
利用所述样本患者数据对应的低维向量训练推荐模型;
若判定所述推荐模型输出的医疗推荐结果符合第二预设训练标准,则确定所述推荐模型通过训练;
若判定所述推荐模型未通过训练,则利用所述所述样本患者数据重复训练所述推荐模型,以使所述推荐模型符合所述第二预设训练标准。
优选地,所述将所述低维向量输入到符合预设训练标准的推荐模型中,获取得到与所述患者数据匹配的医疗推荐结果,具体包括:
将所述低维向量输入到符合所述第二预设训练标准的推荐模型中,获取得到各个预设医疗推荐方案对应的推荐分值;
将所述推荐分值最高的预设医疗推荐方案确定为所述目标用户的医疗推荐结果。
根据本申请的另一个方面,提供了一种非易失性可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现上述基于知识图谱表征学习的医疗信息推荐方法。
根据本申请的再一个方面,提供了一种计算机设备,包括非易失性可读存储介质、处理器及存储在非易失性可读存储介质上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述基于知识图谱表征学习的医疗信息推荐方法。
借由上述技术方案,本申请提供的一种基于知识图谱表征学习的医疗方案推荐系统及方法,与目前医疗推荐系统相比,本申请可首先利用提取模块提取出患者数据中的实体,并利用划分模块,基于实体从知识图谱中抽取子图。之后通过知识图谱表征学习,采用三元组嵌入的方法,将每个实体(医生,病人)和关系(就诊,专业领域,处方,开药等)嵌入得到低维向量,并且保持医疗关系图谱中的语义信息。之后,将嵌入得到的低维向量,输入到推荐算法对应的推荐模型中去,推荐模型即可根据患者的低维向量,进行推荐分类,进一步输出医疗推荐结果,以供患者参考。在本申请中,通过表征学习获取低维向量,能够提高推荐系统所输出推荐结果的准确性,为之后的个性化推荐提供更高的支持。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本地申请的不当限定。在附图中:
图1示出了本申请实施例提供的一种基于知识图谱表征学习的医疗方案推荐系统的结构示意图;
图2示出了本申请实施例提供的另一种基于知识图谱表征学习的医疗方案推荐系统的结构示意图;
图3示出了本申请实施例提供的一种知识图谱表征学习的原理结构示意图;
图4示出了本申请实施例提供的一种基于知识图谱表征学习的医疗方案推荐方法的流程示意图。
具体实施方式
下文将参考附图并结合实施例来详细说明本申请。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互结合。
针对现有医疗推荐系统推荐的医疗信息不够精准,且容易存在潜在风险的问题,本申请实施例提供了一种基于知识图谱表征学习的医疗方案推荐系统,如图1所示,该系统包括:提取模块31、划分模块32、第一确定模块33、获取模块34;
在具体的应用场景中,提取模块31,可用于获取目标用户的患者数据,并提取患者数据中的目标实体。其中,患者数据可为目标用户在推荐系统中手动上传的病例咨询信息,或基于医疗平台提取出的关于目标用户的病例信息,具体可包括文本、图像等多种数据形式,在获取到患者信息后,首先需要基于现有的文本转换技术(如OCR识别技术等),将各个数据形式的患者数据统一转换为文本形式,以便后续进行目标实体的提取。目标实体是指具有可描述意义的单词或短语,通常可以是人名、地名、组织机构名、产品名称,或者在某个领域内具有一定含义的内容,比如医学领域内疾病、药物、生物体名称等。对于本实施例,需要首先从患者数据的结构化和非结构化信息中提取目标实体,以便通过将目标实体与医疗知识图谱的实体进行匹配,进一步抽取出与患者数据对应的知识图谱子图。
相应的,由于基于子图划分的知识图谱降维表达方法对实体的编码相比传统方法更为合理,以子图为基础的降维表达能充分考虑知识图谱的局部特征,得到的实体编码向量能更好地反映实体的本质特征。故在本申请中需要进行知识图谱子图的划分,并且越大的子图通常会学习到越好的特征,故可根据所需要的运行时长预先设定子图的抽取范围,以保证医疗方案推荐结果的精准度。故系统中还包括划分模块32,用于根据目标实体从医疗知识图谱中划分知识图谱子图。
在具体的应用场景中,第一确定模块33,可用于基于表征学习确定知识图谱子图对应的低维向量。对于本实施例,在进行表征学习时,可在传统TRANS方法的基础上,采用新的方法来编码三元组,即通过引入位置编码和关系性记忆网络来挖掘三元组的潜在依赖关系,进一步得到目标实体的低维向量。此一过程应用位置编码和关系型记忆网络编码就诊三元组,能够在一定程度上解决TRANS方法无法描述知识图谱三元组潜在依赖关系的问题,进而能够提高三元组嵌入向量的准确性,为之后的个性化推荐提供更高的支持。
相应的,获取模块34,可用于将第一确定模块33确定出的低维向量输入到符合预设训练标准的推荐模型中,获取得到与患者数据匹配的医疗推荐结果。对于本实施例,为了确定出与目标用户对应匹配的医疗推荐方案,具体的,可在推荐系统中预先基于预设分类规则训练推荐模型,使推荐模型能够根据患者对应的实体低维向量,确定出对应的医疗推荐结果。其中,医疗推荐结果可包括用药组合、采取的治疗方案、以及对应的主治医生人选等。
借由本实施例中基于知识图谱表征学习的医疗方案推荐系统,可首先提取患者数据中的实体,并基于实体从知识图谱中抽取子图。之后通过知识图谱表征学习,采用三元组嵌入的方法,将每个实体(医生,病人)和关系(就诊,专业领域,处方,开药等)嵌入得到低维向量,并且保持医疗关系图谱中的语义信息。之后,将嵌入得到的低维向量,输入到推荐算法对应的推荐模型中去,推荐模型即可根据患者的低维向量,进行推荐分类,进一步输出医疗推荐结果,以供患者参考。在本申请中,通过表征学习获取低维向量,能够提高推荐系统推荐结果的准确性,为之后的个性化推荐提供更高的支持。
进一步的,作为上述实施例具体实施方式的细化和扩展,为了完整说明本实施例中的具体实施过程,如图2所示,提供了另一种基于知识图谱表征学习的医疗方案推荐系统,在该医疗方案推荐系统中,提取模块31可进一步包括:第一训练单元311、抽取单元312。
在具体的应用场景中,第一训练单元311可用于训练用于抽取实体类的实体抽取模型,其中,在训练用于提取患者数据中实体类的实体抽取模型时,第一训练单元311具体可以用于:对训练集数据中所包含的实体类进行词性标注;将标注处理后的训练集数据输入至实体抽取模型中,训练实体抽取模型基于Jieba自然语言处理库抽取实体类;若确定实体类的抽取误差小于预设阈值,则判定实体抽取模型通过训练;若确定实体类的抽取误差大于或等于预设阈值,则判定实体抽取模型未通过训练,利用预先标注好词性的训练集数据重复修正训练实体抽取模型,以使实体抽取模型满足第一预设训练标准。
对于本实施例,在对训练集数据中的实体类进行词性标注时,可基于ICTCLAS汉语词性标注集来进行词性标注,进而确定出分词后每个实体类的词性。在具体训练过程中,可通过Jibba自然语言处理库对数据进行词性分析,划分出所有实体类。其中,Jibba自然语言处理库中包含了超大规模的语料数据,包含349,046条词语,每一行对应一个词语,包含词语、词数、词性三部分。预设阈值应为0到1的数值,表示实体抽取模型通过训练时的最大抽取误差,具体数值的设定大小可根据实际应用需求进行设定,预设阈值越小,表示实体抽取模型的训练精度越高。
在具体的应用场景中,抽取单元312可用于利用符合第一预设训练标准的实体抽取模型抽取患者数据中的目标实体。其中,在依据实体抽取模型提取患者数据中的目标实体时,具体实现过程可为:加载词典文件,识别患者数据中各个词段;基于各个词段构建有向无环图;根据有向无环图计算每个节点到语句结束位置的最大路径概率,并确定概率最大时节点对应词段的最优结束位置;在最优结束位置处切分患者数据,以便获取得到各个目标实体。
例如,输入的患者数据为“有一些发烧”,在利用实体抽取模型抽取目标实体时,首先会构建短语的有向无环图DAG。查词典进行字符串匹配的过程中,可能会出现好几种可能的切分方式,将这些组合构成有向无环图,如可构成四条路径:1)、①有一③/些④/发烧;2)、①有一③/些发⑤/烧;3)、①有②/一些④/发烧;4)、①有②/一些发⑤/烧,根据四条路径对应的有向无环图可确定出各个词的开始位置和可能的结束位置。之后计算对应同一个词的不同结束位置的概率,将概率最大的结束位置确定为最优结束位置。其中,每个词的概率=字典中该词的词数/字典总词数。若确定待抽取文本中词段的开始位置为①,可识别到对应的结束位置有两个,分别为:②和③,则可计算两处结束位置对应的概率,若“有”对应的概率大于“有一”,则可确定②位置对应为①位置的最优结束位置,之后基于同样的方法确定出其他开始位置对应的最优结束位置,对于词段的开始位置②,可识别到对应的结束位置有两个,分别为:④和⑤,如确定④位置对应为②位置的最优结束位置,之后可在最优结束位置②和④处切分待抽取文本,获取得到目标实体为“有”、“一些”、“发烧”。
在具体的应用场景中,为了划分得到知识图谱子图,如图2所示,在该医疗方案推荐系统中,划分模块32,具体可包括:标记单元321、遍历单元322、划分单元323;其中,标记单元321,可用于在目标实体中标记核心对象实体和次要对象实体;遍历单元322,可用于以各个核心对象实体为遍历起点对医疗知识图谱进行遍历,并在遍历到次要对象实体时停止该方向的遍历;划分单元323,可用于依据各个核心对象实体的遍历结果划分知识图谱子图。
其中,实体标记是依据该类实体在知识图谱中的重要性和枢纽性,将其标记为核心对象或次要对象。由于不同领域的知识图谱具有不同的实体类别和关联关系,所以核心对象和次要对象的标记任务可由人工完成。在进行子图遍历时,可根据输入的核心对象实体,采用广度优先遍历规则进行子图遍历,当遍历到核心对象实体时选择将实体保留,作为后续遍历的起点;当遍历到次要对象实体时则在该方向上停止遍历。该步骤得到的实体其实是与起点实体直接相连的周边实体。重复遍历步骤,直到某一次遍历得到的实体,除了已经在知识图谱子图中的,剩下的都是次要对象实体。
相应的,为了得到知识图谱子图对应的低维向量,如图2所示,在该医疗方案推荐系统中,第一确定模块33,具体可包括:提取单元331、配置单元332、编码单元333、第二训练单元334;提取单元331,可用于提取知识图谱子图中的各个三元组;配置单元332,可用于通过对三元组进行位置编码,为三元组中的实体向量配置位置向量;编码单元333,可用于基于关系型网络对添加位置向量后的三元组进行编码处理,得到编码向量;第二训练单元334,可用于利用解码器对编码向量进行分值评定,并利用自适应矩估计(Adam)优化器进行迭代训练,进一步得到知识图谱子图对应的低维向量。
对于本实施例,知识图谱表征学习的原理可参见图3所示的医疗三元组嵌入式编码结构,具体的,在通过表征学习得到低维向量时,首先可将医疗三元组存为(实体,关系,实体)的形式,例如(患者,是否疾病史,疾病),(医生,级别,专业)等形式进行三元组的构建。之后可将位置关系嵌入到三元组对应的实体向量中,即通过对三元组进行位置编码,以实现在嵌入训练中为实体向量配置位置向量。接着可以利用关系型记忆网络对三元组进行编码,具体编码过程可以基于多头自注意力机制来实现。此外,为了避免实体编码的初始化过程中,得出的实体向量不够精准,故可基于解码器进行打分,并利用Adam优化器等进行迭代,通过正向和负向的网络训练过程,进一步对实体向量进行优化调整,使最终得到的低维向量符合预设的精度要求。以便最后在得到医疗实体的低维向量后,将其输入推荐模型中去,完成依次学习的框架。
在具体的应用场景中,如图2所示,在该医疗方案推荐系统中,具体还可包括:标注模块35、训练模块36、第二确定模块37;标注模块35,可用于确定样本患者数据,并为样本患者数据标注对应的预设医疗推荐方案;训练模块36,可用于利用样本患者数据对应的低维向量训练推荐模型;第二确定模块37,可用于若判定推荐模型输出的医疗推荐结果符合第二预设训练标准,则确定推荐模型通过训练;训练模块36,还可用于若判定推荐模型未通过训练,则利用样本患者数据重复训练推荐模型,以使推荐模型符合第二预设训练标准。
对于本实施例,可预先根据不同类型的样本患者数据标注对应的医疗推荐方案,如可为癌症这一类型的患者数据标注针对癌症这一领域的权威主治医生,此外还可标注对应的治疗方案、用药组合等。进而利用标注对应医疗推荐方案的样本患者数据对推荐模型进行针对性的训练,可进一步强化推荐模型的分类识别能力,以使推荐模型输出的结果与标注结果匹配。
相应的,如图2所示,在该医疗方案推荐系统中,获取模块34,具体可包括:输入单元341、确定单元342。
在具体的应用场景中,输入单元341可用于将低维向量输入到符合第二预设训练标准的推荐模型中,获取得到各个预设医疗推荐方案对应的推荐分值。对于本实施例,在获取得到目标患者对应的低维向量后,可将低维向量输入到符合第二预设训练标准的推荐模型中,推荐模型会输出各个预设推荐方案对应的推荐分值,推荐分值越高,代表参考价值越高。
相应的,确定单元342可用于将推荐分值最高的预设医疗推荐方案确定为目标用户的医疗推荐结果。对于本实施例,可将推荐分值最高的预设医疗推荐方案确定为与目标用户匹配的医疗推荐结果,进而输出推荐系统,展示给目标用户,以便为目标用户起到参考作用。
通过上述基于知识图谱表征学习的医疗方案推荐系统,可首先提取患者数据中的实体,并基于实体从知识图谱中抽取子图。之后通过知识图谱表征学习,采用三元组嵌入的方法,将每个实体(医生,病人)和关系(就诊,专业领域,处方,开药等)嵌入得到低维向量,并且保持医疗关系图谱中的语义信息。之后,将嵌入得到的低维向量,输入到推荐算法对应的推荐模型中去,推荐模型即可根据患者的低维向量,进行推荐分类,进一步输出医疗推荐结果,以供患者参考。在本申请中,通过表征学习获取低维向量,能够提高推荐系统推荐结果的准确性,为之后的个性化推荐提供更高的支持。此外,对于表征学习,本申请在传统方法的基础上,还额外引入位置编码和关系性记忆网络来挖掘三元组的潜在依赖关系,进一步得到目标实体的低维向量。此一过程应用位置编码和关系型记忆网络编码就诊三元组,能够在一定程度上解决现有方法无法描述知识图谱三元组潜在依赖关系的问题,能够提高三元组嵌入向量的准确性,为之后的个性化推荐提供更高的支持。
进一步的,作为图1和图2所示方法的具体体现,本申请实施例提供了一种基于知识图谱表征学习的医疗方案推荐方法,如图4所示,该方法包括:101、获取目标用户的患者数据,并提取患者数据中的目标实体;102、根据目标实体从医疗知识图谱中划分知识图谱子图;103、基于表征学习确定知识图谱子图对应的低维向量;104、将低维向量输入到符合预设训练标准的推荐模型中,获取得到与患者数据匹配的医疗推荐结果。
在具体的应用场景中,在提取患者数据中的目标实体时,具体可以包括:训练用于抽取中实体类的实体抽取模型;利用符合第一预设训练标准的实体抽取模型抽取患者数据中的目标实体。其中,训练用于抽取实体类的实体抽取模型的具体方法可为:对训练集数据中所包含的实体类进行词性标注;将标注处理后的训练集数据输入至实体抽取模型中,训练实体抽取模型基于Jieba自然语言处理库抽取实体类;若确定实体类的抽取误差小于预设阈值,则判定实体抽取模型通过训练;若确定实体类的抽取误差大于或等于预设阈值,则判定实体抽取模型未通过训练,利用预先标注好词性的训练集数据重复修正训练实体抽取模型,以使实体抽取模型满足第一预设训练标准。
在具体的应用场景中,在根据目标实体从医疗知识图谱中划分知识图谱子图时,具体可以包括:在目标实体中标记核心对象实体和次要对象实体;以各个核心对象实体为遍历起点对医疗知识图谱进行遍历,并在遍历到次要对象实体时停止该方向的遍历;依据各个核心对象实体的遍历结果划分知识图谱子图。
相应的,在基于表征学习确定知识图谱子图对应的低维向量时,具体可以包括:提取知识图谱子图中的各个三元组;通过对三元组进行位置编码,为三元组中的实体向量配置位置向量;基于关系型网络对添加位置向量后的三元组进行编码处理,得到编码向量;利用解码器对编码向量进行分值评定,并利用自适应矩估计(Adam)优化器进行迭代训练,进一步得到知识图谱子图对应的低维向量。
在具体的应用场景中,在将低维向量输入到符合预设训练标准的推荐模型中,获取得到与患者数据匹配的医疗推荐结果之前,具体还包括:确定样本患者数据,并为样本患者数据标注对应的预设医疗推荐方案;利用样本患者数据对应的低维向量训练推荐模型;若判定推荐模型输出的医疗推荐结果符合第二预设训练标准,则确定推荐模型通过训练;若判定推荐模型未通过训练,则利用样本患者数据重复训练推荐模型,以使推荐模型符合第二预设训练标准。
相应的,将低维向量输入到符合预设训练标准的推荐模型中,获取得到与患者数据匹配的医疗推荐结果,具体可包括:将低维向量输入到符合第二预设训练标准的推荐模型中,获取得到各个预设医疗推荐方案对应的推荐分值;将推荐分值最高的预设医疗推荐方案确定为目标用户的医疗推荐结果。
需要说明的是,本实施例提供的一种基于知识图谱表征学习的医疗方案推荐方法的其它相应描述,可以参考图1至图2中的对应描述,在此不再赘述。
基于上述如图4所示方法,相应的,本申请实施例还提供了一种存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述如图4所示的基于知识图谱表征学习的医疗方案推荐方法。
基于这样的理解,本申请的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施场景的方法。
基于上述如图1、图2所示的系统,以及图4所示的方法实施例,为了实现上述目的,本申请实施例还提供了一种计算机设备,具体可以为个人计算机、服务器、网络设备等,该实体设备包括存储介质和处理器;存储介质,用于存储计算机程序;处理器,用于执行计算机程序以实现上述如图4所示的基于知识图谱表征学习的医疗方案推荐方法。
可选地,该计算机设备还可以包括用户接口、网络接口、摄像头、射频(RadioFrequency,RF)电路,传感器、音频电路、WI-FI模块等等。用户接口可以包括显示屏(Display)、输入单元比如键盘(Keyboard)等,可选用户接口还可以包括USB接口、读卡器接口等。网络接口可选的可以包括标准的有线接口、无线接口(如蓝牙接口、WI-FI接口)等。
本领域技术人员可以理解,本实施例提供的计算机设备结构并不构成对该实体设备的限定,可以包括更多或更少的部件,或者组合某些部件,或者不同的部件布置。
非易失性可读存储介质中还可以包括操作系统、网络通信模块。操作系统是基于知识图谱的数据处理实体设备硬件和软件资源的程序,支持信息处理程序以及其它软件和/或程序的运行。网络通信模块用于实现非易失性可读存储介质内部各组件之间的通信,以及与该实体设备中其它硬件和软件之间通信。
通过以上的实施方式的描述,本领域的技术人员可首先提取患者数据中的实体,并基于实体从知识图谱中抽取子图。之后通过知识图谱表征学习,采用三元组嵌入的方法,将每个实体(医生,病人)和关系(就诊,专业领域,处方,开药等)嵌入得到低维向量,并且保持医疗关系图谱中的语义信息。之后,将嵌入得到的低维向量,输入到推荐算法对应的推荐模型中去,推荐模型即可根据患者的低维向量,进行推荐分类,进一步输出医疗推荐结果,以供患者参考。在本申请中,通过表征学习获取低维向量,能够提高推荐系统推荐结果的准确性,为之后的个性化推荐提供更高的支持。此外,对于表征学习,本申请在传统方法的基础上,还额外引入位置编码和关系性记忆网络来挖掘三元组的潜在依赖关系,进一步得到目标实体的低维向量。此一过程应用位置编码和关系型记忆网络编码就诊三元组,能够在一定程度上解决现有方法无法描述知识图谱三元组潜在依赖关系的问题,能够提高三元组嵌入向量的准确性,为之后的个性化推荐提供更高的支持。
本领域技术人员可以理解附图只是一个优选实施场景的示意图,附图中的模块或流程并不一定是实施本申请所必须的。本领域技术人员可以理解实施场景中的装置中的模块可以按照实施场景描述进行分布于实施场景的装置中,也可以进行相应变化位于不同于本实施场景的一个或多个装置中。上述实施场景的模块可以合并为一个模块,也可以进一步拆分成多个子模块。
上述本申请序号仅仅为了描述,不代表实施场景的优劣。以上公开的仅为本申请的几个具体实施场景,但是,本申请并非局限于此,任何本领域的技术人员能思之的变化都应落入本申请的保护范围。

Claims (9)

1.一种基于知识图谱表征学习的医疗方案推荐系统,其特征在于,包括:
提取模块,用于获取目标用户的患者数据,并提取所述患者数据中的目标实体;
划分模块,用于根据所述目标实体从医疗知识图谱中划分知识图谱子图;
所述划分模块,具体包括:
标记单元,用于在所述目标实体中标记核心对象实体和次要对象实体;
遍历单元,用于以各个所述核心对象实体为遍历起点对医疗知识图谱进行遍历,并在遍历到所述次要对象实体时停止;
划分单元,用于依据各个所述核心对象实体的遍历结果划分知识图谱子图;
第一确定模块,用于基于表征学习确定所述知识图谱子图对应的低维向量;
获取模块,用于将所述低维向量输入到符合预设训练标准的推荐模型中,获取得到与所述患者数据匹配的医疗推荐结果。
2.根据权利要求1所述的系统,其特征在于,所述提取模块,具体包括:
第一训练单元,用于训练用于抽取实体类的实体抽取模型;
抽取单元,用于利用符合第一预设训练标准的所述实体抽取模型抽取患者数据中的目标实体。
3.根据权利要求2所述的系统,其特征在于,所述第一训练单元,具体用于:
对训练集数据中所包含的实体类进行词性标注;
将标注处理后的所述训练集数据输入至实体抽取模型中,训练所述实体抽取模型基于Jieba自然语言处理库抽取实体类;
若确定所述实体类的抽取误差小于预设阈值,则判定所述实体抽取模型通过训练;
若确定所述实体类的抽取误差大于或等于所述预设阈值,则判定所述实体抽取模型未通过训练,利用预先标注好词性的训练集数据重复修正训练所述实体抽取模型,以使所述实体抽取模型满足第一预设训练标准。
4.根据权利要求1所述的系统,其特征在于,所述第一确定模块,具体包括:
提取单元,用于提取所述知识图谱子图中的各个三元组;
配置单元,用于通过对所述三元组进行位置编码,为所述三元组中的实体向量配置位置向量;
编码单元,用于基于关系型网络对添加所述位置向量后的三元组进行编码处理,得到编码向量;
第二训练单元,用于利用解码器对所述编码向量进行分值评定,并利用自适应矩估计Adam优化器进行迭代训练,进一步得到所述知识图谱子图对应的低维向量。
5.根据权利要求4所述的系统,其特征在于,还包括:标注模块、训练模块、第二确定模块;
所述标注模块,用于确定样本患者数据,并为所述样本患者数据标注对应的预设医疗推荐方案;
所述训练模块,用于利用所述样本患者数据对应的低维向量训练推荐模型;
所述第二确定模块,用于若判定所述推荐模型输出的医疗推荐结果符合第二预设训练标准,则确定所述推荐模型通过训练;
所述训练模块,还用于若判定所述推荐模型未通过训练,则利用所述样本患者数据重复训练所述推荐模型,以使所述推荐模型符合所述第二预设训练标准。
6.根据权利要求5所述的系统,其特征在于,所述获取模块,具体包括:
输入单元,用于将所述低维向量输入到符合所述第二预设训练标准的推荐模型中,获取得到各个预设医疗推荐方案对应的推荐分值;
确定单元,用于将所述推荐分值最高的预设医疗推荐方案确定为所述目标用户的医疗推荐结果。
7.一种基于知识图谱表征学习的医疗方案推荐方法,其特征在于,包括:
获取目标用户的患者数据,并提取所述患者数据中的目标实体;
根据所述目标实体从医疗知识图谱中划分知识图谱子图,包括:
在所述目标实体中标记核心对象实体和次要对象实体;
以各个所述核心对象实体为遍历起点对医疗知识图谱进行遍历,并在遍历到所述次要对象实体时停止;
依据各个所述核心对象实体的遍历结果划分知识图谱子图;
基于表征学习确定所述知识图谱子图对应的低维向量;
将所述低维向量输入到符合预设训练标准的推荐模型中,获取得到与所述患者数据匹配的医疗推荐结果。
8.一种非易失性可读存储介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现权利要求7所述的基于知识图谱表征学习的医疗方案推荐方法。
9.一种计算机设备,包括非易失性可读存储介质、处理器及存储在非易失性可读存储介质上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现权利要求7所述的基于知识图谱表征学习的医疗方案推荐方法。
CN202011153510.4A 2020-10-26 2020-10-26 基于知识图谱表征学习的医疗方案推荐系统及方法 Active CN112242187B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202011153510.4A CN112242187B (zh) 2020-10-26 2020-10-26 基于知识图谱表征学习的医疗方案推荐系统及方法
PCT/CN2020/136060 WO2021189971A1 (zh) 2020-10-26 2020-12-14 基于知识图谱表征学习的医疗方案推荐系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011153510.4A CN112242187B (zh) 2020-10-26 2020-10-26 基于知识图谱表征学习的医疗方案推荐系统及方法

Publications (2)

Publication Number Publication Date
CN112242187A CN112242187A (zh) 2021-01-19
CN112242187B true CN112242187B (zh) 2023-06-27

Family

ID=74169617

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011153510.4A Active CN112242187B (zh) 2020-10-26 2020-10-26 基于知识图谱表征学习的医疗方案推荐系统及方法

Country Status (2)

Country Link
CN (1) CN112242187B (zh)
WO (1) WO2021189971A1 (zh)

Families Citing this family (55)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112786198B (zh) * 2021-02-08 2024-05-31 科大讯飞股份有限公司 诊疗信息推荐模型构建方法、诊疗信息推荐方法及装置
CN113327691B (zh) * 2021-06-01 2022-08-12 平安科技(深圳)有限公司 基于语言模型的问询方法、装置、计算机设备及存储介质
CN113434692B (zh) * 2021-06-22 2023-08-01 上海交通大学医学院附属仁济医院 图神经网络模型构建、诊疗方案推荐方法、系统及设备
CN113535974B (zh) * 2021-06-28 2024-04-09 科大讯飞华南人工智能研究院(广州)有限公司 诊断推荐方法及相关装置、电子设备、存储介质
CN113792104B (zh) * 2021-09-16 2024-03-01 平安科技(深圳)有限公司 基于人工智能的医疗数据错误检测方法、装置及存储介质
CN113808664B (zh) * 2021-09-26 2024-03-19 平安科技(深圳)有限公司 基于机器学习的抗体筛选方法及装置
CN113886605A (zh) * 2021-10-25 2022-01-04 支付宝(杭州)信息技术有限公司 一种知识图谱处理方法和系统
CN114004228A (zh) * 2021-10-28 2022-02-01 泰康保险集团股份有限公司 医疗文本数据的标准化处理方法及装置
CN114005509B (zh) * 2021-10-30 2024-06-18 深圳平安智慧医健科技有限公司 一种治疗方案推荐系统、方法、装置和存储介质
CN114138759B (zh) * 2021-11-08 2024-07-23 国家电网公司华中分部 基于知识图谱推理的二次设备故障处理推送方法及系统
CN113918732A (zh) * 2021-11-19 2022-01-11 北京明略软件系统有限公司 多模态知识图谱构建方法、系统、存储介质及电子设备
CN114121212B (zh) * 2021-11-19 2024-04-02 东南大学 一种基于知识图谱和群表示学习的中药处方生成方法
CN114360731A (zh) * 2021-12-09 2022-04-15 武汉科技大学 一种面向老年照护的医养结合知识服务系统构建方法
CN114218402B (zh) * 2021-12-17 2024-05-28 迈创企业管理服务股份有限公司 一种计算机硬件故障更换件推荐的方法
CN114582443B (zh) * 2022-02-23 2023-08-18 西北大学 一种基于知识图谱的药物关系抽取方法
CN114974554A (zh) * 2022-02-23 2022-08-30 北京爱医声科技有限公司 融合图谱知识强化病历特征的方法、装置及存储介质
CN114722184A (zh) * 2022-03-30 2022-07-08 北京物灵科技有限公司 绘本推荐方法、装置、计算机设备及存储介质
CN114461734B (zh) * 2022-04-12 2022-07-12 支付宝(杭州)信息技术有限公司 知识图谱子图匹配的动态控制方法和系统
CN114547345B (zh) * 2022-04-18 2022-07-19 支付宝(杭州)信息技术有限公司 结合图谱模式的输入提示方法及装置
CN114496234B (zh) * 2022-04-18 2022-07-19 浙江大学 一种基于认知图谱的全科患者个性化诊疗方案推荐系统
CN114925160B (zh) * 2022-04-18 2024-06-21 北京急救中心 一种基于知识图谱技术的院前急救指导推荐系统和方法
CN114864037B (zh) * 2022-04-26 2024-07-16 泰康保险集团股份有限公司 医疗辅具推荐方法及装置、可读存储介质及电子设备
CN114880429B (zh) * 2022-05-05 2024-08-09 齐鲁工业大学 基于实体关系映射的医学成果推荐方法及系统
CN114884727B (zh) * 2022-05-06 2023-02-24 天津大学 一种基于动态层次化知识图谱的物联网络风险定位方法
CN114707004B (zh) * 2022-05-24 2022-08-16 国网浙江省电力有限公司信息通信分公司 基于图像模型和语言模型的事理关系抽取处理方法及系统
CN115148330B (zh) * 2022-05-24 2023-07-25 中国医学科学院北京协和医院 Pop治疗方案形成方法及系统
CN114820139B (zh) * 2022-05-25 2024-05-28 重庆大学 一种基于知识图谱路径推理的多用户推荐系统
CN114707005B (zh) * 2022-06-02 2022-10-25 浙江建木智能系统有限公司 一种舰船装备的知识图谱构建方法和系统
CN114783580B (zh) * 2022-06-20 2022-09-13 武汉博科国泰信息技术有限公司 一种医疗数据质量评估方法及系统
CN114840777B (zh) * 2022-07-04 2022-09-27 杭州城市大脑有限公司 多维度养老服务推荐方法、装置以及电子设备
CN114969557B (zh) * 2022-07-29 2022-11-08 之江实验室 一种基于多来源信息融合的宣教推送方法和系统
CN114996412B (zh) * 2022-08-02 2022-11-15 医智生命科技(天津)有限公司 医疗问答方法、装置、电子设备及存储介质
CN115036034B (zh) * 2022-08-11 2022-11-08 之江实验室 一种基于患者表征图的相似患者识别方法及系统
CN115050441B (zh) * 2022-08-16 2022-11-01 北京嘉和美康信息技术有限公司 治疗方案的显示方法、装置、电子设备及介质
CN115148344B (zh) * 2022-09-06 2022-11-29 深圳市指南针医疗科技有限公司 基于蚁群算法的医技管理方法、装置、设备及存储介质
CN115579104B (zh) * 2022-09-08 2024-07-12 广东技术师范大学 一种基于人工智能的肝癌全病程数字化管理方法及系统
CN115344717B (zh) * 2022-10-18 2023-02-17 国网江西省电力有限公司电力科学研究院 面向多类型供用能系统调控运行知识图谱构建方法及装置
CN115952296A (zh) * 2022-12-12 2023-04-11 江苏电子信息职业学院 基于知识增强和图对比学习的企业技术服务推荐方法及装置
CN115658877B (zh) * 2022-12-27 2023-03-21 神州医疗科技股份有限公司 基于强化学习的药物推荐方法、装置、电子设备和介质
CN116364240B (zh) * 2023-02-02 2024-01-26 复旦大学附属肿瘤医院 一种基于互联网的远程营养信息处理方法及系统
CN116186359B (zh) * 2023-05-04 2023-09-01 安徽宝信信息科技有限公司 一种高校多源异构数据的集成管理方法、系统及存储介质
CN116343980B (zh) * 2023-05-30 2023-08-29 深圳市即达健康医疗科技有限公司 一种基于智慧医疗复诊随访数据处理方法及系统
CN116383413B (zh) * 2023-06-05 2023-08-29 湖南云略信息技术有限公司 基于医疗数据提取的知识图谱更新方法和系统
CN116842109A (zh) * 2023-06-27 2023-10-03 北京大学 信息检索知识图谱嵌入方法、装置和计算机设备
CN116612892B (zh) * 2023-07-17 2023-09-26 天津市疾病预防控制中心 一种可穿戴装置的健康监测方法及系统
CN116610871B (zh) * 2023-07-18 2024-01-26 腾讯科技(深圳)有限公司 媒体数据的推荐方法、装置、计算机设备和存储介质
CN116796007B (zh) * 2023-08-03 2024-05-03 苏州浪潮智能科技有限公司 目标知识图谱嵌入方法、其装置及电子设备
CN117010494B (zh) * 2023-09-27 2024-01-05 之江实验室 一种基于因果表示学习的医学数据生成方法及系统
CN117149998B (zh) * 2023-10-30 2024-01-23 北京南师信息技术有限公司 基于多目标优化的智能就诊推荐方法及系统
CN117196027B (zh) * 2023-11-07 2024-02-02 北京航天晨信科技有限责任公司 一种基于知识图谱的训练样本生成方法及装置
CN117609606B (zh) * 2023-11-20 2024-07-19 中国科学院文献情报中心 有机太阳能电池领域的实验方案智能推荐方法及系统
CN117893694B (zh) * 2024-03-15 2024-06-18 北京大学第三医院(北京大学第三临床医学院) 一种寰枢椎脱位的治疗方案推荐方法和系统
CN118098645A (zh) * 2024-03-20 2024-05-28 珠海灏睿数字技术有限公司 基于远程的慢病在线复诊信息管理方法及系统
CN118072928B (zh) * 2024-04-18 2024-08-09 中南大学 一种基于数据仓库的医疗数据整合系统
CN118194984B (zh) * 2024-05-17 2024-07-23 广东海洋大学 一种本体驱动的目标区域鱼类知识图谱构建方法及系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110275960A (zh) * 2019-06-11 2019-09-24 中国电子科技集团公司电子科学研究院 基于指称句的知识图谱和文本信息的表示方法及系统
CN110334339A (zh) * 2019-04-30 2019-10-15 华中科技大学 一种基于位置感知自注意力机制的序列标注模型与标注方法
CN111767410A (zh) * 2020-06-30 2020-10-13 平安国际智慧城市科技股份有限公司 临床医疗知识图谱的构建方法、装置、设备及存储介质

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110287337A (zh) * 2019-06-19 2019-09-27 上海交通大学 基于深度学习和知识图谱获取医学同义词的系统及方法
CN111159424B (zh) * 2019-12-27 2023-06-06 东软集团股份有限公司 标注知识图谱实体的方法,装置,存储介质及电子设备
CN111613339B (zh) * 2020-05-15 2021-07-09 山东大学 一种基于深度学习的相似病历查找方法与系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110334339A (zh) * 2019-04-30 2019-10-15 华中科技大学 一种基于位置感知自注意力机制的序列标注模型与标注方法
CN110275960A (zh) * 2019-06-11 2019-09-24 中国电子科技集团公司电子科学研究院 基于指称句的知识图谱和文本信息的表示方法及系统
CN111767410A (zh) * 2020-06-30 2020-10-13 平安国际智慧城市科技股份有限公司 临床医疗知识图谱的构建方法、装置、设备及存储介质

Also Published As

Publication number Publication date
CN112242187A (zh) 2021-01-19
WO2021189971A1 (zh) 2021-09-30

Similar Documents

Publication Publication Date Title
CN112242187B (zh) 基于知识图谱表征学习的医疗方案推荐系统及方法
CN112256828B (zh) 医学实体关系抽取方法、装置、计算机设备及可读存储介质
CN112270196B (zh) 实体关系的识别方法、装置及电子设备
CN111324743A (zh) 文本关系抽取的方法、装置、计算机设备及存储介质
CN112015917A (zh) 基于知识图谱的数据处理方法、装置及计算机设备
CN110442841A (zh) 识别简历的方法及装置、计算机设备、存储介质
WO2023029502A1 (zh) 基于问诊会话构建用户画像的方法、装置、设备和介质
US20220222447A1 (en) Translation method and apparatus, electronic device, and computer-readable storage medium
CN115292457B (zh) 知识问答方法、装置、计算机可读介质及电子设备
CN112131881B (zh) 信息抽取方法及装置、电子设备、存储介质
CN112487139A (zh) 基于文本的自动出题方法、装置及计算机设备
CN114913953B (zh) 医学实体关系的识别方法、装置、电子设备及存储介质
CN110399547A (zh) 用于更新模型参数的方法、装置、设备和存储介质
CN111611350A (zh) 基于健康知识的应答方法、装置及电子设备
CN113657105A (zh) 基于词汇增强的医学实体抽取方法、装置、设备及介质
CN117076688A (zh) 基于领域知识图谱的知识问答方法及其装置、电子设备
CN117708339B (zh) 一种基于预训练语言模型的icd自动编码方法
CN117407502A (zh) 问答对抽取方法、装置、电子设备及存储介质
CN110969005B (zh) 一种确定实体语料之间的相似性的方法及装置
CN116842168B (zh) 跨领域问题处理方法、装置、电子设备及存储介质
CN115985506A (zh) 一种信息提取方法及装置、存储介质、计算机设备
CN113486680A (zh) 文本翻译方法、装置、设备及存储介质
CN112700825A (zh) 医学数据的处理方法、装置及存储介质
CN114611497B (zh) 语病诊断模型的训练方法、语病诊断方法、装置及设备
CN113536789B (zh) 算法比赛关联性预测方法、装置、设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40041462

Country of ref document: HK

SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant