CN116842142B - 一种医疗器械智能化检索系统 - Google Patents

一种医疗器械智能化检索系统 Download PDF

Info

Publication number
CN116842142B
CN116842142B CN202311094559.0A CN202311094559A CN116842142B CN 116842142 B CN116842142 B CN 116842142B CN 202311094559 A CN202311094559 A CN 202311094559A CN 116842142 B CN116842142 B CN 116842142B
Authority
CN
China
Prior art keywords
index word
search
triplet
matching
retrieval
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202311094559.0A
Other languages
English (en)
Other versions
CN116842142A (zh
Inventor
阳晓慧
王海洋
戴卫泽
毛德许
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nantong Kangsheng Medical Equipment Co ltd
Original Assignee
Nantong Kangsheng Medical Equipment Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nantong Kangsheng Medical Equipment Co ltd filed Critical Nantong Kangsheng Medical Equipment Co ltd
Priority to CN202311617955.7A priority Critical patent/CN117435694A/zh
Priority to CN202311094559.0A priority patent/CN116842142B/zh
Publication of CN116842142A publication Critical patent/CN116842142A/zh
Application granted granted Critical
Publication of CN116842142B publication Critical patent/CN116842142B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H70/00ICT specially adapted for the handling or processing of medical references
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Animal Behavior & Ethology (AREA)
  • Health & Medical Sciences (AREA)
  • Epidemiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Primary Health Care (AREA)
  • Public Health (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种医疗器械智能化检索系统,属于医疗器械知识检索领域,解决了如何提供一个智能化检索系统,使得相关人员能够获取精准的医疗器械知识信息的问题;知识图谱构建模块根据医疗器械信息构建关于医疗器械的知识图谱;检索词解析模块对用户端输入的检索词进行解析,获取检索三元组集合或检索关键词集合发送至关联匹配模块;关联匹配模块对获取的检索三元组集合或检索关键词集合进行分析,获取匹配索引词集合发送至知识推荐模块;知识推荐模块根据获取的匹配索引词集合,将数据库所存储的知识图谱相关知识信息推送至用户端;为用户端提供了包含检索词信息最多、且排列在前的知识图谱知识信息,提高了工作效率或学习效率。

Description

一种医疗器械智能化检索系统
技术领域
本发明属于医疗器械知识检索领域,涉及知识图谱技术,具体是一种医疗器械智能化检索系统。
背景技术
在医学治疗或其他医学研究中需要使用各种医疗器械,医护人员或研究人员可以通过在数据库中进行检索,从而获取所需要的医疗器械的相关知识,进而帮助他们作出更好的决策和进行深入的研究。
现有技术中在对医疗器械的数据库进行检索,当检索词篇幅过长时,并不能检索出较为准确的知识信息,导致相关人员不能很好的获取所需要的知识信息,进而耽误工作进度或学习进度,为此,本发明提出了一种医疗器械智能化检索系统。
发明内容
本发明旨在至少解决现有技术中存在的技术问题之一。为此,本发明提出一种医疗器械智能化检索系统,该发明解决了如何提供一个智能化检索系统,使得相关人员能够获取精准的医疗器械知识信息的问题。
为了实现上述目的,本发明采用了如下技术方案:
一种医疗器械智能化检索系统,包括:知识图谱构建模块,用于对来自不同数据源的医疗器械信息进行分析,进而构建关于医疗器械的知识图谱,并存入数据库中;
检索词解析模块,用于对用户端输入的检索词进行解析,根据自然语言处理技术对获取的检索词进行实体的识别和抽取,获取一个或多个检索三元组,将获取的检索三元组存入检索三元组集合;若无法提取检索三元组,则提取检索词的关键词存入检索关键词集合;将获取的检索三元组集合或检索关键词集合打上时间戳和用户ID标签发送至关联匹配模块;
关联匹配模块,用于对获取的带有时间戳和用户ID标签的检索三元组集合或检索关键词集合进行分析,获取匹配索引词集合发送至知识推荐模块;当获取的是检索三元组集合,则针对检索三元组集合中的一个或多个检索三元组,根据同义词词典获取各个检索三元组对应实体或关系词的索引词集,根据获取的各个索引词链接的知识图谱相关知识是否包含对应三元组的主体实体、关系词以及客体实体,从而获取对应三元组的第一匹配索引词、第二匹配索引词以及第三匹配索引词,进而获取只包含一个检索三元组的检索三元组集合的匹配索引词集合,以及在同一匹配等级下,将索引词按照频次从大到小的顺序进行排列,从而获取包含多个检索三元组的检索三元组集合的匹配索引词集合;当获取的是检索关键词集合,则经过分析获取检索关键词集合的匹配索引词集合;关联匹配模块将获取的匹配索引词集合打上时间戳和用户ID标签发送至知识推荐模块;
知识推荐模块,用于根据获取的带有时间戳和用户ID标签的匹配索引词集合,将数据库所存储的知识图谱相关知识信息推送至用户端。
进一步地,所述知识图谱构建模块的构建过程如下:
获取来自不同数据源的医疗器械信息;
对获取的医疗器械信息所包含的噪声、重复数据、缺失数据或错误数据进行处理,并将不同数据结构的数据转化成统一的数据结构和数据格式;
通过自然语言处理技术对统一数据结构和数据格式的医疗器械的文本数据进行实体识别和抽取,将主体实体、客体实体以及关系词表示为三元组;
在组成多个三元组之后,通过同义词典对其中相同的主体实体或客体实体进行链接,从而构建关于医疗器械的知识图谱,并存入数据库中,数据库采用图算法对知识图谱建立索引;其中,同义词典是前期将不同的词语或术语进行归并,使得同义词能够关联。
进一步地,医疗器械信息包括医疗器械的名称、规格、功能、性能、品牌、生产厂家、使用说明、用途、适应症以及病症描述,其中医疗器械的名称、品牌以及生产厂家为主体实体信息,医疗器械的规格、功能、性能、使用说明、用途、适应症以及病症描述为客体实体信息。
进一步地,所述检索词解析模块获取检索三元组后存入检索三元组集合的过程如下:
统计检索三元组的数量;若通过检索词获取多个检索三元组,则将提取出的三元组按照在检索词中出现的顺序进行排列;并统计各个检索三元组的频次,若存在频次大于1的检索三元组,则将频次大于1的检索三元组删减至频次等于1;将经过处理后的检索三元组存入检索三元组集合,并打上时间戳和用户ID标签发送至关联匹配模块。
进一步地,当获取的是带有时间戳和用户ID标签的检索三元组集合时,关联匹配模块的分析过程如下:
统计检索三元组集合所包含的检索三元组的数量;
若检索三元组的数量等于1,则有:
将检索三元组集合中唯一的检索三元组标记为目标三元组,将其包含的主体实体词、关系词以及客体主体词分别标记为第一目标实体、目标关系词以及第二目标实体;
根据同义词词典,分别将第一目标实体、目标关系词以及第二目标实体在数据库所包含的索引词中进行遍历,分别获取属于第一目标实体、目标关系词以及第二目标实体的主体实体索引词集、关系词索引词集以及客体实体索引词集;
对各个索引词集包含的索引词所链接的知识图谱实体、与该实体链接的其他实体以及该实体与其他实体之间的关系词进行遍历;
根据同义词词典判断知识图谱对应的实体、与该实体链接的其他实体以及该实体与其他实体之间的关系词是否与第一目标实体、第二目标实体以及目标关系词语义相似;若三项语义均相似,则将该索引词标记为第一匹配索引词;若存在两项语义相似,则将该索引词标记为第二匹配索引词,若存在一项语义相似,则将该索引词标记为第三匹配索引词;
从各个索引词集中筛选出第一匹配索引词、第二匹配索引词以及第三匹配索引词,对重复的索引词进行删除,对删除重复后的各个索引词按照匹配等级依次排列,从而获取目标三元组的匹配索引词集合,并将获取的匹配索引词集合打上时间戳和用户ID标签发送至知识推荐模块;
若检索三元组的数量大于1,则有:
按照上述检索三元组的数量等于1的方式对检索三元组集合中每个检索三元组进行处理,获取各个检索三元组的匹配索引词集合,并合并成一个匹配索引词集合;
统计各个索引词的频次,将合并后的匹配索引词集合中的每个匹配等级所包含的各个索引词按照频次从大到小的顺序依次排列,将重复的索引词删除,将处理完毕的匹配索引词集合打上时间戳和用户ID标签发送至知识推荐模块。
进一步地,当获取的是带有时间戳和用户ID标签的检索关键词集合时,关联匹配模块的分析过程如下:
若检索关键词的数量等于1,则将检索关键词集合中唯一的检索关键词标记为目标关键词,根据同义词词典,将目标关键词在数据库所包含的索引词中进行遍历获取属于目标关键词的匹配索引词集合,并将获取的匹配索引词集合打上时间戳和用户ID标签发送至知识推荐模块;
若检索关键词的数量大于1,则根据上述检索关键词的数量等于1的方式获取各个检索关键词的匹配索引词集合,并合并成一个匹配索引词集合;
统计各个索引词的频次,将合并后的匹配索引词集合中的各个索引词按照频次从大到小的顺序依次排列,将重复的索引词删除,打上时间戳和用户ID标签发送至知识推荐模块。
进一步地,所述知识推荐模块根据索引词集合,提取索引词集合所包含的各个索引词;按照索引词在索引词集合中的顺序,依次将链接对应的知识图谱的知识信息发送至用户端,供用户端进行查看。
与现有技术相比,本发明的有益效果是:
1、在本发明中,检索词解析模块对用户端输入的检索词进行解析,对获取的检索词进行实体的识别和抽取,从而获取检索三元组,当检索词篇幅较长时,可以根据检索词获取多个检索三元组,若检索词篇幅较短或者无法从检索词中提取检索三元组,则直接提取检索关键词;检索词解析模块将获取的检索三元组集合或检索关键词集合发送至关联匹配模块,为关联匹配模块提供检索词对应时间戳对应用户ID的数据,从而为后续检索词能够准确链接至知识图谱相关知识提供符合格式和标准的检索数据。
2、在本发明中,通过关联匹配模块对获取的检索三元组集合或检索关键词集合进行分析,进而获取针对相应时间戳和用户ID标签的匹配索引词集合发送至知识推荐模块,由知识推荐模块按照匹配索引词集合中索引词的顺序将知识图谱中相应知识发送至用户端;其中匹配索引词集合的获取分为两种情形,分别是对检索三元组集合分析获取和对检索关键词集合分析获取;其中针对检索三元组集合中的一个或多个检索三元组,根据同义词词典获取各个检索三元组对应实体或关系词的索引词集,再根据获取的各个索引词链接的知识图谱相关知识是否包含对应三元组的主体实体、关系词以及客体实体,从而获取对应三元组的第一匹配索引词、第二匹配索引词以及第三匹配索引词,进而获取只包含一个检索三元组的检索三元组集合的匹配索引词集合,以及在同一匹配等级下,将索引词按照频次从大到小的顺序进行排列,从而获取包含多个检索三元组的检索三元组集合的匹配索引词集合;通过关联匹配模块和知识推荐模块能够为用户端提供包含检索词信息最多、且排列在前的知识图谱知识信息,使得用户能够获取较为准确的知识信息,提高了工作效率或学习效率。
附图说明
图1为本发明的一种医疗器械智能化检索系统框图。
具体实施方式
下面将结合实施例对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
如图1所示,一种医疗器械智能化检索系统,包括:知识图谱构建模块、检索词解析模块、关联匹配模块、知识推荐模块以及数据库;
所述知识图谱构建模块用于对来自不同数据源的医疗器械信息进行分析,进而构建关于医疗器械的知识图谱;过程如下:
获取来自不同数据源的医疗器械信息,包括医疗器械的名称、规格、功能、性能、品牌、生产厂家、使用说明、用途、适应症、病症描述等;数据源来自医疗器械厂商、医学数据库等;
对获取的医疗器械信息所包含的噪声、重复数据、缺失数据或错误数据进行处理,并将不同数据结构的数据转化成统一的数据结构和数据格式;
通过自然语言处理技术对统一数据结构和数据格式的医疗器械的文本数据进行实体识别和抽取,包括:对医疗器械的名称、品牌、生产厂家等主体实体信息进行识别,对医疗器械的规格、功能、性能、使用说明、用途、适应症、病症描述等客体实体信息进行识别,以及对主体实体和客体实体之间的关系词信息进行抽取,如具有、包含、适用于、治疗等;将主体实体、客体实体以及关系词信息表示为三元组;
在组成多个三元组之后,通过同义词典对其中相同的主体实体或客体实体进行链接,从而构建关于医疗器械的知识图谱,并存入数据库中,数据库采用图算法对知识图谱建立索引;
其中,同义词典是前期将不同的词语或术语进行归并,使得同义词能够关联;
所述检索词解析模块用于对用户端输入的检索词进行解析,包括:
获取用户输入的检索词;对获取的检索词进行语义分析,并识别出主体实体、客体实体以及两者之间的关系词,建立检索三元组;如果检索词的文字较多,可以提取出多个检索三元组;若根据检索词未能建立检索三元组,则获取实体或关系词作为关键词;
当通过检索词获取检索三元组,则有:
统计检索三元组的数量;若通过检索词获取多个检索三元组,则将提取出的三元组按照在检索词中出现的顺序进行排列;并统计各个检索三元组的频次,若存在频次大于1的检索三元组,则将频次大于1的检索三元组删减至频次等于1;
将经过处理后的检索三元组存入检索三元组集合,并打上时间戳和用户ID标签发送至关联匹配模块;
当通过检索词未获取检索三元组,则有:
将提取的实体或关系词作为关键词,并将关键词存入检索关键词集合,打上时间戳和用户ID标签发送至关联匹配模块;
未能获取检索三元组指的是只能提取其中一个实体或关系词,或者提取出多个实体,但之间并不能构成三元组形式;
在本实施例中,检索词解析模块对用户端输入的检索词进行解析,对获取的检索词进行实体的识别和抽取,从而获取检索三元组,当检索词篇幅较长时,可以根据检索词获取多个检索三元组,若检索词篇幅较短或者无法从检索词中提取检索三元组,则直接提取检索关键词;检索词解析模块将获取的检索三元组集合或检索关键词集合发送至关联匹配模块,为关联匹配模块提供检索词对应时间戳对应用户ID的数据,从而为后续检索词能够准确链接至知识图谱相关知识提供符合格式和标准的检索数据;
所述关联匹配模块用于对获取的带有时间戳和用户ID标签的检索三元组集合或检索关键词集合进行分析,获取匹配索引词集合发送至知识推荐模块;分为两种情形,过程如下:
情形一:当获取的是带有时间戳和用户ID标签的检索三元组集合;
统计检索三元组集合所包含的检索三元组的数量;
若检索三元组的数量等于1,则有:
将检索三元组集合中唯一的检索三元组标记为目标三元组,将其包含的主体实体词、关系词以及客体主体词分别标记为第一目标实体、目标关系词以及第二目标实体;
根据同义词词典,分别将第一目标实体、目标关系词以及第二目标实体在数据库所包含的索引词中进行遍历,分别获取属于第一目标实体、目标关系词以及第二目标实体的主体实体索引词集、关系词索引词集以及客体实体索引词集;
对各个索引词集包含的索引词所链接的知识图谱实体、与该实体链接的其他实体以及该实体与其他实体之间的关系词进行遍历;
根据同义词词典判断知识图谱对应的实体、与该实体链接的其他实体以及该实体与其他实体之间的关系词是否与第一目标实体、第二目标实体以及目标关系词语义相似;若三项语义均相似,则将该索引词标记为第一匹配索引词;若存在两项语义相似,则将该索引词标记为第二匹配索引词,若存在一项语义相似,则将该索引词标记为第三匹配索引词;
从各个索引词集中筛选出第一匹配索引词、第二匹配索引词以及第三匹配索引词,对重复的索引词进行删除,对删除重复后的各个索引词按照匹配等级依次排列,从而获取目标三元组的匹配索引词集合,并将获取的匹配索引词集合打上时间戳和用户ID标签发送至知识推荐模块;
若检索三元组的数量大于1,则有:
按照上述方式对检索三元组集合中每个检索三元组进行处理,获取各个检索三元组的匹配索引词集合,并合并成一个匹配索引词集合;
统计各个索引词的频次,将合并后的匹配索引词集合中的每个匹配等级所包含的各个索引词按照频次从大到小的顺序依次排列,将重复的索引词删除,将处理完毕的匹配索引词集合打上时间戳和用户ID标签发送至知识推荐模块;
情形二:当获取的是带有时间戳和用户ID标签的检索关键词集合;
若检索关键词的数量等于1,则将检索关键词集合中唯一的检索关键词标记为目标关键词,根据同义词词典,将目标关键词在数据库所包含的索引词中进行遍历获取属于目标关键词的匹配索引词集合,并将获取的匹配索引词集合打上时间戳和用户ID标签发送至知识推荐模块;
若检索关键词的数量大于1,则根据上述方式获取各个检索关键词的匹配索引词集合,并合并成一个匹配索引词集合;
统计各个索引词的频次,将合并后的匹配索引词集合中的各个索引词按照频次从大到小的顺序依次排列,将重复的索引词删除,打上时间戳和用户ID标签发送至知识推荐模块;
所述知识推荐模块用于根据获取的带有时间戳和用户ID标签的匹配索引词集合,将数据库所存储的知识图谱相关知识信息推送至用户端;
根据索引词集合,提取索引词集合所包含的各个索引词;
按照索引词在索引词集合中的顺序,依次将链接对应的知识图谱的知识信息发送至用户端,供用户端进行查看;
在本实施例中,通过关联匹配模块对获取的检索三元组集合或检索关键词集合进行分析,进而获取针对相应时间戳和用户ID标签的匹配索引词集合发送至知识推荐模块,由知识推荐模块按照匹配索引词集合中索引词的顺序将知识图谱中相应知识发送至用户端;其中匹配索引词集合的获取分为两种情形,分别是对检索三元组集合分析获取和对检索关键词集合分析获取;其中针对检索三元组集合中的一个或多个检索三元组,根据同义词词典获取各个检索三元组对应实体或关系词的索引词集,再根据获取的各个索引词链接的知识图谱相关知识是否包含对应三元组的主体实体、关系词以及客体实体,从而获取对应三元组的第一匹配索引词、第二匹配索引词以及第三匹配索引词,进而获取只包含一个检索三元组的检索三元组集合的匹配索引词集合,以及在同一匹配等级下,将索引词按照频次从大到小的顺序进行排列,从而获取包含多个检索三元组的检索三元组集合的匹配索引词集合;通过关联匹配模块和知识推荐模块能够为用户端提供包含检索词信息最多、且排列在前的知识图谱知识信息,使得用户能够获取较为准确的知识信息,提高了工作效率或学习效率。
在本发明所提供的实施例中,应该理解到,所揭露的设备,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式;所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方法的目的。
以上实施例仅用以说明本发明的技术方法而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方法进行修改或等同替换,而不脱离本发明技术方法的精神和范围。

Claims (5)

1.一种医疗器械智能化检索系统,其特征在于:包括:
知识图谱构建模块,用于对来自不同数据源的医疗器械信息进行分析,进而构建关于医疗器械的知识图谱,并存入数据库中;
检索词解析模块,用于对用户端输入的检索词进行解析,根据自然语言处理技术对获取的检索词进行实体的识别和抽取,获取一个或多个检索三元组,将获取的检索三元组存入检索三元组集合;若无法提取检索三元组,则提取检索词的关键词存入检索关键词集合;将获取的检索三元组集合或检索关键词集合打上时间戳和用户ID标签发送至关联匹配模块;
关联匹配模块,用于对获取的带有时间戳和用户ID标签的检索三元组集合或检索关键词集合进行分析,获取匹配索引词集合发送至知识推荐模块;当获取的是检索三元组集合,则针对检索三元组集合中的一个或多个检索三元组,根据同义词词典获取各个检索三元组对应实体或关系词的索引词集,根据获取的各个索引词链接的知识图谱相关知识是否包含对应三元组的主体实体、关系词以及客体实体,从而获取对应三元组的第一匹配索引词、第二匹配索引词以及第三匹配索引词,进而获取只包含一个检索三元组的检索三元组集合的匹配索引词集合,以及在同一匹配等级下,将索引词按照频次从大到小的顺序进行排列,从而获取包含多个检索三元组的检索三元组集合的匹配索引词集合;当获取的是检索关键词集合,则经过分析获取检索关键词集合的匹配索引词集合;关联匹配模块将获取的匹配索引词集合打上时间戳和用户ID标签发送至知识推荐模块;
当获取的是带有时间戳和用户ID标签的检索三元组集合时,关联匹配模块的分析过程如下:
统计检索三元组集合所包含的检索三元组的数量;
若检索三元组的数量等于1,则有:
将检索三元组集合中唯一的检索三元组标记为目标三元组,将其包含的主体实体词、关系词以及客体主体词分别标记为第一目标实体、目标关系词以及第二目标实体;
根据同义词词典,分别将第一目标实体、目标关系词以及第二目标实体在数据库所包含的索引词中进行遍历,分别获取属于第一目标实体、目标关系词以及第二目标实体的主体实体索引词集、关系词索引词集以及客体实体索引词集;
对各个索引词集包含的索引词所链接的知识图谱实体、与该实体链接的其他实体以及该实体与其他实体之间的关系词进行遍历;
根据同义词词典判断知识图谱对应的实体、与该实体链接的其他实体以及该实体与其他实体之间的关系词是否与第一目标实体、第二目标实体以及目标关系词语义相似;若三项语义均相似,则将该索引词标记为第一匹配索引词;若存在两项语义相似,则将该索引词标记为第二匹配索引词,若存在一项语义相似,则将该索引词标记为第三匹配索引词;
从各个索引词集中筛选出第一匹配索引词、第二匹配索引词以及第三匹配索引词,对重复的索引词进行删除,对删除重复后的各个索引词按照匹配等级依次排列,从而获取目标三元组的匹配索引词集合,并将获取的匹配索引词集合打上时间戳和用户ID标签发送至知识推荐模块;
若检索三元组的数量大于1,则有:
按照上述检索三元组的数量等于1的方式对检索三元组集合中每个检索三元组进行处理,获取各个检索三元组的匹配索引词集合,并合并成一个匹配索引词集合;
统计各个索引词的频次,将合并后的匹配索引词集合中的每个匹配等级所包含的各个索引词按照频次从大到小的顺序依次排列,将重复的索引词删除,将处理完毕的匹配索引词集合打上时间戳和用户ID标签发送至知识推荐模块;
当获取的是带有时间戳和用户ID标签的检索关键词集合时,关联匹配模块的分析过程如下:
若检索关键词的数量等于1,则将检索关键词集合中唯一的检索关键词标记为目标关键词,根据同义词词典,将目标关键词在数据库所包含的索引词中进行遍历获取属于目标关键词的匹配索引词集合,并将获取的匹配索引词集合打上时间戳和用户ID标签发送至知识推荐模块;
若检索关键词的数量大于1,则根据上述检索关键词的数量等于1的方式获取各个检索关键词的匹配索引词集合,并合并成一个匹配索引词集合;
统计各个索引词的频次,将合并后的匹配索引词集合中的各个索引词按照频次从大到小的顺序依次排列,将重复的索引词删除,打上时间戳和用户ID标签发送至知识推荐模块;
知识推荐模块,用于根据获取的带有时间戳和用户ID标签的匹配索引词集合,将数据库所存储的知识图谱相关知识信息推送至用户端。
2.根据权利要求1所述的一种医疗器械智能化检索系统,其特征在于:所述知识图谱构建模块的构建过程如下:
获取来自不同数据源的医疗器械信息;
对获取的医疗器械信息所包含的噪声、重复数据、缺失数据或错误数据进行处理,并将不同数据结构的数据转化成统一的数据结构和数据格式;
通过自然语言处理技术对统一数据结构和数据格式的医疗器械的文本数据进行实体识别和抽取,将主体实体、客体实体以及关系词表示为三元组;
在组成多个三元组之后,通过同义词典对其中相同的主体实体或客体实体进行链接,从而构建关于医疗器械的知识图谱,并存入数据库中,数据库采用图算法对知识图谱建立索引;其中,同义词典是前期将不同的词语或术语进行归并,使得同义词能够关联。
3.根据权利要求2所述的一种医疗器械智能化检索系统,其特征在于:医疗器械信息包括医疗器械的名称、规格、功能、性能、品牌、生产厂家、使用说明、用途、适应症以及病症描述,其中医疗器械的名称、品牌以及生产厂家为主体实体信息,医疗器械的规格、功能、性能、使用说明、用途、适应症以及病症描述为客体实体信息。
4.根据权利要求1所述的一种医疗器械智能化检索系统,其特征在于:所述检索词解析模块获取检索三元组后存入检索三元组集合的过程如下:
统计检索三元组的数量;若通过检索词获取多个检索三元组,则将提取出的三元组按照在检索词中出现的顺序进行排列;并统计各个检索三元组的频次,若存在频次大于1的检索三元组,则将频次大于1的检索三元组删减至频次等于1;将经过处理后的检索三元组存入检索三元组集合,并打上时间戳和用户ID标签发送至关联匹配模块。
5.根据权利要求1所述的一种医疗器械智能化检索系统,其特征在于:所述知识推荐模块根据索引词集合,提取索引词集合所包含的各个索引词;按照索引词在索引词集合中的顺序,依次将链接对应的知识图谱的知识信息发送至用户端,供用户端进行查看。
CN202311094559.0A 2023-08-29 2023-08-29 一种医疗器械智能化检索系统 Active CN116842142B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202311617955.7A CN117435694A (zh) 2023-08-29 2023-08-29 一种医疗器械智能化检索系统
CN202311094559.0A CN116842142B (zh) 2023-08-29 2023-08-29 一种医疗器械智能化检索系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311094559.0A CN116842142B (zh) 2023-08-29 2023-08-29 一种医疗器械智能化检索系统

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CN202311617955.7A Division CN117435694A (zh) 2023-08-29 2023-08-29 一种医疗器械智能化检索系统

Publications (2)

Publication Number Publication Date
CN116842142A CN116842142A (zh) 2023-10-03
CN116842142B true CN116842142B (zh) 2023-12-19

Family

ID=88167421

Family Applications (2)

Application Number Title Priority Date Filing Date
CN202311094559.0A Active CN116842142B (zh) 2023-08-29 2023-08-29 一种医疗器械智能化检索系统
CN202311617955.7A Pending CN117435694A (zh) 2023-08-29 2023-08-29 一种医疗器械智能化检索系统

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN202311617955.7A Pending CN117435694A (zh) 2023-08-29 2023-08-29 一种医疗器械智能化检索系统

Country Status (1)

Country Link
CN (2) CN116842142B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117076757B (zh) * 2023-10-16 2024-01-23 校导帮(南京)科技创业有限公司 基于大模型的知识服务检索和管理系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101710318A (zh) * 2009-09-08 2010-05-19 中国农业大学 蔬菜供应链知识智能获取系统
CN112035511A (zh) * 2020-08-31 2020-12-04 康键信息技术(深圳)有限公司 基于医学知识图谱的目标数据搜索方法及相关设备
CN112650860A (zh) * 2021-01-15 2021-04-13 科技谷(厦门)信息技术有限公司 一种基于知识图谱的电子病历智能检索系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101710318A (zh) * 2009-09-08 2010-05-19 中国农业大学 蔬菜供应链知识智能获取系统
CN112035511A (zh) * 2020-08-31 2020-12-04 康键信息技术(深圳)有限公司 基于医学知识图谱的目标数据搜索方法及相关设备
CN112650860A (zh) * 2021-01-15 2021-04-13 科技谷(厦门)信息技术有限公司 一种基于知识图谱的电子病历智能检索系统

Also Published As

Publication number Publication date
CN117435694A (zh) 2024-01-23
CN116842142A (zh) 2023-10-03

Similar Documents

Publication Publication Date Title
CN110765257B (zh) 一种知识图谱驱动型的法律智能咨询系统
CN108804521B (zh) 一种基于知识图谱的问答方法及农业百科问答系统
US20200334249A1 (en) Automatic transformation of complex tables in documents into computer understandable structured format and providing schema-less query support data extraction
CN112000773B (zh) 基于搜索引擎技术的数据关联关系挖掘方法及应用
CN109408578B (zh) 一种针对异构环境监测数据融合方法
US20200334250A1 (en) Automatic transformation of complex tables in documents into computer understandable structured format with mapped dependencies and providing schema-less query support for searching table data
US11308083B2 (en) Automatic transformation of complex tables in documents into computer understandable structured format and managing dependencies
CN111708899B (zh) 一种基于自然语言和知识图谱工程信息智能搜索方法
CN116842142B (zh) 一种医疗器械智能化检索系统
CN112559684A (zh) 一种关键词提取及信息检索方法
CN111243748A (zh) 针推康数据标准化系统
CN102508901A (zh) 基于内容的海量图像检索方法和系统
CN110795932A (zh) 基于地质本体的地质报告文本信息提取方法
CN112149422B (zh) 一种基于自然语言的企业新闻动态监测方法
CN112363996B (zh) 用于建立电网知识图谱的物理模型的方法及系统和介质
KR100490442B1 (ko) 벡터문서모델을 이용한 동일/유사제품 클러스트링 장치 및그 방법
CN118193664B (zh) 一种统一社会信用代码行政区划数据补全方法与系统
CN112364177B (zh) 用于建立电网知识图谱的逻辑模型的方法及系统和介质
CN115168408B (zh) 基于强化学习的查询优化方法、装置、设备及存储介质
CN117150046B (zh) 基于上下文语义的任务自动分解方法和系统
CN117194410B (zh) 一种人工智能语言模型生成业务报表的方法及系统
CN117633051A (zh) 一种基于五类网络数据的虚实实体探测技术
Achichi et al. Doing Web Data: from Dataset Recommendation to Data Linking
CN116738980A (zh) 电网行业元数据信息消歧方法、系统、设备及存储介质
CN115982378A (zh) 数据索引构建方法、装置、电子设备和计算机可读介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant