CN114385845A - 基于图聚类的影像分类管理方法及系统 - Google Patents

基于图聚类的影像分类管理方法及系统 Download PDF

Info

Publication number
CN114385845A
CN114385845A CN202111523720.2A CN202111523720A CN114385845A CN 114385845 A CN114385845 A CN 114385845A CN 202111523720 A CN202111523720 A CN 202111523720A CN 114385845 A CN114385845 A CN 114385845A
Authority
CN
China
Prior art keywords
node
nodes
graph
similarity
rho
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111523720.2A
Other languages
English (en)
Inventor
胡利荣
尤堃
张跃华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang Feitu Imaging Technology Co ltd
Original Assignee
Zhejiang Feitu Imaging Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang Feitu Imaging Technology Co ltd filed Critical Zhejiang Feitu Imaging Technology Co ltd
Priority to CN202111523720.2A priority Critical patent/CN114385845A/zh
Publication of CN114385845A publication Critical patent/CN114385845A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/55Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/5846Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using extracted text

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Library & Information Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Image Analysis (AREA)

Abstract

本发明涉及智慧医院管理技术,公开了基于图聚类的影像分类管理方法及系统,基于图聚类的影像分类管理方法,其通过关系数据库的形式存储影像和报告数据;通过语义分析影像数据库的内容,并提取语义特征;将语义特征作为节点,语义特征间的相似度为边,建立无向图;依据建立的无向图,将无向图中的节点聚类成簇,从而完成影像的分类。本发明在PACS系统的基础上,利用相似度构建整个影像库中的无向图,表达所有检查间的关联,基于图聚类不用指定类别数量,且图也会自适应的变化,随着数据的增加,分类会自然演变,其对于影像的管理更为轻便,泛化性强,便于归纳整理。

Description

基于图聚类的影像分类管理方法及系统
技术领域
本发明涉及智慧医院管理技术,尤其涉及了在多屏网络传输中,基于图聚类的影像分类管理方法及系统。
背景技术
医院现有PACS系统主要通过患者个人信息、检查类型、检查项目、检查时间等维度管理放射检查,这些指标均在放射检查及医生撰写报告完成前可收集到,但医生撰写的报告内容较为复杂,难以归纳、统计和管理。
发明内容
本发明针对现有技术中医院系统中的检查及诊断报告内容复杂,难以归纳、统计和管理的问题,提供了基于图聚类的影像分类管理方法及系统。
为了解决上述技术问题,本发明通过下述技术方案得以解决:
基于图聚类的影像分类管理方法,应用于PACS系统中,其方法包括:
影像数据库的存储,通过关系数据库的形式存储影像和报告数据;
语义特征的提取,通过语义分析影像数据库的内容,并提取语义特征;
无向图的建立,将语义特征作为节点,语义特征间的相似度为边,建立无向图,节点包括邻居节点、核节点、孤立节点和桥节点;
节点的分类,依据建立的无向图,将无向图中的节点聚类成簇,从而完成影像的分类。
作为优选,节点的分类方法包括:
步骤1,对于节点v,计算其与节点v所有核节点的文本相似度,并选择相似度超过文本相似度阈值ε的核节点、桥节点、孤立节点,进入步骤2;若没有相似度超过阈值ε的节点,则该节点v为孤立节点;
步骤2,计算节点v与已选择的核节点的ρ邻域内所有节点的文本相似度,并将文本相似度超过阈值ε的节点与节点v相连;
步骤3,计算该节点v是否存在于任一核节点的ρ邻域内,并分配于所属的ρ邻域;若该节点v不属于任一核节点的ρ邻域,计算节点v的ρ邻域中的节点数,若其大于阈值σ,则节点v为核节点,并生成一个新的节点簇;若节点v非核节点且不存在于任一核节点的ρ邻域内,如果节点v连接两个不同的ρ邻域,则为桥节点,否则,则为孤立节点。
作为优选,语义特征的提取以两条文本为输入,通过语义分析模型输出这两条文本各自的语义特征和文本相似度。
作为优选,语义分析模型以BERT神经网络为基础架构,两个文本样本通过同一个模型,生成各自的语义特征m、n,然后计算两个语义特征的余弦相似度cosinesim(m,n),通过最小化不同类样本的余弦相似度优化模型。
作为优选,邻居节点,若两个节点相连,则互为邻居节点;节点相似度p,即两个节点共同邻居节点数与两节点邻居节点数的几何平均数的比值,即
Figure BDA0003409071850000031
其中Γ(v)为节点v的邻居节点集合,G为两个节点邻居数的几何平均数;ρ邻域,即某节点与所有节点相似度不小于ρ的节点组成的集合,同时作为一个节点簇;
核节点,ρ邻域中节点数量大于阈值σ的节点;
孤立节点,与最多一个节点簇相连的离群点;
桥节点,与至少两个节点簇相连的节点。
作为优选,无向图的边由三元组结构组成,分别为当前节点在文本特征数据库中的索引、下一个邻居节点在文本特征数据库中的索引、两者边的值。
为了解决上述技术问题,本发明还提供了基于图聚类的影像分类管理系统,应用于PACS系统中,其特征在于,包括:影像数据库存储模块、语义特征提取模块、无向图建立模块、节点分类模块;
影像数据库存储模块,影像数据库存储模块通过关系数据库的形式存储影像和报告数据;
语义特征提取模块,语义特征提取模块通过语义分析影像数据库的内容,并提取语义特征;
无向图建立模块,无向图建立模块将语义特征作为节点,语义特征间的相似度为边,建立无向图,节点包括邻居节点、核节点、孤立节点和桥节点;
节点分类模块,节点分类模块依据建立的无向图,将无向图中的节点聚类成簇,从而完成影像的分类。
为了解决上述技术问题,本发明还提供了一种电子设备,其特征在于,包括:至少一个处理器和存储器;
所述存储器存储计算机执行指令;所述至少一个处理器执行所述存储器存储的计算机执行指令,使得所述至少一个处理器执行如所述的图聚类的影像分类管理方法。
为了解决上述技术问题,本发明还提供了一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机执行指令,当处理器执行所述计算机执行指令时,实现如所述的图聚类的影像分类管理方法。
本发明由于采用了以上技术方案,具有显著的技术效果:
本发明在PACS系统的基础上,利用相似度构建整个影像库中的无向图,表达所有检查间的关联,基于图聚类不用指定类别数量,且图也会自适应的变化,随着数据的增加,分类会自然演变。其对于影像的管理更为轻便、泛化性强,便于归纳整理。
附图说明
图1是本发明的流程图。
图2是本发明的聚类流程图。
具体实施方式
下面结合附图与实施例对本发明作进一步详细描述。
实施例1
基于图聚类的影像分类管理方法,应用于PACS系统中,其方法包括:
影像数据库的存储,通过关系数据库的形式存储影像和报告数据;
语义特征的提取,通过语义分析影像数据库的内容,并提取语义特征;
无向图的建立,将语义特征作为节点,语义特征间的相似度为边,建立无向图,节点包括邻居节点、核节点、孤立节点和桥节点;
节点的分类,依据建立的无向图,将无向图中的节点聚类成簇,从而完成影像的分类。
节点的分类方法包括:
步骤1,对于节点v,计算其与节点v所有核节点的文本相似度,并选择相似度超过文本相似度阈值ε的核节点、桥节点、孤立节点,进入步骤2;若没有相似度超过阈值ε的节点,则该节点v为孤立节点;
步骤2,计算节点v与已选择的核节点的ρ邻域内所有节点的文本相似度,并将文本相似度超过阈值ε的节点与节点v相连;
步骤3,计算该节点v是否存在于任一核节点的ρ邻域内,并分配于所属的ρ邻域;若该节点v不属于任一核节点的ρ邻域,计算节点v的ρ邻域中的节点数,若其大于阈值σ,则节点v为核节点,并生成一个新的节点簇;若节点v非核节点且不存在于任一核节点的ρ邻域内,如果节点v连接两个不同的ρ邻域,则为桥节点,否则,则为孤立节点。
语义特征的提取以两条文本为输入,通过语义分析模型输出这两条文本各自的语义特征和文本相似度。
语义分析模型以BERT神经网络为基础架构,两个文本样本通过同一个模型,生成各自的语义特征m、n,然后计算两个语义特征的余弦相似度cosinesim(m,n),通过最小化不同类样本的余弦相似度优化模型。
邻居节点,若两个节点相连,则互为邻居节点;节点相似度p,即两个节点共同邻居节点数与两节点邻居节点数的几何平均数的比值,即
Figure BDA0003409071850000061
其中Γ(v)为节点v的邻居节点集合,G为两个节点邻居数的几何平均数;ρ邻域,即某节点与所有节点相似度不小于ρ的节点组成的集合,同时作为一个节点簇;
核节点,ρ邻域中节点数量大于阈值σ的节点;
孤立节点,与最多一个节点簇相连的离群点;
桥节点,与至少两个节点簇相连的节点。
无向图的边由三元组结构组成,分别为当前节点在文本特征数据库中的索引、下一个邻居节点在文本特征数据库中的索引、两者边的值。
实施例2
在实施例1基础上,本实施例影像数据库中现有100条检查记录,包含100个影像数据及对应的报告文本数据。
从影像数据库中读取所有报告文本,并利用语义分析模块获取文本特征及每个报告间的文本相似度。将文本特征存入图结构模块的文本特征数据库中,初始化所属节点簇索引为0。
连接文本相似度大于阈值的节点,并存入连接边数据库。计算每个节点的邻域,选出核节点、桥节点及孤立节点。
以核节点数、桥节点数、孤立节点数的总和为节点簇索引最大值,以0到节点簇索引最大值定义节点簇索引,并更新图结构存储模块中的文本特征数据库,完成以文本特征为节点、文本相似度为边的无向图影像分类。
实施例3
在上述实施例基础上,本实施例现有1条新放射检查V插入影像数据库,包含其影像数据和报告数据,需要判断其类别。
从影像数据库中提取V的报告数据,并通过语义分析模块获取文本特征v。
通过语义分析模块计算特征v与所有核节点、桥节点、孤立节点的文本相似度,选择相似度前三的3个节点。
进一步,通过语义分析模块计算节点v与所选择节点中为核节点的ρ邻域内所有节点的文本相似度,并连接节点v与所有文本相似度大于阈值ε的节点计算节点v;若没有相似度大于阈值ε的节点,判断节点v。
计算节点v是否处任一所选核节点的ρ邻域,若成立,则该节点簇索引为节点v所属的类别,更新图结构模块中文本特征数据库的节点簇索引。若不成立,则判断节点v;
判断节点v与所选节点中桥节点、孤立节点的文本相似度是否大于阈值ε,若成立,连接节点,计算所连接节点的ρ领域并判断是否存在新的核节点,若存在,则将新的核节点ρ领域中的节点所属节点簇索引修改为新核节点的节点簇索引;判断节点v是否处在任意两个核节点的ρ邻域间,且与两个ρ邻域分别有一个节点相连,若成立,则为桥节点,当前最大节点簇索引加1作为该节点v的节点簇索引,并更新图结构模块;
节点v为孤立节点,当前最大节点簇索引加1作为该节点v的节点簇索引,并更新图结构模块。
实施例4
在上述实施例基础上,本实施例基于图聚类的影像分类管理系统,应用于PACS系统中,其特征在于,包括:影像数据库存储模块、语义特征提取模块、无向图建立模块、节点分类模块;
影像数据库存储模块,影像数据库存储模块通过关系数据库的形式存储影像和报告数据;
语义特征提取模块,语义特征提取模块通过语义分析影像数据库的内容,并提取语义特征;
无向图建立模块,无向图建立模块将语义特征作为节点,语义特征间的相似度为边,建立无向图,节点包括邻居节点、核节点、孤立节点和桥节点;
节点分类模块,节点分类模块依据建立的无向图,将无向图中的节点聚类成簇,从而完成影像的分类。
实施例5
在上述实施例基础上,本实施例为一种电子设备,其特征在于,包括:至少一个处理器和存储器;
所述存储器存储计算机执行指令;所述至少一个处理器执行所述存储器存储的计算机执行指令,使得所述至少一个处理器执行如所述的图聚类的影像分类管理方法。
实施例6
在上述实施例基础上,本实施例为一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机执行指令,当处理器执行所述计算机执行指令时,实现如所述的图聚类的影像分类管理方法。

Claims (9)

1.基于图聚类的影像分类管理方法,应用于PACS系统中,其特征在于,方法包括:
影像数据库的存储,通过关系数据库的形式存储影像和报告数据;
语义特征的提取,通过语义分析影像数据库的内容,并提取语义特征;
无向图的建立,将语义特征作为节点,语义特征间的相似度为边,建立无向图,其中,节点包括邻居节点、核节点、孤立节点和桥节点;
节点的分类,依据建立的无向图,将无向图中的节点聚类成簇,从而完成影像的分类。
2.根据权利要求1所述的基于图聚类的影像分类管理方法,其特征在于,节点的分类的方法包括:
步骤1,对于节点v,计算其与节点v所有核节点的文本相似度,并选择相似度超过文本相似度阈值ε的核节点、桥节点、孤立节点,进入步骤2;若没有相似度超过阈值ε的节点,则该节点v为孤立节点;
步骤2,计算节点v与已选择的核节点的ρ邻域内所有节点的文本相似度,并将文本相似度超过阈值ε的节点与节点v相连;
步骤3,计算该节点v是否存在于任一核节点的ρ邻域内,并分配于所属的ρ邻域;若该节点v不属于任一核节点的ρ邻域,计算节点v的ρ邻域中的节点数,若其大于阈值σ,则节点v为核节点,并生成一个新的节点簇;若节点v非核节点且不存在于任一核节点的ρ邻域内,如果节点v连接两个不同的ρ邻域,则为桥节点,否则,则为孤立节点。
3.根据权利要求1所述的基于图聚类的影像分类管理方法,其特征在于,语义特征的提取以两条文本为输入,通过语义分析模型输出这两条文本各自的语义特征和文本相似度。
4.根据权利要求3所述的基于图聚类的影像分类管理方法,其特征在于,语义分析模型以BERT神经网络为基础架构,两个文本样本通过同一个模型,生成各自的语义特征m、n,然后计算两个语义特征的余弦相似度cosinesim(m,n),通过最小化不同类样本的余弦相似度优化模型。
5.根据权利要求1所述的基于图聚类的影像分类管理方法,其特征在于,邻居节点,若两个节点相连,则互为邻居节点;节点相似度p,即两个节点共同邻居节点数与两节点邻居节点数的几何平均数的比值,即
Figure FDA0003409071840000021
其中Γ(v)为节点v的邻居节点集合,G为两个节点邻居数的几何平均数;ρ邻域,即某节点与所有节点相似度不小于ρ的节点组成的集合,同时作为一个节点簇;
核节点,ρ邻域中节点数量大于阈值σ的节点;
孤立节点,与最多一个节点簇相连的离群点;
桥节点,与至少两个节点簇相连的节点。
6.根据权利要求1所述的基于图聚类的影像分类管理方法,其特征在于,无向图的边由三元组结构组成,分别为当前节点在文本特征数据库中的索引、下一个邻居节点在文本特征数据库中的索引、两者边的值。
7.基于图聚类的影像分类管理系统,应用于PACS系统中,其特征在于,包括:影像数据库存储模块、语义特征提取模块、无向图建立模块、节点分类模块;
影像数据库存储模块,影像数据库存储模块通过关系数据库的形式存储影像和报告数据;
语义特征提取模块,语义特征提取模块通过语义分析影像数据库的内容,并提取语义特征;
无向图建立模块,无向图建立模块将语义特征作为节点,语义特征间的相似度为边,建立无向图,节点包括邻居节点、核节点、孤立节点和桥节点;
节点分类模块,节点分类模块依据建立的无向图,将无向图中的节点聚类成簇,从而完成影像的分类。
8.一种电子设备,其特征在于,包括:至少一个处理器和存储器;所述存储器存储计算机执行指令;所述至少一个处理器执行所述存储器存储的计算机执行指令,使得所述至少一个处理器执行如权利要求1至6任一项所述的图聚类的影像分类管理方法。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机执行指令,当处理器执行所述计算机执行指令时,实现如权利要求1至6任一项所述的图聚类的影像分类管理方法。
CN202111523720.2A 2021-12-14 2021-12-14 基于图聚类的影像分类管理方法及系统 Pending CN114385845A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111523720.2A CN114385845A (zh) 2021-12-14 2021-12-14 基于图聚类的影像分类管理方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111523720.2A CN114385845A (zh) 2021-12-14 2021-12-14 基于图聚类的影像分类管理方法及系统

Publications (1)

Publication Number Publication Date
CN114385845A true CN114385845A (zh) 2022-04-22

Family

ID=81195416

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111523720.2A Pending CN114385845A (zh) 2021-12-14 2021-12-14 基于图聚类的影像分类管理方法及系统

Country Status (1)

Country Link
CN (1) CN114385845A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115579103A (zh) * 2022-10-28 2023-01-06 大连大学附属中山医院 一种基于智慧医疗的分子影像智能报告管理系统及方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115579103A (zh) * 2022-10-28 2023-01-06 大连大学附属中山医院 一种基于智慧医疗的分子影像智能报告管理系统及方法

Similar Documents

Publication Publication Date Title
CN113822494B (zh) 风险预测方法、装置、设备及存储介质
CN108427713B (zh) 一种用于自制视频的视频摘要方法及系统
Simoff et al. Ontology-based multimedia data mining for design information retrieval
CN110738033B (zh) 报告模板生成方法、装置及存储介质
CN114003791B (zh) 基于深度图匹配的医疗数据元自动化分类方法及系统
US20210012211A1 (en) Techniques for visualizing the operation of neural networks
CN112990250A (zh) 使用特征分析解释机器学习结果
JP2008123486A (ja) デジタルメディアで1つまたは複数の概念を検出する方法、システム及びプログラム
CN111338897A (zh) 应用主机中异常节点的识别方法、监测设备和电子设备
CN115905528A (zh) 具有时序特征的事件多标签分类方法、装置及电子设备
WO2021102632A1 (zh) 字符获取、页面处理与知识图谱构建方法及装置、介质
CN114385845A (zh) 基于图聚类的影像分类管理方法及系统
Kim et al. ROLEX: A Novel Method for Interpretable Machine Learning Using Robust Local Explanations.
CN112784017B (zh) 基于主亲和性表示的档案跨模态数据特征融合方法
CN113837307A (zh) 数据相似度计算方法、装置、可读介质及电子设备
Liu et al. Learning implicit labeling-importance and label correlation for multi-label feature selection with streaming labels
WO2023178767A1 (zh) 基于企业征信大数据知识图谱的企业风险检测方法和装置
CN110413795A (zh) 一种数据驱动的专业知识图谱构建方法
CN115269925A (zh) 一种基于层次结构的无偏置场景图生成方法
CN113342988B (zh) 一种基于lda跨域的构建服务知识图谱实现服务组合优化的方法及系统
Kasik et al. Data transformations and representations for computation and visualization
CN114637846A (zh) 视频数据处理方法、装置、计算机设备和存储介质
CN114612246A (zh) 对象集合识别方法、装置、计算机设备及存储介质
Chen et al. A multi-source heterogeneous spatial big data fusion method based on multiple similarity and voting decision
Alali A novel stacking method for multi-label classification

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination