CN115775410B - 一种眼象数据的处理方法、系统、存储介质及电子设备 - Google Patents

一种眼象数据的处理方法、系统、存储介质及电子设备 Download PDF

Info

Publication number
CN115775410B
CN115775410B CN202310104151.0A CN202310104151A CN115775410B CN 115775410 B CN115775410 B CN 115775410B CN 202310104151 A CN202310104151 A CN 202310104151A CN 115775410 B CN115775410 B CN 115775410B
Authority
CN
China
Prior art keywords
eye image
clustering
eye
features
preset
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202310104151.0A
Other languages
English (en)
Other versions
CN115775410A (zh
Inventor
张智
曹晨思
王东平
程京
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tsinghua University
CapitalBio Corp
Original Assignee
CapitalBio Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by CapitalBio Corp filed Critical CapitalBio Corp
Priority to CN202310104151.0A priority Critical patent/CN115775410B/zh
Publication of CN115775410A publication Critical patent/CN115775410A/zh
Application granted granted Critical
Publication of CN115775410B publication Critical patent/CN115775410B/zh
Priority to PCT/CN2023/116916 priority patent/WO2024169163A1/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/762Arrangements for image or video recognition or understanding using pattern recognition or machine learning using clustering, e.g. of similar faces in social networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/18Eye characteristics, e.g. of the iris
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Databases & Information Systems (AREA)
  • Public Health (AREA)
  • Biomedical Technology (AREA)
  • Multimedia (AREA)
  • Ophthalmology & Optometry (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Human Computer Interaction (AREA)
  • Data Mining & Analysis (AREA)
  • Pathology (AREA)
  • Artificial Intelligence (AREA)
  • Epidemiology (AREA)
  • Primary Health Care (AREA)
  • Image Analysis (AREA)

Abstract

本申请公开了一种眼象数据的处理方法、系统、存储介质及电子设备,获取待检测人员的眼象特征和眼象区域,通过预设检验方式获取眼象特征在病例组及对照组中的统计结果,从统计结果中提取眼象特征集合,眼象特征集合为与疾病相关的富集于病例组的眼象特征集合,通过眼象特征集合,对眼象特征和眼象区域进行聚类,得到聚类结果。通过上述方案,无需通过肉眼观察待检测人员的眼部的球结膜微循环,只需基于统计分析和机器学习算法,对多种眼象特征的分布进行分析,实现从样本中挖掘疾病相关的待检测人员的眼象特征及眼象区域,得到眼象特征和眼象区域与疾病之间的关系的聚类结果,通过聚类结果来提高观察待检测人员的眼部的球结膜微循环的准确性。

Description

一种眼象数据的处理方法、系统、存储介质及电子设备
技术领域
本申请涉及信息处理技术领域,更具体地说,涉及一种眼象数据的处理方法、系统、存储介质及电子设备。
背景技术
传统医学认为,人体因为疾病而显现的微小颜色变化,可以通过观察人的眼部的球结膜微循环而得知。眼部的球结膜微循环的改变可以反映全身的情况,不论何种疾病在眼部的球结膜微循环都有相应的改变。
观察人的眼部的球结膜微循环的方式往往是通过医生的肉眼进行观察的,这样过于依赖于医生的肉眼观察及个人经验,从而存在着极大的模糊性、主观性和不稳定性,从而导致观察人的眼部的球结膜微循环的准确性低。
因此,如何提高观察人的眼部的球结膜微循环的准确性,是本申请亟需解决的问题。
发明内容
有鉴于此,本申请公开了一种眼象数据的处理方法、系统、存储介质及电子设备,旨在提高观察待检测人员的眼部的球结膜微循环的准确性。
为了实现上述目的,其公开的技术方案如下:
本申请第一方面公开了一种眼象数据的处理方法,所述方法包括:
获取待检测人员的眼象特征和眼象区域;
通过预设检验方式获取所述眼象特征在病例组及对照组中的统计结果;所述统计结果表征所述眼象特征在病例组及对照组中的相同眼象区域的分布情况;
从所述统计结果中提取眼象特征集合;所述眼象特征集合为与疾病相关的富集于病例组的眼象特征集合;
通过所述眼象特征集合,对所述眼象特征和所述眼象区域进行聚类,得到聚类结果;所述聚类结果包括眼象特征聚类结果和眼象区域聚类结果;所述眼象特征聚类结果将眼象特征划分为多个不同的类别,进而分析每个类别的眼象特征与疾病之间的关系;所述眼象区域聚类结果将眼象区域划分为不同类别,进而分析每个类别的眼象区域与疾病之间的关系。
优选的,所述通过预设检验方式获取所述眼象特征在病例组及对照组中的统计结果,包括:
定义眼表区域,并将定义后的眼表区域划分为预设数量的眼象区域;
获取病例组样本和对照组样本;
统计病例组样本的眼象特征和对照组样本的眼象特征;
确定所述病例组样本的眼象特征在所述眼象区域中的出现次数和所述对照组样本的眼象特征在所述眼象区域中的出现次数;
对所述病例组样本的眼象特征在所述眼象区域中的出现次数和所述对照组样本的眼象特征在所述眼象区域中的出现次数进行卡方校验和多次抽样操作,得到相关指数矩阵、有效校验矩阵和卡方校验矩阵;
通过所述相关指数矩阵、所述有效校验矩阵和所述卡方校验矩阵,确定所述眼象特征在病例组及对照组中的统计结果。
优选的,所述从所述统计结果中提取眼象特征集合,包括:
根据所述相关指数矩阵,得到在统计结果中各个区域的相关指数的和;
通过预设排序顺序,将各个区域的相关指数的和进行排序,得到相关指数和的集合;
通过预设阈值将所述相关指数和的集合进行分组,得到第一分组和第二分组;所述第一分组为大于所述预设阈值的分组;所述第二分组为小于等于所述预设阈值的分组;
通过预设检验方法,检验所述第一分组和所述第二分组之间的分布差异,得到分布概率值;
通过所述分布概率值确定预设检验阈值;
将所述相关指数和的集合大于所述预设检验阈值对应的眼象特征确定为疾病相关特征;
提取所述疾病相关特征所对应的富集于病例组的眼象特征集合。
优选的,所述通过所述眼象特征集合,对所述眼象特征和所述眼象区域进行聚类,得到聚类结果,包括:
获取所述眼象特征集合中的相关指数矩阵的值;
通过所述相关指数矩阵的值分别对所述眼象特征和所述眼象区域进行聚类,得到聚类结果。
优选的,还包括:
生成所述统计结果对应的热图。
本申请第二方面公开了一种眼象数据的处理系统,所述系统包括:
第一获取单元,用于获取待检测人员的眼象特征和眼象区域;
第二获取单元,用于通过预设检验方式获取所述眼象特征在病例组及对照组中的统计结果;所述统计结果表征所述眼象特征在病例组及对照组中的相同眼象区域的分布情况;
提取单元,用于从所述统计结果中提取眼象特征集合;所述眼象特征集合为与疾病相关的富集于病例组的眼象特征集合;
聚类单元,用于通过所述眼象特征集合,对所述眼象特征和所述眼象区域进行聚类,得到聚类结果;所述聚类结果包括眼象特征聚类结果和眼象区域聚类结果;所述眼象特征聚类结果将眼象特征划分为多个不同的类别,进而分析每个类别的眼象特征与疾病之间的关系;所述眼象区域聚类结果将眼象区域划分为不同类别,进而分析每个类别的眼象区域与疾病之间的关系。
优选的,所述第二获取单元,包括:
定义划分模块,用于定义眼表区域,并将定义后的眼表区域划分为预设数量的眼象区域;
第一获取模块,用于获取病例组样本和对照组样本;
统计模块,用于统计病例组样本的眼象特征和对照组样本的眼象特征;
第一确定模块,用于确定所述病例组样本的眼象特征在所述眼象区域中的出现次数和所述对照组样本的眼象特征在所述眼象区域中的出现次数;
操作模块,用于对所述病例组样本的眼象特征在所述眼象区域中的出现次数和所述对照组样本的眼象特征在所述眼象区域中的出现次数进行卡方校验和多次抽样操作,得到相关指数矩阵、有效校验矩阵和卡方校验矩阵;
第二确定模块,用于通过所述相关指数矩阵、所述有效校验矩阵和所述卡方校验矩阵,确定所述眼象特征在病例组及对照组中的统计结果。
优选的,所述提取单元,包括:
第二获取模块,用于根据所述相关指数矩阵,得到在统计结果中各个区域的相关指数的和;
排序模块,用于通过预设排序顺序,将各个区域的相关指数的和进行排序,得到相关指数和的集合;
分组模块,用于通过预设阈值将所述相关指数和的集合进行分组,得到第一分组和第二分组;所述第一分组为大于所述预设阈值的分组;所述第二分组为小于等于所述预设阈值的分组;
检验模块,用于通过预设检验方法,检验所述第一分组和所述第二分组之间的分布差异,得到分布概率值;
第三确定模块,用于通过所述分布概率值确定预设检验阈值;
第四确定模块,用于将所述相关指数和的集合大于所述预设检验阈值对应的眼象特征确定为疾病相关特征;
提取模块,用于提取所述疾病相关特征所对应的富集于病例组的眼象特征集合。
本申请第三方面公开了一种存储介质,所述存储介质包括存储的指令,其中,在所述指令运行时控制所述存储介质所在的设备执行如第一方面任意一项所述的眼象数据的处理方法。
本申请第四方面公开了一种电子设备,包括存储器,以及一个或者一个以上的指令,其中一个或者一个以上指令存储于存储器中,且经配置以由一个或者一个以上处理器执行如第一方面任意一项所述的眼象数据的处理方法。
经由上述技术方案可知,本申请公开了一种眼象数据的处理方法、系统、存储介质及电子设备,获取待检测人员的眼象特征和眼象区域,通过预设检验方式获取眼象特征在病例组及对照组中的统计结果,统计结果表征眼象特征在病例组及对照组中的相同眼象区域的分布情况,从统计结果中提取眼象特征集合,眼象特征集合为与疾病相关的富集于病例组的眼象特征集合,通过所述眼象特征集合,对眼象特征和眼象区域进行聚类,得到聚类结果,聚类结果包括眼象特征聚类结果和眼象区域聚类结果;眼象特征聚类结果将眼象特征划分为多个不同的类别,进而分析每个类别的眼象特征与疾病之间的关系;眼象区域聚类结果将眼象区域划分为不同类别,进而分析每个类别的眼象区域与疾病之间的关系。通过上述方案,无需通过肉眼观察待检测人员的眼部的球结膜微循环,只需基于统计分析和机器学习算法,对多种眼象特征的分布进行分析,实现从样本中挖掘疾病相关的待检测人员的眼象特征及眼象区域,得到眼象特征和眼象区域与疾病之间的关系的聚类结果,通过聚类结果来提高观察待检测人员的眼部的球结膜微循环的准确性。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本申请实施例公开的一种眼象数据的处理方法的流程示意图;
图2为本申请实施例公开的将定义后的眼表区域划分为预设数量的眼象区域的示意图;
图3为本申请实施例公开的定义眼表区域并统计每个眼表区域中样本与特征的对应关系的示意图;
图4为本申请实施例公开的进行卡方校验后的矩阵示意图;
图5为本申请实施例公开的多次抽样操作后的矩阵示意图;
图6为本申请实施例公开的眼象特征层次聚类的示意图;
图7为本申请实施例公开的眼象区域层次聚类示例图;
图8为本申请实施例公开的一种眼象数据的处理系统的结构示意图;
图9为本申请实施例公开的一种电子设备的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
在本申请中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
由背景技术可知,观察人的眼部的球结膜微循环的方式往往是通过医生的肉眼进行观察的,这样过于依赖于医生的肉眼观察及个人经验,从而存在着极大的模糊性、主观性和不稳定性,从而导致观察人的眼部的球结膜微循环的准确性低。因此,如何提高观察人的眼部的球结膜微循环的准确性,是本申请亟需解决的问题。
为了解决上述问题,本申请实施例公开了一种眼象数据的处理方法、系统、存储介质及电子设备,获取待检测人员的眼象特征和眼象区域,通过预设检验方式获取眼象特征在病例组及对照组中的统计结果,统计结果表征眼象特征在病例组及对照组中的相同眼象区域的分布情况,从统计结果中提取眼象特征集合,眼象特征集合为与疾病相关的富集于病例组的眼象特征集合,通过眼象特征集合,对眼象特征和眼象区域进行聚类,得到聚类结果,眼象特征聚类结果将眼象特征划分为多个不同的类别,进而分析每个类别的眼象特征与疾病之间的关系;眼象区域聚类结果将眼象区域划分为不同类别,进而分析每个类别的眼象区域与疾病之间的关系。通过上述方案,无需通过肉眼观察待检测人员的眼部的球结膜微循环,只需基于统计分析和机器学习算法,对多种眼象特征的分布进行分析,实现从样本中挖掘疾病相关的待检测人员的眼象特征及眼象区域,得到眼象特征和眼象区域与疾病之间的关系的聚类结果,通过聚类结果来提高观察待检测人员的眼部的球结膜微循环的准确性。具体实现方式通过下述实施例进行说明。
参考图1所示,为本申请实施例公开的一种眼象数据的处理方法的流程示意图,该眼象数据的处理方法主要包括如下步骤:
S101:获取待检测人员的眼象特征和眼象区域。
其中,眼象特征表征特定颜色和特定形状的眼象特征,眼象特征包括黯黄色月晕、红黯色斑等。
眼象区域为眼表的预设部分区域;眼象区域可以为多个。
定义眼表区域并将眼表区域进行划分,得到眼象区域,具体如图2所示。图2示出了将定义后的眼表区域划分为预设数量的眼象区域的示意图。
图2中,将眼表区域划分为15个预设数量的眼象区域(如A、B、C、D等)。
每一个(在数据集中出现过的)眼象特征在不同眼象区域都有相关指数值。
每一个(在数据集中出现过的)眼象特征在多个眼象区域的相关指数值组成一个相关指数向量。其中,相关指数向量表征了当前特征在病例组(当前眼象区域)的富集情况,如果相关指数高,则代表当前特征可能和疾病更加相关。
S102:通过预设检验方式获取眼象特征在病例组及对照组中的统计结果;统计结果表征眼象特征在病例组及对照组中的相同眼象区域的分布情况。
其中,预设检验方式为卡方检验方式。
通过卡方检验方式统计待检测人员的眼象特征在相同眼象区域的富集情况。
富集情况表示待检测人员的每个眼象特征在病例组及对照组中相同眼象区域的分布情况,比如某特征在病例组富集,指的是该特征更多的出现在病例组眼象中。
具体通过预设检验方式获取眼象特征在病例组及对照组中的统计结果的过程如A1-A6所示。
A1:定义眼表区域,并将定义后的眼表区域划分为预设数量的眼象区域。
其中,预设数量可以是15、16等,具体预设数量的确定由技术人员根据实际情况进行设置,本申请不做具体限定。
由于疾病的特征可能具有区域特异性,比如特征“殷红色血脉“出现在内眼角和外眼角对于所述疾病来说意义是不一样的。所以对不同的眼象区域分别进行特征的定义和统计。定义眼表区域的过程,即为图2中依照现有相关疾病相关的眼象等文献进行眼表区域划分,也可以根据研究目标自行定义,比如:希望研究内眼角区域中与疾病相关的特征,则可以将内眼角定义为一个区域,其他眼表部分作为一个区。
A2:获取病例组样本和对照组样本。
A3:统计病例组样本的眼象特征和对照组样本的眼象特征。
A4:确定病例组样本的眼象特征在眼象区域中的出现次数和对照组样本的眼象特征在眼象区域中的出现次数。
其中,定义眼表区域并统计每个眼表区域中样本与眼象特征的对应关系。对应关系即为每一个眼表区域统计每一个眼象特征在每一个样本中出现情况。
为了方便理解确定病例组样本的眼象特征在眼象区域中的出现次数和对照组样本的眼象特征在眼象区域中的出现次数的过程,结合图3进行说明。图3示出了定义眼表区域并统计每个眼表区域中样本与特征的对应关系的示意图。
图3中,对每一个眼表区域统计每一个眼象特征在每一个样本中出现情况,出现记为1,未出现记为0。
图3中,横坐标为样本数(样本1、样本i、样本N等),纵坐标为特征数(特征1、特征k、特征M等)。
A5:对病例组样本的眼象特征在眼象区域中的出现次数和对照组样本的眼象特征在眼象区域中的出现次数进行卡方校验和多次抽样操作,得到相关指数矩阵、有效校验矩阵和卡方校验矩阵。
其中,通过卡方检验评估待检测人员的每个眼象特征与疾病的相关性。针对某一眼表区域,对 N case 个病例组样本和 N control 个对照组样本,统计眼象特征在两组样本中此区域出现的次数(假设分别为 T case T control ),并进行卡方检验。计算当前眼表区域此特征的相关指数( f)、是否有效检验(),及是否校正卡方检验()。其中, f的计算方法如公式(1)所示,校验( md)的计算方法如公式(2)所示。
(1)
其中, P为两组样本(病例组样本和对照组样本)来自同一分布的概率, P越小,说明两组样本越不可能来自同一分布; α为假设检验的第一类错误的显著性水平; T control 为眼象特征在对照组出现的次数; N control 为对照组样本个数; T case 为眼象特征在病例组出现的次数; N case 为病例组样本个数。
(2)
通过对眼表区域及眼表特征的遍历,可以得到取值为{-1,0,1}的相关指数矩阵、有效检验矩阵及卡方检验矩阵。矩阵横轴为眼象区域,纵轴为眼象特征,值分别为相关指数( f∈{-1,0,1})、是否为有效卡方检验( valid∈{0,1})、是否为校正卡方检验( adj∈{0,1}),如图4所示。图4示出了进行卡方校验后的矩阵示意图。
图4中,横坐标为区域数(区域1、区域i、区域n等);纵坐标为特征数(特征1、特征k、特征m等)。
为提高结果可靠性,分别对病例组和对照组进行多次抽样,并重复通过卡方检验评估待检测人员的每个眼象特征与疾病的相关性。针对某一眼表区域,对 N case 个病例组样本和 N control 个对照组样本,统计眼象特征在两组样本中此区域出现的次数(假设分别为 T case T control ),并进行卡方检验。计算当前眼表区域此特征的相关指数( f)、是否有效检验(),及是否校正卡方检验()这一步骤。例如,以1000次抽样为例,得到的1000个相关指数矩阵进行相加,得到最终的相关指数矩阵(),其中,为实数空间;矩阵取值为,表示1000次抽样中,对应特征显著富集于病例组的次数减去其显著富集于对照组的次数,在有效检验中的占比,如图5中矩阵所示。图5示出了多次抽样操作后的矩阵示意图。
A6:通过相关指数矩阵、有效校验矩阵和卡方校验矩阵,确定眼象特征在病例组及对照组中的统计结果。
生成统计结果对应的热图。
其中,热图中包括大肠、小肠、心、肝、肺、肾、胃等器官,血脉粉红色、血脉股红色、黄色斑、暗粉色丘、底色淡黄色等特征。
热图横纵轴分别表示特征及眼象区域。颜色表示当前特征在病例组当前眼象区域的相关指数(富集情况)。
S103:从统计结果中提取眼象特征集合;眼象特征集合为与疾病相关的富集于病例组的眼象特征集合。
具体从统计结果中提取眼象特征集合的过程如B1-B7所示。
B1:根据相关指数矩阵( M p ),得到在统计结果中各个区域的相关指数的和。
B2:通过预设排序顺序,将各个区域的相关指数的和进行排序,得到相关指数和的集合( S Feature ={ Sum Featurek })。
其中,预设排序顺序可以是由大到小的顺序,也可以是由小到大的顺序,具体预设排序顺序的确定本申请不做具体限定。本方案的预设排序顺序优选由大到小的顺序。
根据 M p 和由大到小的排序顺序,将眼象特征按照各个区域相关指数和进行排序,得到 S Feature ={ Sum Featurek }。
S Feature 为相关指数和的集合; Sum Featurek 为每个眼象特征在各个区域的相关指数的和。
B3:通过预设阈值将相关指数和的集合进行分组,得到第一分组和第二分组;第一分组为大于预设阈值的分组;第二分组为小于等于预设阈值的分组。
其中,预设阈值为 C∈(min( S Feature ),max( S Feature )); C的确定根据实际情况进行设置,本申请不做具体限定。
S Feature 按照预设阈值分为两组(第一分组和第二分组),检验两组的分布差异。
B4:通过预设检验方法,检验第一分组和第二分组之间的分布差异,得到分布概率值。
其中,预设检验方法可以是T检验、曼-惠特尼U检验、K-S检验、游程检验、中位数检验等,具体预设检验方法的确定本申请不做具体限定。
给定预设阈值 C,相关指数和的集合( S)中的元素分为> C和≤ C的两组(第一分组和第二分组),使用统计检验方法,检验这两组之间的分布差异(意为比较这两组是否一样)。
检验比较两组是否一样时,检验方法会给出 P值, P值为两组样本来自同一分布的概率, P值越小,说明两组样本越不可能来自同一分布。
B5:通过分布概率值确定预设检验阈值( C 0 )。
其中,选取最小 P值所对应的 C作为 C 0
选取 P值最小的 C这一步的目的是将 S分为两组,使两组尽可能不相同。
B6:将相关指数和的集合大于预设检验阈值对应的眼象特征确定为疾病相关特征( F)。
其中,选取{ Sum Featurek > C 0 }对应的眼象特征作为 F
B7:提取疾病相关特征所对应的富集于病例组的眼象特征集合。
S104:通过眼象特征集合,对眼象特征和眼象区域进行聚类,得到聚类结果;聚类结果包括眼象特征聚类结果和眼象区域聚类结果;眼象特征聚类结果将眼象特征划分为多个不同的类别,进而分析每个类别的眼象特征与疾病之间的关系;眼象区域聚类结果将眼象区域划分为不同类别,进而分析每个类别的眼象区域与疾病之间的关系。
为了方便理解眼象特征与疾病之间的关系和眼象区域与疾病之间的关系,这里举例进行说明:
例如,以眼象特征的聚类为例(眼象区域相似),每一个眼象特征在不同眼象区域都有相关指数值。每一个眼象特征在多个眼象区域的相关指数值组成一个相关指数向量。对这些向量进行聚类,可以将某些眼象特征聚为多个类,这些类别中的眼象特征,可能同属于阴虚内热型,后续可分析阴虚内热与所述疾病的关系。
具体通过眼象特征集合,对眼象特征和眼象区域进行聚类,得到聚类结果的过程如C1-C2所示。
C1:获取眼象特征集合中的相关指数矩阵的值。
C2:通过相关指数矩阵的值分别对眼象特征和眼象区域进行聚类,得到聚类结果。
根据 M p 值,分别对 F,或 F的子集进行聚类,将眼象特征划分为若干不同类,进而分析每个类别的眼象特征与疾病的关系;或对眼表区域进行聚类,将眼象区域划分为若干不同类,进而分析每个类别的眼象区域与疾病的关系;或对眼表特征及眼表区域进行双聚类,以便分析眼表特征、眼表区域,及疾病之间的关系。
其中,聚类包含但不限于划分聚类、层次聚类、密度聚类、网络聚类、模型聚类、模糊聚类等。以层次聚类为例,眼象特征聚类及眼象区域聚类结果分别如图6和图7所示。图6示出了眼象特征层次聚类的示意图。图7示出了眼象区域层次聚类示例图。
图6中,横坐标为眼象特征,具体包括斑、黄色斑、血脉粉红色、血脉殷红色、丘、黑睛周围黄斑、血脉入黑睛、底色粉黯色、底色粉色、底色红色、底色淡黄色、淡黄色斑、粉黯色雾漫、黯黄色点、红黯色点、粉红色斑、血脉黯红色、红黯色雾漫、红黯色斑、粉红色雾漫、点、血脉鲜红色、黯粉色斑、粉黄色丘、淡黄色丘、粉色丘、黄色丘、黯红色丘、黯粉色丘、粉色雾漫、黯黄色斑、灰色丘等。
图6中,纵坐标的数字表示代表各个特征之间的相对距离,如果连接两个特征的距离较小(如距离小于预设距离阈值时,预设距离阈值根据实际情况进行设置,本申请不做具体限定),则代表两个特征距离“较近”,即两个特征分布相似,可作为一类特征分析其与疾病的关系。纵坐标包括0、200、400、600、800、1000、1200和1400。
图7的横坐标表示眼象区域,眼象区域包括心、肝、全局、胃、脾、肺和肾。
图7的纵坐标表示代表各个特征之间的相对距离,如果连接两个特征的距离较小,则代表两个特征距离“较近”,即两个特征分布相似,可作为一类特征分析其与疾病的关系,纵坐标包括0、500、1000、1500、2000、2500、3000、3500和4000。
本方案提出了疾病相关眼象特征和眼象区域的探究方法,可以准确、客观地进行多种疾病相关眼象分析。相较于人工探究疾病相关眼象特征,结果更加可靠、全面。
本方案提出的眼象特征和眼象区域聚类方法,有利于对相似眼表特征进行统一分析,减轻中医师工作量的同时,还可以揭示眼表特征之间的相关关系,利于对疾病的深入理解。
本申请实施例中,无需通过肉眼观察待检测人员的眼部的球结膜微循环,只需基于统计分析和机器学习算法,对多种眼象特征的分布进行分析,实现从样本中挖掘疾病相关的待检测人员的眼象特征及眼象区域,得到眼象特征和眼象区域与疾病之间的关系的聚类结果,通过聚类结果来提高观察待检测人员的眼部的球结膜微循环的准确性。
基于上述实施例图1公开的一种眼象数据的处理方法,本申请实施例还对应公开了一种眼象数据的处理系统的结构示意图,如图8所示,该眼象数据的处理系统包括第一获取单元801、第二获取单元802、提取单元803和聚类单元804。
第一获取单元801,用于获取待检测人员的眼象特征和眼象区域。
第二获取单元802,用于通过预设检验方式获取眼象特征在病例组及对照组中的统计结果;统计结果表征眼象特征在病例组及对照组中的相同眼象区域的分布情况。
提取单元803,用于从统计结果中提取眼象特征集合;眼象特征集合为与疾病相关的富集于病例组的眼象特征集合。
聚类单元804,用于通过眼象特征集合,对眼象特征和眼象区域进行聚类,得到聚类结果;聚类结果包括眼象特征聚类结果和眼象区域聚类结果;眼象特征聚类结果将眼象特征划分为多个不同的类别,进而分析每个类别的眼象特征与疾病之间的关系;眼象区域聚类结果将眼象区域划分为不同类别,进而分析每个类别的眼象区域与疾病之间的关系。
进一步的,第二获取单元802包括定义划分模块、第一获取模块、统计模块、第一确定模块、操作模块和第二确定模块。
定义划分模块,用于定义眼表区域,并将定义后的眼表区域划分为预设数量的眼象区域。
第一获取模块,用于获取病例组样本和对照组样本。
统计模块,用于统计病例组样本的眼象特征和对照组样本的眼象特征。
第一确定模块,用于确定病例组样本的眼象特征在眼象区域中的出现次数和对照组样本的眼象特征在眼象区域中的出现次数。
操作模块,用于对病例组样本的眼象特征在眼象区域中的出现次数和对照组样本的眼象特征在眼象区域中的出现次数进行卡方校验和多次抽样操作,得到相关指数矩阵、有效校验矩阵和卡方校验矩阵。
第二确定模块,用于通过相关指数矩阵、有效校验矩阵和卡方校验矩阵,确定眼象特征在病例组及对照组中的统计结果。
进一步的,提取单元803包括第二获取模块、排序模块、分组模块、检验模块、第三确定模块、第四确定模块和提取模块。
第二获取模块,用于根据相关指数矩阵,得到在统计结果中各个区域的相关指数的和。
排序模块,用于通过预设排序顺序,将各个区域的相关指数的和进行排序,得到相关指数和的集合。
分组模块,用于通过预设阈值将相关指数和的集合进行分组,得到第一分组和第二分组;第一分组为大于预设阈值的分组;第二分组为小于等于预设阈值的分组。
检验模块,用于通过预设检验方法,检验第一分组和第二分组之间的分布差异,得到分布概率值。
第三确定模块,用于通过分布概率值确定预设检验阈值。
第四确定模块,用于将相关指数和的集合大于预设检验阈值对应的眼象特征确定为疾病相关特征。
提取模块,用于提取疾病相关特征所对应的富集于病例组的眼象特征集合。
进一步的,聚类单元804包括第三获取模块和聚类模块。
第三获取模块,用于获取眼象特征集合中的相关指数矩阵的值;
聚类模块,用于通过相关指数矩阵的值分别对眼象特征和眼象区域进行聚类,得到聚类结果。
进一步的,眼象数据的处理系统还包括生成单元。
生成单元,用于生成统计结果对应的热图。
本申请实施例中,无需通过肉眼观察待检测人员的眼部的球结膜微循环,只需基于统计分析和机器学习算法,对多种眼象特征的分布进行分析,实现从样本中挖掘疾病相关的待检测人员的眼象特征及眼象区域,得到眼象特征和眼象区域与疾病之间的关系的聚类结果,通过聚类结果来提高观察待检测人员的眼部的球结膜微循环的准确性。
本申请实施例还提供了一种存储介质,存储介质包括存储的指令,其中,在指令运行时控制存储介质所在的设备执行上述眼象数据的处理方法。
本申请实施例还提供了一种电子设备,其结构示意图如图9所示,具体包括存储器901,以及一个或者一个以上的指令902,其中一个或者一个以上指令902存储于存储器901中,且经配置以由一个或者一个以上处理器903执行所述一个或者一个以上指令902执行上述眼象数据的处理方法。
上述各个实施例的具体实施过程及其衍生方式,均在本申请的保护范围之内。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统或系统实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的系统及系统实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
对所公开的实施例的上述说明,使本领域技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
以上所述仅是本申请的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本申请的保护范围。

Claims (8)

1.一种眼象数据的处理方法,其特征在于,所述方法包括:
获取待检测人员的眼象特征和眼象区域;
通过预设检验方式获取所述眼象特征在病例组及对照组中的统计结果,包括:定义眼表区域,并将定义后的眼表区域划分为预设数量的眼象区域;获取病例组样本和对照组样本;统计病例组样本的眼象特征和对照组样本的眼象特征;确定所述病例组样本的眼象特征在所述眼象区域中的出现次数和所述对照组样本的眼象特征在所述眼象区域中的出现次数;对所述病例组样本的眼象特征在所述眼象区域中的出现次数和所述对照组样本的眼象特征在所述眼象区域中的出现次数进行卡方校验和多次抽样操作,得到相关指数矩阵、有效校验矩阵和卡方校验矩阵;通过所述相关指数矩阵、所述有效校验矩阵和所述卡方校验矩阵,确定所述眼象特征在病例组及对照组中的统计结果;所述统计结果表征所述眼象特征在病例组及对照组中的相同眼象区域的分布情况;
从所述统计结果中提取眼象特征集合;所述眼象特征集合为与疾病相关的富集于病例组的眼象特征集合;
通过所述眼象特征集合,对所述眼象特征和所述眼象区域进行聚类,得到聚类结果;所述聚类结果包括眼象特征聚类结果和眼象区域聚类结果;所述眼象特征聚类结果将眼象特征划分为多个不同的类别,进而分析每个类别的眼象特征与疾病之间的关系;所述眼象区域聚类结果将眼象区域划分为不同类别,进而分析每个类别的眼象区域与疾病之间的关系。
2.根据权利要求1所述的方法,其特征在于,所述从所述统计结果中提取眼象特征集合,包括:
根据所述相关指数矩阵,得到在统计结果中各个区域的相关指数的和;
通过预设排序顺序,将各个区域的相关指数的和进行排序,得到相关指数和的集合;
通过预设阈值将所述相关指数和的集合进行分组,得到第一分组和第二分组;所述第一分组为大于所述预设阈值的分组;所述第二分组为小于等于所述预设阈值的分组;
通过预设检验方法,检验所述第一分组和所述第二分组之间的分布差异,得到分布概率值;
通过所述分布概率值确定预设检验阈值;
将所述相关指数和的集合大于所述预设检验阈值对应的眼象特征确定为疾病相关特征;
提取所述疾病相关特征所对应的富集于病例组的眼象特征集合。
3.根据权利要求2所述的方法,其特征在于,所述通过所述眼象特征集合,对所述眼象特征和所述眼象区域进行聚类,得到聚类结果,包括:
获取所述眼象特征集合中的相关指数矩阵的值;
通过所述相关指数矩阵的值分别对所述眼象特征和所述眼象区域进行聚类,得到聚类结果。
4.根据权利要求1所述的方法,其特征在于,还包括:
生成所述统计结果对应的热图。
5.一种眼象数据的处理系统,其特征在于,所述系统包括:
第一获取单元,用于获取待检测人员的眼象特征和眼象区域;
第二获取单元,用于通过预设检验方式获取所述眼象特征在病例组及对照组中的统计结果;所述统计结果表征所述眼象特征在病例组及对照组中的相同眼象区域的分布情况;
所述第二获取单元,包括:定义划分模块、第一获取模块、统计模块、第一确定模块、操作模块和第二确定模块;
所述定义划分模块,用于定义眼表区域,并将定义后的眼表区域划分为预设数量的眼象区域;
所述第一获取模块,用于获取病例组样本和对照组样本;
所述统计模块,用于统计病例组样本的眼象特征和对照组样本的眼象特征;
所述第一确定模块,用于确定所述病例组样本的眼象特征在所述眼象区域中的出现次数和所述对照组样本的眼象特征在所述眼象区域中的出现次数;
所述操作模块,用于对所述病例组样本的眼象特征在所述眼象区域中的出现次数和所述对照组样本的眼象特征在所述眼象区域中的出现次数进行卡方校验和多次抽样操作,得到相关指数矩阵、有效校验矩阵和卡方校验矩阵;
所述第二确定模块,用于通过所述相关指数矩阵、所述有效校验矩阵和所述卡方校验矩阵,确定所述眼象特征在病例组及对照组中的统计结果;
提取单元,用于从所述统计结果中提取眼象特征集合;所述眼象特征集合为与疾病相关的富集于病例组的眼象特征集合;
聚类单元,用于通过所述眼象特征集合,对所述眼象特征和所述眼象区域进行聚类,得到聚类结果;所述聚类结果包括眼象特征聚类结果和眼象区域聚类结果;所述眼象特征聚类结果将眼象特征划分为多个不同的类别,进而分析每个类别的眼象特征与疾病之间的关系;所述眼象区域聚类结果将眼象区域划分为不同类别,进而分析每个类别的眼象区域与疾病之间的关系。
6.根据权利要求5所述的系统,其特征在于,所述提取单元,包括:
第二获取模块,用于根据所述相关指数矩阵,得到在统计结果中各个区域的相关指数的和;
排序模块,用于通过预设排序顺序,将各个区域的相关指数的和进行排序,得到相关指数和的集合;
分组模块,用于通过预设阈值将所述相关指数和的集合进行分组,得到第一分组和第二分组;所述第一分组为大于所述预设阈值的分组;所述第二分组为小于等于所述预设阈值的分组;
检验模块,用于通过预设检验方法,检验所述第一分组和所述第二分组之间的分布差异,得到分布概率值;
第三确定模块,用于通过所述分布概率值确定预设检验阈值;
第四确定模块,用于将所述相关指数和的集合大于所述预设检验阈值对应的眼象特征确定为疾病相关特征;
提取模块,用于提取所述疾病相关特征所对应的富集于病例组的眼象特征集合。
7.一种存储介质,其特征在于,所述存储介质包括存储的指令,其中,在所述指令运行时控制所述存储介质所在的设备执行如权利要求1至4任意一项所述的眼象数据的处理方法。
8.一种电子设备,其特征在于,包括存储器,以及一个或者一个以上的指令,其中一个或者一个以上指令存储于存储器中,且经配置以由一个或者一个以上处理器执行如权利要求1至4任意一项所述的眼象数据的处理方法。
CN202310104151.0A 2023-02-13 2023-02-13 一种眼象数据的处理方法、系统、存储介质及电子设备 Active CN115775410B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202310104151.0A CN115775410B (zh) 2023-02-13 2023-02-13 一种眼象数据的处理方法、系统、存储介质及电子设备
PCT/CN2023/116916 WO2024169163A1 (zh) 2023-02-13 2023-09-05 一种眼象数据的处理方法、系统、存储介质及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310104151.0A CN115775410B (zh) 2023-02-13 2023-02-13 一种眼象数据的处理方法、系统、存储介质及电子设备

Publications (2)

Publication Number Publication Date
CN115775410A CN115775410A (zh) 2023-03-10
CN115775410B true CN115775410B (zh) 2023-04-28

Family

ID=85393614

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310104151.0A Active CN115775410B (zh) 2023-02-13 2023-02-13 一种眼象数据的处理方法、系统、存储介质及电子设备

Country Status (2)

Country Link
CN (1) CN115775410B (zh)
WO (1) WO2024169163A1 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115775410B (zh) * 2023-02-13 2023-04-28 博奥生物集团有限公司 一种眼象数据的处理方法、系统、存储介质及电子设备

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE4433235A1 (de) * 1993-09-20 1995-03-23 Eugen Prof Dr Dr Gramer Perimeter zur Untersuchung von insbesondere Glaukom und okularer Hypertension sowie Ermittlung diagnoserelevanter Indices
US20060089812A1 (en) * 2004-10-25 2006-04-27 Jacquez Geoffrey M System and method for evaluating clustering in case control data
CN108416371A (zh) * 2018-02-11 2018-08-17 艾视医疗科技成都有限公司 一种糖尿病性视网膜病变自动检测方法
CN110648303B (zh) * 2018-06-08 2022-07-26 上海市第六人民医院 眼底图像分析方法、计算机设备和存储介质
CN110379505A (zh) * 2019-06-10 2019-10-25 天津开心生活科技有限公司 一种疾病常见处理方式的识别方法、装置、可读介质及电子设备
CN112686855B (zh) * 2020-12-28 2024-04-16 博奥生物集团有限公司 一种眼象与症状信息的信息关联方法
CN115496700A (zh) * 2021-06-01 2022-12-20 眼灵(上海)智能科技有限公司 一种基于眼部图像的疾病检测系统及方法
CN115775410B (zh) * 2023-02-13 2023-04-28 博奥生物集团有限公司 一种眼象数据的处理方法、系统、存储介质及电子设备

Also Published As

Publication number Publication date
WO2024169163A1 (zh) 2024-08-22
CN115775410A (zh) 2023-03-10

Similar Documents

Publication Publication Date Title
Mishra et al. Diabetic retinopathy detection using deep learning
CN110503630B (zh) 一种基于三维深度学习模型的脑出血分类、定位与预测方法
US9510756B2 (en) Method and system for diagnosis of attention deficit hyperactivity disorder from magnetic resonance images
Du et al. Identification of COPD from multi-view snapshots of 3D lung airway tree via deep CNN
CN111009321A (zh) 一种机器学习分类模型在青少年孤独症辅助诊断中的应用方法
CN114999629B (zh) 一种基于多特征融合的ad早期预测方法、系统、装置
Harangi et al. Detection of the optic disc in fundus images by combining probability models
Yugha et al. An automated glaucoma detection from fundus images based on deep learning network
CN115775410B (zh) 一种眼象数据的处理方法、系统、存储介质及电子设备
CN114600155A (zh) 用于细胞检测和分割的弱监督多任务学习
Songdechakraiwut et al. Topological learning for brain networks
Elayaraja et al. An efficient approach for detection and classification of cancer regions in cervical images using optimization based CNN classification approach
CN113052800A (zh) 一种阿尔茨海默症影像分析方法与装置
Shrivastava et al. Deep learning for visual recognition of environmental enteropathy and celiac disease
CN113553991A (zh) 一种基于深度学习的舌象识别方法
Kelly et al. Extracting complex lesion phenotypes in Zea mays
CN112861881A (zh) 一种基于改进MobileNet模型的蜂窝肺识别方法
CN113627522B (zh) 基于关系网络的图像分类方法、装置、设备及存储介质
Nagesh et al. A spatiotemporal approach to predicting glaucoma progression using a ct-hmm
Xu et al. Unsupervised profiling of microglial arbor morphologies and distribution using a nonparametric Bayesian approach
WO2021260396A1 (en) Method and system for generating a visual representation
Winata et al. Implementation of a faster R-CNN algorithm for identification of metastatic tissue using lymphoma histopathological images
Shabbir et al. Detection of Glaucoma using ORB (Oriented FAST and Rotated BRIEF) Feature Extraction
CN115240014B (zh) 基于残差神经网络的医学图像分类系统
Oliveira et al. Automatic features extraction from the optic cup and disc segmentation for glaucoma classification

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20230821

Address after: 102206 No. 18, life science Road, Beijing, Changping District

Patentee after: CAPITALBIO Corp.

Patentee after: TSINGHUA University

Address before: 102206 No. 18, life science Road, Beijing, Changping District

Patentee before: CAPITALBIO Corp.

TR01 Transfer of patent right