CN117392165B - 一种基于人工智能的医疗样本大数据采集方法 - Google Patents

一种基于人工智能的医疗样本大数据采集方法 Download PDF

Info

Publication number
CN117392165B
CN117392165B CN202311695078.5A CN202311695078A CN117392165B CN 117392165 B CN117392165 B CN 117392165B CN 202311695078 A CN202311695078 A CN 202311695078A CN 117392165 B CN117392165 B CN 117392165B
Authority
CN
China
Prior art keywords
gray
obtaining
seed
area
gray level
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202311695078.5A
Other languages
English (en)
Other versions
CN117392165A (zh
Inventor
吴淡娟
宋文
宋怿江
彭彬
林晓萍
张鹏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Southern Hospital Southern Medical University
Original Assignee
Southern Hospital Southern Medical University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Southern Hospital Southern Medical University filed Critical Southern Hospital Southern Medical University
Priority to CN202311695078.5A priority Critical patent/CN117392165B/zh
Publication of CN117392165A publication Critical patent/CN117392165A/zh
Application granted granted Critical
Publication of CN117392165B publication Critical patent/CN117392165B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/136Segmentation; Edge detection involving thresholding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/90Determination of colour characteristics
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/762Arrangements for image or video recognition or understanding using pattern recognition or machine learning using clustering, e.g. of similar faces in social networks
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H30/00ICT specially adapted for the handling or processing of medical images
    • G16H30/20ICT specially adapted for the handling or processing of medical images for handling medical images, e.g. DICOM, HL7 or PACS

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Epidemiology (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Primary Health Care (AREA)
  • Public Health (AREA)
  • Radiology & Medical Imaging (AREA)
  • Computing Systems (AREA)
  • Databases & Information Systems (AREA)
  • Evolutionary Computation (AREA)
  • Software Systems (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

本发明涉及图像处理领域,具体涉及一种基于人工智能的医疗样本大数据采集方法,包括:获取病理灰度图;根据病理灰度图得到每个灰度级的重要程度,得到种子点,根据每两个种子点之间的距离和每个种子点邻域内种子点的密度得到每两个种子点之间的相关性系数,得到若干个类簇和所有区域;根据相邻两个区域的灰度值差异得到相邻两个区域之间的筑坝判断条件,得到调整区域和非调整区域,得到调整区域调整后的灰度分布,得到每个区域的截止阈值;根据每个区域的截止阈值对每个区域进行分割,得到灰度图像中所有的分割区域,根据所有的分割区域进行医疗样本大数据的采集。本发明通过对病理灰度图进行处理,提高了区域分割的准确性。

Description

一种基于人工智能的医疗样本大数据采集方法
技术领域
本发明涉及图像处理技术领域,具体涉及一种基于人工智能的医疗样本大数据采集方法。
背景技术
医学检验是医疗领域中的一项重要工具,用于诊断、监测和评估疾病、健康状况以及治疗效果。它涉及分析生物样本(如血液、尿液、唾液、组织或细胞)以获得关于病情或身体健康的信息。一些常见的医学检验包括血液生化检查(例如,测量血糖、血脂、电解质等)、血液细胞计数(例如,白细胞计数、红细胞计数)、影像学检查(如X射线、MRI、CT扫描)、生物化学标志物检测(例如,肿瘤标志物、心肌标志物)。医学检验可以帮助医生确定疾病的存在或排除,监测患者的疾病进展,以及评估治疗是否有效。例如病理切片是一种常用的医学诊断工具,它允许病理学家或病理医师在显微镜下观察组织样本的微观结构,以确定是否存在疾病或异常情况。这对于确定疾病的种类和性质非常关键,如肿瘤、感染、炎症、变性等。而在对病理切片进行观察分析时,主要是对不同的生物组织进行分割,然后识别可能产生的病变组织。
但是在对不同的生物组织进行分区域检测时,由于生物组织在显微镜下通常是透明的或者颜色相似,导致直接使用显微镜对生物组织进行观察时,看不到具体生物组织,为了增加对生物组织的可见性,需要使用染色对生物组织进行染色,对染色后的生物组织使用显微镜进行观察时,则能观察到生物组织。但是在进行染色时,由于相邻细胞对染色的渗透能力相同,在使用分水岭算法进行分割时,对每个细胞分割的不太明确,则无法采集到准确的医疗样本大数据。
发明内容
本发明提供一种基于人工智能的医疗样本大数据采集方法,以解决现有的问题。
本发明的一种基于人工智能的医疗样本大数据采集方法采用如下技术方案:
本发明一个实施例提供了一种基于人工智能的医疗样本大数据采集方法,该方法包括以下步骤:
采集病理切片图像,获取病理灰度图;
根据病理灰度图得到每个灰度级的重要程度,根据灰度级的重要程度得到种子点,根据每两个种子点之间的距离和每个种子点邻域内种子点的密度得到每两个种子点之间的相关性系数,根据每两个种子点之间的相关性系数对所有的种子点进行聚类得到若干个类簇,根据若干个类簇得到病理灰度图中的所有区域;
根据相邻两个区域中所有种子点之间的相关性系数、相邻两个区域之间的距离和每个区域中的像素点的灰度值差异,得到相邻两个区域之间的筑坝判断条件,根据相邻两个区域之间的筑坝判断条件得到调整区域和非调整区域,根据调整区域中像素点的灰度值得到调整区域调整后的灰度分布,根据调整区域调整后的灰度分布和非调整区域的灰度分布得到每个区域的灰度分布,根据每个区域的灰度分布得到每个区域的截止阈值;
根据每个区域的截止阈值对每个区域进行分割,得到灰度图像中所有的分割区域,根据所有的分割区域进行医疗样本大数据的采集。
进一步地,所述每个灰度级的重要程度的计算公式为:
式中,I表示第I个灰度级,表示第I灰度级对应的像素点的个数,/>表示第I+t个灰度级,/>表示第I+t个灰度级对应的像素点的个数,/>表示线性归一化函数,/>表示第I个灰度级的重要程度,n为预设阈值。
进一步地,所述根据灰度级的重要程度得到种子点,包括的具体步骤如下:
选取重要程度最大时的灰度级所对应的像素点记为种子点。
进一步地,所述每个种子点邻域内种子点的密度的具体获取步骤如下:
以每个种子点为圆心,以预设阈值r为半径获得一个圆,将该圆作为圆心种子点的邻域;获取圆内所有的种子点个数,将圆内所有的种子点个数与圆内所有像素点个数的比值记为圆心种子点邻域内种子点的密度。
进一步地,所述每两个种子点之间的相关性系数的计算公式为:
式中,表示第a个种子点与第b个种子点之间的欧氏距离,/>表示第a个种子点邻域内种子点的密度,/>表示第b个种子点邻域内种子点的密度,/>表示第a个种子点与第b个种子点之间的相关性系数。
进一步地,所述根据每两个种子点之间的相关性系数对所有的种子点进行聚类得到若干个类簇,包括的具体步骤如下:
使用密度聚类算法根据每两个种子点之间的相关性系数对所有的种子点进行聚类,得到若干个类簇。
进一步地,所述根据若干个类簇得到病理灰度图中的所有区域,包括的具体步骤如下:
根据所有的种子点通过分水岭算法将每个类簇中的所有种子点划分在一个区域,得到病理灰度图中的所有区域。
进一步地,所述相邻两个区域之间的筑坝判断条件的计算公式为:
式中,表示第c个区域中所有像素点的灰度值均值,/>表示第v个区域中所有像素点的灰度值均值,/>表示第c个区域的质心和第v个区域的质心之间的欧式距离,表示第c个区域的种子点与第v个区域的种子点之间的所有种子点组合的相关性系数的均值,/>表示第c个区域和第v个区域之间的筑坝判断条件,/>表示以自然常数为底的指数函数,/>表示绝对值符号。
进一步地,所述根据相邻两个区域之间的筑坝判断条件得到调整区域和非调整区域,根据调整区域中像素点的灰度值得到调整区域调整后的灰度分布,包括的具体步骤如下:
当相邻两个区域之间的筑坝判断条件大于预设阈值T时,则判定相邻两个区域之间需要进行筑坝,选取需要进行筑坝的相邻两个区域中像素点的灰度均值最大的一个区域记为调整区域,除了调整区域之外的区域记为非调整区域;将调整区域的每个像素点的灰度值进行调高G个灰度级,得到调整区域调整后的灰度分布;
其中,G为预设阈值。
进一步地,所述每个区域的截止阈值的计算公式为:
式中,表示第f个区域中所有像素点的灰度值均值,/>表示第f个区域的最大灰度值,/>表示第f个区域的最小灰度值,/>表示第f个区域中所有像素点的梯度幅值的均值,/>表示第f个区域的最大梯度幅值对应像素点的灰度值,/>表示取最大值函数,/>表示取最小值函数,/>表示第f个区域的截止阈值。
本发明的技术方案的有益效果是:本发明通过病理灰度图得到每个灰度级的重要程度,根据灰度级的重要程度得到种子点,根据每两个种子点之间的相关性系数对所有的种子点进行聚类得到若干个类簇,根据若干个类簇得到病理灰度图中的所有区域,提高了初次区域确定的准确性;再根据相邻两个区域中所有种子点之间的相关性系数、相邻两个区域之间的距离和每个区域中的像素点的灰度值差异得到相邻两个区域之间的筑坝判断条件,根据相邻两个区域之间的筑坝判断条件得到调整区域和非调整区域,根据调整区域中像素点的灰度值得到调整区域调整后的灰度分布,扩大了差异较小的两个区域,使得在进行医疗样本区域分割时更加准确;根据调整区域调整后的灰度分布和非调整区域的灰度分布得到每个区域的灰度分布,根据每个区域的灰度分布得到每个区域的截止阈值,根据每个区域的截止阈值对每个区域进行分割,提高了区域分割的准确性;根据所有的分割区域进行医疗样本大数据的采集,进而提高对医疗样本大数据采集的准确性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明一种基于人工智能的医疗样本大数据采集方法的步骤流程图。
具体实施方式
为了更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本发明提出的一种基于人工智能的医疗样本大数据采集方法,其具体实施方式、结构、特征及其功效,详细说明如下。在下述说明中,不同的“一个实施例”或“另一个实施例”指的不一定是同一实施例。此外,一或多个实施例中的特定特征、结构或特点可由任何合适形式组合。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。
下面结合附图具体的说明本发明所提供的一种基于人工智能的医疗样本大数据采集方法的具体方案。
请参阅图1,其示出了本发明一个实施例提供的一种基于人工智能的医疗样本大数据采集方法的步骤流程图,该方法包括以下步骤:
步骤S001:采集病理切片图像,并对图像进行预处理得到病理灰度图。
需要说明的是,本实施例的主要目的是为了对病理切片图像进行分割,获得图像中的不同分割区域,根据分割区域获取医疗样本中需要获取的数据,因此首先需要采集病理切片图像,根据切片图像的特征进行分析处理得到最终的分割区域。
具体地,先对病理切片进行染色,然后使用扫描显微镜采集病理切片图像,再对病理切片图像进行灰度化处理得到灰度图,通过维纳滤波算法对灰度图进行去噪处理,得到病理灰度图。其中,维纳滤波算法为公知技术,此处不再进行赘述。
至此,得到病理灰度图。
步骤S002:根据病理灰度图得到每个灰度级的重要程度,根据灰度级的重要程度得到种子点,根据每两个种子点之间的距离和每个种子点邻域内种子点的密度得到每两个种子点之间的相关性系数,根据每两个种子点之间的相关性系数对所有的种子点进行聚类得到若干个类簇,根据若干个类簇得到病理灰度图中的所有区域。
需要说明的是,在对病理切片的图像进行分割时,因为在切片的制备过程中,需要对细胞进行染色处理,而染色后的病理切片图像的颜色差异较小,那么在对其进行灰度化处理后,图像中不同区域的灰度分布存在相同的情况,而对于相同的灰度,在对图像进行分割时,就会造成不同区域的边缘不明确,从而导致目标区域的分割错误的情况。因此为了能够对图像进行准确的分割,需要根据不同目标区域的特征不同,首先对图像进行初始区域的筛选,然后在根据筛选出来的区域的灰度变化通过分水岭算法对其进行分割,而在通过分水岭算法对图像进行分割时,因为不同区域存在灰度相同的像素点,因此对不同区域的截止阈值需要不同,这样才能够将区域完整的分割出来,因此本实施例根据不同区域的灰度变化来自适应截止阈值,使其满足对不同目标区域的分割效果。
(1)根据病理灰度图得到每个灰度级的重要程度,根据灰度级的重要程度得到种子点。
进一步需要说明的是,为了进行区域的划分,则需要根据像素点的灰度级分析获取划分区域的种子点,由于是为了分析病理切片,所以需要将病理切片全部进行划分区域,则应该选取灰度级对应的像素点多的作为种子点。又由于染色后的病理切片中,处于细胞的边缘区域的颜色较深,细胞的内部颜色较浅,因此着色区域较重是细胞膜,颜色较浅的是细胞质所包含的区域,因此选取像素点的灰度级偏低的灰度级对应的像素点作为种子点进行区域划分。则根据灰度级的高低和灰度级对应的像素点的个数进行分析。
具体地,本实施例中以常规的256个灰度级作为病理灰度图的灰度级。预设一个阈值n,其中本实施例以n=3为例进行叙述,本实施例不进行具体限定,其中n可根据具体实施情况而定。获取每个灰度级邻域内的所有灰度级,根据每个灰度级邻域内的所有灰度级和灰度级对应的像素点的个数得到每个灰度级的重要程度,用公式表示为:
式中,I表示第I个灰度级,表示第I灰度级对应的像素点的个数,/>表示第I+t个灰度级,/>表示第I+t个灰度级对应的像素点的个数,/>表示线性归一化函数,/>表示第I个灰度级的重要程度,n为预设阈值。
其中,表示第I个灰度级邻域内所有灰度级对应的像素点的数量变化,其值越大,则该灰度级的重要程度越大。选取重要程度最大时的灰度级所对应的像素点记为种子点。
至此,得到病理灰度图中的种子点。
(2)根据每两个种子点之间的距离和每个种子点邻域内种子点的密度得到每两个种子点之间的相关性系数。
需要说明的是,根据上述获得的种子点,然后对其进行分水岭分割,因为分水岭算法是模拟水淹的过程,对不同区域选择不同的注水点,并且根据其需要来选择注水的高度,也就是水淹位置。但是因为需要对不同区域进行分割,为了能够将灰度变化程度不同的区域分割开来,需要在注水的过程中建坝,防止水发生漫延,造成其他的区域未分割出来。因为在进行分水岭分割时,需要获得不同区域的水淹截止条件,并且判断其是否需要建坝,进而获得最终的截止阈值。
进一步需要说明的是,由于种子点数量较多,直接用种子点进行分割时可能将一个区域分割成多个区域,因此需要通过任意两个种子点之间的相关性系数进行分析,将相关性强的种子点放置在同一个区域,避免过分割情况的出现。
具体地,预设一个阈值r,其中本实施例以r=2为例进行叙述,本实施例不进行具体限定,其中r可根据具体实施情况而定。以每个种子点为圆心,以预设阈值r为半径获得一个圆,将该圆作为圆心种子点的邻域。获取圆内所有的种子点个数,将圆内所有的种子点个数与圆内所有像素点个数的比值记为圆心种子点邻域内种子点的密度。其中,将涉及的像素点但未全部在圆内的像素点仍然记为圆内的一个像素点。
根据每两个种子点之间的距离和每个种子点邻域内种子点的密度得到每两个种子点之间的相关性系数,用公式表示为:
式中,表示第a个种子点与第b个种子点之间的欧氏距离,/>表示第a个种子点邻域内种子点的密度,/>表示第b个种子点邻域内种子点的密度,/>表示第a个种子点与第b个种子点之间的相关性系数。
其中,当越小,则两个种子点之间的相关性系数越大,即两个种子点之间的相关性越强;当种子点邻域内种子点的密度越大,则两个种子点之间的相关性系数越大,即两个种子点之间的相关性越强。
至此,得到每两个种子点之间的相关性系数。
(3)根据每两个种子点之间的相关性系数对所有的种子点进行聚类得到若干个类簇,根据若干个类簇得到病理灰度图中的所有区域。
需要说明的是,为了避免出现过分割的情况,则需要将相关性很强的放在一个区域,防止过分割导致采集到的医疗样本数据不准确,因此此处需要根据种子点之间的相关性系数进行聚类,将相关性强的种子点进行注水得到一个水坝,即得到一个区域。
具体地,预设一个阈值Z,其中本实施例以Z=5为例进行叙述,本实施例不进行具体限定,其中Z可根据具体实施情况而定。使用密度聚类算法根据每两个种子点之间的相关性系数对所有的种子点进行聚类,得到若干个类簇。其中,密度聚类过程中的类簇的最小个数为Z,其聚类半径等于每两个种子点之间的最大相关性系数与最小相关性系数的均值。其中,密度聚类算法为公知技术,此处不再进行赘述。
根据所有的种子点通过分水岭算法将每个类簇中的所有种子点划分在一个区域,得到病理灰度图中的所有区域。其中,分水岭算法为公知技术,此处不再进行赘述。
至此,得到病理灰度图中的所有区域。
步骤S003:根据相邻两个区域中所有种子点之间的相关性系数、相邻两个区域之间的距离和每个区域中的像素点的灰度值差异得到相邻两个区域之间的筑坝判断条件,根据相邻两个区域之间的筑坝判断条件得到调整区域和非调整区域,根据调整区域中像素点的灰度值得到调整区域调整后的灰度分布,根据调整区域调整后的灰度分布和非调整区域的灰度分布得到每个区域的灰度分布,根据每个区域的灰度分布得到每个区域的截止阈值。
(1)根据相邻两个区域中所有种子点之间的相关性系数、相邻两个区域之间的距离和每个区域中的像素点的灰度值差异得到相邻两个区域之间的筑坝判断条件。
需要说明的是,在水淹过程中,因为不同区域之间的灰度值存在差异,也就是分水岭算法中存在不同高度的峰,那么就会导致水淹过程中可能会出现一个区域的水位漫延到别的区域,因此需要根据不同区域之间的灰度差异来筑坝,防止水的漫延,从而导致区域的分割不准确。
具体地,根据相邻两个区域中所有种子点之间的相关性系数、相邻两个区域之间的距离和每个区域中的像素点的灰度值差异得到相邻两个区域之间的筑坝判断条件,用公式表示为:
式中,表示第c个区域中所有像素点的灰度值均值,/>表示第v个区域中所有像素点的灰度值均值,/>表示第c个区域的质心和第v个区域的质心之间的欧式距离,表示第c个区域的种子点与第v个区域的种子点之间的所有种子点组合的相关性系数的均值,/>表示第c个区域和第v个区域之间的筑坝判断条件,/>表示以自然常数为底的指数函数,/>表示绝对值符号。
其中,当相邻两个区域的相关性系数越大,相关性越强,相邻两个区域之间的灰度差异越小,相邻两个区域之间的距离越短,则表面这相邻两个区域之间的筑坝判断条件越大,则这相邻两个区域之间的差异越小,即相邻两个区域之间越需要筑坝。
(2)根据相邻两个区域之间的筑坝判断条件得到调整区域和非调整区域,根据调整区域中像素点的灰度值得到调整区域调整后的灰度分布,根据调整区域调整后的灰度分布和非调整区域的灰度分布得到每个区域的灰度分布。
预设一个阈值T,其中本实施例以T=0.32为例进行叙述,本实施例不进行具体限定,其中T可根据具体实施情况而定。当相邻两个区域之间的筑坝判断条件大于预设阈值T时,则表明这相邻两个区域之间需要进行筑坝。
预设一个阈值G,其中本实施例以G=5为例进行叙述,本实施例不进行具体限定,其中G可根据具体实施情况而定。选取这相邻两个区域中像素点的灰度均值最大的一个区域记为调整区域,除了调整区域之外的区域记为非调整区域;将调整区域的每个像素点的灰度值进行调高G个灰度级,得到调整区域调整后的灰度分布。
根据调整区域调整后的灰度分布和非调整区域的灰度分布得到每个区域的灰度分布。
至此,得到每个区域的灰度分布。
(3)根据每个区域的灰度分布得到每个区域的截止阈值。
根据每个区域中的灰度值和梯度值得到每个区域的截止阈值,用公式表示为:
式中,表示第f个区域中所有像素点的灰度值均值,/>表示第f个区域的最大灰度值,/>表示第f个区域的最小灰度值,/>表示第f个区域中所有像素点的梯度幅值的均值,/>表示第f个区域的最大梯度幅值对应像素点的灰度值,/>表示取最大值函数,/>表示取最小值函数,/>表示第f个区域的截止阈值。
其中,表示第f个区域的灰度分布,若/>的值一定,平均灰度值越小,说明该区域的灰度值就主要集中在较小的灰度级区间内,因此截止阈值需要更小;而乘以平均梯度幅值/>是为了表示该区域的灰度变化,因为灰度变化越剧烈,则梯度幅值越大,因此在获得截止阈值时,应该更靠近背景,而背景区域的灰度大,因此所获得的截止阈值就大,因为梯度幅值最大的区域可能表示的边缘区域,而对图像分割主要是对边缘的变化进行描述,因此在这里程度梯度最大值的像素点对应的灰度值。
至此,得到每个区域的截止阈值。
步骤S004:根据每个区域的截止阈值对每个区域进行分割,得到灰度图像中所有的分割区域,根据所有的分割区域进行医疗样本大数据的采集。
对每个区域使用截止阈值进行分割,即将一个区域分割成两个区域,得到所有的分割区域,然后对每个分割区域进行医疗样本大数据的采集。
至此,本实施例完成。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (7)

1.一种基于人工智能的医疗样本大数据采集方法,其特征在于,该方法包括以下步骤:
采集病理切片图像,获取病理灰度图;
根据病理灰度图得到每个灰度级的重要程度,根据灰度级的重要程度得到种子点,根据每两个种子点之间的距离和每个种子点邻域内种子点的密度得到每两个种子点之间的相关性系数,根据每两个种子点之间的相关性系数对所有的种子点进行聚类得到若干个类簇,根据若干个类簇得到病理灰度图中的所有区域;
根据相邻两个区域中所有种子点之间的相关性系数、相邻两个区域之间的距离和每个区域中的像素点的灰度值差异,得到相邻两个区域之间的筑坝判断条件,根据相邻两个区域之间的筑坝判断条件得到调整区域和非调整区域,根据调整区域中像素点的灰度值得到调整区域调整后的灰度分布,根据调整区域调整后的灰度分布和非调整区域的灰度分布得到每个区域的灰度分布,根据每个区域的灰度分布得到每个区域的截止阈值;
所述相邻两个区域之间的筑坝判断条件的计算公式为:
式中,表示第c个区域中所有像素点的灰度值均值,/>表示第v个区域中所有像素点的灰度值均值,/>表示第c个区域的质心和第v个区域的质心之间的欧式距离,/>表示第c个区域的种子点与第v个区域的种子点之间的所有种子点组合的相关性系数的均值,/>表示第c个区域和第v个区域之间的筑坝判断条件,/>表示以自然常数为底的指数函数,/>表示绝对值符号;
所述根据相邻两个区域之间的筑坝判断条件得到调整区域和非调整区域,根据调整区域中像素点的灰度值得到调整区域调整后的灰度分布,包括的具体步骤如下:
当相邻两个区域之间的筑坝判断条件大于预设阈值T时,则判定相邻两个区域之间需要进行筑坝,选取需要进行筑坝的相邻两个区域中像素点的灰度均值最大的一个区域记为调整区域,除了调整区域之外的区域记为非调整区域;将调整区域的每个像素点的灰度值进行调高G个灰度级,得到调整区域调整后的灰度分布;
其中,G为预设阈值;
所述每个区域的截止阈值的计算公式为:
式中,表示第f个区域中所有像素点的灰度值均值,/>表示第f个区域的最大灰度值,/>表示第f个区域的最小灰度值,/>表示第f个区域中所有像素点的梯度幅值的均值,/>表示第f个区域的最大梯度幅值对应像素点的灰度值,/>表示取最大值函数,/>表示取最小值函数,/>表示第f个区域的截止阈值;
根据每个区域的截止阈值对每个区域进行分割,得到病理灰度图中所有的分割区域,根据所有的分割区域进行医疗样本大数据的采集。
2.根据权利要求1所述一种基于人工智能的医疗样本大数据采集方法,其特征在于,所述每个灰度级的重要程度的计算公式为:
式中,I表示第I个灰度级,表示第I灰度级对应的像素点的个数,/>表示第I+t个灰度级,/>表示第I+t个灰度级对应的像素点的个数,/>表示线性归一化函数,/>表示第I个灰度级的重要程度,n为预设阈值。
3.根据权利要求1所述一种基于人工智能的医疗样本大数据采集方法,其特征在于,所述根据灰度级的重要程度得到种子点,包括的具体步骤如下:
选取重要程度最大时的灰度级所对应的像素点记为种子点。
4.根据权利要求1所述一种基于人工智能的医疗样本大数据采集方法,其特征在于,所述每个种子点邻域内种子点的密度的具体获取步骤如下:
以每个种子点为圆心,以预设阈值r为半径获得一个圆,将该圆作为圆心种子点的邻域;获取圆内所有的种子点个数,将圆内所有的种子点个数与圆内所有像素点个数的比值记为圆心种子点邻域内种子点的密度。
5.根据权利要求1所述一种基于人工智能的医疗样本大数据采集方法,其特征在于,所述每两个种子点之间的相关性系数的计算公式为:
式中,表示第a个种子点与第b个种子点之间的欧氏距离,/>表示第a个种子点邻域内种子点的密度,/>表示第b个种子点邻域内种子点的密度,/>表示第a个种子点与第b个种子点之间的相关性系数。
6.根据权利要求1所述一种基于人工智能的医疗样本大数据采集方法,其特征在于,所述根据每两个种子点之间的相关性系数对所有的种子点进行聚类得到若干个类簇,包括的具体步骤如下:
使用密度聚类算法根据每两个种子点之间的相关性系数对所有的种子点进行聚类,得到若干个类簇。
7.根据权利要求1所述一种基于人工智能的医疗样本大数据采集方法,其特征在于,所述根据若干个类簇得到病理灰度图中的所有区域,包括的具体步骤如下:
根据所有的种子点通过分水岭算法将每个类簇中的所有种子点划分在一个区域,得到病理灰度图中的所有区域。
CN202311695078.5A 2023-12-12 2023-12-12 一种基于人工智能的医疗样本大数据采集方法 Active CN117392165B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311695078.5A CN117392165B (zh) 2023-12-12 2023-12-12 一种基于人工智能的医疗样本大数据采集方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311695078.5A CN117392165B (zh) 2023-12-12 2023-12-12 一种基于人工智能的医疗样本大数据采集方法

Publications (2)

Publication Number Publication Date
CN117392165A CN117392165A (zh) 2024-01-12
CN117392165B true CN117392165B (zh) 2024-02-23

Family

ID=89463484

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311695078.5A Active CN117392165B (zh) 2023-12-12 2023-12-12 一种基于人工智能的医疗样本大数据采集方法

Country Status (1)

Country Link
CN (1) CN117392165B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN118071776B (zh) * 2024-04-22 2024-06-21 大连云智信科技发展有限公司 一种用于家禽肠道健康状况检测的图像处理系统

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1999005640A1 (en) * 1997-07-25 1999-02-04 Arch Development Corporation Method and system for the segmentation of lung regions in lateral chest radiographs
CN110276764A (zh) * 2019-05-29 2019-09-24 南京工程学院 基于K值估计的K-Means水下图像背景分割改进算法
CN115187592A (zh) * 2022-09-08 2022-10-14 山东奥洛瑞医疗科技有限公司 一种适用于核磁共振图像的图像分割方法
CN115457004A (zh) * 2022-09-22 2022-12-09 山东华太新能源电池有限公司 基于计算机视觉的锌膏的智能检测方法
CN115546203A (zh) * 2022-11-23 2022-12-30 常熟理工学院 基于图像数据算法的生产监测分析方法
CN116383450A (zh) * 2023-06-05 2023-07-04 沧州中铁装备制造材料有限公司 一种铁路公路物流运输信息综合管理系统
CN116503392A (zh) * 2023-06-26 2023-07-28 细胞生态海河实验室 一种用于卵巢组织分析的卵泡区域分割方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1999005640A1 (en) * 1997-07-25 1999-02-04 Arch Development Corporation Method and system for the segmentation of lung regions in lateral chest radiographs
CN110276764A (zh) * 2019-05-29 2019-09-24 南京工程学院 基于K值估计的K-Means水下图像背景分割改进算法
CN115187592A (zh) * 2022-09-08 2022-10-14 山东奥洛瑞医疗科技有限公司 一种适用于核磁共振图像的图像分割方法
CN115457004A (zh) * 2022-09-22 2022-12-09 山东华太新能源电池有限公司 基于计算机视觉的锌膏的智能检测方法
CN115546203A (zh) * 2022-11-23 2022-12-30 常熟理工学院 基于图像数据算法的生产监测分析方法
CN116383450A (zh) * 2023-06-05 2023-07-04 沧州中铁装备制造材料有限公司 一种铁路公路物流运输信息综合管理系统
CN116503392A (zh) * 2023-06-26 2023-07-28 细胞生态海河实验室 一种用于卵巢组织分析的卵泡区域分割方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Methods in quantitative image analysis;Oberholzer, M等;《HISTOCHEMISTRY AND CELL BIOLOGY》;19960531;第105卷(第5期);第333-355页 *
基于LiDAR点云的蓄滞洪区建筑提取方法研究;黄煌;《中国优秀硕士学位论文全文数据库基础科学辑》;20230415(第04期);第A008-38页 *
基于改进分水岭算法的农村地区LiDAR点云建筑物提取;李昂;《长江科学院院报》;20210331;第38卷(第03期);第149-154页 *

Also Published As

Publication number Publication date
CN117392165A (zh) 2024-01-12

Similar Documents

Publication Publication Date Title
CN111951221B (zh) 一种基于深度神经网络的肾小球细胞图像识别方法
CN117392165B (zh) 一种基于人工智能的医疗样本大数据采集方法
CN102068281B (zh) 一种占位性病变超声图像的处理方法
CN116645384B (zh) 基于人工智能的干细胞区域快速分割方法
CN109785310B (zh) 一种基于乳腺淋巴结全景图像计算的自动分期系统
CN111798425B (zh) 基于深度学习的胃肠道间质瘤中核分裂象智能检测方法
CN113706492B (zh) 一种基于胸部ct影像的肺实质自动分割方法
CN107567631B (zh) 组织样品分析技术
CN111340128A (zh) 一种肺癌转移性淋巴结病理图像识别系统及方法
WO2010030159A2 (en) A non invasive method for analysing the retina for ocular manifested diseases
CN115760858B (zh) 基于深度学习的肾脏病理切片细胞识别方法及系统
CN110763677A (zh) 甲状腺冰冻切片诊断方法及系统
CN113017687A (zh) 一种腹腔积液b超图像自动识别方法
CN112767407A (zh) 一种基于级联门控3DUnet模型的CT图像肾脏肿瘤分割方法
CN118115466A (zh) 一种眼底伪病灶检测方法
Kamenetsky et al. Analysis of the glomerular basement membrane in images of renal biopsies using the split-and-merge method: a pilot study
JPWO2019044579A1 (ja) 病理診断装置、画像処理方法及びプログラム
CN111292285B (zh) 一种基于朴素贝叶斯与支持向量机的糖网病自动筛查方法
CN117274606A (zh) 一种核磁共振脑瘤区域提取方法
CN111798426A (zh) 用于移动端的胃肠道间质瘤中核分裂象深度学习检测系统
CN114862799B (zh) 一种用于flair-mri序列的全自动脑体积分割方法
CN114511564A (zh) 基于dce-mri对乳腺癌残存肿瘤负荷的影像分析方法
Bhuiyan et al. Drusen quantification for early identification of age related macular degeneration (AMD) using color fundus imaging
JP2006507486A (ja) 細管の自動組織学的類別
CN117974692B (zh) 一种基于区域生长的眼科医学影像处理方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant