CN116092645A - 一种基于大数据的医疗辅助ai智能化管理系统及方法 - Google Patents

一种基于大数据的医疗辅助ai智能化管理系统及方法 Download PDF

Info

Publication number
CN116092645A
CN116092645A CN202310051969.0A CN202310051969A CN116092645A CN 116092645 A CN116092645 A CN 116092645A CN 202310051969 A CN202310051969 A CN 202310051969A CN 116092645 A CN116092645 A CN 116092645A
Authority
CN
China
Prior art keywords
labeling
training
screening
medical
medical image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202310051969.0A
Other languages
English (en)
Other versions
CN116092645B (zh
Inventor
赵明一
何庆南
杨杨
胡琳
唐兰兰
王子赛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Third Xiangya Hospital of Central South University
Original Assignee
Third Xiangya Hospital of Central South University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Third Xiangya Hospital of Central South University filed Critical Third Xiangya Hospital of Central South University
Priority to CN202310051969.0A priority Critical patent/CN116092645B/zh
Publication of CN116092645A publication Critical patent/CN116092645A/zh
Application granted granted Critical
Publication of CN116092645B publication Critical patent/CN116092645B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H30/00ICT specially adapted for the handling or processing of medical images
    • G16H30/40ICT specially adapted for the handling or processing of medical images for processing medical images, e.g. editing
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Public Health (AREA)
  • Epidemiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Data Mining & Analysis (AREA)
  • Radiology & Medical Imaging (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Biomedical Technology (AREA)
  • Databases & Information Systems (AREA)
  • Pathology (AREA)
  • Image Analysis (AREA)

Abstract

本发明涉及大数据技术领域,具体为一种基于大数据的医疗辅助AI智能化管理系统及方法,包括:辅助信息采集模块、数据库、影像标注分析模块、训练样本筛除模块和医疗影像AI标注模块,通过辅助信息采集模块采集医疗影像标注信息和用于标注的训练样本信息,通过数据库存储采集到的全部数据,通过影像标注分析模块分析医疗影像标注的准确率,选择是否需要对训练样本做筛除处理,通过训练样本筛除模块筛选出需要筛除的对象并对训练样本做筛除处理,通过医疗影像AI标注模块进行医疗影像AI标注,在提高医疗影像标注准确率和标注效率的前提下减少了人工标注成本。

Description

一种基于大数据的医疗辅助AI智能化管理系统及方法
技术领域
本发明涉及大数据技术领域,具体为一种基于大数据的医疗辅助AI智能化管理系统及方法。
背景技术
大部分医疗数据都来源于医疗影像,医疗影像数据已经成为诊断不可缺失的依据之一,利用人工智能技术对医疗影像进行标注,能够为医疗诊断提供辅助和参考,对医疗影像标注数据进行智能化管理能够帮助提高标注质量,进一步能够提高诊断效率和精度;
然而,现有的医疗影像标注数据的管理方式仍存在一些问题:利用人工智能技术对医疗影像进行标注时需要一定的训练样本,但是训练样本的质量决定了医疗影像标注的准确性,现有技术无法及时发现训练样本出现的质量问题并优化训练样本,无法有效提高医疗影像标注的准确率。
所以,人们需要一种基于大数据的医疗辅助AI智能化管理系统及方法来解决上述问题。
发明内容
本发明的目的在于提供一种基于大数据的医疗辅助AI智能化管理系统及方法,以解决上述背景技术中提出的问题。
为了解决上述技术问题,本发明提供如下技术方案:一种基于大数据的医疗辅助AI智能化管理系统,所述系统包括:辅助信息采集模块、数据库、影像标注分析模块、训练样本筛除模块和医疗影像AI标注模块;
所述辅助信息采集模块的输出端连接所述数据库的输入端,所述数据库的输出端连接所述影像标注分析模块的输入端,所述影像标注分析模块的输出端连接所述训练样本筛除模块的输入端,所述训练样本筛除模块的输出端连接所述医疗影像AI标注模块的输入端;
所述辅助信息采集模块用于采集医疗影像标注信息和用于标注的训练样本信息;
所述数据库用于存储采集到的全部数据;
所述影像标注分析模块用于分析医疗影像标注的准确率,选择是否需要对训练样本做筛除处理;
所述训练样本筛除模块用于筛选出需要筛除的对象并对训练样本做筛除处理;
所述医疗影像AI标注模块用于进行医疗影像AI标注。
进一步的,所述辅助信息采集模块包括样本信息采集单元和标注信息采集单元;
所述样本信息采集单元和标注信息采集单元的输出端连接所述数据库的输入端;
所述样本信息采集单元用于采集以往进行医疗影像AI标注时的训练样本量和样本添加到训练数据集的时间信息,所述训练样本量表示的是训练样本的数量,训练数据集由每次进行医疗影像AI标注后添加进入的标注完成且标注正确的医疗影像组成,医疗影像添加进入后会作为训练样本;
所述标注信息采集单元用于采集以往将标注完成的医疗影像发送给相关人员后,相关人员指出的标注错误的医疗影像数量,每次发送的医疗影像数量不止一个,同一时间发送的医疗影像进行标注时使用的是相同训练样本。
进一步的,所述影像标注分析模块包括准确率分析单元和样本筛除选择单元;
所述准确率分析单元的输入端连接所述数据库的输出端,所述准确率分析单元的输出端连接所述样本筛除选择单元的输入端;
所述准确率分析单元用于调取发送的医疗影像数量以及标注错误的医疗影像数量,比对分析每次医疗影像标注的准确率;
所述样本筛除选择单元用于根据比对结果选择是否需要对训练样本做部分删除处理。
进一步的,所述训练样本筛除模块包括样本数据分析单元和筛除对象选择单元;
所述样本数据分析单元的输入端连接所述样本筛除选择单元的输出端,所述样本数据分析单元的输出端连接所述筛除对象选择单元;
所述样本数据分析单元用于若选择对训练样本做部分删除处理,比对不同样本添加到训练数据集的时间信息;
所述筛除对象选择单元用于依据比对结果筛选需要做删除处理的训练样本,将筛选出的训练样本发送给相关人员确认是否做删除处理,在相关人员确认后将筛选出的样本从训练样本中筛除。
进一步的,所述医疗影像AI标注模块包括训练样本提取单元、医疗影像标注单元和标注结果修正单元;
所述训练样本提取单元的输入端连接所述筛除对象选择单元的输出端,所述训练样本提取单元的输出端连接所述医疗影像标注单元的输入端,所述医疗影像标注单元的输出端连接所述标注结果修正单元的输入端;
所述训练样本提取单元用于提取处理后的训练样本;
所述医疗影像标注单元用于将提取到的训练样本应用于训练一个用于特定医疗影像标注的AI目标检测系统中,利用训练好的AI目标检测系统标注医疗影像,训练和标注方式属于现有技术,此处不再赘述;
所述标注结果修正单元用于将标注完成的医疗影像发送给相关人员,由相关人员进行对标注结果进行确认或修正,将标注正确的医疗影像添加到训练样本中形成新的训练样本。
一种基于大数据的医疗辅助AI智能化管理方法,包括以下步骤:
S01:采集医疗影像标注信息和用于标注的训练样本信息;
S02:分析医疗影像标注的准确率,选择是否需要对训练样本做筛除处理;
S03:在选择对训练样本做筛除处理时,筛选出筛除处理的对象;
S04:进行医疗影像AI标注。
进一步的,在步骤S01中:采集到以往f次进行医疗影响AI标注时的训练样本量集合为A={A1,A2,...,Af},后一次标注时使用到的训练样本量都多于前一次标注时使用到的训练样本量,采集样本添加到训练数据集的时间信息,采集到以往利用对应数量的训练样本标注完成的医疗影像数量集合为B={B1,B2,...,Bf},将标注完成的医疗影像发送给相关人员后,相关人员指出的标注错误的医疗影像数量集合为E={E1,E2,...,Ef}。
进一步的,在步骤S02中:根据公式
Figure BDA0004058523600000031
计算随机一次医疗影像标注的准确率Wi,其中,Bi表示以往随机一次利用对应数量的训练样本标注完成的医疗影像数量,Ei表示随机一次将标注完成的医疗影像发送给相关人员后,相关人员指出的标注错误的医疗影像数量,得到f次医疗影像标注的准确率集合为W={W1,W2,...,Wi,...,Wf},将数据点{(A1,W1),(A2,W2),...,(Ai,Wi),...,(Af,Wf)}映射到二维直角坐标系中,根据下列公式选择是否需要对训练样本做筛除处理:
Figure BDA0004058523600000041
其中,θi表示数据点(Ai,Wi)和(Ai+1,Wi+1)连成的直线与x轴正半轴的夹角,Ai和Ai+1分别表示第i次和第i+1次进行医疗影响AI标注时的训练样本量,Wi和Wi+1表示第i次和第i+1次医疗影像标注的准确率,得到夹角集合为θ={θ1,θ2,...,θi,...,θf-1},若夹角范围在
Figure BDA0004058523600000042
内,说明医疗影像标注的准确率随着训练样本量的增加而降低,统计到范围在
Figure BDA0004058523600000043
的夹角个数为b,设置夹角个数阈值为
Figure BDA0004058523600000044
比较b和
Figure BDA0004058523600000045
Figure BDA0004058523600000046
选择不对当前的训练样本做筛除处理,执行步骤S05;若
Figure BDA0004058523600000047
选择需要对当前的训练样本做筛除处理,由于进行医疗影像AI标注时需要利用训练样本训练得到AI目标检测系统,训练样本具有一定的时效性,并非训练样本量越多,标注医疗影像的正确率就越高,训练样本的质量得不到保障,也会影响医疗影像的标注正确率,使得标注正确率降低,通过大数据技术采集历史标注信息,分析医疗影像标注的准确率,将训练样本量和对应的准确率组成数据点,在直角坐标系中进行映射,计算夹角的目的在于判断在训练样本量增加时准确率是否降低,若夹角为钝角,说明训练样本量增加时,标注准确率降低,通过计算夹角的方式选择是否需要筛除部分训练样本,有利于通过直观分析方式及时寻找到筛除训练样本的合适时机以提高训练样本的质量。
进一步的,在步骤S03中:若选择需要对当前的训练样本做筛除处理,调取样本添加到训练数据集的时间信息,从调取到的数据中获取到样本添加到训练数据集的时间与当前时间的间隔时长集合为t={t1,t2,...,tm},其中,m表示当前的训练样本量,m=Af,将训练样本按间隔时长从大到小的顺序将训练样本进行排列,将训练样本分为n类,第n-1类训练样本添加到训练数据集的时间与当前时间的间隔时长之和比第n类大,得到按随机一种分类方式将训练样本进行分类后,每类训练样本添加到训练数据集的时间与当前时间的间隔时长之和集合为T={T1,T2,...,Tn},根据公式
Figure BDA0004058523600000048
计算随机一种分类方式的分类有效程度Pj,得到所有分类方式的分类有效程度集合为P={P1,P2,...,Pj,...,Pk},其中,共有k种分类方式,选择分类有效程度最高的分类方式作为最佳分类方式,筛选出按最佳分类方式将训练样本进行分类后属于第一类的训练样本,将第一类训练样本作为筛除处理的对象,将第一类训练样本发送给相关人员确认是否做筛除处理,在相关人员确认后筛除第一类训练样本,在选择对训练样本做筛除处理时,通过大数据技术采集不同训练样本添加进训练数据集的时间数据,训练样本的时效性在一定程度上会影响样本质量,对于添加时长过长的训练样本,判断其可能会对训练得到的AI目标检测系统的标注性能造成影响,将训练样本按添加时长进行分类,对添加时长过长的训练样本做筛除处理,有利于提高训练样本的质量,优化分类方式能够提高筛选出需要做筛除处理的训练样本的精确性,进一步能够提高医疗影响标注的准确率。
进一步的,提取处理后的训练样本,将提取到的训练样本应用于训练一个用于特定医疗影像标注的AI目标检测系统中,利用训练好的AI目标检测系统标注医疗影像,将标注完成的医疗影像发送给相关人员,由相关人员进行对标注结果进行确认或修正,将标注正确的医疗影像添加到训练样本中形成新的训练样本,无需大量医疗专家加入医疗影像标注工作,在保障标注准确率和标注效率的前提下减少了人工成本。
与现有技术相比,本发明所达到的有益效果是:
本发明通过AI目标检测系统标注医疗影像,将标注完成的医疗影像发送给相关人员,由相关人员进行对标注结果进行确认或修正,无需大量医疗专家加入医疗影像标注工作,在保障标注准确率和标注效率的前提下减少了人工成本;通过大数据技术采集历史标注信息,分析医疗影像标注的准确率,将训练样本量和对应的准确率组成数据点,在直角坐标系中进行映射,计算夹角,判断在训练样本量增加时准确率是否降低,通过计算夹角的方式选择是否需要筛除部分训练样本,通过直观分析方式帮助及时寻找到筛除训练样本的合适时机以提高训练样本的质量;对添加时长过长的训练样本做筛除处理,提高了训练样本的质量,优化分类方式,提高了筛选出需要做筛除处理的训练样本的精确性,进一步提高了医疗影响标注的准确率。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:
图1是本发明一种基于大数据的医疗辅助AI智能化管理系统的结构图;
图2是本发明一种基于大数据的医疗辅助AI智能化管理方法的流程图。
具体实施方式
以下结合附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。
下面结合图1-图2和具体实施例对本发明作进一步的说明。
实施例一:
如图1所示,本实施例提供了一种基于大数据的医疗辅助AI智能化管理系统,系统包括:辅助信息采集模块、数据库、影像标注分析模块、训练样本筛除模块和医疗影像AI标注模块;
辅助信息采集模块的输出端连接数据库的输入端,数据库的输出端连接影像标注分析模块的输入端,影像标注分析模块的输出端连接训练样本筛除模块的输入端,训练样本筛除模块的输出端连接医疗影像AI标注模块的输入端;
辅助信息采集模块用于采集医疗影像标注信息和用于标注的训练样本信息;
数据库用于存储采集到的全部数据;
影像标注分析模块用于分析医疗影像标注的准确率,选择是否需要对训练样本做筛除处理;
训练样本筛除模块用于筛选出需要筛除的对象并对训练样本做筛除处理;
医疗影像AI标注模块用于进行医疗影像AI标注。
辅助信息采集模块包括样本信息采集单元和标注信息采集单元;
样本信息采集单元和标注信息采集单元的输出端连接数据库的输入端;
样本信息采集单元用于采集以往进行医疗影像AI标注时的训练样本量和样本添加到训练数据集的时间信息,训练样本量表示的是训练样本的数量,训练数据集由每次进行医疗影像AI标注后添加进入的标注完成且标注正确的医疗影像组成,医疗影像添加进入后会作为训练样本;
标注信息采集单元用于采集以往将标注完成的医疗影像发送给相关人员后,相关人员指出的标注错误的医疗影像数量,每次发送的医疗影像数量不止一个,同一时间发送的医疗影像进行标注时使用的是相同训练样本。
影像标注分析模块包括准确率分析单元和样本筛除选择单元;
准确率分析单元的输入端连接数据库的输出端,准确率分析单元的输出端连接样本筛除选择单元的输入端;
准确率分析单元用于调取发送的医疗影像数量以及标注错误的医疗影像数量,比对分析每次医疗影像标注的准确率;
样本筛除选择单元用于根据比对结果选择是否需要对训练样本做部分删除处理。
训练样本筛除模块包括样本数据分析单元和筛除对象选择单元;
样本数据分析单元的输入端连接样本筛除选择单元的输出端,样本数据分析单元的输出端连接筛除对象选择单元;
样本数据分析单元用于若选择对训练样本做部分删除处理,比对不同样本添加到训练数据集的时间信息;
筛除对象选择单元用于依据比对结果筛选需要做删除处理的训练样本,将筛选出的训练样本发送给相关人员确认是否做删除处理,在相关人员确认后将筛选出的样本从训练样本中筛除。
医疗影像AI标注模块包括训练样本提取单元、医疗影像标注单元和标注结果修正单元;
训练样本提取单元的输入端连接筛除对象选择单元的输出端,训练样本提取单元的输出端连接医疗影像标注单元的输入端,医疗影像标注单元的输出端连接标注结果修正单元的输入端;
训练样本提取单元用于提取处理后的训练样本;
医疗影像标注单元用于将提取到的训练样本应用于训练一个用于特定医疗影像标注的AI目标检测系统中,利用训练好的AI目标检测系统标注医疗影像;
标注结果修正单元用于将标注完成的医疗影像发送给相关人员,由相关人员进行对标注结果进行确认或修正,将标注正确的医疗影像添加到训练样本中形成新的训练样本。
实施例二:
如图2所示,本实施例提供了一种基于大数据的医疗辅助AI智能化管理方法,其基于实施例中的管理系统实现,具体包括以下步骤:
S01:采集医疗影像标注信息和用于标注的训练样本信息,采集到以往f次进行医疗影响AI标注时的训练样本量集合为A={A1,A2,A3,A4,A5}={20,25,30,40,50},后一次标注时使用到的训练样本量都多于前一次标注时使用到的训练样本量,采集样本添加到训练数据集的时间信息,采集到以往利用对应数量的训练样本标注完成的医疗影像数量集合为B={B1,B2,B3,B4,B5}={10,5,8,12,9},将标注完成的医疗影像发送给相关人员后,相关人员指出的标注错误的医疗影像数量集合为E={E1,E2,E3,E4,E5}={2,1,4,7,6};
S02:分析医疗影像标注的准确率,选择是否需要对训练样本做筛除处理,根据公式
Figure BDA0004058523600000081
计算随机一次医疗影像标注的准确率Wi,其中,Bi表示以往随机一次利用对应数量的训练样本标注完成的医疗影像数量,Ei表示随机一次将标注完成的医疗影像发送给相关人员后,相关人员指出的标注错误的医疗影像数量,得到f次医疗影像标注的准确率集合为W={W1,W2,W3,W4,W5}={0.8,0.8,0.5,0.4,0.3},将数据点{(A1,W1),(A2,W2),(A3,W3),(A4,W4),(A5,W5)}={(20,0.8),(25,0.8),(30,0.5),(40,0.4),(50,0.3)}映射到二维直角坐标系中,根据公式
Figure BDA0004058523600000082
选择是否需要对训练样本做筛除处理,其中,θi表示数据点(Ai,Wi)和(Ai+1,Wi+1)连成的直线与x轴正半轴的夹角,Ai和Ai+1分别表示第i次和第i+1次进行医疗影响AI标注时的训练样本量,Wi和Wi+1表示第i次和第i+1次医疗影像标注的准确率,得到夹角集合为θ={θ1,θ2,θ3,θ4}={0,176°,179°,179°},若夹角范围在
Figure BDA0004058523600000083
内,说明医疗影像标注的准确率随着训练样本量的增加而降低,统计到范围在
Figure BDA0004058523600000084
的夹角个数为b=3,设置夹角个数阈值为
Figure BDA0004058523600000085
比较b和
Figure BDA0004058523600000086
Figure BDA0004058523600000087
选择不对当前的训练样本做筛除处理,执行步骤S05;若
Figure BDA0004058523600000088
选择需要对当前的训练样本做筛除处理,
Figure BDA0004058523600000089
选择需要对当前的训练样本做筛除处理;
S03:在选择对训练样本做筛除处理时,筛选出筛除处理的对象,若选择需要对当前的训练样本做筛除处理,调取样本添加到训练数据集的时间信息,从调取到的数据中获取到样本添加到训练数据集的时间与当前时间的间隔时长集合为t={t1,t2,t3,t4,t5}={20,100,200,10,55},单位为:天,其中,m表示当前的训练样本量,m=Af,将训练样本按间隔时长从大到小的顺序将训练样本进行排列,将训练样本分为n=2类,第n-1类训练样本添加到训练数据集的时间与当前时间的间隔时长之和比第n类大,得到按随机一种分类方式将训练样本进行分类后,每类训练样本添加到训练数据集的时间与当前时间的间隔时长之和集合为T={T1,T2}={355,30},根据公式
Figure BDA00040585236000000810
计算随机一种分类方式的分类有效程度Pj=162.5,得到所有分类方式的分类有效程度集合为P={P1,P2}={162.5,107.5},其中,共有k=2种分类方式,选择分类有效程度最高的分类方式作为最佳分类方式,筛选出按最佳分类方式将训练样本进行分类后属于第一类的训练样本:t2、t3和t5对应的训练样本,将t2、t3和t5对应的训练样本作为筛除处理的对象,将t2、t3和t5对应的训练样本发送给相关人员确认是否做筛除处理,在相关人员确认后筛除t2、t3和t5对应的训练样本;
S04:进行医疗影像AI标注,提取处理后的训练样本,将提取到的训练样本应用于训练一个用于特定医疗影像标注的AI目标检测系统中,利用训练好的AI目标检测系统标注医疗影像,将标注完成的医疗影像发送给相关人员,由相关人员进行对标注结果进行确认或修正,将标注正确的医疗影像添加到训练样本中形成新的训练样本。
最后应说明的是:以上所述仅为本发明的优选实例而已,并不用于限制本发明,尽管参照前述实施例对本发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种基于大数据的医疗辅助AI智能化管理系统,其特征在于:所述系统包括:辅助信息采集模块、数据库、影像标注分析模块、训练样本筛除模块和医疗影像AI标注模块;
所述辅助信息采集模块的输出端连接所述数据库的输入端,所述数据库的输出端连接所述影像标注分析模块的输入端,所述影像标注分析模块的输出端连接所述训练样本筛除模块的输入端,所述训练样本筛除模块的输出端连接所述医疗影像AI标注模块的输入端;
所述辅助信息采集模块用于采集医疗影像标注信息和用于标注的训练样本信息;
所述数据库用于存储采集到的全部数据;
所述影像标注分析模块用于分析医疗影像标注的准确率,选择是否需要对训练样本做筛除处理;
所述训练样本筛除模块用于筛选出需要筛除的对象并对训练样本做筛除处理;
所述医疗影像AI标注模块用于进行医疗影像AI标注。
2.根据权利要求1所述的一种基于大数据的医疗辅助AI智能化管理系统,其特征在于:所述辅助信息采集模块包括样本信息采集单元和标注信息采集单元;
所述样本信息采集单元和标注信息采集单元的输出端连接所述数据库的输入端;
所述样本信息采集单元用于采集以往进行医疗影像AI标注时的训练样本量和样本添加到训练数据集的时间信息;
所述标注信息采集单元用于采集以往将标注完成的医疗影像发送给相关人员后,相关人员指出的标注错误的医疗影像数量。
3.根据权利要求1所述的一种基于大数据的医疗辅助AI智能化管理系统,其特征在于:所述影像标注分析模块包括准确率分析单元和样本筛除选择单元;
所述准确率分析单元的输入端连接所述数据库的输出端,所述准确率分析单元的输出端连接所述样本筛除选择单元的输入端;
所述准确率分析单元用于调取发送的医疗影像数量以及标注错误的医疗影像数量,比对分析每次医疗影像标注的准确率;
所述样本筛除选择单元用于根据比对结果选择是否需要对训练样本做部分删除处理。
4.根据权利要求3所述的一种基于大数据的医疗辅助AI智能化管理系统,其特征在于:所述训练样本筛除模块包括样本数据分析单元和筛除对象选择单元;
所述样本数据分析单元的输入端连接所述样本筛除选择单元的输出端,所述样本数据分析单元的输出端连接所述筛除对象选择单元;
所述样本数据分析单元用于若选择对训练样本做部分删除处理,比对不同样本添加到训练数据集的时间信息;
所述筛除对象选择单元用于依据比对结果筛选需要做删除处理的训练样本,将筛选出的训练样本发送给相关人员确认是否做删除处理,在相关人员确认后将筛选出的样本从训练样本中筛除。
5.根据权利要求4所述的一种基于大数据的医疗辅助AI智能化管理系统,其特征在于:所述医疗影像AI标注模块包括训练样本提取单元、医疗影像标注单元和标注结果修正单元;
所述训练样本提取单元的输入端连接所述筛除对象选择单元的输出端,所述训练样本提取单元的输出端连接所述医疗影像标注单元的输入端,所述医疗影像标注单元的输出端连接所述标注结果修正单元的输入端;
所述训练样本提取单元用于提取处理后的训练样本;
所述医疗影像标注单元用于将提取到的训练样本应用于训练一个用于特定医疗影像标注的AI目标检测系统中,利用训练好的AI目标检测系统标注医疗影像;
所述标注结果修正单元用于将标注完成的医疗影像发送给相关人员,由相关人员进行对标注结果进行确认或修正,将标注正确的医疗影像添加到训练样本中形成新的训练样本。
6.一种基于大数据的医疗辅助AI智能化管理方法,其特征在于:包括以下步骤:
S01:采集医疗影像标注信息和用于标注的训练样本信息;
S02:分析医疗影像标注的准确率,选择是否需要对训练样本做筛除处理;
S03:在选择对训练样本做筛除处理时,筛选出筛除处理的对象;
S04:进行医疗影像AI标注。
7.根据权利要求6所述的一种基于大数据的医疗辅助AI智能化管理方法,其特征在于:在步骤S01中:采集到以往f次进行医疗影响AI标注时的训练样本量集合为A={A1,A2,...,Af},采集样本添加到训练数据集的时间信息,采集到以往利用对应数量的训练样本标注完成的医疗影像数量集合为B={B1,B2,...,Bf},将标注完成的医疗影像发送给相关人员后,相关人员指出的标注错误的医疗影像数量集合为E={E1,E2,...,Ef}。
8.根据权利要求7所述的一种基于大数据的医疗辅助AI智能化管理方法,其特征在于:在步骤S02中:根据公式
Figure FDA0004058523590000031
计算随机一次医疗影像标注的准确率Wi,其中,Bi表示以往随机一次利用对应数量的训练样本标注完成的医疗影像数量,Ei表示随机一次将标注完成的医疗影像发送给相关人员后,相关人员指出的标注错误的医疗影像数量,得到f次医疗影像标注的准确率集合为W={W1,W2,...,Wi,...,Wf},将数据点{(A1,W1),(A2,W2),...,(Ai,Wi),...,(Af,Wf)}映射到二维直角坐标系中,根据下列公式选择是否需要对训练样本做筛除处理:
Figure FDA0004058523590000032
其中,θi表示数据点(Ai,Wi)和(Ai+1,Wi+1)连成的直线与x轴正半轴的夹角,Ai和Ai+1分别表示第i次和第i+1次进行医疗影响AI标注时的训练样本量,Wi和Wi+1表示第i次和第i+1次医疗影像标注的准确率,得到夹角集合为θ={θ1,θ2,...,θi,...,θf-1},统计到范围在
Figure FDA0004058523590000033
的夹角个数为b,设置夹角个数阈值为
Figure FDA0004058523590000034
比较b和
Figure FDA0004058523590000035
Figure FDA0004058523590000036
选择不对当前的训练样本做筛除处理,执行步骤S05;若
Figure FDA0004058523590000037
选择需要对当前的训练样本做筛除处理。
9.根据权利要求6所述的一种基于大数据的医疗辅助AI智能化管理方法,其特征在于:在步骤S03中:若选择需要对当前的训练样本做筛除处理,调取样本添加到训练数据集的时间信息,从调取到的数据中获取到样本添加到训练数据集的时间与当前时间的间隔时长集合为t={t1,t2,...,tm},其中,m表示当前的训练样本量,m=Af,将训练样本按间隔时长从大到小的顺序将训练样本进行排列,将训练样本分为n类,得到按随机一种分类方式将训练样本进行分类后,每类训练样本添加到训练数据集的时间与当前时间的间隔时长之和集合为T={T1,T2,...,Tn},根据公式
Figure FDA0004058523590000041
计算随机一种分类方式的分类有效程度Pj,得到所有分类方式的分类有效程度集合为P={P1,P2,...,Pj,...,Pk},其中,共有k种分类方式,选择分类有效程度最高的分类方式作为最佳分类方式,筛选出按最佳分类方式将训练样本进行分类后属于第一类的训练样本,将第一类训练样本作为筛除处理的对象,将第一类训练样本发送给相关人员确认是否做筛除处理,在相关人员确认后筛除第一类训练样本。
10.根据权利要求6所述的一种基于大数据的医疗辅助AI智能化管理方法,其特征在于:提取处理后的训练样本,将提取到的训练样本应用于训练一个用于特定医疗影像标注的AI目标检测系统中,利用训练好的AI目标检测系统标注医疗影像,将标注完成的医疗影像发送给相关人员,由相关人员进行对标注结果进行确认或修正,将标注正确的医疗影像添加到训练样本中形成新的训练样本。
CN202310051969.0A 2023-02-02 2023-02-02 一种基于大数据的医疗辅助ai智能化管理系统及方法 Active CN116092645B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310051969.0A CN116092645B (zh) 2023-02-02 2023-02-02 一种基于大数据的医疗辅助ai智能化管理系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310051969.0A CN116092645B (zh) 2023-02-02 2023-02-02 一种基于大数据的医疗辅助ai智能化管理系统及方法

Publications (2)

Publication Number Publication Date
CN116092645A true CN116092645A (zh) 2023-05-09
CN116092645B CN116092645B (zh) 2023-08-18

Family

ID=86204081

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310051969.0A Active CN116092645B (zh) 2023-02-02 2023-02-02 一种基于大数据的医疗辅助ai智能化管理系统及方法

Country Status (1)

Country Link
CN (1) CN116092645B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109583904A (zh) * 2018-11-30 2019-04-05 深圳市腾讯计算机系统有限公司 异常操作检测模型的训练方法、异常操作检测方法及装置
CN110459302A (zh) * 2019-08-05 2019-11-15 苏州米特希赛尔人工智能有限公司 超声医疗影像ai辅助标注系统
CN111209945A (zh) * 2019-12-31 2020-05-29 覃士忠 基于ai的影像科医疗影像辅助识别方法及系统
CN114120035A (zh) * 2021-11-17 2022-03-01 韩帅 一种医学影像识别训练方法
CN115457349A (zh) * 2022-09-21 2022-12-09 京东方科技集团股份有限公司 医疗影像分类模型的训练方法和装置、预测方法和装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109583904A (zh) * 2018-11-30 2019-04-05 深圳市腾讯计算机系统有限公司 异常操作检测模型的训练方法、异常操作检测方法及装置
CN110459302A (zh) * 2019-08-05 2019-11-15 苏州米特希赛尔人工智能有限公司 超声医疗影像ai辅助标注系统
CN111209945A (zh) * 2019-12-31 2020-05-29 覃士忠 基于ai的影像科医疗影像辅助识别方法及系统
CN114120035A (zh) * 2021-11-17 2022-03-01 韩帅 一种医学影像识别训练方法
CN115457349A (zh) * 2022-09-21 2022-12-09 京东方科技集团股份有限公司 医疗影像分类模型的训练方法和装置、预测方法和装置

Also Published As

Publication number Publication date
CN116092645B (zh) 2023-08-18

Similar Documents

Publication Publication Date Title
WO2021051885A1 (zh) 目标标注的方法及装置
CN111461068B (zh) 一种染色体中期图识别和分割方法
CN108363701B (zh) 命名实体识别方法及系统
CN109460735B (zh) 基于图半监督学习的文档二值化处理方法、系统、装置
CN108229588B (zh) 一种基于深度学习的机器学习识别方法
CN112765235A (zh) 基于特征识别和大数据分析的人力资源智能管理系统及云管理服务器
CN109903282B (zh) 一种细胞计数方法、系统、装置和存储介质
CN109740457B (zh) 一种人脸识别算法评测方法
CN111353978B (zh) 一种识别心脏解剖学结构的方法及装置
CN109948621B (zh) 一种基于图片验证码的图像处理与字符分割方法
CN110992365A (zh) 一种基于图像语义分割的损失函数及其设计方法
CN111210402A (zh) 人脸图像质量评分方法、装置、计算机设备及存储介质
US11861451B2 (en) Method for chip collection and method for chip positioning
US8787702B1 (en) Methods and apparatus for determining and/or modifying image orientation
CN111723852A (zh) 针对目标检测网络的鲁棒训练方法
CN111507119B (zh) 标识码识别方法、装置、电子设备及计算机可读存储介质
CN116092645B (zh) 一种基于大数据的医疗辅助ai智能化管理系统及方法
US9646249B2 (en) Method for inferring attributes of a data set and recognizers used thereon
CN111160374A (zh) 一种基于机器学习的颜色识别方法及系统、装置
CN114037868B (zh) 图像识别模型的生成方法及装置
CN112699886B (zh) 一种字符识别方法、装置及电子设备
CN115310505A (zh) 一种用于互感器二次回路接线端子的自动识别方法及系统
KR102265678B1 (ko) 이미지 파일의 바운딩 박스 작업의 난이도를 예측하는 방법 및 이를 수행하는 컴퓨터 장치
CN113610161A (zh) 一种基于图像分类技术的目标检测数据标注方法
CN113987025A (zh) 标准化热点监测方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant