CN111582404A - 内容分类方法、装置及可读存储介质 - Google Patents
内容分类方法、装置及可读存储介质 Download PDFInfo
- Publication number
- CN111582404A CN111582404A CN202010450192.1A CN202010450192A CN111582404A CN 111582404 A CN111582404 A CN 111582404A CN 202010450192 A CN202010450192 A CN 202010450192A CN 111582404 A CN111582404 A CN 111582404A
- Authority
- CN
- China
- Prior art keywords
- classification
- uncertainty
- content
- class
- classification result
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 79
- 238000013145 classification model Methods 0.000 claims abstract description 93
- 238000013076 uncertainty analysis Methods 0.000 claims abstract description 59
- 238000004458 analytical method Methods 0.000 claims abstract description 27
- 230000006870 function Effects 0.000 claims description 74
- 238000012549 training Methods 0.000 claims description 36
- 238000013473 artificial intelligence Methods 0.000 abstract description 16
- 230000008569 process Effects 0.000 abstract description 15
- 230000001965 increasing effect Effects 0.000 abstract description 6
- 230000001976 improved effect Effects 0.000 abstract description 5
- 238000003745 diagnosis Methods 0.000 description 34
- 238000005516 engineering process Methods 0.000 description 18
- 230000004927 fusion Effects 0.000 description 17
- 238000012545 processing Methods 0.000 description 10
- 238000010586 diagram Methods 0.000 description 8
- 241000282414 Homo sapiens Species 0.000 description 6
- 238000003908 quality control method Methods 0.000 description 6
- 238000013135 deep learning Methods 0.000 description 5
- 238000010801 machine learning Methods 0.000 description 5
- 238000003062 neural network model Methods 0.000 description 5
- 241000894007 species Species 0.000 description 4
- 238000013136 deep learning model Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 238000012216 screening Methods 0.000 description 3
- 230000006399 behavior Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 230000002349 favourable effect Effects 0.000 description 2
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 2
- 238000012015 optical character recognition Methods 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 239000002699 waste material Substances 0.000 description 2
- 230000032683 aging Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000003190 augmentative effect Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000002787 reinforcement Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 238000013526 transfer learning Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V2201/00—Indexing scheme relating to image or video recognition or understanding
- G06V2201/03—Recognition of patterns in medical or anatomical images
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Life Sciences & Earth Sciences (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Mathematical Physics (AREA)
- Evolutionary Biology (AREA)
- Biophysics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computational Linguistics (AREA)
- Biomedical Technology (AREA)
- Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请公开了一种内容分类方法、装置及可读存储介质,涉及人工智能领域。该方法包括:获取目标内容;通过内容分类模型对目标内容进行分类识别,得到目标内容的分类结果;对目标内容和分类结果进行不确定度分析,得到分类结果的不确定度,不确定度用于指示分类结果的可信度,其中,不确定度分析包括类间不确定度分析和类内不确定度分析中的至少一种。通过对目标内容和分类结果进行不确定度分析,从而将内容分类过程中的类间不确定度和类内不确定度,结合类间不确定度和类内不确定度对内容分类模型的内容分类结果进行可信度辅助分析,增加内容分类模型的分类结果的分析维度,以及提高内容分类模型的分类准确度。
Description
技术领域
本申请实施例涉及人工智能领域,特别涉及一种内容分类方法、装置及可读存储介质。
背景技术
人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。其中,神经网络模型是人工智能的一种实现方式。
相关技术中,神经网络模型可以通过标注有标签的样本进行监督训练,以图像分类模型为例进行说明,将标注有类别标签的图像输入图像分类模型进行分类后,根据标签和分类结果对图像分类模型进行监督训练。
然而,由于样本所标注的标签通常为人工根据眼睛识别结果标注的,针对类间差异较小或者类内差异较大的样本,本身标签的标注就附带有不确定性,导致图像分类模型的训练结果准确率低,图像分类模型的分类结果的可信度不可知。
发明内容
本申请实施例提供了一种内容分类方法、装置及可读存储介质,可以提高图像分类模型的训练结果准确率。所述技术方案如下:
一方面,提供了一种内容分类方法,所述方法包括:
获取目标内容,所述目标内容为待分类的内容;
通过内容分类模型对所述目标内容进行分类识别,得到所述目标内容的分类结果;
根据所述目标内容对应不同分类之间的差异度对所述目标内容和所述分类结果进行类间不确定度分析,得到所述分类结果的类间不确定度;和/或,根据所述目标内容对应同一分类之间其他内容的差异度对所述目标内容和所述分类结果进行类内不确定度分析,得到所述分类结果的类内不确定度;
其中,所述类间不确定度和所述类内不确定度用于指示所述分类结果的可信度。
另一方面,提供了一种内容分类装置,所述装置包括:
获取模块,用于获取目标内容,所述目标内容为待分类的内容;
识别模块,用于通过内容分类模型对所述目标内容进行分类识别,得到所述目标内容的分类结果;
分析模块,用于根据所述目标内容对应不同分类之间的差异度对所述目标内容和所述分类结果进行类间不确定度分析,得到所述分类结果的类间不确定度;和/或,根据所述目标内容对应同一分类之间其他内容的差异度对所述目标内容和所述分类结果进行类内不确定度分析,得到所述分类结果的类内不确定度;其中,所述类间不确定度和所述类内不确定度用于指示所述分类结果的可信度。
另一方面,提供了一种计算机设备,所述计算机设备包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现如上述本申请实施例中任一所述的内容分类方法。
另一方面,提供了一种计算机可读存储介质,所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现如上述本申请实施例中任一所述的内容分类方法。
另一方面,提供了一种计算机程序产品,当所述计算机程序产品在计算机上运行时,使得计算机执行如上述本申请实施例中任一所述的内容分类方法。
本申请实施例提供的技术方案带来的有益效果至少包括:
通过对目标内容和分类结果进行不确定度分析,从而将内容分类过程中的类间不确定度和类内不确定度,结合类间不确定度和类内不确定度对内容分类模型的内容分类结果进行可信度辅助分析,增加内容分类模型的分类结果的分析维度,以及提高内容分类模型的分类准确度。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请一个示例性的实施例提供的眼底图像分类的结果示意图;
图2是本申请一个示例性实施例提供的内容分类方法的流程图;
图3是基于图2示出的实施例提供的分类结果预测以及不确定度预测的整体过程示意图;
图4是本申请另一个示例性实施例提供的内容分类方法的流程图;
图5是基于图4示出的实施例提供的方差幅值曲线示意图;
图6是本申请另一个示例性实施例提供的内容分类方法的流程图;
图7是本申请一个示例性实施例提供的内容分类装置的结构框图;
图8是本申请另一个示例性实施例提供的内容分类装置的结构框图;
图9是本申请一个示例性的实施例提供的服务器的结构框图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。
首先,对本申请实施例中涉及的名词进行简单介绍:
人工智能(Artificial Intelligence,AI):是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
计算机视觉技术(Computer Vision,CV):是一门研究如何使机器“看”的科学,更进一步的说,就是指用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等机器视觉,并进一步做图形处理,使电脑处理成为更适合人眼观察或传送给仪器检测的图像。作为一个科学学科,计算机视觉研究相关的理论和技术,试图建立能够从图像或者多维数据中获取信息的人工智能系统。计算机视觉技术通常包括图像处理、图像识别、图像语义理解、图像检索、光学字符识别(Optical Character Recognition,OCR)、视频处理、视频语义理解、视频内容/行为识别、三维物体重建、3D技术、虚拟现实、增强现实、同步定位与地图构建等技术,还包括常见的人脸识别、指纹识别等生物特征识别技术。
机器学习(Machine Learning,ML):是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、示教学习等技术。
类间差异:是指属于不同类别的两个样本之间的差异,示意性的,样本A属于类别a,样本B属于类别b,则样本A与样本B之间的差异即为类间差异;当类间差异较小时,则不利于类别之间的区分,如:当样本A与样本B之间的类间差异小时,则不利于类别a与类别b之间的区分。
类内差异:是指属于同一类别的两个样本之间的差异,示意性的,样本A属于类别a,样本C也属于类别a,则样本A与样本C之间的差异即为类内差异;当类内差异较大时,则不利于类别内样本之间的区分,如:当样本A与样本C之间地类内差异较大时,则不利于类别a中样本之间的区分。
相关技术中,用于对分类模型进行监督训练的样本标注有标签,而标签通常是人为对样本进行识别后手动标注的,故样本标注的标签通常受类间差异或类内差异的影响,从而导致样本对分类模型进行的训练准确度较低,训练后分类模型的分类准确率也较低。
结合上述名词简介,对本申请实施例的应用场景进行举例说明:
第一,随着中国人口的不断增长和人口老龄化加剧,眼健康形势日趋严重,而随着医疗图像深度学习技术的发展,全自动眼底图像AI筛查系统需求日益显著,而通常,眼底图像AI筛查系统在落地式,由于采用手动眼底相机拍摄,因此产生大量曝光不准、污损等废片,在没有进行质控处理就直接上传,会导致眼底图像AI筛查系统准确率较低,故设置眼底图像质控系统对有效图像进行自动化筛选,从而减小医生在图像质控上的精力。
在眼部医疗领域中,通过图像识别模型将眼底图像进行分类识别,判断眼底图像的可用性,如:将眼底图像输入图像识别模型,确定眼底图像可用于诊断或不可用于诊断,而对图像识别模型进行训练的样本图像所标注的标签由医生手动标注,引入了医生的主观判断,不同医生标注的差异较大,从而引入了类间不确定性和类内不确定性,故,本申请中,在通过图像识别模型对图像进行类型识别后,对识别结果进行类间不确定性分析和类内不确定性分析,从而对图像识别模型的识别结果进行可信度示意,辅助医生进行识别结果的辅助;
示意性的,如图1所示,将眼底图像110、眼底图像120以及眼底图像130输入图像识别模型140进行分类,得到眼底图像110分类结果为可用于诊断,以及分类结果的可信度为80,眼底图像120分类结果为可用于诊断,以及分类结果的可信度为60,眼底图像130分类结果为不可用于诊断,以及分类结果的可信度为95。
第二,在百科识别领域中,通过物种识别模型对图像中的物体进行分类识别,判断图像中的物体所属的物种类别,如:将图像输入物种识别模型,确定图像中的植物所属的类目,而对物种识别模型进行训练的样本图像所标注的标签由模型开发人员查询资料后标注,引入了开发人员的主观判断,从而引入了类间不确定性和类内不确定性,故,本申请中,在通过物种识别模型对图像进行类型识别后,对识别结果进行类间不确定性分析和类内不确定性分析,从而对物种识别模型的识别结果进行可信度示意以及能够通过类间不确定性和类内不确定性对物种识别模型进行辅助训练。
上述两种应用场景仅为本申请示意性的举例,本申请实施例提供的内容分类方法还可以应用于其他存在类间不确定度和类内不确定度的方案中,本申请实施例对此不加以限定。
值得注意的是,本申请实施例提供的内容分类方法,可以由终端实现,也可以由服务器实现,还可以由终端和服务器协同实现。其中,终端包括智能手机、平板电脑、便携式膝上笔记本电脑、台式计算机、智能音箱、智能可穿戴设备等终端中的至少一种,服务器可以是物理服务器,也可以是提供云计算服务的云服务器,且服务器可以实现为一台服务器,也可以是多个服务器构成的服务器集群或分布式系统。其中,当终端和服务器协同实现本申请实施例提供的方案时,终端和服务器可以通过有线或无线通信方式进行直接或间接连接,本申请实施例对此不加以限定。
结合上述名词简介以及应用场景,对本申请实施例提供的内容分类方法进行说明,以该方法应用于服务器中为例进行说明,如图2所示,该方法包括:
步骤201,获取目标内容,目标内容为待分类的内容。
可选地,目标内容可以是图像形式内容、音频形式内容、文本形式内容、视频形式内容等,本申请实施例对此不加以限定。
本实施例中,以目标内容为图像形式内容为例进行说明,且该目标内容为眼底图像,也即,对眼底图像进行分类,可选地,该眼底图像可以是用于对内容分类模型进行训练的样本图像,也可以是实际识别过程中的待识别图像。
本实施例中,在获取眼底图像后,对眼底图像进行分类,其中,分类结果包括:可用于诊断、可接受、不可用于诊断至少三种,其中,可用于诊断用于指示眼底图像可以用于传送至医生处进行眼部医疗诊断,也即眼底图像的清晰度符合医疗诊断的要求;可接受用于指示眼底图像在清晰度上稍有欠缺,但能够传送至医生处进行眼部医疗诊断,诊断结果可能会产生一定的偏差;不可用于诊断用于指示眼底图像不可用于传送至医生处进行眼部医疗诊断,也即眼底图像的清晰度不符合医疗诊断的要求。可选地,上述分类结果仅为示意性的举例,分类的类别数量可以更多也可以更少,本申请实施例对分类方式不加以限定。
可选地,本申请实施例中,以目标内容为眼底图像为例,且目标内容为标注有标签的样本图像,该眼底图像的数据来源包括:1、公开数据集EyePACS中的质控子集EyeQ数据集;2、来源于三个不同等级的医疗机构或图像采集中心的私有数据集。可选地,数据集中的数据统一缩放为224×224像素大小。
步骤202,通过内容分类模型对目标内容进行分类识别,得到目标内容的分类结果。
可选地,内容分类模型可以是当前待训练的模型,也可以是已训练得到的模型。其中,当内容分类模型为待训练的模型时,则目标内容为用于对内容分类模型进行监督训练的样本内容;当内容分类模型为已完成训练的模型时,则目标内容为待通过内容分类模型进行分类的内容。
可选地,内容分类模型为深度学习模型,且内容分类模型为神经网络模型。
可选地,内容分类模型在对目标内容进行分类识别时,首先提取目标内容的特征数据,并对特征数据进行分类识别,得到目标内容对应的分类结果。
可选地,内容分类模型在对目标内容进行分类识别后,输出内容为目标内容对应每种类别的比例,示意性的,目标内容为眼底图像,内容分类模型对眼底图像进行分类识别后,输出得到眼底图像分别对应类别可用于诊断、可接受以及不可用于诊断的概率,如:眼底图像A对应可用于诊断的指数为0.7,对应可接受的指数为0.2,对应不可用于诊断的指数为0.1,则眼底图像A最终的目标类别为可用于诊断。
步骤203,对目标内容和分类结果进行不确定度分析,得到分类结果的不确定度,不确定度用于指示分类结果的可信度。
可选地,不确定度分析中包括类间不确定度分析和类内不确定度分析中的至少一种,其中,类间不确定度分析对应类间不确定度,类内不确定度分析对应类内不确定度。
可选地,根据目标内容对应不同分类之间的差异度对目标内容和分类结果进行类间不确定度分析,得到分类结果的类间不确定度;和/或,根据目标内容对应同一分类之间其他内容的差异度对目标内容和分类结果进行类内不确定度分析,得到分类结果的内类不确定度。
可选地,确定类间不确定度和类内不确定度后,包括如下应用方式中的至少一种:
第一,在向用户展示分类结果的同时,显示类间不确定度和类内不确定度,用于辅助用户了解分类结果的可信度;
第二,通过类间不确定度确定可信度数值,在向用户展示分类结果的同时,显示可信度数值,用于辅助用户了解分类结果的可信度;
第三,通过不确定度对内容分类模型进行监督训练,也即通过类间不确定度和类内不确定度对内容分类模型进行辅助监督训练,也即,在通过标签对内容分类模型进行训练的同时,根据类间不确定度和类内不确定度对监督训练过程进行辅助。
可选地,采用深度学习分类模型DenseNet121,通过三个全连接层获得两个预测输出,分别是预测分类结果输出和类间不确定度预测输出,示意性的,通过深度学习分类模型输出预测分类结果,其中包括可用于诊断、可接受和不可用于诊断分别对应的比例,以及输出类间不确定度预测输出,其中包括可用于诊断、可接受和不可用于诊断分别对应的类间不确定度。
示意性的,请参考图3,将眼底图像310输入内容分类模型300中,通过Backbone框架320处理后,提取得到眼底图像310的特征330,对特征330进行分类识别,输出得到预测分类结果340和不确定度预测结果350。
可选地,在确定不确定度的过程中,通过损失函数对不确定度进行确定,其中,通过第一损失函数对类间不确定度进行分析,第一损失函数用于根据目标内容对应类别的分布情况进行类间不确定度分析;通过第二损失函数对类内不确定度进行分析,第二损失函数用于根据目标内容对应分类中的其他内容进行类内不确定度分析。
综上所述,本实施例提供的内容分类方法,通过对目标内容和分类结果进行不确定度分析,从而将内容分类过程中的类间不确定度和类内不确定度,结合类间不确定度和类内不确定度对内容分类模型的内容分类结果进行可信度辅助分析,增加内容分类模型的分类结果的分析维度,以及提高内容分类模型的分类准确度。
在一个可选的实施例中,不确定度分析中包括类间不确定度分析和类内不确定度分析,图4是本申请另一个示例性实施例提供的内容分类方法的流程图,以该方法应用于服务器中为例进行说明,如图4所示,该方法包括:
步骤401,获取目标内容,目标内容为待分类的内容。
可选地,目标内容可以是图像形式内容、音频形式内容、文本形式内容、视频形式内容等,本申请实施例对此不加以限定。
本实施例中,以目标内容为图像形式内容为例进行说明,且该目标内容为眼底图像,也即,对眼底图像进行分类,可选地,该眼底图像可以是用于对内容分类模型进行训练的样本图像,也可以是实际识别过程中的待识别图像。
步骤402,通过内容分类模型对目标内容进行分类识别,得到目标内容的分类结果。
可选地,内容分类模型为深度学习模型,且内容分类模型为神经网络模型。
可选地,以上述目标内容实现为目标图像为例进行说明,则内容分类模型中包括至少两种图像分类模型,将目标图像转化为至少两种通道图像,并通过至少两种通道图像分别对应的图像分类模型对至少两种通道图像进行分类识别,得到至少两种通道识别结果,其中,每种通道图像对应一种通道识别结果,通过融合模型将至少两种通道识别结果进行融合,得到目标图像对应的分类结果。
可选地,通过融合模型对至少两种通道识别结果进行融合,得到目标图像对应的融合识别结果,将至少两种通道识别结果和融合识别结果的加权平均结果作为目标图像对应的分类结果。
可选地,通过第一融合模型对至少两个图像分类模型提取的图像特征进行融合分类识别,得到第一融合识别结果;通过第二融合模型对至少两种通道识别结果和第一融合识别结果进行融合,得到目标图像对应的第二融合识别结果,将至少两种通道识别结果、第一融合识别结果和第二融合识别结果的加权平均结果作为目标图像的分类结果。
示意性的,眼底图像A转换为RGB通道图像后,分类识别结果对应可用于诊断的指数为0.7,对应可接受的指数为0.2,对应不可用于诊断的指数为0.1;转换为HSV通道图像后,分类识别结果对应可用于诊断的指数为0.6,对应可接受的指数为0.3,对应不可用于诊断的指数为0.1;转换为LAB通道图像后,分类识别结果对应可用于诊断的指数为0.7,对应可接受的指数为0.3,对应不可用于诊断的指数为0,将上述三种通道识别结果输入第一融合模型,得到第一融合识别结果为:可用于诊断的指数为0.8,对应可接受的指数为0.1,对应不可用于诊断的指数为0.1,将三种通道识别结果和第一融合识别结果输入第二融合模型,输出得到第二融合识别结果为:可用于诊断的指数为0.7,对应可接受的指数为0.1,对应不可用于诊断的指数为0.2,则取加权平均结果后,眼底图像A对应可用于诊断的指数为0.7,对应可接受的指数为0.2,对应不可用于诊断的指数为0.1。
步骤403,通过第一损失函数对目标内容和分类结果进行类间不确定度分析,得到分类结果的类间不确定度。
可选地,第一损失函数用于根据目标内容对应类别的分布情况进行类间不确定度分析。可选地,第一损失函数由分布公式构成,通过分布公式对目标内容对应类别的分布情况进行确定后,根据分布情况确定分类结果的类间不确定度。
可选地,第一损失函数中包括高斯分布式和狄拉克分布式,其中,通过高斯分布式确定目标内容对应类别的第一分布情况,以及通过狄拉克分布式确定目标内容对应类别的第二分布情况,并通过第一分布情况和第二分布情况,结合分类结果进行分析,得到分类结果的类间不确定度。
示意性的,高斯分布式请参考如下公式一:
狄拉克分布式请参考如下公式二:
公式二:PD(x|xg)=δ(x-xg)
第一损失函数请参考如下公式三:
公式三:LKL=DKL(PD(x|xg)||PG(x|xe,xσ))
其中,PG(x|xe,xσ)用于指示高斯分布情况,也即上述第一分布情况,PD(x|xg)用于指示狄拉克分布情况,也即上述第二分布情况,xe为网络预测结果,也即上述分类结果,xσ为不确定度预测结果,也即预测得到的类间不确定度,xg为金标准,用于对网络进行监督,δ为计算狄拉克分布情况时的冲激函数,LKL为第一损失函数计算得到的损失值,DKL用于表示KL散度。
将公式三通过推导,得到如下公式四:
步骤404,通过第二损失函数对目标内容和分类结果进行类内不确定度分析,得到分类结果的类内不确定度。
可选地,第二损失函数用于根据目标内容对应分类中的其他内容进行类内不确定度分析。
上述步骤403中提供的类间不确定度可以一定程度上提升内容分类模型的准确度,但仅应用KL散度约束不确定度会产生1、类间方差小幅值大;2、类间方差大幅值小的情况,如图5所示,曲线510对应方差小幅值大的情况,曲线520对应方差大幅值小的情况,为减少第二种情况的产生,通过第二损失函数计算类内不确定度,第二损失函数请参考如下公式五:
其中,LIU为第二损失函数计算得到的损失值,xe为网络预测结果,也即上述分类结果,C为类别数。
第二损失函数的网络不需要金标准的监督,而是一种自身的熵运算。
综上所述,本实施例提供的内容分类方法,通过对目标内容和分类结果进行不确定度分析,从而将内容分类过程中的类间不确定度和类内不确定度,结合类间不确定度和类内不确定度对内容分类模型的内容分类结果进行可信度辅助分析,增加内容分类模型的分类结果的分析维度,以及提高内容分类模型的分类准确度。
本实施例提供的方法,通过第一损失函数对类间不确定度进行确定,且第一损失函数通过两种分布公式之间的距离进行确定,从而利用金标准训练不确定度分支,获得可靠的类间不确定度预测结果。
在一个可选的实施例中,在确定不确定度后,通过不确定度对内容分类模型进行监督训练,图6是本申请一个示例性实施例提供的内容分类方法的流程图,以该方法应用于服务器中为例进行说明,如图6所示,该方法包括:
步骤601,获取目标内容,目标内容为待分类的内容。
可选地,目标内容可以是图像形式内容、音频形式内容、文本形式内容、视频形式内容等,本申请实施例对此不加以限定。
本实施例中,以目标内容为图像形式内容为例进行说明,且该目标内容为眼底图像,也即,对眼底图像进行分类,可选地,该眼底图像可以是用于对内容分类模型进行训练的样本图像,也可以是实际识别过程中的待识别图像。
步骤602,通过内容分类模型对目标内容进行分类识别,得到目标内容的分类结果。
可选地,内容分类模型为深度学习模型,且内容分类模型为神经网络模型。
步骤603,对目标内容和分类结果进行不确定度分析,得到分类结果的不确定度,不确定度用于指示分类结果的可信度。
可选地,不确定度分析中包括类间不确定度分析和类内不确定度分析中的至少一种,其中,类间不确定度分析对应类间不确定度,类内不确定度分析对应类内不确定度。也即,对目标内容和分类结果进行类间不确定度分析后,得到分类结果的类间不确定度;对目标内容和分类结果进行类内不确定度分析后,得到分类结果的类内不确定度。
可选地,在确定不确定度的过程中,通过损失函数对不确定度进行确定,其中,通过第一损失函数对类间不确定度进行分析,第一损失函数用于根据目标内容对应类别的分布情况进行类间不确定度分析;通过第二损失函数对类内不确定度进行分析,第二损失函数用于根据目标内容对应分类中的其他内容进行类内不确定度分析。
步骤604,通过类间不确定度和类内不确定度交替对内容分类模型进行监督训练。
可选地,结合上述图4示出的实施例,在对内容分类模型进行监督训练时,结合类间不确定度和类内不确定度进行训练的方式不同,下面,针对结合类间不确定度和结合类内不确定度对内容分类模型进行监督训练的方式分别进行说明。
第一,结合类间不确定度对内容分类模型进行监督训练;
可选地,将类间不确定度代入第三损失函数,第三损失函数用于结合分类结果的不确定度对内容分类模型的分类准确率进行分析,以减小第三损失函数的损失值为目标,对内容分类模型进行监督训练,也即,以减小第三损失函数的损失值为目标,对内容分类模型进行训练;可选地,在对内容分类模型进行训练的同时,通过以减小类间不确定度为目标调整第一损失函数的参数;
可选地,在将类间不确定度代入第三损失函数时,将大于不确定度要求的类间不确定度代入第三损失函数。
第二,结合类内不确定度对内容分类模型进行监督训练;
可选地,以减小第二损失函数与第三损失函数之和为目标,对内容分类模型进行监督训练,其中,第二损失函数用于根据目标内容对应分类中的其他内容进行类内不确定度分析,第三损失函数用于结合分类结果的不确定度对内容分类模型的分类准确率进行分析。
示意性的,第三损失函数的形式请参考如下公式六:
其中,LUCE为第三损失函数计算得到的损失值,C为类别数,xe为网络预测结果,也即上述分类结果,u为不确定度。
在结合类间不确定度对内容分类模型进行监督训练时,通过上述第一损失函数计算得到xσ,并将xσ作为上述公式六中的u代入公式六,通过第三损失函数对内容分类模型进行监督训练;在结合类内不确定度对内容分类模型进行监督训练时,将上述公式五中的LIU与上述公式六中的LUCE相加,并通过相加得到的损失函数对内容分类模型进行训练。
综上所述,本实施例提供的内容分类方法,通过对目标内容和分类结果进行不确定度分析,从而将内容分类过程中的类间不确定度和类内不确定度,结合类间不确定度和类内不确定度对内容分类模型的内容分类结果进行可信度辅助分析,增加内容分类模型的分类结果的分析维度,以及提高内容分类模型的分类准确度。
本实施例提供的方法,针对质控任务标注类间差异小的特点,引入类间不确定度分支估计,用于衡量质控结果的不确定性,从而得到模型预测结果的可信度,对模型的预测结果进行辅助了解。
图7是本申请一个示例性实施例提供的内容分类装置的结构框图,如图7所示,该装置包括:
获取模块710,用于获取目标内容,所述目标内容为待分类的内容;
识别模块720,用于通过内容分类模型对所述目标内容进行分类识别,得到所述目标内容的分类结果;
分析模块730,用于根据所述目标内容对应不同分类之间的差异度对所述目标内容和所述分类结果进行类间不确定度分析,得到所述分类结果的类间不确定度;和/或,根据所述目标内容对应同一分类之间其他内容的差异度对所述目标内容和所述分类结果进行类内不确定度分析,得到所述分类结果的类内不确定度;其中,所述类间不确定度和所述类内不确定度用于指示所述分类结果的可信度。
在一个可选的实施例中,所述分析模块730,还用于通过第一损失函数对所述目标内容和所述分类结果进行所述类间不确定度分析,得到所述分类结果的所述类间不确定度,所述第一损失函数用于根据所述目标内容对应类别的分布情况进行所述类间不确定度分析。
在一个可选的实施例中,所述第一损失函数中包括高斯分布式和狄拉克分布式;
如图8所示,所述分析模块730,包括:
确定单元731,用于通过高斯分布式确定所述目标内容对应所述类别的第一分布情况;
所述确定单元731,还用于通过狄拉克分布式确定所述目标内容对应所述类别的第二分布情况;
分析单元732,用于通过所述第一分布情况和所述第二分布情况,结合所述分类结果进行分析,得到所述分类结果的所述类间不确定度。
在一个可选的实施例中,所述分析模块730,还用于通过第二损失函数对所述目标内容和所述分类结果进行所述类内不确定度分析,得到所述分类结果的所述类内不确定度,所述第二损失函数用于根据所述目标内容对应分类中的其他内容进行所述类内不确定度分析。
在一个可选的实施例中,所述装置,还包括:
训练模块740,用于通过所述不确定度对所述内容分类模型进行监督训练。
在一个可选的实施例中,所述训练模块740,还用于通过所述类间不确定度和所述类内不确定度交替对所述内容分类模型进行监督训练。
在一个可选的实施例中,所述分析模块730,还用于将所述类间不确定度代入第三损失函数,所述第三损失函数用于结合所述分类结果的不确定度对所述内容分类模型的分类准确率进行分析;
所述训练模块740,还用于以减小所述第三损失函数的损失值为目标,对所述内容分类模型进行监督训练。
在一个可选的实施例中,所述分析模块730,还用于将大于不确定度要求的所述类间不确定度代入所述第三损失函数。
在一个可选的实施例中,所述训练模块740,还用于以减小第二损失函数与第三损失函数之和为目标,对所述内容分类模型进行监督训练,其中,所述第二损失函数用于根据所述目标内容对应分类中的其他内容进行所述类内不确定度分析,所述第三损失函数用于结合所述分类结果的不确定度对所述内容分类模型的分类准确率进行分析。
综上所述,本实施例提供的内容分类装置,通过对目标内容和分类结果进行不确定度分析,从而将内容分类过程中的类间不确定度和类内不确定度,结合类间不确定度和类内不确定度对内容分类模型的内容分类结果进行可信度辅助分析,增加内容分类模型的分类结果的分析维度,以及提高内容分类模型的分类准确度。
需要说明的是:上述实施例提供的内容分类装置,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将设备的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的内容分类装置与内容分类方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
图9示出了本申请一个示例性实施例提供的服务器的结构示意图。该具体来讲:
服务器900包括中央处理单元(Central Processing Unit,CPU)901、包括随机存取存储器(Random Access Memory,RAM)902和只读存储器(Read Only Memory,ROM)903的系统存储器904,以及连接系统存储器904和中央处理单元901的系统总线905。服务器900还包括帮助计算机内的各个器件之间传输信息的基本输入/输出系统(Input OutputSystem,I/O系统)906,和用于存储操作系统913、应用程序914和其他程序模块915的大容量存储设备907。
基本输入/输出系统906包括有用于显示信息的显示器908和用于用户输入信息的诸如鼠标、键盘之类的输入设备909。其中显示器908和输入设备909都通过连接到系统总线905的输入输出控制器910连接到中央处理单元901。基本输入/输出系统906还可以包括输入输出控制器910以用于接收和处理来自键盘、鼠标、或电子触控笔等多个其他设备的输入。类似地,输入输出控制器910还提供输出到显示屏、打印机或其他类型的输出设备。
大容量存储设备907通过连接到系统总线905的大容量存储控制器(未示出)连接到中央处理单元901。大容量存储设备907及其相关联的计算机可读介质为服务器900提供非易失性存储。也就是说,大容量存储设备907可以包括诸如硬盘或者紧凑型光盘只读存储器(Compact Disc Read Only Memory,CD-ROM)驱动器之类的计算机可读介质(未示出)。
不失一般性,计算机可读介质可以包括计算机存储介质和通信介质。计算机存储介质包括以用于存储诸如计算机可读指令、数据结构、程序模块或其他数据等信息的任何方法或技术实现的易失性和非易失性、可移动和不可移动介质。计算机存储介质包括RAM、ROM、可擦除可编程只读存储器(Erasable Programmable Read Only Memory,EPROM)、带电可擦可编程只读存储器(Electrically Erasable Programmable Read Only Memory,EEPROM)、闪存或其他固态存储其技术,CD-ROM、数字通用光盘(Digital Versatile Disc,DVD)或其他光学存储、磁带盒、磁带、磁盘存储或其他磁性存储设备。当然,本领域技术人员可知计算机存储介质不局限于上述几种。上述的系统存储器904和大容量存储设备907可以统称为存储器。
根据本申请的各种实施例,服务器900还可以通过诸如因特网等网络连接到网络上的远程计算机运行。也即服务器900可以通过连接在系统总线905上的网络接口单元911连接到网络912,或者说,也可以使用网络接口单元911来连接到其他类型的网络或远程计算机系统(未示出)。
上述存储器还包括一个或者一个以上的程序,一个或者一个以上程序存储于存储器中,被配置由CPU执行。
本申请的实施例还提供了一种计算机设备,该计算手机设备包括处理器和存储器,该存储器中存储有至少一条指令、至少一段程序、代码集或指令集,至少一条指令、至少一段程序、代码集或指令集由处理器加载并执行以实现上述各方法实施例提供的内容分类方法。
本申请的实施例还提供了一种计算机可读存储介质,该计算机可读存储介质上存储有至少一条指令、至少一段程序、代码集或指令集,至少一条指令、至少一段程序、代码集或指令集由处理器加载并执行,以实现上述各方法实施例提供的内容分类方法。
可选地,该计算机可读存储介质可以包括:只读存储器(ROM,Read Only Memory)、随机存取记忆体(RAM,Random Access Memory)、固态硬盘(SSD,Solid State Drives)或光盘等。其中,随机存取记忆体可以包括电阻式随机存取记忆体(ReRAM,Resistance RandomAccess Memory)和动态随机存取存储器(DRAM,Dynamic Random Access Memory)。上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上所述仅为本申请的可选实施例,并不用以限制本申请,凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。
Claims (15)
1.一种内容分类方法,其特征在于,所述方法包括:
获取目标内容,所述目标内容为待分类的内容;
通过内容分类模型对所述目标内容进行分类识别,得到所述目标内容的分类结果;
根据所述目标内容对应不同分类之间的差异度对所述目标内容和所述分类结果进行类间不确定度分析,得到所述分类结果的类间不确定度;和/或,根据所述目标内容对应同一分类之间其他内容的差异度对所述目标内容和所述分类结果进行类内不确定度分析,得到所述分类结果的类内不确定度;
其中,所述类间不确定度和所述类内不确定度用于指示所述分类结果的可信度。
2.根据权利要求1所述的方法,其特征在于,所述根据所述目标内容对应不同分类之间的差异度对所述目标内容和所述分类结果进行类间不确定度分析,得到所述分类结果的类间不确定度,包括:
通过第一损失函数对所述目标内容和所述分类结果进行所述类间不确定度分析,得到所述分类结果的所述类间不确定度,所述第一损失函数用于根据所述目标内容对应类别的分布情况进行所述类间不确定度分析。
3.根据权利要求2所述的方法,其特征在于,所述第一损失函数中包括高斯分布式和狄拉克分布式;
所述通过第一损失函数对所述目标内容和所述分类结果进行所述类间不确定度分析,得到所述分类结果的类间不确定度,包括:
通过高斯分布式确定所述目标内容对应所述类别的第一分布情况;
通过狄拉克分布式确定所述目标内容对应所述类别的第二分布情况;
通过所述第一分布情况和所述第二分布情况,结合所述分类结果进行分析,得到所述分类结果的所述类间不确定度。
4.根据权利要求1所述的方法,其特征在于,所述根据所述目标内容对应同一分类之间其他内容的差异度对所述目标内容和所述分类结果进行类内不确定度分析,得到所述分类结果的类内不确定度,包括:
通过第二损失函数对所述目标内容和所述分类结果进行所述类内不确定度分析,得到所述分类结果的所述类内不确定度,所述第二损失函数用于根据所述目标内容对应分类中的其他内容进行所述类内不确定度分析。
5.根据权利要求1至4任一所述的方法,其特征在于,所述对所述目标内容和所述分类结果进行不确定度分析,得到所述分类结果的不确定度之后,还包括:
通过所述类内不确定度和所述类间不确定度对所述内容分类模型进行监督训练。
6.根据权利要求5所述的方法,其特征在于,所述通过所述类内不确定度和所述类间不确定度对所述内容分类模型进行监督训练,包括:
通过所述类间不确定度和所述类内不确定度交替对所述内容分类模型进行监督训练。
7.根据权利要求6所述的方法,其特征在于,所述方法还包括:
将所述类间不确定度代入第三损失函数,所述第三损失函数用于结合所述分类结果的不确定度对所述内容分类模型的分类准确率进行分析;
以减小所述第三损失函数的损失值为目标对所述内容分类模型进行监督训练。
8.根据权利要求7所述的方法,其特征在于,所述将所述类间不确定度代入第三损失函数,包括:
将大于不确定度要求的所述类间不确定度代入所述第三损失函数。
9.根据权利要求6所述的方法,其特征在于,所述方法还包括:
以减小第二损失函数与第三损失函数之和为目标,对所述内容分类模型进行监督训练,其中,所述第二损失函数用于根据所述目标内容对应分类中的其他内容进行所述类内不确定度分析,所述第三损失函数用于结合所述分类结果的不确定度对所述内容分类模型的分类准确率进行分析。
10.一种内容分类装置,其特征在于,所述装置包括:
获取模块,用于获取目标内容,所述目标内容为待分类的内容;
识别模块,用于通过内容分类模型对所述目标内容进行分类识别,得到所述目标内容的分类结果;
分析模块,用于根据所述目标内容对应不同分类之间的差异度对所述目标内容和所述分类结果进行类间不确定度分析,得到所述分类结果的类间不确定度;和/或,根据所述目标内容对应同一分类之间其他内容的差异度对所述目标内容和所述分类结果进行类内不确定度分析,得到所述分类结果的类内不确定度;其中,所述类间不确定度和所述类内不确定度用于指示所述分类结果的可信度。
11.根据权利要求10所述的装置,其特征在于,所述分析模块,还用于通过第一损失函数对所述目标内容和所述分类结果进行所述类间不确定度分析,得到所述分类结果的所述类间不确定度,所述第一损失函数用于根据所述目标内容对应类别的分布情况进行所述类间不确定度分析。
12.根据权利要求11所述的装置,其特征在于,所述第一损失函数中包括高斯分布式和狄拉克分布式;
所述分析模块,包括:
确定单元,用于通过高斯分布式确定所述目标内容对应所述类别的第一分布情况;
所述确定单元,还用于通过狄拉克分布式确定所述目标内容对应所述类别的第二分布情况;
分析单元,用于通过所述第一分布情况和所述第二分布情况,结合所述分类结果进行分析,得到所述分类结果的所述类间不确定度。
13.根据权利要求10所述的装置,其特征在于,所述分析模块,还用于通过第二损失函数对所述目标内容和所述分类结果进行所述类内不确定度分析,得到所述分类结果的所述类内不确定度,所述第二损失函数用于根据所述目标内容对应分类中的其他内容进行所述类内不确定度分析。
14.一种计算机设备,其特征在于,所述计算机设备包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现如权利要求1至9任一所述的内容分类方法。
15.一种计算机可读存储介质,其特征在于,所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现如权利要求1至9任一所述的内容分类方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010450192.1A CN111582404B (zh) | 2020-05-25 | 2020-05-25 | 内容分类方法、装置及可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010450192.1A CN111582404B (zh) | 2020-05-25 | 2020-05-25 | 内容分类方法、装置及可读存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111582404A true CN111582404A (zh) | 2020-08-25 |
CN111582404B CN111582404B (zh) | 2024-03-26 |
Family
ID=72125356
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010450192.1A Active CN111582404B (zh) | 2020-05-25 | 2020-05-25 | 内容分类方法、装置及可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111582404B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP4246431A4 (en) * | 2020-11-11 | 2024-04-24 | Tencent Tech Shenzhen Co Ltd | METHOD AND DEVICE FOR ASSESSING THE QUALITY OF A FACIAL IMAGE, COMPUTER DEVICE AND STORAGE MEDIUM |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20110022553A1 (en) * | 2009-06-03 | 2011-01-27 | Canon Kabushiki Kaisha | Diagnosis support system, diagnosis support method therefor, and information processing apparatus |
CN103617429A (zh) * | 2013-12-16 | 2014-03-05 | 苏州大学 | 一种主动学习分类方法和系统 |
CN108090499A (zh) * | 2017-11-13 | 2018-05-29 | 中国科学院自动化研究所 | 基于最大信息三元组筛选网络的数据主动标注方法和系统 |
JP2018109906A (ja) * | 2017-01-05 | 2018-07-12 | 住友電気工業株式会社 | 画像データ作成プログラム、画像データ作成装置および画像データ作成方法 |
CN108416370A (zh) * | 2018-02-07 | 2018-08-17 | 深圳大学 | 基于半监督深度学习的图像分类方法、装置和存储介质 |
CN111061890A (zh) * | 2019-12-09 | 2020-04-24 | 腾讯云计算(北京)有限责任公司 | 一种标注信息验证的方法、类别确定的方法及装置 |
-
2020
- 2020-05-25 CN CN202010450192.1A patent/CN111582404B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20110022553A1 (en) * | 2009-06-03 | 2011-01-27 | Canon Kabushiki Kaisha | Diagnosis support system, diagnosis support method therefor, and information processing apparatus |
CN103617429A (zh) * | 2013-12-16 | 2014-03-05 | 苏州大学 | 一种主动学习分类方法和系统 |
JP2018109906A (ja) * | 2017-01-05 | 2018-07-12 | 住友電気工業株式会社 | 画像データ作成プログラム、画像データ作成装置および画像データ作成方法 |
CN108090499A (zh) * | 2017-11-13 | 2018-05-29 | 中国科学院自动化研究所 | 基于最大信息三元组筛选网络的数据主动标注方法和系统 |
CN108416370A (zh) * | 2018-02-07 | 2018-08-17 | 深圳大学 | 基于半监督深度学习的图像分类方法、装置和存储介质 |
CN111061890A (zh) * | 2019-12-09 | 2020-04-24 | 腾讯云计算(北京)有限责任公司 | 一种标注信息验证的方法、类别确定的方法及装置 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP4246431A4 (en) * | 2020-11-11 | 2024-04-24 | Tencent Tech Shenzhen Co Ltd | METHOD AND DEVICE FOR ASSESSING THE QUALITY OF A FACIAL IMAGE, COMPUTER DEVICE AND STORAGE MEDIUM |
Also Published As
Publication number | Publication date |
---|---|
CN111582404B (zh) | 2024-03-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112949786B (zh) | 数据分类识别方法、装置、设备及可读存储介质 | |
CN110929622B (zh) | 视频分类方法、模型训练方法、装置、设备及存储介质 | |
Wells et al. | Artificial intelligence in dermatopathology: Diagnosis, education, and research | |
CN113139628B (zh) | 样本图像的识别方法、装置、设备及可读存储介质 | |
US20220222925A1 (en) | Artificial intelligence-based image processing method and apparatus, device, and storage medium | |
CN111310731A (zh) | 基于人工智能的视频推荐方法、装置、设备及存储介质 | |
CN112381782B (zh) | 人脸图像质量评估方法、装置、计算机设备及存储介质 | |
CN111368672A (zh) | 一种用于遗传病面部识别模型的构建方法及装置 | |
CN111832581B (zh) | 肺部特征识别方法、装置、计算机设备及存储介质 | |
CN112541529A (zh) | 表情与姿态融合的双模态教学评价方法、设备及存储介质 | |
CN113722474A (zh) | 文本分类方法、装置、设备及存储介质 | |
CN112801236B (zh) | 图像识别模型的迁移方法、装置、设备及存储介质 | |
CN112257665A (zh) | 图像内容的识别方法、图像识别模型的训练方法及介质 | |
CN115050064A (zh) | 人脸活体检测方法、装置、设备及介质 | |
CN114445670A (zh) | 图像处理模型的训练方法、装置、设备及存储介质 | |
CN114330499A (zh) | 分类模型的训练方法、装置、设备、存储介质及程序产品 | |
CN110457523B (zh) | 封面图片的选取方法、模型的训练方法、装置及介质 | |
CN111898528B (zh) | 数据处理方法、装置、计算机可读介质及电子设备 | |
CN111582404B (zh) | 内容分类方法、装置及可读存储介质 | |
CN113705293A (zh) | 图像场景的识别方法、装置、设备及可读存储介质 | |
CN114764865A (zh) | 数据分类模型训练方法、数据分类方法和装置 | |
CN111651626B (zh) | 图像分类方法、装置及可读存储介质 | |
Sameki et al. | ICORD: Intelligent Collection of Redundant Data-A Dynamic System for Crowdsourcing Cell Segmentations Accurately and Efficiently. | |
CN115659221A (zh) | 一种教学质量的评估方法、装置及计算机可读存储介质 | |
CN114764948A (zh) | 活体检测方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 40027942 Country of ref document: HK |
|
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |