CN111368789B - 图像识别方法、装置、计算机设备和存储介质 - Google Patents

图像识别方法、装置、计算机设备和存储介质 Download PDF

Info

Publication number
CN111368789B
CN111368789B CN202010189599.3A CN202010189599A CN111368789B CN 111368789 B CN111368789 B CN 111368789B CN 202010189599 A CN202010189599 A CN 202010189599A CN 111368789 B CN111368789 B CN 111368789B
Authority
CN
China
Prior art keywords
target
image recognition
tag
concept
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010189599.3A
Other languages
English (en)
Other versions
CN111368789A (zh
Inventor
王汉杰
李岩
毛懿荣
成文龙
谌丹璐
陈波
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN202010189599.3A priority Critical patent/CN111368789B/zh
Publication of CN111368789A publication Critical patent/CN111368789A/zh
Priority to PCT/CN2020/127455 priority patent/WO2021184776A1/zh
Application granted granted Critical
Publication of CN111368789B publication Critical patent/CN111368789B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

本申请涉及一种图像识别方法、装置、计算机设备和存储介质。涉及人工智能,所述方法包括:接收针对目标概念标签的图像识别请求;获取所述图像识别请求对应的待识别的目标图像;将所述目标图像输入到实体标签对应的目标图像识别模型中进行图像识别,得到目标图像识别结果集合,所述目标图像识别结果集合中的图像识别结果为目标实体标签对应的图像识别结果,所述目标实体标签为所述目标概念标签对应的实体标签;根据所述目标图像识别结果集合得到所述目标概念标签对应的图像识别结果。采用本方法能够提高图像识别效率。

Description

图像识别方法、装置、计算机设备和存储介质
技术领域
本申请涉及图像识别技术领域,特别是涉及一种图像识别方法、装置、计算机设备和存储介质。
背景技术
随着科技的发展,图像识别技术被越来越广泛的使用。图像识别技术是指识别出图像所包括的对象的技术,例如识别图像中是否包括牛。
相关技术中,可以通过基于人工智能的图像识别模型进行图像识别。图像识别模型需要预先根据训练数据进行模型训练。然而,不同的业务场景下所需要输出的图像标签经常存在差别,因此经常存在当需要进行图像识别,需要根据所需要识别的图像标签进行模型训练,再根据训练得到的图像识别模型进行图像识别的情况,浪费计算机资源,且导致图像识别效率低。
发明内容
基于此,有必要针对上述浪费计算资源,且导致图像识别效率低的技术问题,提供一种图像识别方法、装置、计算机设备和存储介质。
一种图像识别方法,所述方法包括:接收针对目标概念标签的图像识别请求;获取所述图像识别请求对应的待识别的目标图像;将所述目标图像输入到实体标签对应的目标图像识别模型中进行图像识别,得到目标图像识别结果集合,所述目标图像识别结果集合中的图像识别结果为目标实体标签对应的图像识别结果,所述目标实体标签为所述目标概念标签对应的实体标签;根据所述目标图像识别结果集合得到所述目标概念标签对应的图像识别结果。
一种图像识别装置,所述装置包括:图像识别请求接收模块,用于接收针对目标概念标签的图像识别请求;目标图像获取模块,用于获取所述图像识别请求对应的待识别的目标图像;目标图像识别结果集合获取模块,用于将所述目标图像输入到实体标签对应的目标图像识别模型中进行图像识别,得到目标图像识别结果集合,所述目标图像识别结果集合中的图像识别结果为目标实体标签对应的图像识别结果,所述目标实体标签为所述目标概念标签对应的实体标签;结果获取模块,用于根据所述目标图像识别结果集合得到所述目标概念标签对应的图像识别结果。
在一些实施例中,所述可能度条件为可能度最大,所述结果获取模块用于执行以下步骤的至少一个:当所述目标可能度大于第二预设阈值时,确定所述目标概念标签对应的图像识别结果包括:所述目标图像中包括所述目标概念标签对应的实体;或者将所述目标可能度作为所述目标概念标签对应的图像识别结果。
在一些实施例中,所述装置还包括:业务定制请求接收模块,用于接收目标业务终端发送的图像识别业务定制请求,所述图像识别业务定制请求携带目标业务标识以及对应的所述目标概念标签;对应关系建立模块,用于响应于所述图像识别业务定制请求,建立所述目标业务标识与所述目标概念标签的对应关系;所述图像识别请求接收模块用于:当接收到携带所述目标业务标识的图像识别请求时,根据所述对应关系确定所述图像识别请求为针对所述目标概念标签的图像识别请求。
在一些实施例中,所述装置还包括:标签协作请求接收模块,用于接收所述目标业务标识对应的标签协作请求;目标概念标签得到模块,用于根据在所述标签协作请求对应的协作终端上触发选择的概念标签,得到所述目标业务标识对应的目标概念标签。
在一些实施例中,所述目标概念标签得到模块用于:将所述标签协作请求对应的协作终端触发选择的概念标签,发送至所述目标业务终端的概念标签显示区域中,所述概念标签显示区域用于显示已选择的概念标签;将所述目标业务终端接收到触发所述图像识别业务定制请求的触发操作时,所述概念标签显示区域当前显示的概念标签,作为所述目标业务标识对应的目标概念标签。
在一些实施例中,所述标签协作请求携带协作用户标识、所述目标业务标识以及协作标签范围,所述装置还包括:协作标签获取模块,用于获取所述协作标签范围对应的标签,作为协作标签;协作信息发送模块,用于将所述协作标签以及所述目标业务标识发送至所述协作用户标识对应的协作终端,以使得所述协作终端在标签协作选择界面上显示所述目标业务标识对应的所述协作标签。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:接收针对目标概念标签的图像识别请求;获取所述图像识别请求对应的待识别的目标图像;将所述目标图像输入到实体标签对应的目标图像识别模型中进行图像识别,得到目标图像识别结果集合,所述目标图像识别结果集合中的图像识别结果为目标实体标签对应的图像识别结果,所述目标实体标签为所述目标概念标签对应的实体标签;根据所述目标图像识别结果集合得到所述目标概念标签对应的图像识别结果。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:接收针对目标概念标签的图像识别请求;获取所述图像识别请求对应的待识别的目标图像;将所述目标图像输入到实体标签对应的目标图像识别模型中进行图像识别,得到目标图像识别结果集合,所述目标图像识别结果集合中的图像识别结果为目标实体标签对应的图像识别结果,所述目标实体标签为所述目标概念标签对应的实体标签;根据所述目标图像识别结果集合得到所述目标概念标签对应的图像识别结果。
上述图像识别方法、装置、计算机设备和存储介质,对于针对目标概念标签的图像识别请求,可以将待识别的图像输入到实体标签对应的目标图像识别模型中进行图像识别,得到目标实体标签对应的图像识别结果,根据目标实体标签对应的图像识别结果得到目标概念标签对应的图像识别结果。因此,当需要针对目标概念标签进行图像识别时,无需额外针对目标概念标签进行模型的训练,也能够得到目标概念标签对应的图像识别结果,减少了对计算机资源的占用,提高了图像识别效率。
附图说明
图1为一些实施例中图像识别方法的应用环境图;
图2为一些实施例中图像识别方法的流程示意图;
图3为一些实施例中图像标签树的示意图;
图4为另一些实施例中触发图像识别请求以及显示目标概念标签对应的图像识别结果的界面示意图;
图5为一些实施例中将目标图像输入到实体标签对应的目标图像识别模型中进行图像识别,得到目标图像识别结果集合的流程示意图;
图6为一些实施例中对图像识别模型进行模型训练,得到目标图像识别模型的流程图;
图7为一些实施例中标签修改界面的示意图;
图8为一些实施例中图像识别业务定制界面的示意图;
图9为一些实施例中请求用户进行协作的界面示意图;
图10为一些实施例中协作终端确定协作任务的界面示意图;
图11为一些实施例中协作界面的示意图;
图12为一些实施例中图像识别系统的运行原理图;
图13为一些实施例中图像识别装置的结构框图;
图14为一些实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
人工智能(ArtificialIntelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
计算机视觉技术(ComputerVision,CV)计算机视觉是一门研究如何使机器“看”的科学,更进一步的说,就是指用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等机器视觉,并进一步做图形处理,使电脑处理成为更适合人眼观察或传送给仪器检测的图像。作为一个科学学科,计算机视觉研究相关的理论和技术,试图建立能够从图像或者多维数据中获取信息的人工智能系统。计算机视觉技术通常包括图像处理、图像识别、图像语义理解、图像检索、OCR、视频处理、视频语义理解、视频内容/行为识别、三维物体重建、3D技术、虚拟现实、增强现实、同步定位与地图构建等技术,还包括常见的人脸识别、指纹识别等生物特征识别技术。
机器学习(MachineLearning,ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、式教学习等技术。
随着人工智能技术研究和进步,人工智能技术在多个领域展开研究和应用,例如常见的智能家居、智能穿戴设备、虚拟助理、智能音箱、智能营销、无人驾驶、自动驾驶、无人机、机器人、智能医疗、智能客服等,相信随着技术的发展,人工智能技术将在更多的领域得到应用,并发挥越来越重要的价值。
本申请实施例提供的方案涉及人工智能的图像识别等技术,具体通过如下实施例进行说明:
本申请提供的图像识别方法,可以应用于如图1所示的应用环境中。其中,终端102通过网络与服务器104进行通信。服务器104中预先部署有预先进行模型训练得到的目标图像识别模型。当需要进行图像识别时,用户可以通过操作终端102触发针对目标概念标签的图像识别请求,终端102向服务器104发送针对目标概念标签的图像识别请求,服务器104执行本申请实施例提供的方法,得到目标概念标签对应的图像识别结果。服务器104将目标概念标签对应的图像识别结果返回至终端102,终端102显示目标概念标签对应的图像识别结果。可以理解,本申请实施例提供的图像识别方法还可以应用于终端102中。例如,目标图像识别模型可以部署于终端102中。
其中,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备,服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
在一些实施例中,如图2所示,提供了一种图像识别方法,以该方法应用于图1中的服务器为例进行说明,包括以下步骤:
步骤S202,接收针对目标概念标签的图像识别请求。
其中,概念标签用于表示概念,实体标签用于表示实体。概念是对具有共同的特点的实体的表达。实体是指概念对应的具体的事物。概念包括它所定义的各个实体,一个概念标签下对应多个实体标签,“多个”是指“至少两个”。例如,概念标签可以是汽车,实体标签则可以包括A品牌的汽车以及B品牌的汽车。又例如,概念标签可以是犬类,实体标签可以包括牧羊犬以及猎犬等。
可以理解,概念标签以及实体标签是相对的,一个图像标签是概念标签还是实体标签,可以根据实际情况变化。例如,对于两个概念,如果前一个概念包括后一个概念所表达的意思,则前一个概念相对于后一个概念,为概念标签。后一个概念相对于前一个概念,为实体标签。例如,在C场景中,“汽车”标签是实体标签。“交通工具”标签是概念标签。在D场景中,“汽车”标签是概念标签,汽车的品牌例如“A品牌”以及“B品牌”是实体标签。
图像识别请求用于请求对图像的内容进行识别。针对目标概念标签的图像识别请求是指:该图像识别请求用于请求识别图像中目标概念标签对应的内容。例如,针对“汽车”标签的图像识别请求用于请求识别图像中是否包括汽车。
具体地,目标概念标签可以为一个或多个,图像识别请求中可以携带目标概念标签对应的标签相关信息,该标签相关信息可以包括概念标签标识或者目标业务标识。当接收到携带概念标签标识的图像识别请求时,获取概念标签标识对应的标签,作为目标概念标签,确定该图像识别请求为针对目标概念标签的图像识别请求。也可以预先建立业务标识与概念标签的对应关系,当接收到携带目标业务标识的图像识别请求时,可以根据该对应关系确定目标概念标签,确定图像识别请求为针对目标概念标签的图像识别请求。
在一些实施例中,服务器中可以预先存储图像标签之间的层级关系,可以根据图像标签的层级确定图像标签的类型,一个图像标签的类型可以为概念标签或者实体标签。例如可以将层级最低的图像标签作为实体标签,将实体标签对应的上一层级的图像标签作为概念标签。
在一些实施例中,可以将对图像识别模型进行模型训练时,训练图像对应的图像标签作为实体标签,表示实体对应的上位概念的标签为概念标签。训练图像对应的图像标签是指该训练图像中包括该图像标签直接对应的实体。
例如,如图3所示,为一些实施例中图像标签树的示意图。图像标签按照层级关系可以以树形结构展示,包括非叶子节点和叶子节点。叶子节点是指没有子节点的节点,即层级最低的节点,例如图3中的C1、C2、C3以及B2节点。非叶子节点的标签表示某种或粗或细的概念,因此被称为“概念标签”,叶子节点的标签表示特定的对应有训练图像的标签,因此被称为“实体标签”,在训练模型时,可以获取实体标签对应的训练图像,进行模型的训练。
步骤S204,获取图像识别请求对应的待识别的目标图像。
具体地,图像识别请求中可以携带图像或者图像索引信息。当图像识别请求携带图像时,将该图像作为待识别的目标图像。图像索引信息例如可以是图像的存储位置或者图像的标识例如名称。当该图像识别请求携带图像索引信息时,可以根据图像索引信息获取得到对应的图像,作为待识别的目标图像。
举个实际的例子,假设“acc”文件夹存储有5张图片,当用户希望对该5张图片进行图像识别时,则图像识别请求中可以携带文件夹的名称“acc”,服务器可以将“acc”文件夹里的5张图片作为待识别的目标图像。
步骤S206,将目标图像输入到实体标签对应的目标图像识别模型中进行图像识别,得到目标图像识别结果集合,目标图像识别结果集合中的图像识别结果为目标实体标签对应的图像识别结果,目标实体标签为目标概念标签对应的实体标签。
其中,图像识别模型用于对图像进行识别,图像识别模型例如可以是卷积神经网络模型。实体标签对应的目标图像识别模型是指:该目标图像识别模型输出的是实体标签对应的识别结果。目标实体标签是目标概念标签对应的实体标签,目标实体标签所对应的实体,是属于目标概念的实体。例如,目标概念标签为“计算机设备”,则目标实体标签可以为“平板电脑”以及“服务器”。目标实体标签对应的图像识别结果表示目标图像中包括目标实体标签对应的实体的情况。目标实体标签对应的图像识别结果可以为模型输出的目标图像中包括实体标签对应的实体的可能度,其中可能度是指图像中包括实体的可能程度,实体标签对应的可能度越大,则表示图像中越可能存在实体标签对应的实体,可能度可以通过概率表示。
目标图像识别模型可以是预先通过机器学习训练得到的。可以采用有监督的训练方法,获取训练图像以及对应的实体标签,进行模型训练。模型训练的目标可以是使模型输出的实体标签对应的概率分布与训练图像对应的实体标签对应的概率分布的差异越小越好,即可以朝着使模型损失值下降的方向调整模型的参数,直至模型收敛,得到目标图像识别模型。模型输出的实体标签对应的概率分布与训练图像对应的实体标签对应的概率分布的差异,与模型损失值可以成正相关关系,即差异越大,则模型损失值越大。
具体地,得到目标图像后,可以将目标图像输入到目标图像识别模型中,目标图像识别模型可以对图像进行处理,例如经过卷积层、全连接层以及激活层的处理,输出各个实体标签对应的概率,可以获取目标实体标签对应的概率,组成目标图像识别结果集合。
步骤S208,根据目标图像识别结果集合得到目标概念标签对应的图像识别结果。
其中,目标概念标签对应的图像识别结果可以是目标概念标签对应的可能度以及目标概念标签对应的实体的判断结果的至少一个。例如,当目标概念标签为“交通工具”时,目标概念标签对应的图像识别结果可以是“图像中包括交通工具的概率为0.9”,也可以是判断结果“图像中包括交通工具”。
具体地,得到目标图像识别结果集合后,由于该目标图像识别结果集合中的图像识别结果为目标实体标签对应的识别结果,目标概念标签所表示的概念包括目标实体标签所表示的实体,因此可以根据目标图像识别结果集合得到目标概念标签对应的图像识别结果。
举个实际的例子,假设目标概念标签为“交通工具”,目标图像识别模型为识别图像中是否包括“汽车”、“飞机”或者“轮船”等实体的识别模型。将目标图像输入到目标图像识别模型中,输出“汽车”、“飞机”、“轮船”分别对应的概率为“0.9”、“0.05”、“0.05”。则目标实体标签对应的图像识别结果可以为“0.9”、“0.05”、“0.05”。由于根据“0.9”、“0.05”、“0.05”得到最大概率为“汽车”对应的概率“0.9”,大于预设概率例如0.8,则目标概念标签对应的图像识别结果可以为目标图像中包括“交通工具”。
上述图像识别方法,对于针对目标概念标签的图像识别请求,对于针对目标概念标签的图像识别请求,可以将待识别的图像输入到实体标签对应的目标图像识别模型中进行图像识别,得到目标实体标签对应的图像识别结果,根据目标实体标签对应的图像识别结果得到目标概念标签对应的图像识别结果。因此,当需要针对目标概念标签进行图像识别时,无需额外针对目标概念标签进行模型的训练,也能够得到目标概念标签对应的图像识别结果,减少了对计算机资源的占用,提高了图像识别效率。
在一些实施例中,目标实体标签对应的图像识别结果包括:目标图像中包括目标实体标签对应的实体的可能度,根据目标图像识别结果集合得到概念标签对应的图像识别结果包括:从目标图像识别结果集合中获取满足可能度条件的可能度,作为目标可能度;根据目标可能度得到目标概念标签对应的图像识别结果,可能度条件包括可能度排序在第一排序之前、可能度排序为第一排序或者可能度大于第一预设阈值的至少一个。
具体地,第一排序以及第一预设阈值可以根据需要设置,例如可能度条件可以为可能度最大,也可以是可能度大于0.8。得到目标可能度之后,可以根据目标可能度计算得到目标概念标签对应的可能度,也可以是根据目标可能度确定目标概念标签对应的实体的判断结果。例如,假设可能度条件包括可能度大于第一预设阈值,如果大于第一预设阈值的可能度大于预设数量,例如3,则说明该图像中存在目标概念标签对应的实体的可能性是比较大的,则可以确定目标概念标签对应的图像识别结果为:目标图像中包括目标概念标签对应的实体。
在一些实施例中,可能度条件可以为可能度最大,根据目标可能度得到目标概念标签对应的图像识别结果包括以下步骤的至少一个:当目标可能度大于第二预设阈值时,确定目标概念标签对应的图像识别结果包括目标图像中包括目标概念标签对应的实体;或者将目标可能度作为目标概念标签对应的图像识别结果。
具体地,第二预设阈值也可以根据需要设置。例如,可以是0.85。获取得到最大可能度后,可以将该最大可能度作为目标概念标签对应的图像识别结果,也可以是判断目标可能度大于第二预设阈值时,确定目标图像中包括目标概念标签对应的实体。举个实际的例子,假设目标概念标签为“交通工具”,目标图像识别结果集合包括输出“汽车”、“飞机”、“轮船”分别对应的概率为“0.9”、“0.05”、“0.05”。则可以将最大概率“0.9”,作为目标图像中包括“交通工具”的概率。也可以判断最大概率“0.9”大于第二预设概率“0.85”时,确定目标图像中包括交通工具。
在一些实施例中,得到目标概念标签对应的图像识别结果后,可以将该图像结果返回至发送图像识别请求对应的目标业务终端。例如,如图4所示,为一些实施例中触发图像识别请求以及显示目标概念标签对应的图像识别结果的界面示意图。该界面包括图片上传区域402、判断结果显示区域404以及概率显示区域406。“XX业务分类器”为图像识别业务的业务名称。当用户需要对图像进行识别时,可以点击“上传”按钮,进入图像上传界面选择图片,当图片选择完毕,接收到确认操作后,目标业务终端可以触发向服务器发送针对目标概念标签的图像识别请求,目标概念标签例如可以为“鸟类”以及“鱼类”。服务器中部署有输出“鸟类”对应的实体标签例如“麻雀”、“雁”、“鹧鸪”等,以及“鱼类”对应的实体标签例如“金鱼”、“鲤鱼”以及“草鱼”等图像标签的概率的图像识别模型,服务器将终端上传的图片分别输入到图像识别模型中,该图像识别模型输出上传的图片中包括“麻雀”、“雁”、“鹧鸪”、“金鱼”、“鲤鱼”以及“草鱼”等的概率。服务器可以获取实体标签“麻雀”、“雁”、“鹧鸪”分别对应的概率中的最大概率,作为上传的图片中包括目标概念标签“鸟类”的概率。服务器可以获取实体标签“金鱼”、“鲤鱼”以及“草鱼”分别对应的概率中的最大概率,作为上传的图片中包括目标概念标签“鱼类”的概率。如果“鸟类”的概率为0.9667,大于预设概率0.85,服务器还可以输出“图片中包括鸟类”的图像识别结果。
在一些实施例中,如图5所示,步骤S206即将目标图像输入到实体标签对应的目标图像识别模型中进行图像识别,得到目标图像识别结果集合包括以下步骤:
步骤S502,将目标图像输入到实体标签对应的目标图像识别模型中进行图像识别,得到候选图像识别结果集合,候选图像识别结果集合包括各个第一实体标签对应的图像识别结果。
其中,第一实体标签可以是任意的实体标签。目标图像识别模型可以是通用的图像识别模型,可以用于输出多个概念标签分别对应的实体标签的概率。例如,图像识别业务平台中,不同的业务方的图像识别需求是不同的,有些业务方的业务与游戏相关,因此需要识别的图像标签与游戏相关。有些业务方的业务与植物相关,需要识别的图像标签与植物相关。则可以部署一个既可以识别与植物相关的图像标签的模型,也可以识别游戏相关的图像标签的通用图像识别模型。
具体地,可以将目标图像输入到目标图像识别模型中,目标图像识别模型可以对图像进行处理,输出各个第一实体标签对应的概率,服务器可以获取第一实体标签对应的概率,组成候选图像识别结果集合。
步骤S504,确定目标概念标签对应的第一实体标签,作为目标实体标签。
具体地,可以预先设置概念标签与实体标签的对应关系,得到目标概念标签后,获取目标概念标签对应的实体标签,作为目标实体标签。例如目标概念标签为“计算机设备”,第一实体标签包括“麻雀”、“雁”、“鹧鸪”、“金鱼”、“鲤鱼”、“草鱼”、“平板电脑”以及“服务器”,则目标概念标签“计算机设备”对应的目标实体标签可以为“平板电脑”以及“服务器”。
步骤S506,从候选图像识别结果集合中获取目标实体标签对应的图像识别结果,得到目标图像识别结果集合。
具体地,得到目标实体标签后,可以从候选图像识别结果集合中,获取目标实体标签对应的图像识别结果,组成目标图像识别结果集合。
本申请实施例中,通过将目标图像输入到实体标签对应的目标图像识别模型中进行图像识别,得到各个第一实体标签对应的图像识别结果组成的候选图像识别结果集合,从候选图像识别结果集合中获取目标实体标签对应的图像识别结果,因此针对任意的目标概念标签,可以输入到相同的图像识别模型进行识别,从而无需为每个概念标签对应的实体标签训练一个专门的图像识别模型,节省了模型训练资源。
在一些实施例中,如图6所示,为一些实施例中对图像识别模型进行模型训练,得到目标图像识别模型的流程图,包括以下步骤:
步骤S602,获取第一实体标签集合,第一实体标签集合中包括多个概念标签分别对应的实体标签。
具体地,第一实体标签集合可以是预先设置的,可以是由具有图像识别需求的业务方人工设置的,也可以是由提供图像识别服务的服务方设置的。例如在图像识别平台中,服务方和业务方可在该平台以各自的身份登陆进行操作。服务方可以通过整理标签,将标签发布于“标签商店”中。业务方也可以根据需要添加标签。可以理解,该多个概念标签包括目标概念标签。
在一些实施例中,服务方在整理以及发布标签过程中可以多人协作,各领域专家负责各自领域的标签,既减轻工作量,又确保专业性。添加或者修改的服务方作者名字可以在光标悬浮窗中出现,供其他的协作者查看,确保责任明晰。标签的数量可以根据实际情况设置,例如可以达到数万乃至数十万,标签可以树形结构展示层级关系,层级关系有助于理清体系脉络、快速定位标签,方便整理和发布标签。
在一些实施例中,服务方整理以及发布的标签可以包括概念标签以及实体标签,服务器可以接收修改请求,对概念标签以及实体标签进行修改。修改的类型可以为增加标签、删除标签以及改变标签信息的至少一种。增加标签是指增加概念标签或者实体标签到指定的父节点下。服务器可以根据用户的删除操作删除标签,也可以是限制标签的删除,例如设置根节点的图像标签不可以删除。在当接收到删除操作,终端可以弹出询问框,询问是否删除标签,当接收到确认操作后,再进行删除避免误操作。改变标签信息可以是修改图像标签的描述,也可以是修改该标签的父亲节点。
如图7所示,为一些实施例中标签修改界面的示意图。当接收到针对标签“C2”的预设操作例如右键点击操作后,可以弹出标签修改界面,界面中显示“添加子节点”、“更新节点”、“删除节点”以及“复制本标签编码”功能控件,通过触发对应的控件,可以实现对应的功能。
在一些实施例中,可以通过颜色表示标签节点的含义,不同颜色的标签节点具有不同的含义。例如普通节点为灰色,表示该标签为新增的标签,没有获取得到对应的图像。黄色节点表示支持查看该标签的图像数据,蓝色节点支持查看图像,还表示该标签为实体标签,已经根据实体标签对应的图像进行了模型的训练,故图像识别模型可以支持输出实体标签的对应的概率。对于支持查看图像的标签,可以在接收到对该标签的点击操作时,在终端上显示图像显示界面,该界面上可以显示图像以及图像的标注结果。
步骤S604,获取第一实体标签集合中各个第一实体标签分别对应的图像,作为训练图像,得到训练图像集合。
具体地,第一实体标签对应的图像指该图像中包括第一实体标签所表示的实体。例如,第一实体标签包括“麻雀”以及“手机”。则可以获取包括麻雀的图像以及获取包括手机的图像,将这些图像作为训练图像,得到训练图像集合。
步骤S606,根据训练图像集合进行模型训练,得到目标图像识别模型,将目标图像识别模型作为多个概念标签对应的通用图像识别模型。
其中,将目标图像识别模型作为多个概念标签对应的通用图像识别模型是指:目标图像识别模型是通用的,对于针对该多个概念标签中任一个概念标签的图像识别请求,可以获取对应的目标图像,输入到通用图像识别模型中进行图像识别。例如,假设多个概念标签包括“鸟类”标签以及“犬类”标签,则接收到针对“鸟类”标签的图像识别请求后,将对应的目标图像输入到该通用图像识别模型中进行图像识别。接收到针对“犬类”标签的图像识别请求后,可以将对应的目标图像输入到该通用图像识别模型中进行图像识别。
具体地,得到训练图像集合后,可以将训练图像集合中的训练图像输入到待训练的图像识别模型中,模型输出该训练图像包括各个实体标签对应的实体的概率,可以根据模型输出的概率分布,以及训练图像对应的真实的图像标签的概率分布的差异,得到模型损失值,采用随机梯度下降方法调整模型的参数,直至模型收敛,得到目标图像识别模型,由于目标图像识别模型是根据多个概念标签分别对应的实体标签对应的图像训练得到的,因此可以将该目标图像识别模型作为多个概念标签对应的通用图像识别模型,当接收到针对这些概念标签的图像识别请求时,可以输入到该通用图像识别模型中进行图像的识别。
本申请实施例中,通过获取多个概念标签分别对应的实体标签=所对应的图像进行模型的训练,可以训练得到对该多个概念标签的实体标签所表示的实体进行识别的图像识别模型,将该图像识别模型作为多个概念标签对应的通用图像识别模型,对于具有不同图像识别需求的业务方,也可以使用相同的模型进行图像的识别,得到实体标签的识别结果,再根据实体标签的识别结果得到目标概念标签对应的图像识别结果,因此可以在无需为不同的业务方专门训练对应的模型的情况下,满足不同的业务方的图像识别业务需求。
例如,假设A业务方的图像识别业务需求为鸟类图像识别业务,B业务方对应的图像识别业务需求为犬类图像识别业务。则可以训练得到一个既能识别得到鸟类图像识别业务对应的实体标签以及犬类图像识别业务对应的实体标签对应的概率的通用图像识别模型,这样,对于A业务方以及B业务方的终端分别发送的图像识别请求,都可以获取图像识别请求对应的目标图像,输入到该通用图像识别模型中进行图像识别。
在一些实施例中,第一实体标签分别对应的图像可以是预先存储的,也可以是通过图像挖掘得到的,可以是进行离线的图像挖掘。例如,可以获取候选图像集以及图像对应的文本,候选图像集可以是在互联网上爬取得到的图像。可以每隔预设时长例如24小时扫描图像标签的标签树,查找其中的所有实体标签或者不存在对应的图像的实体标签,获取图像对应的文本中存在该实体标签的图像,作为该实体标签对应的图像,得到训练图像集合。例如,假设获取到图像t1,图像上的文本或者图像对应的介绍文本为“平板电脑”,则该图像t1为实体标签“平板电脑”对应的图像。这样,服务器可以自动获取训练图像集,进行模型的训练,使得目标图像识别模型可以随图像数据的累积进行潜在的进化,可以利用进化得到的目标图像识别模型更新图像识别引擎中旧的目标图像识别模型,以为业务方提供更好的服务。其中,图像识别引擎是指将图像作为输入,经过模型推断,输出图像标签的核心组件服务。
在一些实施例中,当挖掘得到第一实体标签分别对应的图像后,服务器可以发送标签颜色改变指令,以改变标签树中标签的颜色。例如可以使得灰色的叶子节点(无对应的图像的实体标签)变成黄色(有对应的图像的实体标签)。,使得业务方可以根据标签的颜色确定该标签是否存在对应的图像数据。服务器还可以根据标签颜色改变指令激活实体标签对应的图像查看功能,例如实体标签对应的“查看图像”功能控件,在接收到标签颜色改变指令之后,可以由灰色(表示不可点击)变更为黑色(表示可点击)。
在一些实施例中,图像识别方法还可以包括:接收目标业务终端发送的图像识别业务定制请求,图像识别业务定制请求携带目标业务标识以及目标概念标签;建立目标业务标识与目标概念标签的对应关系。因此当接收到携带目标业务标识的图像识别请求时,可以根据对应关系确定图像识别请求为针对目标概念标签的图像识别请求。
具体地,业务标识可以用于标识对应的业务,业务标识可以根据需要设置,可以是服务器自动生成的,也可以是根据业务方的业务标识输入操作得到的。例如,当目标业务方需要定制识别图像中是否包括“交通工具”的图像识别业务,则可以输入“交通工具分类器”,当目标业务方登录的目标业务终端接收到目标业务方触发图像定制业务的操作时,触发图像识别业务定制请求,并携带目标业务标识“交通工具分类器”。该图像识别业务定制请求用于请求定制“交通工具分类器”对应的图像识别业务。当接收到图像识别业务定制请求,服务器可以将目标业务标识与目标概念标签关联存储,这样,当接收到携带目标业务标识的图像识别请求时,服务器根据对应关系确定图像识别请求为针对目标概念标签的图像识别请求。因此,用户无需在每次需要进行图像识别时选择目标概念标签,提高了图像识别的效率。
例如,目标业务终端上可以显示业务定制入口“定制我的图像识别业务”,当接收到对业务定制入口的触发操作例如点击操作,可以进入图像识别业务定制界面,如图8所示,图像识别业务定制界面可以包括图像标签树显示区域802、概念标签显示区域804以及业务标识显示区域806。图像标签树显示区域802用于显示候选的图像标签,该候选的图像标签以标签树的形式显示,目标业务终端可以接收用户的标签选择操作例如点击标签的操作。其中,可以设置目标业务方可以选择的标签为非叶子节点的标签,即概念标签。终端将用户选择的标签加入到概念标签显示区域804中进行显示,业务标识显示区域806显示用户当前选择的业务标识,例如“犬类分类器”为业务标识,表示该业务为对犬类进行分类的业务。如果用户需要再创建另一个业务对应的分类器,可以点击创建新业务的控件“创建新的购物车”,当目标业务终端接收到对“创建新的购物车”控件的选择操作时,目标业务终端可以显示业务标识输入框,目标业务终端获取用户在业务标识输入框输入的业务标识,作为新的业务标识。其中,“购物车”表示用户选择的概念标签的集合。当目标业务方对应的目标业务终端接收到对“训练”控件的触发操作,例如点击操作或者语音操作时,可以向服务器发送图像识别业务定制请求,服务器生成该图像识别业务定制请求对应的图像识别引擎。
此外,目标业务终端还可以接收对“刷新”控件的选择操作,服务器根据对“刷新”控件的选择操作对该业务标识对应的已选择的标签进行刷新,目标业务终端可以接收对“预览”控件的选择操作,向服务器发送图像识别引擎测试请求,服务器可以对生成的图像识别引擎进行测试。由于目标图像识别模型已经预先训练完毕,则接收到对“训练”控件的点击操作后,目标业务终端触发图像识别业务定制请求,服务器可以直接获取已训练得到的目标图像识别模型,作为该目标业务标识对应的图像识别引擎中的图像识别引擎,这样,可以提高构建图像识别引擎的效率。
其中,选择操作是用于选择目标信息的操作,可以是通过控件、语音、手势或者表情中的一种或多种操作选择信息。
在一些实施例中,服务器还可以接收目标业务方对应的目标业务终端发送的标签查询请求,查询请求可以携带查询信息,查询信息例如可以是标签的名称信息或者编码,服务器可以根据查询信息将对应的标签返回至目标业务终端,使得目标业务方可以快速进行标签的查询。例如,图像识别平台可以提供精确查找和模糊查找图像标签的功能,以供有明确标签列表的业务方快速查询标签,加快标签购物车的添加。其中,目标业务方可以通过图像标签名称,以及图像标签编码进行标签的查询。
在一些实施例中,目标图像识别模型可以是在接收到图像识别业务定制请求后,再进行模型训练得到的。目标图像识别模型也可以是预先已经训练得到的,通过预先训练得到目标图像识别模型,可以快速创建图像识别引擎,利用该图像识别引擎对目标业务的图像进行图像识别。
在一些实施例中,为了提高确定目标业务标识对应的目标概念标签的效率,目标业务标识对应的目标概念标签可以是多用户协作确定的。图像识别方法还可以包括以下步骤:接收目标业务标识对应的标签协作请求;根据在标签协作请求对应的协作终端上触发选择的概念标签,得到目标业务标识对应的目标概念标签。
具体地,标签协作请求用于请求其他用户协作完成标签的选择。协作终端是指协作完成标签选择的终端。目标业务方对应的目标业务终端可以响应于目标业务方的操作,触发向服务器发送标签协作请求,标签协作请求中可以携带协作用户的用户标识,服务器接收标签协作请求后,可以将协作用户的标识加入目标业务标识对应的协作用户集合中,服务器可以向协作终端发送协作邀请信息,例如邀请链接,协作终端可以响应于协作用户对邀请链接的点击操作,进入标签协作页面,以协作完成目标业务标识对应的概念标签的选择。
如图9所示,为一些实施例中请求用户进行协作的界面示意图。当目标业务方对应的目标业务终端接收到对协作请求控件902的触发操作,例如点击操作时,显示协作配置界面904,协作配置界面904上显示目标业务标识、协作用户标识以及添加协作用户的控件。例如,图9中购物车名称“犬类分类器”表示目标业务标识。合作者列表中显示协作用户的用户标识:用户1和用户2。“添加合作者”控件为添加协作用户的控件,当协作终端接收到对该控件的触发操作,例如“触发添加合作者控件”的语音时,协作终端可以显示与目标业务方具有关联关系的用户标识,例如显示与目标业务方同一个公司的用户的标识,或者目标业务方在即时通讯应用中的好友列表。
在一些实施例中,服务器可以向协作用户对应的协作终端发送目标业务标识,当协作终端接收到对目标业务标识的选择操作时,可以向服务器发送获取目标业务标识对应的已选择标签集合的请求,服务器可以将目标业务标识对应的已选择标签集合发送到协作终端中,已选择标签集合中包括目标业务标识对应的已被用户选择的标签,可以是目标用户选择的,也可以是协作用户选择的。协作终端中显示目标业务标识以及对应的已选择标签集合,可以使得协作用户方便了解目标业务是什么以及该业务已经选择的标签,提高了协作的效率。
如图10所示,为一些实施例提供的协作终端确定协作任务的界面示意图。协作终端上可以显示选择目标业务标识的区域,并显示提示信息“请选择您的购物车”。“朋友创建”表示该购物车是其他用户创建的购物车,需要进行协作。“自己创建”表示是用户本人创建的购物车。当协作终端接收到对目标业务标识“犬类分类器”的选择操作例如点击操作时,触发向服务器发送获取“犬类分类器”对应的已选择标签集合的请求,协作终端接收到服务器发送的已选择标签集合后,在界面上显示已选择标签集合中的标签。如图11所示。由于该购物车是朋友创建的,因此协作终端上可以不显示“训练”以及“预览”控件。
在一些实施例中,标签协作请求携带协作用户标识、目标业务标识以及协作标签范围,图像识别方法还包括:获取协作标签范围对应的标签,作为协作标签;将协作标签以及目标业务标识发送至协作用户标识对应的协作终端,以使得协作终端在标签协作选择界面上显示目标业务标识以及对应的协作标签。
具体地,协作标签范围用于指示进行标签协作时,标签的范围。标签协作的范围可以是通过标签对应的层级信息表示的,例如,标签协作范围可以为第二层级,表示标签树中,第二层级的标签在标签协作范围内,协作用户可以选择第二层级的标签。协作标签范围可以是目标业务终端响应于目标业务方的标签范围选择操作确定的,例如,目标业务方可以根据实际需要确定协作标签范围,目标业务终端上可以显示标签树中各个标签的层级信息,目标业务终端根据对层级信息的选择操作确定标签协作范围。协作标签是指协作终端可以触发选择的标签。非协作标签对于协作终端而言,是处于锁定状态的,例如服务器可以不将非协作标签发送至协作终端中。通过获取协作标签范围对应的标签,作为协作标签,将协作标签发送至协作用户标识对应的协作终端,以使得协作终端在标签协作选择界面上显示协作标签,使得协作用户在进行标签协作时,是在协作范围内选择概念标签的,可以避免协作用户选择无效的概念标签,提高了协作选择标签的效率。
在一些实施例中,对于协作终端发送的非协作标签,服务器可以将该非协作标签丢弃,即不加入到目标业务标识对应的已选择标签集合中。
在一些实施例中,根据标签协作请求对应的协作终端触发选择的概念标签,得到目标业务标识对应的目标概念标签包括:将标签协作请求对应的协作终端触发选择的概念标签,发送至目标业务终端的概念标签显示区域中,概念标签显示区域用于显示已选择的概念标签;将目标业务终端接收到触发图像识别业务定制请求的触发操作时,概念标签显示区域当前显示的概念标签,作为目标业务标识对应的目标概念标签。
具体地,概念标签显示区域显示的是目标业务标识对应的已被用户选择的概念标签。服务器可以是将协作终端触发选择的概念标签同步至目标业务终端中,也可以是接收到目标业务终端发送的标签获取请求时,再进行发送。例如目标业务终端可以是当接收到对图8中“刷新”控件的触发操作时,触发向服务器发送标签获取请求。
当目标业务终端接收到对“训练”控件的选择操作时,触发向服务器发送图像识别业务定制请求,图像识别业务定制请求携带的目标概念标签为概念标签显示区域当前显示的概念标签。例如,假设概念标签显示区域显示5个概念标签,其中4个为目标业务方选择的图像标签,另一个为协作终端发送的图像标签,则可以将该5个概念标签作为“犬类分类器”对应的目标概念标签。
在一些实施例中,对于已经加入当前购物车的标签,可以进行突出显示,例如对于已被加入到购物车的标签,在标签树中可以显示为红色,以使得业务方可以快速确定已加入标签的分布情况。
以下以创建犬类分类业务为例,结合图12所示的图像识别系统的运行原理图,对本申请实施例提供的图像识别方法进行说明。如图12所示,图像识别系统主要包括“标签商店”的设计、标签以及对应的图像数据的自动挖掘和图像识别基础模型自动进化这三个模块。
1、获取图像标签以及图像标签对应的层级信息。
具体地,图像标签以及图像标签对应的层级信息可以是提供图像识别服务的服务提供方预先设置的。例如,服务提供方的程序开发人员可以根据需要建立图像标签树。该标签树可以发布于标签商店中。服务器可以为图像标签树中的标签自动分配标签的编号,服务器也可以对标签树中的标签是否重复进行检查。服务器还可以自动获取标签树中实体标签对应的图像。
2、获取第一实体标签集合,第一实体标签集合中包括多个概念标签分别对应的实体标签;获取第一实体标签集合中各个第一实体标签分别对应的图像,作为训练图像,得到训练图像集合。
具体地,服务器可以将图像标签树中,叶子节点的图像标签作为实体标签(第一实体标签),即可以将最低层级的标签作为实体标签,得到第一实体标签集合。该第一实体标签集合包括多个概念标签对应的实体标签。例如,第一实体标签集合可以包括鸟类以及犬类分别对应的实体标签。
如图12所示,服务器可以每日扫描服务提供方是否有添加新的实体标签,如果有,则更新标签。并获取原有的标签以及新的标签对应的新挖掘的图像,进行图像库的更新。
例如,程序开发人员可以预先设计离线的图像自动挖掘作业的流程。该流程可以每日扫描一次标签树,查找其中的不存在对应的图像的实体标签,进行图像数据的挖掘。例如可以获取海量的图像以及图像对应的文本,将图像对应的文本与实体标签进行对比,如果图像对应的文本包括实体标签,则将该图像作为该实体标签对应的图像。
3、根据训练图像集合进行模型训练,得到目标图像识别模型,将目标图像识别模型作为多个概念标签对应的通用图像识别模型。
具体地,模型的训练可以是每隔预设时长训练一次。例如,可以是每天训练一次。程序开发人员可以设计模型离线更新流程,该流程定期例如在每日的某个时间点可以自动扫描标签树,拉取具有图像数据的所有实体标签,根据这些实体标签和对应的训练图像集合,训练生成可以输出标签树中各个实体标签的识别结果的通用图像识别模型,替代原有的通用图像识别模型,完成模型更替的过程。可以理解,服务器可以根据业务方的选择确定是否更替图像是被模型,例如,为了保证业务稳定,业务方可以选择不进化。则服务器不对该业务方对应的图像识别引擎中的图像识别模型进行更新。
4、接收目标业务终端发送的图像识别业务定制请求,图像识别业务定制请求携带目标业务标识以及对应的目标概念标签。
具体地,当目标业务方需要定制所需要的图像识别服务,例如识别犬类的图像识别服务时,可以通过操作目标业务终端,向服务器发送图像识别业务定制请求。图像识别业务定制请求携带“犬类分类器”以及对应的目标概念标签。例如,牧羊犬以及贵宾犬等。
例如,目标业务方可以通过搜索标签树的标签或者导入标签的方式,将概念标签加入到标签购物车中,完成特定业务的标签定制。标签购物车上的标签可以是多人协作完成的。例如,购物车分为“我的购物车”和“朋友的购物车”。用户本人可以在“我的购物车”可以进行标签的增删,以定制特定的图像识别引擎,也可以删除已经创建的自己的购物车。用户也可以在“朋友的购物车”上增加标签,以进行标签的协作添加,还可以预先设置用户对与“朋友的购物车”上的标签有增加标签的权限,无删除标签的权限,以更好的管理标签。“朋友的购物车”的设计主旨是为了支持多人同时操作,加快购物车的标签添加,帮助购物车主人建立数量大的目标概念标签。
由于图像识别引擎需要占用一定的计算机资源,因此可以预先为图像识别引擎申请服务器的计算资源。图像识别平台可以支持同时创建多个业务方分别对应的图像服务引擎。
5、响应于图像识别业务定制请求,建立目标业务标识与目标概念标签的对应关系。
具体地,当接收到图像识别业务定制请求,可以为目标业务方创建图像识别引擎,如创建对犬类进行识别的图像识别服务。如图12所示,由于图像识别基础模型已经预先训练得到,该图像识别基础模型可以输出标签树中各个实体标签对应的图像识别结果,因此可以基于购物车中的目标概念标签以及已经训练得到的图像识别基础模型创建目标业务方对应的图像识别服务。
在一些实施例中,可以通过网页、母应用程序或者子应用程序的至少一种形式提供图像识别服务。其中,子应用程序俗称为小程序,是能够在母应用提供的环境中实现的应用程序。母应用程序是承载子应用程序的应用程序,为子应用程序的实现提供环境。母应用程序是原生应用程序。原生应用程序是可直接运行于操作系统的应用程序。例如,母应用程序可以是即时通讯应用程序,子应用程序可以是图像识别程序。当子应用程序发布后,可以在母应用程序对应的页面中展示子应用程序的图标,当用户点击该图标后,则可以在母应用提供的环境中运行该子应用程序,例如运行图像识别程序,从而使用户无需预先在终端中安装图像识别应用也可以进行图像识别。
6、当接收到携带目标业务标识的图像识别请求时,根据对应关系确定图像识别请求为针对目标概念标签的图像识别请求。
具体地,假设当接收到携带“犬类分类器”的图像识别请求时,根据“犬类分类器”可以得到对应的概念标签为“牧羊犬”以及“贵宾犬”,则确认该图像识别请求是针对“牧羊犬”以及“贵宾犬”这两个目标概念标签的图像识别请求。
7、将目标图像输入到实体标签对应的目标图像识别模型中进行图像识别,得到目标图像识别结果集合,目标图像识别结果集合中的图像识别结果为目标实体标签对应的图像识别结果,目标实体标签为目标概念标签对应的实体标签。
具体地,由于目标图像识别模型是多个概念标签对应的实体标签,所对应的训练图像训练得到的。因此该目标图像识别模型可以输出各个实体标签对应的概率。例如,可以输出“黄鹂鸟”、“燕子”、“德国牧羊犬”、“苏格兰牧羊犬”、“贵妇犬”、“卷毛狗”、“泰迪犬”分别对应的概率。其中,贵妇犬、卷毛狗、泰迪犬为贵宾犬的别称,即“贵妇犬”、“卷毛狗”、“泰迪犬”为概念标签“贵宾犬”对应的实体标签。因此目标概念标签“牧羊犬”对应的目标实体标签的图像识别结果包括“德国牧羊犬”以及“苏格兰牧羊犬”分别对应的概率。目标概念标签“贵宾犬”对应的目标实体标签的图像识别结果包括“贵妇犬”、“卷毛狗”、“泰迪犬”分别对应的概率。
8、根据目标图像识别结果集合得到目标概念标签对应的图像识别结果。
具体地,可以获取“德国牧羊犬”以及“苏格兰牧羊犬”分别对应的概率中最大的概率,作为目标概念标签“牧羊犬”对应的概率。可以获取“贵妇犬”、“卷毛狗”、“泰迪犬”分别对应的概率中最大的概率,作为目标概念标签“贵宾犬”对应的概率。因此,即使没有训练得到输出“牧羊犬”以及“贵宾犬”概念标签的识别概率的模型,也可以可得到“牧羊犬”以及“贵宾犬”概念标签的概率,相当于图像识别引擎模型可以推断得到在模型训练过程中不曾“见”过的概念标签。
由于不同的图像识别业务所需要输出的图像标签有着巨大的差别。比如游戏识别场景下的业务只关注游戏图像,并输出游戏相关的标签即可;而菜品识别场景的业务则关心输出的菜品标签是否齐全,是否正确。如果针对不同的业务需求单独训练该业务的图像识别模型,并上线图像识别引擎是极其耗费精力、财力和资源的。而通过本申请实施例提供的图像识别方法,通过训练得到输出识别低层级的实体标签对应的识别结果的图像识别模型。对于概念标签,输入到实体标签对应的图像识别模型中进行识别,再根据实体标签对应的识别结果得到概念标签的识别结果,因此可以采用通用的图像识别模型进行图像的识别
通过本申请实施例提供的图像识别方法进行图像识别,为业务方定制符合业务需要的图像识别引擎,使得服务提供方无需为了某个特定图像识别业务进行专门的标签制定和图像数据挖掘并训练模型。业务方也可以自主以及快速地构建所需要的图像识别引擎服务,从而能够节省大量的人力和资源,使服务提供方能够专注于开发识别率更高的图像识别模型,减少响应各种业务需求,进行业务配置的时间,同时业务方能够专注于业务,在无需了解解图像识别的特定细节的情况下也能够得到满足业务需求的服务。
应该理解的是,虽然上述流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,上述流程图中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
在一些实施例中,如图13所示,提供了一种图像识别装置,该装置可以采用软件模块或硬件模块,或者是二者的结合成为计算机设备的一部分,该装置具体包括:图像识别请求接收模块1302、目标图像获取模块1304、目标图像识别结果集合获取模块1306和结果获取模块1308,其中:
图像识别请求接收模块1302,用于接收针对目标概念标签的图像识别请求。
目标图像获取模块1304,用于获取图像识别请求对应的待识别的目标图像。
目标图像识别结果集合获取模块1306,用于将目标图像输入到实体标签对应的目标图像识别模型中进行图像识别,得到目标图像识别结果集合,目标图像识别结果集合中的图像识别结果为目标实体标签对应的图像识别结果,目标实体标签为目标概念标签对应的实体标签。
结果获取模块1308,用于根据目标图像识别结果集合得到目标概念标签对应的图像识别结果。
在一些实施例中,目标图像识别结果集合获取模块1306包括:候选图像识别结果集合获取单元,用于将目标图像输入到实体标签对应的目标图像识别模型中进行图像识别,得到候选图像识别结果集合,候选图像识别结果集合包括第一实体标签对应的图像识别结果;目标实体标签确定单元,用于确定目标概念标签对应的第一实体标签,作为目标实体标签;目标图像识别结果集合获取单元,用于从候选图像识别结果集合中获取目标实体标签对应的图像识别结果,得到目标图像识别结果集合。
在一些实施例中,图像识别装置还包括:第一实体标签集合获取模块,用于获取第一实体标签集合,第一实体标签集合中包括多个概念标签分别对应的实体标签;训练图像集合得到模块,用于获取第一实体标签集合中各个第一实体标签分别对应的图像,作为训练图像,得到训练图像集合;模型训练模块,用于根据训练图像集合进行模型训练,得到目标图像识别模型,将目标图像识别模型作为多个概念标签对应的通用图像识别模型。
在一些实施例中,目标实体标签对应的图像识别结果包括:目标图像中包括目标实体标签对应的实体的可能度,结果获取模块1308用于:从目标图像识别结果集合中获取满足可能度条件的可能度,作为目标可能度;根据目标可能度得到目标概念标签对应的图像识别结果,可能度条件包括可能度排序在第一排序之前、可能度排序为第一排序或者可能度大于第一预设阈值中的至少一个。
在一些实施例中,可能度条件为可能度最大,结果获取模块1308用于执行以下步骤的至少一个:当目标可能度大于第二预设阈值时,确定目标概念标签对应的图像识别结果包括:目标图像中包括目标概念标签对应的实体;或者将目标可能度作为目标概念标签对应的图像识别结果。
在一些实施例中,图像识别装置还包括:业务定制请求接收模块,用于接收目标业务终端发送的图像识别业务定制请求,图像识别业务定制请求携带目标业务标识以及对应的目标概念标签;对应关系建立模块,用于响应于图像识别业务定制请求,建立目标业务标识与目标概念标签的对应关系;图像识别请求接收模块用于:当接收到携带目标业务标识的图像识别请求时,根据对应关系确定图像识别请求为针对目标概念标签的图像识别请求。
在一些实施例中,图像识别装置还包括:标签协作请求接收模块,用于接收目标业务标识对应的标签协作请求;目标概念标签得到模块,用于根据在标签协作请求对应的协作终端上触发选择的概念标签,得到目标业务标识对应的目标概念标签。
在一些实施例中,目标概念标签得到模块用于:将标签协作请求对应的协作终端触发选择的概念标签,发送至目标业务终端的概念标签显示区域中,概念标签显示区域用于显示选择的概念标签;将目标业务终端接收到触发图像识别业务定制请求的触发操作时,概念标签显示区域当前显示的概念标签,作为目标业务标识对应的目标概念标签。
在一些实施例中,标签协作请求携带协作用户标识、目标业务标识以及协作标签范围,图像识别装置还包括:协作标签获取模块,用于获取协作标签范围对应的标签,作为协作标签;协作信息发送模块,用于将协作标签以及目标业务标识发送至协作用户标识对应的协作终端,以使得协作终端在标签协作选择界面上显示目标业务标识以及对应的协作标签。
关于图像识别装置的具体限定可以参见上文中对于图像识别方法的限定,在此不再赘述。上述图像识别装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一些实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图14所示。该计算机设备包括通过系统总线连接的处理器、存储器和网络接口。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储图像。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种图像识别方法。
本领域技术人员可以理解,图14中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一些实施例中,还提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现上述各方法实施例中的步骤。
在一些实施例中,提供了一种计算机可读存储介质,存储有计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中的步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-OnlyMemory,ROM)、磁带、软盘、闪存或光存储器等。易失性存储器可包括随机存取存储器(Random AccessMemory,RAM)或外部高速缓冲存储器。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(StaticRandomAccessMemory,SRAM)或动态随机存取存储器(DynamicRandomAccessMemory,DRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (18)

1.一种图像识别方法,所述方法包括:
接收目标业务终端发送的图像识别业务定制请求,所述图像识别业务定制请求携带目标业务标识;
接收所述目标业务标识对应的标签协作请求,所述标签协作请求用于请求协作终端协作完成标签的选择,所述协作终端表示协作完成标签选择的终端;
根据在所述标签协作请求对应的协作终端上触发选择的概念标签,得到所述目标业务标识对应的目标概念标签;
接收针对所述目标概念标签的图像识别请求;
获取所述图像识别请求对应的待识别的目标图像;
将所述目标图像输入到实体标签对应的目标图像识别模型中进行图像识别,得到目标图像识别结果集合,所述目标图像识别结果集合中的图像识别结果为目标实体标签对应的图像识别结果,所述目标实体标签为所述目标概念标签对应的实体标签;
根据所述目标图像识别结果集合得到所述目标概念标签对应的图像识别结果。
2.根据权利要求1所述的方法,其特征在于,所述将所述目标图像输入到实体标签对应的目标图像识别模型中进行图像识别,得到目标图像识别结果集合,包括:
将所述目标图像输入到实体标签对应的目标图像识别模型中进行图像识别,得到候选图像识别结果集合,所述候选图像识别结果集合包括第一实体标签对应的图像识别结果;
确定所述目标概念标签对应的第一实体标签,作为目标实体标签;
从所述候选图像识别结果集合中获取所述目标实体标签对应的图像识别结果,得到目标图像识别结果集合。
3.根据权利要求2所述的方法,其特征在于,所述方法还包括:
获取第一实体标签集合,所述第一实体标签集合中包括多个概念标签分别对应的实体标签;
获取所述第一实体标签集合中各个第一实体标签分别对应的图像,作为训练图像,得到训练图像集合;
根据所述训练图像集合进行模型训练,得到所述目标图像识别模型,将所述目标图像识别模型作为所述多个概念标签对应的通用图像识别模型。
4.根据权利要求1所述的方法,其特征在于,所述目标实体标签对应的图像识别结果包括:所述目标图像中包括所述目标实体标签对应的实体的可能度,所述根据所述目标图像识别结果集合得到所述概念标签对应的图像识别结果,包括:
从所述目标图像识别结果集合中获取满足可能度条件的可能度,作为目标可能度;
根据所述目标可能度得到所述目标概念标签对应的图像识别结果,所述可能度条件包括可能度排序在第一排序之前、可能度排序为所述第一排序或者可能度大于第一预设阈值中的至少一个。
5.根据权利要求4所述的方法,其特征在于,所述可能度条件为可能度最大,所述根据所述目标可能度得到所述目标概念标签对应的图像识别结果包括以下步骤的至少一个:
当所述目标可能度大于第二预设阈值时,确定所述目标概念标签对应的图像识别结果包括:所述目标图像中包括所述目标概念标签对应的实体;或者
将所述目标可能度作为所述目标概念标签对应的图像识别结果。
6.根据权利要求1所述的方法,其特征在于,所述图像识别业务定制请求携带目标业务标识以及对应的所述目标概念标签;所述方法还包括:
响应于所述图像识别业务定制请求,建立所述目标业务标识与所述目标概念标签的对应关系;
所述接收针对所述目标概念标签的图像识别请求,包括:
当接收到携带所述目标业务标识的图像识别请求时,根据所述对应关系确定所述图像识别请求为针对所述目标概念标签的图像识别请求。
7.根据权利要求1所述的方法,其特征在于,所述根据所述标签协作请求对应的协作终端触发选择的概念标签,得到所述目标业务标识对应的目标概念标签,包括:
将所述标签协作请求对应的协作终端触发选择的概念标签,发送至所述目标业务终端的概念标签显示区域中,所述概念标签显示区域用于显示已选择的概念标签;
将所述目标业务终端接收到触发所述图像识别业务定制请求的触发操作时,所述概念标签显示区域当前显示的概念标签,作为所述目标业务标识对应的目标概念标签。
8.根据权利要求1所述的方法,其特征在于,所述标签协作请求携带协作用户标识、所述目标业务标识以及协作标签范围,所述方法还包括:
获取所述协作标签范围对应的标签,作为协作标签;
将所述协作标签以及所述目标业务标识发送至所述协作用户标识对应的协作终端,以使得所述协作终端在标签协作选择界面上显示所述目标业务标识以及对应的所述协作标签。
9.一种图像识别装置,所述装置包括:
业务定制请求接收模块,用于接收目标业务终端发送的图像识别业务定制请求,所述图像识别业务定制请求携带目标业务标识;
标签协作请求接收模块,用于接收所述目标业务标识对应的标签协作请求,所述标签协作请求用于请求协作终端协作完成标签的选择,所述协作终端表示协作完成标签选择的终端;
目标概念标签得到模块,用于根据在所述标签协作请求对应的协作终端上触发选择的概念标签,得到所述目标业务标识对应的目标概念标签;
图像识别请求接收模块,用于接收针对所述目标概念标签的图像识别请求;目标图像获取模块,用于获取所述图像识别请求对应的待识别的目标图像;
目标图像识别结果集合获取模块,用于将所述目标图像输入到实体标签对应的目标图像识别模型中进行图像识别,得到目标图像识别结果集合,所述目标图像识别结果集合中的图像识别结果为目标实体标签对应的图像识别结果,所述目标实体标签为所述目标概念标签对应的实体标签;
结果获取模块,用于根据所述目标图像识别结果集合得到所述目标概念标签对应的图像识别结果。
10.根据权利要求9所述的装置,其特征在于,所述目标图像识别结果集合获取模块包括:
候选图像识别结果集合获取单元,用于将所述目标图像输入到实体标签对应的目标图像识别模型中进行图像识别,得到候选图像识别结果集合,所述候选图像识别结果集合包括第一实体标签对应的图像识别结果;
目标实体标签确定单元,用于确定所述目标概念标签对应的第一实体标签,作为目标实体标签;
目标图像识别结果集合获取单元,用于从所述候选图像识别结果集合中获取所述目标实体标签对应的图像识别结果,得到目标图像识别结果集合。
11.根据权利要求10所述的装置,其特征在于,所述装置还包括:
第一实体标签集合获取模块,用于获取第一实体标签集合,所述第一实体标签集合中包括多个概念标签分别对应的实体标签;
训练图像集合得到模块,用于获取所述第一实体标签集合中各个第一实体标签分别对应的图像,作为训练图像,得到训练图像集合;
模型训练模块,用于根据所述训练图像集合进行模型训练,得到所述目标图像识别模型,将所述目标图像识别模型作为所述多个概念标签对应的通用图像识别模型。
12.根据权利要求9所述的装置,其特征在于,所述目标实体标签对应的图像识别结果包括:所述目标图像中包括所述目标实体标签对应的实体的可能度,所述结果获取模块用于:
从所述目标图像识别结果集合中获取满足可能度条件的可能度,作为目标可能度;
根据所述目标可能度得到所述目标概念标签对应的图像识别结果,所述可能度条件包括可能度排序在第一排序之前、可能度排序为第一排序或者可能度大于第一预设阈值中的至少一个。
13.根据权利要求12所述的装置,其特征在于,所述结果获取模块用于:
当所述目标可能度大于第二预设阈值时,确定所述目标概念标签对应的图像识别结果包括:所述目标图像中包括所述目标概念标签对应的实体;或者
将所述目标可能度作为所述目标概念标签对应的图像识别结果。
14.根据权利要求9所述的装置,其特征在于,所述图像识别业务定制请求携带目标业务标识以及对应的所述目标概念标签,所述图像识别装置还包括:
对应关系建立模块,用于响应于所述图像识别业务定制请求,建立所述目标业务标识与所述目标概念标签的对应关系;
图像识别请求接收模块,用于当接收到携带所述目标业务标识的图像识别请求时,根据所述对应关系确定所述图像识别请求为针对所述目标概念标签的图像识别请求。
15.根据权利要求9所述的装置,其特征在于,所述目标概念标签得到模块用于:
将所述标签协作请求对应的协作终端触发选择的概念标签,发送至所述目标业务终端的概念标签显示区域中,所述概念标签显示区域用于显示已选择的概念标签;
将所述目标业务终端接收到触发所述图像识别业务定制请求的触发操作时,所述概念标签显示区域当前显示的概念标签,作为所述目标业务标识对应的目标概念标签。
16.根据权利要求9所述的装置,其特征在于,所述标签协作请求携带协作用户标识、所述目标业务标识以及协作标签范围,所述图像识别装置还包括:
协作标签获取模块,用于获取所述协作标签范围对应的标签,作为协作标签;将所述协作标签以及所述目标业务标识发送至所述协作用户标识对应的协作终端,以使得所述协作终端在标签协作选择界面上显示所述目标业务标识以及对应的所述协作标签。
17.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至8中任一项所述的方法的步骤。
18.一种计算机可读存储介质,存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至8中任一项所述的方法的步骤。
CN202010189599.3A 2020-03-18 2020-03-18 图像识别方法、装置、计算机设备和存储介质 Active CN111368789B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202010189599.3A CN111368789B (zh) 2020-03-18 2020-03-18 图像识别方法、装置、计算机设备和存储介质
PCT/CN2020/127455 WO2021184776A1 (zh) 2020-03-18 2020-11-09 图像识别方法、装置、计算机设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010189599.3A CN111368789B (zh) 2020-03-18 2020-03-18 图像识别方法、装置、计算机设备和存储介质

Publications (2)

Publication Number Publication Date
CN111368789A CN111368789A (zh) 2020-07-03
CN111368789B true CN111368789B (zh) 2023-05-26

Family

ID=71212530

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010189599.3A Active CN111368789B (zh) 2020-03-18 2020-03-18 图像识别方法、装置、计算机设备和存储介质

Country Status (2)

Country Link
CN (1) CN111368789B (zh)
WO (1) WO2021184776A1 (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111368789B (zh) * 2020-03-18 2023-05-26 腾讯科技(深圳)有限公司 图像识别方法、装置、计算机设备和存储介质
CN112380261B (zh) * 2020-10-10 2024-06-18 杭州翔毅科技有限公司 基于5g技术的远程辅导方法、装置、系统及存储介质
US11769256B2 (en) * 2021-02-16 2023-09-26 Avanade Holdings Llc Image creation for computer vision model training
CN113298806A (zh) * 2021-06-18 2021-08-24 上海市机械施工集团有限公司 焊接缺陷智能检测方法、装置、焊接设备和存储介质
CN115061490B (zh) * 2022-05-30 2024-04-05 广州中科云图智能科技有限公司 基于无人机的水库巡检方法、装置、设备以及存储介质
CN115203457B (zh) * 2022-07-15 2023-11-14 小米汽车科技有限公司 图像检索方法、装置、车辆、存储介质及芯片

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104751163A (zh) * 2013-12-27 2015-07-01 同方威视技术股份有限公司 对货物进行自动分类识别的透视检查系统和方法
US10019654B1 (en) * 2017-06-28 2018-07-10 Accenture Global Solutions Limited Image object recognition
CN109584050A (zh) * 2018-12-14 2019-04-05 深圳壹账通智能科技有限公司 基于微表情识别的用户风险程度分析方法及装置
CN109987102A (zh) * 2018-01-03 2019-07-09 田文洪 一种基于卷积神经网络的高精度自动识别驾驶员不安全行为的方法与装置
CN110163301A (zh) * 2019-05-31 2019-08-23 北京金山云网络技术有限公司 一种图像的分类方法及装置
CN110852360A (zh) * 2019-10-30 2020-02-28 腾讯科技(深圳)有限公司 图像情感识别方法、装置、设备及存储介质

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8331650B2 (en) * 2010-07-29 2012-12-11 Sharp Laboratories Of America, Inc. Methods, systems and apparatus for defect detection
CN104200238B (zh) * 2014-09-22 2017-07-28 北京酷云互动科技有限公司 台标识别方法和台标识别装置
CN108171257B (zh) * 2017-12-01 2019-11-26 百度在线网络技术(北京)有限公司 细粒度图像识别模型训练及识别方法、装置及存储介质
CN110084317B (zh) * 2019-05-06 2023-04-21 北京字节跳动网络技术有限公司 用于识别图像的方法和装置
CN110414532B (zh) * 2019-06-21 2021-08-06 广州利科科技有限公司 一种基于深度学习的商品图像识别方法
CN111368789B (zh) * 2020-03-18 2023-05-26 腾讯科技(深圳)有限公司 图像识别方法、装置、计算机设备和存储介质

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104751163A (zh) * 2013-12-27 2015-07-01 同方威视技术股份有限公司 对货物进行自动分类识别的透视检查系统和方法
US10019654B1 (en) * 2017-06-28 2018-07-10 Accenture Global Solutions Limited Image object recognition
CN109987102A (zh) * 2018-01-03 2019-07-09 田文洪 一种基于卷积神经网络的高精度自动识别驾驶员不安全行为的方法与装置
CN109584050A (zh) * 2018-12-14 2019-04-05 深圳壹账通智能科技有限公司 基于微表情识别的用户风险程度分析方法及装置
CN110163301A (zh) * 2019-05-31 2019-08-23 北京金山云网络技术有限公司 一种图像的分类方法及装置
CN110852360A (zh) * 2019-10-30 2020-02-28 腾讯科技(深圳)有限公司 图像情感识别方法、装置、设备及存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
C. V. Angelino 等.A case study on the detection of illegal dumps with GIS and remote sensing images.《Earth Resources and Environmental Remote Sensing/GIS Applications IX》.2018,107900M-1至107900M-7. *
易先军 等.基于深度学习的ATM机非法改装行为自动识别.《五邑大学学报(自然科学版)》.2018,第32卷(第4期),24-29. *

Also Published As

Publication number Publication date
CN111368789A (zh) 2020-07-03
WO2021184776A1 (zh) 2021-09-23

Similar Documents

Publication Publication Date Title
CN111368789B (zh) 图像识别方法、装置、计算机设备和存储介质
CN109919316B (zh) 获取网络表示学习向量的方法、装置和设备及存储介质
CN111431742B (zh) 网络信息检测方法、装置、存储介质和计算机设备
US11645548B1 (en) Automated cloud data and technology solution delivery using machine learning and artificial intelligence modeling
WO2021139191A1 (zh) 数据标注的方法以及数据标注的装置
CN111651671B (zh) 用户对象推荐方法、装置、计算机设备和存储介质
US11907860B2 (en) Targeted data acquisition for model training
CN112256537B (zh) 模型运行状态的展示方法、装置、计算机设备和存储介质
US20190220767A1 (en) Probabilistic modeling system and method
CN108549909B (zh) 基于众包的对象分类方法及对象分类系统
CN103246690A (zh) 标签继承
US20240211496A1 (en) Systems and Methods for Determining Entity Attribute Representations
JP6787831B2 (ja) 検索結果による学習が可能な対象検出装置、検出モデル生成装置、プログラム及び方法
US20240143654A1 (en) Systems and methods for determining whether to modify content
CN112765387A (zh) 图像检索方法、图像检索装置和电子设备
US20230106106A1 (en) Text backup method, apparatus, and device, and computer-readable storage medium
US20210271725A1 (en) Systems and methods for managing media feed timelines
US20230186117A1 (en) Automated cloud data and technology solution delivery using dynamic minibot squad engine machine learning and artificial intelligence modeling
US20230117893A1 (en) Machine learning techniques for environmental discovery, environmental validation, and automated knowledge repository generation
Qu et al. The application of interactive methods under swarm computing and artificial intelligence in image retrieval and personalized analysis
CN111935259A (zh) 目标帐号集合的确定方法和装置、存储介质及电子设备
CN117934997B (zh) 用于corner case样本生成的大语言模型系统及方法
CN117033664B (zh) 业务的序列图生成方法、装置、计算机设备和存储介质
KR20220164957A (ko) 인공지능 및 사물인식을 이용한 이미지 기반의 장소 추정 방법 및 이를 수행하는 컴퓨팅 시스템
CN116167798A (zh) 一种数据处理方法、计算机设备以及可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40026365

Country of ref document: HK

GR01 Patent grant
GR01 Patent grant