CN115170932A - 门店终端识别方法、装置、系统及计算机可读存储介质 - Google Patents
门店终端识别方法、装置、系统及计算机可读存储介质 Download PDFInfo
- Publication number
- CN115170932A CN115170932A CN202210861377.0A CN202210861377A CN115170932A CN 115170932 A CN115170932 A CN 115170932A CN 202210861377 A CN202210861377 A CN 202210861377A CN 115170932 A CN115170932 A CN 115170932A
- Authority
- CN
- China
- Prior art keywords
- sku
- detection model
- training
- store
- identification
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 48
- 238000003860 storage Methods 0.000 title claims abstract description 10
- 238000001514 detection method Methods 0.000 claims abstract description 96
- 238000012549 training Methods 0.000 claims abstract description 84
- 238000012360 testing method Methods 0.000 claims abstract description 30
- 238000012545 processing Methods 0.000 claims abstract description 13
- 238000002372 labelling Methods 0.000 claims abstract description 12
- 238000004140 cleaning Methods 0.000 claims abstract description 8
- 230000003190 augmentative effect Effects 0.000 claims description 9
- 230000008569 process Effects 0.000 claims description 8
- 238000004590 computer program Methods 0.000 claims description 5
- 239000000126 substance Substances 0.000 claims description 2
- 238000005406 washing Methods 0.000 claims description 2
- 238000010586 diagram Methods 0.000 description 8
- 230000000694 effects Effects 0.000 description 8
- 238000013434 data augmentation Methods 0.000 description 4
- 230000003416 augmentation Effects 0.000 description 3
- 244000062793 Sorghum vulgare Species 0.000 description 2
- 238000005034 decoration Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 235000019713 millet Nutrition 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- KLDZYURQCUYZBL-UHFFFAOYSA-N 2-[3-[(2-hydroxyphenyl)methylideneamino]propyliminomethyl]phenol Chemical compound OC1=CC=CC=C1C=NCCCN=CC1=CC=CC=C1O KLDZYURQCUYZBL-UHFFFAOYSA-N 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 238000012550 audit Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 201000001098 delayed sleep phase syndrome Diseases 0.000 description 1
- 208000033921 delayed sleep phase type circadian rhythm sleep disease Diseases 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000009432 framing Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000036544 posture Effects 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 238000004080 punching Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000007306 turnover Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/35—Categorising the entire scene, e.g. birthday party or wedding scene
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V2201/00—Indexing scheme relating to image or video recognition or understanding
- G06V2201/07—Target detection
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Image Analysis (AREA)
Abstract
本申请公开了一种门店终端识别方法、装置、系统及计算机可读存储介质,该方法包括对不同类型的门店终端图像进行清洗标注,按照预设比例对标注后的图像进行划分,生成训练集和测试集;利用训练集对原始的SKU检测模型进行迭代训练,并利用测试集进行SKU检测模型训练结果的测试,直至SKU检测模型的识别准确率达到预设阈值,生成SKU目标检测模型;接收移动端上传的待识别门店图像,利用SKU目标检测模型进行在线识别,将识别结果发送至移动端。本申请通过端对端的门店终端识别模型训练,无需额外的数据处理;利用SKU目标检测模型进行门店识别,能够加快对单张图像的识别速度,同时提高终端识别的准确率,确保了拜访的有效性和真实性。
Description
技术领域
本申请涉及目标检测技术领域,尤其涉及一种门店终端识别方法、装置、系统及计算机可读存储介质。
背景技术
传统快消工作方式中,拍照一直是快消铺货的重要手段。随着信息化水平的不断提高,人们也逐渐意识到了传统快消的弊端。比如,外勤人员拍摄的照片需要逐张或者打包上传到工作群,数量太多的时候,发重或者发漏都时有发生;当大家都在同一个工作群里汇报工作的时候,群里照片会不断刷屏,翻拍、乱拍场景的图片更是屡见不鲜,其真实性难以保障。此时,如果采用传统的人工筛查、核对照片,以作为打卡或者绩效评定的依据,不仅数据处理过程耗时长、识别速度低下,且照片的真实性和有效性难以保障,说服力不强,从而严重影响考勤绩效评定结果的能效。
发明内容
本申请的目的在于提供一种门店终端识别方法、装置、系统及计算机可读存储介质,以提高识别检测外勤人员拜访终端门店进行业务作业的真实性,同时减少图片处理花费时长,提高识别效率。
为实现上述目的,本申请提供一种门店终端识别方法,包括:
对不同类型的门店终端图像进行清洗标注,按照预设比例对标注后的图像进行划分,生成训练集和测试集;
利用训练集对原始的SKU检测模型进行迭代训练,并利用测试集进行SKU检测模型训练结果的测试,直至SKU检测模型的识别准确率达到预设阈值,生成SKU目标检测模型;
接收移动端上传的待识别门店图像,利用SKU目标检测模型进行在线识别,将识别结果发送至移动端。
进一步,作为优选地,所述利用训练集对原始的SKU检测模型进行迭代训练,包括:
利用Transformer算法构建原始的SKU检测模型;
对SKU检测模型的网络参数进行设置,包括设置学习率为0.002,每隔16个epoch学习率下降10%,迭代次数为60轮;
将训练集输入至设置了网络参数的SKU检测模型中进行迭代训练。
进一步,作为优选地,在所述对不同类型的门店终端图像进行清洗标注之前,还包括:
获取不同类型门店终端的正面、侧面以及不同距离下的图像,作为第一图像;
对第一图像进行处理,得到对应的增广图像;其中,所述第一图像包含多种姿态下的门店招牌。
进一步,作为优选地,所述直至SKU检测模型的识别准确率达到预设阈值,生成SKU目标检测模型,包括:
当SKU检测模型的识别准确率大于或等于99%时,终止训练过程,生成SKU目标检测模型。
本申请还提供一种门店终端识别装置,包括:
标注单元,用于对不同类型的门店终端图像进行清洗标注,按照预设比例对标注后的图像进行划分,生成训练集和测试集;
训练单元,用于利用训练集对原始的SKU检测模型进行迭代训练,并利用测试集进行SKU检测模型训练结果的测试,直至SKU检测模型的识别准确率达到预设阈值,生成SKU目标检测模型;
识别单元,用于接收移动端上传的待识别门店图像,利用SKU目标检测模型进行在线识别,将识别结果发送至移动端。
进一步,作为优选地,所述训练单元,还用于:
利用Transformer算法构建原始的SKU检测模型;
对SKU检测模型的网络参数进行设置,包括设置学习率为0.002,每隔16个epoch学习率下降10%,迭代次数为60轮;
将训练集输入至设置了网络参数的SKU检测模型中进行迭代训练。
进一步,作为优选地,所述的门店终端识别装置,还包括获取单元,用于:
获取不同类型门店终端的正面、侧面以及不同距离下的图像,作为第一图像;
对第一图像进行处理,得到对应的增广图像;其中,所述第一图像包含多种姿态下的门店招牌。
进一步,作为优选地,所述训练单元,还用于:
当SKU检测模型的识别准确率大于或等于99%时,终止训练过程,生成SKU目标检测模型。
本申请还提供一种门店终端识别系统,包括云服务器和移动端;
所述移动端,用于采集待识别门店图像并发送至所述云服务器;
所述云服务器,用于对待识别门店图像进行门店终端识别,并将识别结果发送至移动端;其中,
所述云服务器包括存储器以及一个或多个处理器;
所述存储器与所述一个或多个处理器耦接,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现上任一项所述的门店终端识别方法。
本申请还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上任一项所述的门店终端识别方法。
相对于现有技术,本申请的有益效果在于:
本申请公开了一种门店终端识别方法、装置、系统及计算机可读存储介质,该方法包括对不同类型的门店终端图像进行清洗标注,按照预设比例对标注后的图像进行划分,生成训练集和测试集;利用训练集对原始的SKU检测模型进行迭代训练,并利用测试集进行SKU检测模型训练结果的测试,直至SKU检测模型的识别准确率达到预设阈值,生成SKU目标检测模型;接收移动端上传的待识别门店图像,利用SKU目标检测模型进行在线识别,将识别结果发送至移动端。
本申请通过端对端的门店终端识别模型训练,无需额外的数据处理,减少了人工筛查图像的繁琐;利用SKU目标检测模型进行门店识别,能够加快对单张图像的识别速度,同时提高终端识别的准确率,确保了拜访的有效性和真实性。
附图说明
为了更清楚地说明本申请的技术方案,下面将对实施方式中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请某一实施例提供的门店终端识别方法的流程示意图;
图2是本申请某一实施例提供的“人店同照”终端门店示意图;
图3是本申请某一实施例提供的数据增广效果示意图;
图4是本申请某一实施例提供门店终端识别方法的步骤程序框图;
图5是本申请某一实施例提供的门店终端识别装置的结构示意图;
图6是本申请某一实施例提供的门店终端识别系统的结构示意图;
图7是本申请某一实施例提供的云服务器的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
应当理解,文中所使用的步骤编号仅是为了方便描述,不对作为对步骤执行先后顺序的限定。
应当理解,在本申请说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本申请。如在本申请说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
请参阅图1,本申请某一实施例提供一种门店终端识别方法。如图1所示,该门店终端识别方法包括步骤S10至步骤S30。各步骤具体如下:
S10、对不同类型的门店终端图像进行清洗标注,按照预设比例对标注后的图像进行划分,生成训练集和测试集。
在一个具体实施例中,在执行步骤S10之前,首先需要进行以下操作:
获取不同类型门店终端的正面、侧面以及不同距离下的图像,作为第一图像;
对第一图像进行处理,得到对应的增广图像;其中,所述第一图像包含多种姿态下的门店招牌。
本实施例中,主要进行门店终端的门店招牌数据的准备,具体包括以下步骤:
1.1)建立不同类型终端门店招牌的图像库,传统的快消行业门店终端包括有大卖场、KA商超、连锁超市、夫妻老婆店等类型,该图像库包括快消场景中不同类型门店类型的正、侧面和不同距离等多种姿态的图片数据和增广图片数据;
1.2)结合品牌商对业务人员的日常拜访,拍照打卡的时候经常需要“人店同照”的要求,如图2为“人店同照”终端门店示意图。收集图像时,需要考虑门店招牌被遮挡或门店信息不全的情况,在采集数据时,门店照片也需要作为特定业务类型照片,从而有针对性的进行收集。
在收集完图像后,接下来则进入步骤S10,对不同类型的门店终端图像进行清洗标注。作为优选地实施方式,图像标注采取Mask掩码完成店头招牌的实例标注,单张图片可能存在一个或多个店头招牌也需要对应标注,为了保证学习效果,图片数据量通常要求在5000张以上。
在一个示例性的实施例中,为了使得训练样本更加丰富多样,还需要对标注后的图像进行图像增广处理。例如,上一步中的得到的训练数据为5000张图像,经过旋转、平移、随机遮挡不同大小区域和抖动像素值的增强方式,增广到8000张训练图片。如图3所示,图3提供了图像增广后的效果示意图。其中,图(a)和(b)分别为图像门头招牌被遮挡的原始图;图(c)和(d)分别为图(a)和(b)对应增广后得到的图片,能够清晰的显示出门店招牌。
进一步地,当所有的图像数据处理好后,按照预设比例对标注后的图像进行划分,生成训练集和测试集。例如,可以随机挑选所有图像其中的10%图片量作为测试集,剩下90%作为训练集。可以理解,该比例只是一种优选方式,在实际应用中可以根据场景需求对训练集和测试集的比例灵活调整,此处不进行任何限定。
S20、利用训练集对原始的SKU检测模型进行迭代训练,并利用测试集进行SKU检测模型训练结果的测试,直至SKU检测模型的识别准确率达到预设阈值,生成SKU目标检测模型。
在一个实施例中,所述利用训练集对原始的SKU检测模型进行迭代训练,包括:
利用Transformer算法构建原始的SKU检测模型;
对SKU检测模型的网络参数进行设置,包括设置学习率为0.002,每隔16个epoch学习率下降10%,迭代次数为60轮;
将训练集输入至设置了网络参数的SKU检测模型中进行迭代训练。
所述直至SKU检测模型的识别准确率达到预设阈值,生成SKU目标检测模型,包括:
当SKU检测模型的识别准确率大于或等于99%时,终止训练过程,生成SKU目标检测模型。
需要说明的是,本实施例中主要进行门店终端AI识别模型训练过程,目的是训练出SKU目标检测模型,用于待识别图像的门店识别。具体地,模型训练共包括以下步骤:
2.1)对步骤S10准备的图片库中的各种门店招牌进行SKU学习建模,根据任务的识别高泛化性要求和识别SKU个体较大的客观情况,选择了对图片全局建模强的Transformer算法,也即利用Transformer算法搭建原始的SKU检测模型。作为优选地,采用SwinTransformer算法建模。
2.2)基于Swin Transformer算法的神经网络结构,进一步对网络参数进行设置。本步骤中加载以coco数据集训练好的SwinTransformer Tiny模型参数,在NVIDIA 2080TI4卡GPU服务器上完成训练60轮epoch周期训练,初始学习率为0.002,每隔16个epoch学习率下降10%的训练策略。
2.3)当60轮训练结束后,利用测试集对训练后的SKU检测模型进行测试,如图3所示,具体为判断模型识别的准确率是否达到99%,如果小于99%则返回训练步骤,直至准确率大于或等于99%时,生成最终的SKU目标检测模型。
S30、接收移动端上传的待识别门店图像,利用SKU目标检测模型进行在线识别,将识别结果发送至移动端。
本步骤中,首先对步骤S20得到的SKU目标检测模型部署于云服务器中,提供检测算法服务API接口给移动终端/设备随时调用。在应用时,外勤拜访门店人员应用移动端设备对拜访终端门店进行规范拍照,将图像数据上传至云服务器调用SKU目标检测模型完成图像检测识别,并将图像识别结果回传至移动端设备和存储至后台数据库信息,移动设备显示反馈的门店核查信息。
综上所述,本申请实施例提供的门店终端识别方法,通过端对端的门店终端识别模型训练,无需额外的数据处理;利用SKU目标检测模型进行门店识别,能够加快对单张图像的识别速度,具体可以达到0.2s/张。同时,该方法提高了终端识别的准确率,确保了拜访的有效性和真实性。
为了帮助理解,在一具体实施例中,以终端拜访、门店稽核等快消行业中包括且不限于门店检测、外勤考核等业务场景的图片为训练数据建立SKU目标检测算法模型学习图像数据增广库,以传统夫妻老婆店为例,收集类似如图2所示的不同门店招牌角度、不同距离拍摄的多样式图像。下面对各个步骤进行具体说明:
步骤1)对快消行业不同终端类型的门店场景进行图片采集,对其进行不同角度的取景拍照并一一规则命名,收集不同场景和不同灯光下的多类型样本。
步骤2)准备当前市面多种不同类型手机,主要以Android和IOS操作系统的多款热门手机,其中包括华为、小米手机mate10、mate 30、小米10;苹果手机iPhone系类、iPhonePro系列、iPhone X和mac book pro 13.3等设备,对步骤1)收集的SKU图片采集5000张的图像库。
步骤3)根据步骤2)建立的SKU图形数据增广库,增广方式以图像随机扰动、图片数据增广方式以图像随机扰动、图像翻转、图片Mixup等方式,增广数据至8000张训练图片,额外准备100张测试集图片。
步骤4)考虑业务人员在夜晚拜访时,拍摄环境和时间为户外、夜晚居多,整体拍摄环境较暗,图片整体呈现较暗和模糊,训练数据增广的方式随机亮度,根据下述变换公式完成图像对比度调节,增强模型对于网络的明暗适应性。
g(i,j)=af(i,j)+b;
其中,原像素灰度为f(i,j),转化后的像素灰度为g(i,j),系数a影响图像的对比度,系数b影响图像的亮度。
步骤5)SKU目标检测模型建模采用的是Swin Transformer算法,加载以coco数据集训练好的SwinTransformer Tiny模型参数,训练epoch设置为60,初始学习率为0.002,隔13个epoch学习率下降10%的训练策略。
最后,通过建立收集的特定陈列图片样本作为训练集,用于训练SKU目标检测模型,其识别效果准确率能达到99%,优于工作人员传统作业准确率,同时保证SKU检测速度,提高外勤人员外出拜访终端时的作业效率。
请参阅图5,本申请某一实施例还提供一种门店终端识别装置,包括:
标注单元01,用于对不同类型的门店终端图像进行清洗标注,按照预设比例对标注后的图像进行划分,生成训练集和测试集;
训练单元02,用于利用训练集对原始的SKU检测模型进行迭代训练,并利用测试集进行SKU检测模型训练结果的测试,直至SKU检测模型的识别准确率达到预设阈值,生成SKU目标检测模型;
识别单元03,用于接收移动端上传的待识别门店图像,利用SKU目标检测模型进行在线识别,将识别结果发送至移动端。
在一个实施例中,训练单元02,还用于:
利用Transformer算法构建原始的SKU检测模型;
对SKU检测模型的网络参数进行设置,包括设置学习率为0.002,每隔16个epoch学习率下降10%,迭代次数为60轮;
将训练集输入至设置了网络参数的SKU检测模型中进行迭代训练。
在一个实施例中,所述门店终端识别装置,还包括获取单元,用于:
获取不同类型门店终端的正面、侧面以及不同距离下的图像,作为第一图像;
对第一图像进行处理,得到对应的增广图像;其中,所述第一图像包含多种姿态下的门店招牌。
在一个实施例中,训练单元02,还用于:
当SKU检测模型的识别准确率大于或等于99%时,终止训练过程,生成SKU目标检测模型。
可以理解的是,本申请实施例提供的门店终端识别装置用于执行如上述任一项实施例所述的门店终端识别方法,并实现与其相同的效果,在此不再进一步赘述。
请参阅图6,在本申请某一实施例中,还提供了一种门店终端识别系统,包括云服务器100和移动端200;
移动端200,用于采集待识别门店图像并发送至云服务器100;
云服务器100,用于对待识别门店图像进行门店终端识别,并将识别结果发送至移动端200。
其中,云服务器100的结构示意图如图7所示,具体包括:
存储器以及一个或多个处理器;
存储器与一个或多个处理器耦接,用于存储一个或多个程序;
当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现上述任一项实施例所述的门店终端识别方法。
处理器用于控制该终端系统的整体操作,以完成上述的门店终端识别方法的全部或部分步骤。存储器用于存储各种类型的数据以支持在该终端系统的操作,这些数据例如可以包括用于在该终端系统上操作的任何应用程序或方法的指令,以及应用程序相关的数据。该存储器可以由任何类型的易失性或非易失性存储系统或者它们的组合实现,例如静态随机存取存储器(Static Random Access Memory,简称SRAM),电可擦除可编程只读存储器(Electrically Erasable Programmable Read-Only Memory,简称EEPROM),可擦除可编程只读存储器(Erasable Programmable Read-Only Memory,简称EPROM),可编程只读存储器(Programmable Read-Only Memory,简称PROM),只读存储器(Read-Only Memory,简称ROM),磁存储器,快闪存储器,磁盘或光盘。
在一示例性实施例中,终端系统可以被一个或多个应用专用集成电路(Application Specific 1ntegrated Circuit,简称AS1C)、数字信号处理器(DigitalSignal Processor,简称DSP)、数字信号处理系统(Digital Signal Processing Device,简称DSPD)、可编程逻辑器件(Programmable Logic Device,简称PLD)、现场可编程门阵列(Field Programmable Gate Array,简称FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行如上述任一项实施例所述的门店终端识别方法,并达到如上述方法一致的技术效果。
在另一示例性实施例中,还提供一种包括计算机程序的计算机可读存储介质,该计算机程序被处理器执行时实现如上述任一项实施例所述的门店终端识别方法的步骤。例如,该计算机可读存储介质可以为上述包括计算机程序的存储器,上述计算机程序可由终端系统的处理器执行以完成如上述任一项实施例所述的门店终端识别方法,并达到如上述方法一致的技术效果。
以上所述是本申请的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也视为本申请的保护范围。
Claims (10)
1.一种门店终端识别方法,其特征在于,包括:
对不同类型的门店终端图像进行清洗标注,按照预设比例对标注后的图像进行划分,生成训练集和测试集;
利用训练集对原始的SKU检测模型进行迭代训练,并利用测试集进行SKU检测模型训练结果的测试,直至SKU检测模型的识别准确率达到预设阈值,生成SKU目标检测模型;
接收移动端上传的待识别门店图像,利用SKU目标检测模型进行在线识别,将识别结果发送至移动端。
2.根据权利要求1所述的门店终端识别方法,其特征在于,所述利用训练集对原始的SKU检测模型进行迭代训练,包括:
利用Transformer算法构建原始的SKU检测模型;
对SKU检测模型的网络参数进行设置,包括设置学习率为0.002,每隔16个epoch学习率下降10%,迭代次数为60轮;
将训练集输入至设置了网络参数的SKU检测模型中进行迭代训练。
3.根据权利要求1所述的门店终端识别方法,其特征在于,在所述对不同类型的门店终端图像进行清洗标注之前,还包括:
获取不同类型门店终端的正面、侧面以及不同距离下的图像,作为第一图像;
对第一图像进行处理,得到对应的增广图像;其中,所述第一图像包含多种姿态下的门店招牌。
4.根据权利要求1所述的门店终端识别方法,其特征在于,所述直至SKU检测模型的识别准确率达到预设阈值,生成SKU目标检测模型,包括:
当SKU检测模型的识别准确率大于或等于99%时,终止训练过程,生成SKU目标检测模型。
5.一种门店终端识别装置,其特征在于,包括:
标注单元,用于对不同类型的门店终端图像进行清洗标注,按照预设比例对标注后的图像进行划分,生成训练集和测试集;
训练单元,用于利用训练集对原始的SKU检测模型进行迭代训练,并利用测试集进行SKU检测模型训练结果的测试,直至SKU检测模型的识别准确率达到预设阈值,生成SKU目标检测模型;
识别单元,用于接收移动端上传的待识别门店图像,利用SKU目标检测模型进行在线识别,将识别结果发送至移动端。
6.根据权利要求5所述的门店终端识别装置,其特征在于,所述训练单元,还用于:
利用Transformer算法构建原始的SKU检测模型;
对SKU检测模型的网络参数进行设置,包括设置学习率为0.002,每隔16个epoch学习率下降10%,迭代次数为60轮;
将训练集输入至设置了网络参数的SKU检测模型中进行迭代训练。
7.根据权利要求5所述的门店终端识别装置,其特征在于,还包括获取单元,用于:
获取不同类型门店终端的正面、侧面以及不同距离下的图像,作为第一图像;
对第一图像进行处理,得到对应的增广图像;其中,所述第一图像包含多种姿态下的门店招牌。
8.根据权利要求5所述的门店终端识别装置,其特征在于,所述训练单元,还用于:
当SKU检测模型的识别准确率大于或等于99%时,终止训练过程,生成SKU目标检测模型。
9.一种门店终端识别系统,其特征在于,包括云服务器和移动端;
所述移动端,用于采集待识别门店图像并发送至所述云服务器;
所述云服务器,用于对待识别门店图像进行门店终端识别,并将识别结果发送至移动端;其中,
所述云服务器包括存储器以及一个或多个处理器;
所述存储器与所述一个或多个处理器耦接,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-4任一项所述的门店终端识别方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-4任一项所述的门店终端识别方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210861377.0A CN115170932A (zh) | 2022-07-22 | 2022-07-22 | 门店终端识别方法、装置、系统及计算机可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210861377.0A CN115170932A (zh) | 2022-07-22 | 2022-07-22 | 门店终端识别方法、装置、系统及计算机可读存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115170932A true CN115170932A (zh) | 2022-10-11 |
Family
ID=83495917
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210861377.0A Pending CN115170932A (zh) | 2022-07-22 | 2022-07-22 | 门店终端识别方法、装置、系统及计算机可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115170932A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116704234A (zh) * | 2023-04-10 | 2023-09-05 | 广州市玄武无线科技股份有限公司 | 一种陈列场景类型的检测方法、装置、设备及存储介质 |
CN117671341A (zh) * | 2023-11-28 | 2024-03-08 | 广州市玄武无线科技股份有限公司 | 一种商品识别建模方法及装置 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109492122A (zh) * | 2018-11-26 | 2019-03-19 | Oppo广东移动通信有限公司 | 商家信息的获取方法、装置、终端及计算机可读存储介质 |
CN110188762A (zh) * | 2019-04-23 | 2019-08-30 | 山东大学 | 中英文混合商户门店名称识别方法、系统、设备及介质 |
CN112434715A (zh) * | 2020-12-10 | 2021-03-02 | 腾讯科技(深圳)有限公司 | 基于人工智能的目标识别方法、装置及存储介质 |
CN112926616A (zh) * | 2019-12-06 | 2021-06-08 | 顺丰科技有限公司 | 图像匹配方法和装置、电子设备、计算机可读存储介质 |
CN114494892A (zh) * | 2022-04-15 | 2022-05-13 | 广州市玄武无线科技股份有限公司 | 一种货架商品陈列信息识别方法、装置、设备及存储介质 |
CN114550158A (zh) * | 2022-02-23 | 2022-05-27 | 厦门大学 | 一种场景文字识别方法及系统 |
-
2022
- 2022-07-22 CN CN202210861377.0A patent/CN115170932A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109492122A (zh) * | 2018-11-26 | 2019-03-19 | Oppo广东移动通信有限公司 | 商家信息的获取方法、装置、终端及计算机可读存储介质 |
CN110188762A (zh) * | 2019-04-23 | 2019-08-30 | 山东大学 | 中英文混合商户门店名称识别方法、系统、设备及介质 |
CN112926616A (zh) * | 2019-12-06 | 2021-06-08 | 顺丰科技有限公司 | 图像匹配方法和装置、电子设备、计算机可读存储介质 |
CN112434715A (zh) * | 2020-12-10 | 2021-03-02 | 腾讯科技(深圳)有限公司 | 基于人工智能的目标识别方法、装置及存储介质 |
CN114550158A (zh) * | 2022-02-23 | 2022-05-27 | 厦门大学 | 一种场景文字识别方法及系统 |
CN114494892A (zh) * | 2022-04-15 | 2022-05-13 | 广州市玄武无线科技股份有限公司 | 一种货架商品陈列信息识别方法、装置、设备及存储介质 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116704234A (zh) * | 2023-04-10 | 2023-09-05 | 广州市玄武无线科技股份有限公司 | 一种陈列场景类型的检测方法、装置、设备及存储介质 |
CN117671341A (zh) * | 2023-11-28 | 2024-03-08 | 广州市玄武无线科技股份有限公司 | 一种商品识别建模方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10943145B2 (en) | Image processing methods and apparatus, and electronic devices | |
CN109376667B (zh) | 目标检测方法、装置及电子设备 | |
CN115170932A (zh) | 门店终端识别方法、装置、系统及计算机可读存储介质 | |
CN108337505B (zh) | 信息获取方法和装置 | |
CN110008956B (zh) | 发票关键信息定位方法、装置、计算机设备及存储介质 | |
US11216924B2 (en) | Method and apparatus for processing image | |
CN109255767B (zh) | 图像处理方法和装置 | |
CN109116129B (zh) | 终端检测方法、检测设备、系统及存储介质 | |
CN111339902B (zh) | 一种数显仪表的液晶屏示数识别方法及装置 | |
CN113627411A (zh) | 一种基于超分辨率的商品识别与价格匹配方法及系统 | |
CN110942456B (zh) | 篡改图像检测方法、装置、设备及存储介质 | |
CN114169381A (zh) | 图像标注方法、装置、终端设备及存储介质 | |
CN106202086A (zh) | 一种图片处理、获取方法、装置及系统 | |
CN112435223B (zh) | 目标检测方法、装置及存储介质 | |
CN114842185A (zh) | 用于火灾的目标识别方法、装置、设备及介质 | |
CN114550051A (zh) | 一种车损检测方法、装置、计算机设备及存储介质 | |
CN116597270A (zh) | 基于注意力机制集成学习网络的道路损毁目标检测方法 | |
CN113688839B (zh) | 视频处理方法及装置、电子设备、计算机可读存储介质 | |
CN113642582B (zh) | 电表读数识别方法、装置、电子设备和存储介质 | |
CN109961060B (zh) | 用于生成人群密度信息的方法和装置 | |
CN111382689A (zh) | 一种利用计算机在线学习的打卡系统及方法 | |
CN114757941A (zh) | 变电站设备缺陷的识别方法、装置、电子设备及存储介质 | |
CN113610832A (zh) | 一种徽标缺陷检测方法、装置、设备和存储介质 | |
CN111191593A (zh) | 图像目标检测方法、装置、存储介质及污水管道检测装置 | |
CN112927221B (zh) | 一种基于图像细粒度特征翻拍检测方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20221011 |
|
RJ01 | Rejection of invention patent application after publication |