CN111695558A - 基于YoloV3模型的物流运单图片摆正方法及系统 - Google Patents

基于YoloV3模型的物流运单图片摆正方法及系统 Download PDF

Info

Publication number
CN111695558A
CN111695558A CN202010350278.7A CN202010350278A CN111695558A CN 111695558 A CN111695558 A CN 111695558A CN 202010350278 A CN202010350278 A CN 202010350278A CN 111695558 A CN111695558 A CN 111695558A
Authority
CN
China
Prior art keywords
frame
waybill
column frame
sending
receiving
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010350278.7A
Other languages
English (en)
Other versions
CN111695558B (zh
Inventor
陈才宁
寇宇
赵兴
陈婷
林灿
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Leap New Technology Co ltd
Original Assignee
Shenzhen Leap New Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Leap New Technology Co ltd filed Critical Shenzhen Leap New Technology Co ltd
Priority to CN202010350278.7A priority Critical patent/CN111695558B/zh
Publication of CN111695558A publication Critical patent/CN111695558A/zh
Application granted granted Critical
Publication of CN111695558B publication Critical patent/CN111695558B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/24Aligning, centring, orientation detection or correction of the image
    • G06V10/242Aligning, centring, orientation detection or correction of the image by image rotation, e.g. by 90 degrees
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/08Logistics, e.g. warehousing, loading or distribution; Inventory or stock management
    • G06Q10/083Shipping
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/24Aligning, centring, orientation detection or correction of the image
    • G06V10/243Aligning, centring, orientation detection or correction of the image by compensating for image skew or non-uniform image deformations
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Data Mining & Analysis (AREA)
  • Economics (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Development Economics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Sorting Of Articles (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于YoloV3模型的物流运单图片摆正方法及系统,其中方法包括:将待摆正运单图片输入至训练好的YoloV3模型进行检测,得到待摆正运单图片中的寄方框、寄方栏框、收方框和收方栏框的信息;寄方框、寄方栏框、收方框和收方栏框的信息包括各个框的高度、宽度以及中心点坐标;将属于同一联运单的寄方框、寄方栏框、收方框和收方栏框合成在同一框群中;选择任一框群中的寄方栏框或收方栏框,比较其高度与宽度两者间的大小,并结合寄方框和收方框的相对位置关系,识别出待摆正运单图片的当前姿态;根据当前姿态,将待摆正运单图片进行旋转摆正。通过上述方式,本发明能够降低工作人员的工作量,提升运单信息的录入效率。

Description

基于YoloV3模型的物流运单图片摆正方法及系统
技术领域
本申请涉及物流运输技术领域,特别是涉及一种基于YoloV3模型的物流运单图片摆正方法及系统。
背景技术
随着物流市场的快速发展,物流公司的运单量也日渐增长。通常情况下,实际发生的运单信息往往与用户在终端上下单的信息有出路,所以企业的取件人员在取件时需要在纸质运单上手动修改信息,企业录单人员对纸质运单修改后的信息录入系统的工作量也就随之增加。然而,取件人员大多是通过外部终端拍摄运单图片,然后录单人员根据拍摄的运单图片进行完成对运单信息的录入,但是,外部终端拍摄时,所拍的照片并非全部都是摆正状态,可能是倒立的,或者是逆时针或者顺时针旋转90°的姿态,而未摆正的图片会使录单人员进行录入运单信息时造成不便,需要录单人员手动将图片摆正,然后再录入信息,这样大大增加了工作人员的工作量,同时还降低了运单信息的录入效率。
发明内容
本申请提供一种基于YoloV3模型的物流运单图片摆正方法及系统,以解决现有运单图片摆正大大增加工作量、降低工作效率的问题。
为解决上述技术问题,本申请采用的一个技术方案是:提供一种基于YoloV3模型的物流运单图片摆正方法,包括:S1、将待摆正运单图片输入至训练好的YoloV3模型进行检测,得到待摆正运单图片中的寄方框、寄方栏框、收方框和收方栏框的信息;待摆正运单图片中的寄方框、寄方栏框、收方框和收方栏框的信息包括各个框的高度、宽度以及中心点坐标;S2、将属于同一联运单的寄方框、寄方栏框、收方框和收方栏框合成在同一框群中;S3、选择任一框群中的寄方栏框或收方栏框,比较其高度与宽度两者间的大小,并结合寄方框和收方框的相对位置关系,识别出待摆正运单图片的当前姿态;S4、根据当前姿态,将待摆正运单图片进行旋转摆正;摆正后的运单图片中,寄方框和寄方栏框并排,收方框在寄方框正下方,收方栏框在寄方栏框正下方。
作为本发明的进一步改进,步骤S3包括:S31、选择任一框群中寄方栏框信息或收方栏框信息,比较寄方栏框或收方栏框的宽度与高度的大小;S32、判断宽度是否小于高度;S33、若是,判断寄方框的中心点的X轴坐标值是否大于收方框的中心点的X轴坐标值,若是,则待摆正运单图片当前姿态相对于摆正姿态,顺时针旋转了90°,若否,则待摆正运单图片当前姿态相对于摆正姿态,逆时针旋转了90°;S34、若否,判断寄方框的中心点的Y轴坐标值是否大于收方框的中心点的Y轴坐标值时,若是,则待摆正运单图片当前姿态相对于摆正姿态,旋转了0°,若否,则待摆正运单图片当前姿态相对于摆正姿态,旋转了180°。
作为本发明的进一步改进,步骤S2包括:S21、选择寄方框、寄方栏框、收方框和收方栏框中任意一框依次与除该框以外的其他框进行计算中心点距离;S22、比较中心点距离和预设距离阈值的大小;S23、将中心点距离小于预设距离阈值的寄方框、寄方栏框、收方框和收方栏框确定为属于同一联运单,进而合成在同一框群中。
作为本发明的进一步改进,步骤S22之前,还包括:选择任一寄方栏框或收方栏框,判断其高度是否小于宽度;若是,预设距离阈值设定为待摆正运单图片的高度的1/4;若否,预设距离阈值设定为待摆正运单图片的宽度的1/4。
作为本发明的进一步改进,训练好的YoloV3模型通过如下步骤得到:获取样本图片,将样本图片进行数据清洗以及数据增强,得到目标图片;对目标图片中的寄方框、寄方栏框、收方框和收方栏框进行打标,生成标注信息;标注信息包括目标图片中各个框的中心点的X轴坐标、Y轴坐标,以及各个框的宽度和高度;将目标图片和标注信息输入至YoloV3模型进行训练。
为解决上述技术问题,本申请采用的另一个技术方案是:提供一种基于YoloV3模型的物流运单图片摆正系统,包括:检测模块,用于将待摆正运单图片输入至训练好的YoloV3模型进行检测,得到待摆正运单图片中的寄方框、寄方栏框、收方框和收方栏框的信息;待摆正运单图片中的寄方框、寄方栏框、收方框和收方栏框的信息包括各个框的高度、宽度以及中心点坐标;合成模块,用于将属于同一联运单的寄方框、寄方栏框、收方框和收方栏框合成在同一框群中;识别模块,用于选择任一框群中的寄方栏框或收方栏框,比较其高度与宽度两者间的大小,并结合寄方框和收方框的相对位置关系,识别出待摆正运单图片的当前姿态;摆正模块,用于根据当前姿态,将待摆正运单图片进行旋转摆正;摆正后的运单图片中,寄方框和寄方栏框并排,收方框在寄方框正下方,收方栏框在寄方栏框正下方。
作为本发明的进一步改进,识别模块包括:第一比较单元,用于选择任一框群中寄方栏框信息或收方栏框信息,比较寄方栏框或收方栏框的宽度与高度的大小;第一判断单元,用于判断宽度是否小于高度;第一姿态确定单元,用于当宽度小于高度时,判断寄方框的中心点的X轴坐标值是否大于收方框的中心点的X轴坐标值,若是,则待摆正运单图片当前姿态相对于摆正姿态,顺时针旋转了90°,若否,则待摆正运单图片当前姿态相对于摆正姿态,逆时针旋转了90°;第二姿态确定单元,用于当宽度大于高度时,判断寄方框的中心点的Y轴坐标值是否大于收方框的中心点的Y轴坐标值时,若是,则待摆正运单图片当前姿态相对于摆正姿态,旋转了0°,若否,则待摆正运单图片当前姿态相对于摆正姿态,旋转了180°。
作为本发明的进一步改进,合成模块包括:计算单元,用于选择寄方框、寄方栏框、收方框和收方栏框中任意一框依次与除该框以外的其他框进行计算中心点距离;第二比较单元,用于比较中心点距离和预设距离阈值的大小;框群合成单元,用于将中心点距离小于预设距离阈值的寄方框、寄方栏框、收方框和收方栏框确定为属于同一联运单,进而合成在同一框群中。
作为本发明的进一步改进,合成模块还包括:第二判断单元,用于选择任一寄方栏框或收方栏框,判断其高度是否小于宽度;第一设定模块,用于当任一寄方栏框或收方栏框的高度小于宽度时,预设距离阈值设定为待摆正运单图片的高度的1/4;第二设定模块,用于当任一寄方栏框或收方栏框的高度大于宽度时,预设距离阈值设定为待摆正运单图片的宽度的1/4。
作为本发明的进一步改进,还包括:样本获取模块,用于获取样本图片,将样本图片进行数据清洗以及数据增强,得到目标图片;标注模块,用于对目标图片中的寄方框、寄方栏框、收方框和收方栏框进行打标,生成标注信息;标注信息包括目标图片中各个框的中心点的X轴坐标、Y轴坐标,以及各个框的宽度和高度;训练模块,用于将目标图片和标注信息输入至YoloV3模型进行训练。
本申请的有益效果是:本发明的基于YoloV3模型的物流运单图片摆正方法利用训练好的YoloV3模型检测出运单图片中的寄方框、寄方栏框、收方框和收方栏框的信息,并将属于同一联运单的寄方框、寄方栏框、收方框和收方栏框合成在同一框群中,避免多联运单对图片摆正的影响,再根据寄方栏框或收方栏框的高度与宽度之间的大小识别出运单图片的当前姿态,根据当前姿态将运单图片进行旋转摆正,其充分利用了运单的布局特征,通过YoloV3模型识别出寄方框、寄方栏框、收方框和收方栏框的信息,进而确认运单图片的当前姿态,从而对运单图片进行自动摆正,其无需工作人员进行手动进行摆正,降低了工作人员的工作量,提升了运单信息的录入效率。
附图说明
图1是本发明第一实施例的基于YoloV3模型的物流运单图片摆正方法的流程示意图;
图2是本发明实施例中摆正姿态的运单图片的结构示意图;
图3是本发明第二实施例的基于YoloV3模型的物流运单图片摆正方法的流程示意图;
图4是本发明第三实施例的基于YoloV3模型的物流运单图片摆正方法的流程示意图;
图5是本发明第四实施例的基于YoloV3模型的物流运单图片摆正方法的流程示意图;
图6是本发明第一实施例的基于YoloV3模型的物流运单图片摆正系统的功能模块示意图;
图7是本发明第二实施例的基于YoloV3模型的物流运单图片摆正系统的功能模块示意图;
图8是本发明第三实施例的基于YoloV3模型的物流运单图片摆正系统的功能模块示意图;
图9是本发明第四实施例的基于YoloV3模型的物流运单图片摆正系统的功能模块示意图;
图10是本发明第五实施例的基于YoloV3模型的物流运单图片摆正系统的功能模块示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请的一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请中的术语“第一”、“第二”、“第三”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”、“第三”的特征可以明示或者隐含地包括至少一个该特征。本申请的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。本申请实施例中所有方向性指示(诸如上、下、左、右、前、后……)仅用于解释在某一特定姿态(如附图所示)下各部件之间的相对位置关系、运动情况等,如果该特定姿态发生改变时,则该方向性指示也相应地随之改变。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
图1是本发明第一实施例的基于YoloV3模型的物流运单图片摆正方法的流程示意图。需注意的是,若有实质上相同的结果,本发明的方法并不以图1所示的流程顺序为限。如图1所示,该方法包括步骤:
步骤S1:将待摆正运单图片输入至训练好的YoloV3模型进行检测,得到待摆正运单图片中的寄方框、寄方栏框、收方框和收方栏框的信息。
需要说明的是,待摆正运单图片中的寄方框、寄方栏框、收方框和收方栏框的信息包括各个框的高度、宽度以及中心点坐标。本实施例中针对运单图片是指包括有寄方框、寄方栏框、收方框和收方栏框的运单,如图2所示,当运单图片摆正时,寄方框和寄方栏框并排,收方框在寄方框正下方,收方栏框在寄方栏框正下方,并且,寄方栏框和收方栏框的高度要小于宽度,而当运单图片顺时针旋转90°或逆时针旋转90°时,寄方栏框和收方栏框的高度则要大于宽度,其中,顺时针旋转90°是指,待摆正运单图片当前姿态相对于摆正姿态作顺时针旋转了90°;逆时针旋转90°是指,待摆正运单图片当前姿态相对于摆正姿态逆时针旋转了90°。
本实施例中,采用YoloV3模型来检测待摆正运单图片中的寄方框、寄方栏框、收方框和收方栏框的信息,在进行检测之前,首先需要对YoloV3模型进行训练,如图3所示,具体地训练步骤如下:
步骤S11:获取样本图片,将样本图片进行数据清洗以及数据增强,得到目标图片。
在步骤S11中,为了提高训练的效率和效果,本实施例中,对样本图片进行数据清洗和数据增强操作。其中,数据清洗包括去除模糊的、寄方框、寄方栏框、收方框和收方栏框残缺的运单图片;数据增强具体包括以下方式:
1、对摆正姿态下的样本图片随机旋转90°的倍数,从而使得YoloV3模型对顺时针旋转90°、逆时针旋转90°、倒立的运单图片的识别能力增强;
2、对样本图片随机进行仿射变化,以增强YoloV3模型对不同倾斜程度的运单图片的泛化识别能力,其中,仿射变化是指在几何中,一个向量空间进行一次线性变换并接上一个平移,变换为另一个向量空间;
3、随机改变样本图片的亮度、饱和度,以增强YoloV3模型对不同光照下的运单图片的泛化识别能力。
通过以上数据增强方式,可以有效增加YoloV3模型的泛化识别能力。需要说明的是,本实施例中数据清洗和数据增强并不局限于以上方式,其他可实现数据清洗或数据增强目的的操作也属于本发明的保护范围之内。
步骤S12:对目标图片中的寄方框、寄方栏框、收方框和收方栏框进行打标,生成标注信息。
需要说明的是,标注信息包括目标图片中各个框的中心点的X轴坐标、Y轴坐标,以及各个框的宽度和高度。
在步骤S12中,为了实现对寄方框、寄方栏框、收方框和收方栏框的定位,需要对识别的目标图片上的寄方框、寄方栏框、收方框和收方栏框进行打标,即框住各个框并记录各个框中心点的X轴坐标、Y轴坐标,以及各个框的宽度和高度,生成标注信息,需要说明的是,在本发明实施例中,以运单图片左上角的顶点为坐标系原点建立坐标系,进而以该原点进行计算得到各个框的中心点X轴坐标、Y轴坐标,另外,在本实施例中,标注信息可以以txt格式的文件记录,例如,如下所示为一目标图片中寄方框、收方框、寄方栏框和收方栏框的标注信息:
Figure BDA0002471585980000081
其中,第一列数据0、1、2、3分别代表寄方框、收方框、寄方栏框和收方栏框的标号,每一行的第二、三、四、五个数据分别代表每个方框的中心点的X轴坐标、Y轴坐标、宽度和高度。其中,上述数据均已进行归一化操作,具体为,X轴坐标和宽度通过除以整个运单图片的宽度来执行归一化操作,Y轴坐标和高度通过除以整个运单图片的高度来执行归一化操作。
步骤S13:将目标图片和标注信息输入至YoloV3模型进行训练。
在步骤S13中,将目标图片和标注信息输入至YoloV3模型中训练,采用平方差损失函数进行计算,整个训练过程采用随机梯度下降优化器进行优化,直至损失函数不再下降时为止,得到训练好的YoloV3模型。
将待摆正运单图片输入至训练好的YoloV3模型进行检测,得到待摆正运单图片中的寄方框、寄方栏框、收方框和收方栏框的信息后,执行步骤S2。
步骤S2:将属于同一联运单的寄方框、寄方栏框、收方框和收方栏框合成在同一框群中。
具体地,在实际物流运输过程中会出现多个收寄方的情况,使得拍摄的一张运单图片上出现多联运单,为了避免将不同联的寄方框、寄方栏框、收方框和收方栏框混淆,本实施例中,还需要将属于同一联运单的寄方框、寄方栏框、收方框和收方栏框合成在同一框群中,即聚集寄方框、寄方栏框、收方框和收方栏框四种距离最相近的框。
具体地,如图4所示,步骤S2包括:
步骤S21:选择寄方框、寄方栏框、收方框和收方栏框中任意一框依次与除该框以外的其他框进行计算中心点距离。
在步骤S21中,中心点距离是指两个方框之间的中心点坐标之间的距离,可通过中心点坐标计算获得。
具体的,当该待摆正运单图片只有一联时,寄方框、寄方栏框、收方框和收方栏框中任意一框依次与除该框以外的其他框进行计算中心点距离,例如,选择寄方框依次与寄方栏框、收方框和收方栏框进行计算中心点距离。
另外,在计算各个框的中心点距离时,可先判断出运单图片是属于横向状态,即摆正或倒立,还是竖向状态,即顺时针旋转90°或逆时针旋转90°;可通过随机选择寄方框、寄方栏框、收方框和收方栏框中任意一框的高度与宽度的大小来判断,例如,选择寄方框,若寄方框的高度小于宽,则待摆正运单图片处于横向状态,即摆正或倒立,此种状态下,计算中心点距离,即可通过各个框中心点的Y轴坐标来计算中心点距离;若寄方框高度大于宽,则待摆正运单图片处于竖向状态,即顺时针旋转90°或逆时针旋转90°,此种状态下,计算中心点距离,即可通过各个框中心点的X轴坐标来计算中心点距离。
步骤S22:比较中心点距离和预设距离阈值的大小。
具体地,该预设距离阈值用于限制框群中各个框之间的距离,以免将不属于同一联运单的方框聚集同一个框群中,因此预设距离阈值的设置应合适。该预设距离阈值的设定实际是根据待摆正运单图片在摆正姿态下的高度进行设定。
预设距离阈值的设定具体包括:首先选择任一寄方栏框或收方栏框,判断其高度是否小于宽度。若其高度小于宽度,则判断该待摆正运单图片处于横向状态,即摆正或倒立,那么该预设距离阈值则设定为待摆正运单图片的高度的1/4;若其高度大于宽度,则判断该待摆正运单图片处于竖向状态,即顺时针旋转90°或逆时针旋转90°,那么该预设距离阈值则设定为待摆正运单图片的宽度的1/4。需要说明的是,在进行设定预设距离阈值时,若寄方框和收方框的高度与宽度不相等的情况下,也可采用寄方框或收方框来进行判断,通常情况下,寄方框和收方框的高度与宽度差由于较小,而寄方栏框和收方栏框的高度与宽度差相差较大,所以优先采用寄方栏框或收方栏框来进行判断。
步骤S23:将中心点距离小于预设距离阈值的寄方框、寄方栏框、收方框和收方栏框确定为属于同一联运单,进而合成在同一框群中。
具体地,中心点距离小于预设距离阈值,表示框之间的距离较近,即将距离较近的寄方框、寄方栏框、收方框和收方栏框确定为属于同一联运单。
进一步地,在合成框群后,还需进行对各个框群进行判断是否每个框群均包括寄方框、寄方栏框、收方框和收方栏框这四种框。
步骤S3:选择任一框群中的寄方栏框或收方栏框,比较其高度与宽度两者间的大小,并结合寄方框和收方框的相对位置关系,识别出待摆正运单图片的当前姿态。
在步骤S3中,通过比较寄方栏框或收方栏框的高度与宽度两者间的大小,即可确认该待摆正运单图片是处于摆正或倒立姿态,还是处于左旋90°或右旋90°姿态,再结合寄方框与收方框之间的相对位置关系,即可识别出待摆正运单图片的当前姿态,需要说明的是,若寄方框和收方框的高度与宽度不相等的情况下,也可采用寄方框或收方框来进行判断,通常情况下,寄方框和收方框的高度与宽度差由于较小,而寄方栏框和收方栏框的高度与宽度差相差较大,所以优先采用寄方栏框或收方栏框来进行判断。
具体地,如图5所示,步骤S3包括:
步骤S31:选择任一框群中寄方栏框信息或收方栏框信息,比较寄方栏框或收方栏框的宽度与高度的大小。
在步骤S31中,通过比较寄方栏框或收方栏框的宽度与高度的大小,从而确认该待摆正运单图片处于摆正或倒立姿态,还是处于顺时针旋转90°或逆时针旋转90°姿态。
步骤S32:判断宽度是否小于高度。
在步骤S32中,若宽度小于高度,则说明该待摆正运单图片处于顺时针旋转90°或逆时针旋转90°姿态,此时执行步骤S33;若宽度大于高度,则说明该待摆正运单图片处于摆正或倒立姿态,此时执行步骤S34。
步骤S33:判断寄方框的中心点的X轴坐标值是否大于收方框的中心点的X轴坐标值,若是,则待摆正运单图片当前姿态相对于摆正姿态,顺时针旋转了90°,若否,则待摆正运单图片当前姿态相对于摆正姿态,逆时针旋转了90°。
在步骤S33中,当确定待摆正运单图片处于顺时针旋转90°或逆时针旋转90°姿态时,则可通过寄方框的中心点的X轴坐标值与收方框的中心点的X轴坐标值的大小关系来确定寄方框和收方框之间的位置关系。当寄方框的中心点的X轴坐标值小于收方框的中心点的X轴坐标值时,说明寄方框在收方框左侧,则该待摆正运单图片当前姿态相对于摆正姿态,逆时针旋转了90°;当寄方框的中心点的X轴坐标值大于收方框的中心点的X轴坐标值时,说明寄方框在收方框右侧,则该待摆正运单图片当前姿态相对于摆正姿态,顺时针旋转了90°。
步骤S34:判断寄方框的中心点的Y轴坐标值是否大于收方框的中心点的Y轴坐标值时,若是,则待摆正运单图片当前姿态相对于摆正姿态,旋转了0°,若否,则待摆正运单图片当前姿态相对于摆正姿态,旋转了180°。
在步骤S34中,当确定待摆正运单图片处于摆正或倒立姿态时,则可通过寄方框的中心点的Y轴坐标值与收方框的中心点的Y轴坐标值的大小关系来确定寄方框和收方框之间的位置关系。当寄方框的中心点的Y轴坐标值小于收方框的中心点的Y轴坐标值时,说明寄方框在收方框下侧,则该待摆正运单图片当前姿态相对于摆正姿态,旋转了180°,即倒立姿态;当寄方框的中心点的Y轴坐标值大于收方框的中心点的Y轴坐标值时,说明寄方框在收方框上侧,则该待摆正运单图片当前姿态相对于摆正姿态,旋转了0°,即摆正姿态。
步骤S4:根据当前姿态,将待摆正运单图片进行旋转摆正;摆正后的运单图片中,寄方框和寄方栏框并排,收方框在寄方框正下方,收方栏框在寄方栏框正下方。
具体地,若通过上述步骤判断出待摆正运单图片处于顺时针旋转90°姿态,则待摆正运单图片将逆时针旋转90°进行摆正;若判断出待摆正运单图片处于逆时针90°姿态,则待摆正运单图片将顺时针旋转90°进行摆正;若判断出待摆正运单图片处于摆正姿态,则待摆正运单图片保持现有姿态不变;若判断出待摆正运单图片处于倒立姿态,则待摆正运单图片将逆时针或顺时针旋转180°进行摆正。
本实施例利用训练好的YoloV3模型检测出运单图片中的寄方框、寄方栏框、收方框和收方栏框的信息,并将属于同一联运单的寄方框、寄方栏框、收方框和收方栏框合成在同一框群中,避免多联运单对图片摆正的影响,再根据寄方栏框或收方栏框的高度与宽度之间的大小识别出运单图片的当前姿态,根据当前姿态将运单图片进行旋转摆正,其充分利用了运单的布局特征,并通过YoloV3模型识别出寄方框、寄方栏框、收方框和收方栏框的信息,进而确认运单图片的当前姿态,从而对运单图片进行自动摆正,其无需工作人员进行手动进行摆正,降低了工作人员的工作量,提升了运单信息的录入效率。
图6是本发明实施例的基于YoloV3模型的物流运单图片摆正系统的功能模块示意图。如图6所示,该基于YoloV3模型的物流运单图片摆正系统包括检测模块10、合成模块11、识别模块12和摆正模块13。
其中,检测模块10,用于将待摆正运单图片输入至训练好的YoloV3模型进行检测,得到待摆正运单图片中的寄方框、寄方栏框、收方框和收方栏框的信息;待摆正运单图片中的寄方框、寄方栏框、收方框和收方栏框的信息包括各个框的高度、宽度以及中心点坐标;合成模块11,用于将属于同一联运单的寄方框、寄方栏框、收方框和收方栏框合成在同一框群中;识别模块12,用于选择任一框群中的寄方栏框或收方栏框,比较其高度与宽度两者间的大小,并结合寄方框和收方框的相对位置关系,识别出待摆正运单图片的当前姿态;摆正模块13,用于根据当前姿态,将待摆正运单图片进行旋转摆正;摆正后的运单图片中,寄方框和寄方栏框并排,收方框在寄方框正下方,收方栏框在寄方栏框正下方。
上述实施例的基础上,其他实施例中,如图7所示,识别模块12包括第一比较单元121、第一判断单元122、第一姿态确定单元123和第二姿态确定单元124。
其中,第一比较单元121,用于选择任一框群中寄方栏框信息或收方栏框信息,比较寄方栏框或收方栏框的宽度与高度的大小;第一判断单元122,用于判断宽度是否小于高度;第一姿态确定单元123,用于当宽度小于高度时,判断寄方框的中心点的X轴坐标值是否大于收方框的中心点的X轴坐标值,若是,则待摆正运单图片当前姿态相对于摆正姿态,顺时针旋转了90°,若否,则待摆正运单图片当前姿态相对于摆正姿态,逆时针旋转了90°;第二姿态确定单元124,用于当宽度大于高度时,判断寄方框的中心点的Y轴坐标值是否大于收方框的中心点的Y轴坐标值时,若是,则待摆正运单图片当前姿态相对于摆正姿态,旋转了0°,若否,则待摆正运单图片当前姿态相对于摆正姿态,旋转了180°。
上述实施例的基础上,其他实施例中,如图8所示,合成模块11包括计算单元111、第二比较单元112、框群合成单元113。
其中,计算单元111,用于选择寄方框、寄方栏框、收方框和收方栏框中任意一框依次与除该框以外的其他框进行计算中心点距离;第二比较单元112,用于比较中心点距离和预设距离阈值的大小;框群合成单元113,用于将中心点距离小于预设距离阈值的寄方框、寄方栏框、收方框和收方栏框确定为属于同一联运单,进而合成在同一框群中。
上述实施例的基础上,其他实施例中,如图9所示,合成模块11还包括第二判断单元114、第一设定模块115、第二设定模块116。
其中,第二判断单元114,用于选择任一寄方栏框或收方栏框,判断其高度是否小于宽度;第一设定模块115,用于当任一寄方栏框或收方栏框的高度小于宽度时,预设距离阈值设定为待摆正运单图片的高度的1/4;第二设定模块116,用于当任一寄方栏框或收方栏框的高度大于宽度时,预设距离阈值设定为待摆正运单图片的宽度的1/4。
上述实施例的基础上,其他实施例中,如图10所示,还包括样本获取模块14、标注模块15、训练模块16。
其中,样本获取模块14,用于获取样本图片,将样本图片进行数据清洗以及数据增强,得到目标图片;标注模块15,用于对目标图片中的寄方框、寄方栏框、收方框和收方栏框进行打标,生成标注信息;标注信息包括目标图片中各个框的中心点的X轴坐标、Y轴坐标,以及各个框的宽度和高度;训练模块16,用于将目标图片和标注信息输入至YoloV3模型进行训练。
关于上述五个实施例基于YoloV3模型的物流运单图片摆正系统中各模块实现技术方案的其他细节,可参见上述实施例中的基于YoloV3模型的物流运单图片摆正方法中的描述,此处不再赘述。
需要说明的是,本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。对于系统类实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上对发明的具体实施方式进行了详细说明,但其只作为范例,本发明并不限制于以上描述的具体实施方式。对于本领域的技术人员而言,任何对该发明进行的等同修改或替代也都在本发明的范畴之中,因此,在不脱离本发明的精神和原则范围下所作的均等变换和修改、改进等,都应涵盖在本发明的范围内。

Claims (10)

1.一种基于YoloV3模型的物流运单图片摆正方法,其特征在于,包括:
S1、将待摆正运单图片输入至训练好的YoloV3模型进行检测,得到所述待摆正运单图片中的寄方框、寄方栏框、收方框和收方栏框的信息;所述待摆正运单图片中的寄方框、寄方栏框、收方框和收方栏框的信息包括各个框的高度、宽度以及中心点坐标;
S2、将属于同一联运单的寄方框、寄方栏框、收方框和收方栏框合成在同一框群中;
S3、选择任一框群中的寄方栏框或收方栏框,比较其高度与宽度两者间的大小,并结合寄方框和收方框的相对位置关系,识别出所述待摆正运单图片的当前姿态;
S4、根据当前姿态,将所述待摆正运单图片进行旋转摆正;摆正后的运单图片中,寄方框和寄方栏框并排,收方框在寄方框正下方,收方栏框在寄方栏框正下方。
2.根据权利要求1所述的物流运单图片摆正方法,其特征在于,所述步骤S3包括:
S31、选择任一框群中寄方栏框信息或收方栏框信息,比较所述寄方栏框或收方栏框的宽度与高度的大小;
S32、判断宽度是否小于高度;
S33、若是,判断寄方框的中心点的X轴坐标值是否大于收方框的中心点的X轴坐标值,若是,则待摆正运单图片当前姿态相对于摆正姿态,顺时针旋转了90°,若否,则待摆正运单图片当前姿态相对于摆正姿态,逆时针旋转了90°;
S34、若否,判断寄方框的中心点的Y轴坐标值是否大于收方框的中心点的Y轴坐标值时,若是,则待摆正运单图片当前姿态相对于摆正姿态,旋转了0°,若否,则待摆正运单图片当前姿态相对于摆正姿态,旋转了180°。
3.根据权利要求1所述的物流运单图片摆正方法,其特征在于,所述步骤S2包括:
S21、选择所述寄方框、寄方栏框、收方框和收方栏框中任意一框依次与除该框以外的其他框进行计算中心点距离;
S22、比较所述中心点距离和预设距离阈值的大小;
S23、将所述中心点距离小于预设距离阈值的寄方框、寄方栏框、收方框和收方栏框确定为属于同一联运单,进而合成在同一框群中。
4.根据权利要求3所述的物流运单图片摆正方法,其特征在于,所述步骤S22之前,还包括:
选择任一寄方栏框或收方栏框,判断其高度是否小于宽度;
若是,所述预设距离阈值设定为所述待摆正运单图片的高度的1/4;
若否,所述预设距离阈值设定为所述待摆正运单图片的宽度的1/4。
5.根据权利要求1所述的物流运单图片摆正方法,其特征在于,所述训练好的YoloV3模型通过如下步骤得到:
获取样本图片,将所述样本图片进行数据清洗以及数据增强,得到目标图片;
对所述目标图片中的寄方框、寄方栏框、收方框和收方栏框进行打标,生成标注信息;所述标注信息包括目标图片中各个框的中心点的X轴坐标、Y轴坐标,以及各个框的宽度和高度;
将所述目标图片和标注信息输入至YoloV3模型进行训练。
6.一种基于YoloV3模型的物流运单图片摆正系统,其特征在于,包括:
检测模块,用于将待摆正运单图片输入至训练好的YoloV3模型进行检测,得到所述待摆正运单图片中的寄方框、寄方栏框、收方框和收方栏框的信息;所述待摆正运单图片中的寄方框、寄方栏框、收方框和收方栏框的信息包括各个框的高度、宽度以及中心点坐标;
合成模块,用于将属于同一联运单的寄方框、寄方栏框、收方框和收方栏框合成在同一框群中;
识别模块,用于选择任一框群中的寄方栏框或收方栏框,比较其高度与宽度两者间的大小,并结合寄方框和收方框的相对位置关系,识别出所述待摆正运单图片的当前姿态;
摆正模块,用于根据当前姿态,将所述待摆正运单图片进行旋转摆正;摆正后的运单图片中,寄方框和寄方栏框并排,收方框在寄方框正下方,收方栏框在寄方栏框正下方。
7.根据权利要求6所述的物流运单图片摆正系统,其特征在于,所述识别模块包括:
第一比较单元,用于选择任一框群中寄方栏框信息或收方栏框信息,比较所述寄方栏框或收方栏框的宽度与高度的大小;
第一判断单元,用于判断宽度是否小于高度;
第一姿态确定单元,用于当宽度小于高度时,判断寄方框的中心点的X轴坐标值是否大于收方框的中心点的X轴坐标值,若是,则待摆正运单图片当前姿态相对于摆正姿态,顺时针旋转了90°,若否,则待摆正运单图片当前姿态相对于摆正姿态,逆时针旋转了90°;
第二姿态确定单元,用于当宽度大于高度时,判断寄方框的中心点的Y轴坐标值是否大于收方框的中心点的Y轴坐标值时,若是,则待摆正运单图片当前姿态相对于摆正姿态,旋转了0°,若否,则待摆正运单图片当前姿态相对于摆正姿态,旋转了180°。
8.根据权利要求6所述的物流运单图片摆正系统,其特征在于,所述合成模块包括:
计算单元,用于选择所述寄方框、寄方栏框、收方框和收方栏框中任意一框依次与除该框以外的其他框进行计算中心点距离;
第二比较单元,用于比较所述中心点距离和预设距离阈值的大小;
框群合成单元,用于将所述中心点距离小于预设距离阈值的寄方框、寄方栏框、收方框和收方栏框确定为属于同一联运单,进而合成在同一框群中。
9.根据权利要求8所述的物流运单图片摆正系统,其特征在于,所述合成模块还包括:
第二判断单元,用于选择任一寄方栏框或收方栏框,判断其高度是否小于宽度;
第一设定模块,用于当任一寄方栏框或收方栏框的高度小于宽度时,所述预设距离阈值设定为所述待摆正运单图片的高度的1/4;
第二设定模块,用于当任一寄方栏框或收方栏框的高度大于宽度时,所述预设距离阈值设定为所述待摆正运单图片的宽度的1/4。
10.根据权利要求6所述的物流运单图片摆正系统,其特征在于,还包括:
样本获取模块,用于获取样本图片,将所述样本图片进行数据清洗以及数据增强,得到目标图片;
标注模块,用于对所述目标图片中的寄方框、寄方栏框、收方框和收方栏框进行打标,生成标注信息;所述标注信息包括目标图片中各个框的中心点的X轴坐标、Y轴坐标,以及各个框的宽度和高度;
训练模块,用于将所述目标图片和标注信息输入至YoloV3模型进行训练。
CN202010350278.7A 2020-04-28 2020-04-28 基于YoloV3模型的物流运单图片摆正方法及系统 Active CN111695558B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010350278.7A CN111695558B (zh) 2020-04-28 2020-04-28 基于YoloV3模型的物流运单图片摆正方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010350278.7A CN111695558B (zh) 2020-04-28 2020-04-28 基于YoloV3模型的物流运单图片摆正方法及系统

Publications (2)

Publication Number Publication Date
CN111695558A true CN111695558A (zh) 2020-09-22
CN111695558B CN111695558B (zh) 2023-08-04

Family

ID=72476664

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010350278.7A Active CN111695558B (zh) 2020-04-28 2020-04-28 基于YoloV3模型的物流运单图片摆正方法及系统

Country Status (1)

Country Link
CN (1) CN111695558B (zh)

Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110052062A1 (en) * 2009-08-25 2011-03-03 Patrick Chiu System and method for identifying pictures in documents
CN107766809A (zh) * 2017-10-09 2018-03-06 平安科技(深圳)有限公司 电子装置、票据信息识别方法和计算机可读存储介质
CN107862303A (zh) * 2017-11-30 2018-03-30 平安科技(深圳)有限公司 表格类图像的信息识别方法、电子装置及可读存储介质
CN108805800A (zh) * 2018-04-24 2018-11-13 北京嘀嘀无限科技发展有限公司 图片处理方法、装置及存储介质
WO2019071660A1 (zh) * 2017-10-09 2019-04-18 平安科技(深圳)有限公司 票据信息识别方法、电子装置及可读存储介质
CN109740548A (zh) * 2019-01-08 2019-05-10 北京易道博识科技有限公司 一种报销票据图像分割方法及系统
CN110472524A (zh) * 2019-07-25 2019-11-19 广东工业大学 基于深度学习的发票信息管理方法、系统和可读介质
CN110490198A (zh) * 2019-08-12 2019-11-22 上海眼控科技股份有限公司 文本方向校正方法、装置、计算机设备和存储介质
WO2019227615A1 (zh) * 2018-06-01 2019-12-05 平安科技(深圳)有限公司 校正发票图像的方法、装置、计算机设备和存储介质
CN110765910A (zh) * 2019-10-14 2020-02-07 西安网算数据科技有限公司 一种密集场景下的票据区域识别方法及装置
CN110826520A (zh) * 2019-11-14 2020-02-21 燕山大学 一种基于改进YOLOv3-tiny算法的港口抓斗检测方法
CN110991435A (zh) * 2019-11-27 2020-04-10 南京邮电大学 一种基于深度学习的快递运单关键信息定位方法和装置
US20200126261A1 (en) * 2017-07-28 2020-04-23 Zhejiang Dahua Technology Co., Ltd. Systems and methods for image processing

Patent Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110052062A1 (en) * 2009-08-25 2011-03-03 Patrick Chiu System and method for identifying pictures in documents
US20200126261A1 (en) * 2017-07-28 2020-04-23 Zhejiang Dahua Technology Co., Ltd. Systems and methods for image processing
CN107766809A (zh) * 2017-10-09 2018-03-06 平安科技(深圳)有限公司 电子装置、票据信息识别方法和计算机可读存储介质
WO2019071660A1 (zh) * 2017-10-09 2019-04-18 平安科技(深圳)有限公司 票据信息识别方法、电子装置及可读存储介质
CN107862303A (zh) * 2017-11-30 2018-03-30 平安科技(深圳)有限公司 表格类图像的信息识别方法、电子装置及可读存储介质
CN108805800A (zh) * 2018-04-24 2018-11-13 北京嘀嘀无限科技发展有限公司 图片处理方法、装置及存储介质
WO2019227615A1 (zh) * 2018-06-01 2019-12-05 平安科技(深圳)有限公司 校正发票图像的方法、装置、计算机设备和存储介质
CN109740548A (zh) * 2019-01-08 2019-05-10 北京易道博识科技有限公司 一种报销票据图像分割方法及系统
CN110472524A (zh) * 2019-07-25 2019-11-19 广东工业大学 基于深度学习的发票信息管理方法、系统和可读介质
CN110490198A (zh) * 2019-08-12 2019-11-22 上海眼控科技股份有限公司 文本方向校正方法、装置、计算机设备和存储介质
CN110765910A (zh) * 2019-10-14 2020-02-07 西安网算数据科技有限公司 一种密集场景下的票据区域识别方法及装置
CN110826520A (zh) * 2019-11-14 2020-02-21 燕山大学 一种基于改进YOLOv3-tiny算法的港口抓斗检测方法
CN110991435A (zh) * 2019-11-27 2020-04-10 南京邮电大学 一种基于深度学习的快递运单关键信息定位方法和装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
O. LAVIALLE; X. MOLINES; F. ANGELLA; P. BAYLOU: "《Active contours network to straighten distorted text lines》", 《PROCEEDINGS 2001 INTERNATIONAL CONFERENCE ON IMAGE PROCESSING (CAT. NO.01CH37205)》, pages 748 - 751 *
黄梦涛,黎译繁: "《面向快递分拣的二维码定位与校正方法》", 《科学技术与工程》, vol. 19, no. 3, pages 153 - 157 *

Also Published As

Publication number Publication date
CN111695558B (zh) 2023-08-04

Similar Documents

Publication Publication Date Title
CN108549843A (zh) 一种基于图像处理的增值税发票识别方法
CN106971406B (zh) 物体位姿的检测方法和装置
CN110991435A (zh) 一种基于深度学习的快递运单关键信息定位方法和装置
JP2007245283A (ja) ワーク姿勢検知装置、ワーク姿勢検知方法、ピッキングシステム、およびピッキング方法
CN108416355A (zh) 一种基于机器视觉的工业现场生产数据的采集方法
WO1993015376A1 (en) System for recognizing and tracking target mark, and method therefor
CN111860527A (zh) 图像校正方法、图像校正装置、计算机设备及存储介质
CN113664838B (zh) 机器人定位放置控制方法、装置、电子设备及存储介质
TWI823463B (zh) 標籤完整度自適應檢測方法及系統
CN110281240A (zh) 液晶显示屏玻璃定位、拾取方法及系统和视觉处理系统
CN115272446B (zh) 一种堆头占地面积计算的方法和系统
CN114187253A (zh) 一种电路板零件安装检测方法
CN113947714A (zh) 一种视频监控和遥感的多模态协同优化方法及系统
CN111428743B (zh) 商品识别方法、商品处理方法、装置及电子设备
CN111784238A (zh) 电子围栏分单方法、装置、终端设备及存储介质
CN115100657A (zh) 电气cad图纸扫描图的字符与带宽度的线条识别方法
CN111695558A (zh) 基于YoloV3模型的物流运单图片摆正方法及系统
CN110955797B (zh) 用户位置确定方法、装置、电子设备及存储介质
CN116563876A (zh) 一种发票识别方法
CN111046770A (zh) 一种照片档案人物自动标注方法
CN116030013A (zh) 多目标多类别破损缺陷检测方法、系统及计算机存储介质
CN106648171B (zh) 一种基于书写笔的交互系统及方法
CN115565171A (zh) 安检图像关联标注方法及装置
CN112507838B (zh) 一种指针表计识别方法、装置和电力巡检机器人
CN113610079A (zh) 一种基于机器视觉技术的虚拟水文标尺建立方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: 518000 floor 4, building a, Lufthansa aviation Park, hourui community, Hangcheng street, Bao'an District, Shenzhen City, Guangdong Province

Applicant after: Shenzhen Leap New Technology Co.,Ltd.

Address before: 518000 Room 201, building A, No. 1, Qian Wan Road, Qianhai Shenzhen Hong Kong cooperation zone, Shenzhen, Guangdong (Shenzhen Qianhai business secretary Co., Ltd.)

Applicant before: Shenzhen Leap New Technology Co.,Ltd.

CB02 Change of applicant information
GR01 Patent grant
GR01 Patent grant