CN116110037B - 一种基于视觉识别的图书盘点方法、装置和终端设备 - Google Patents

一种基于视觉识别的图书盘点方法、装置和终端设备 Download PDF

Info

Publication number
CN116110037B
CN116110037B CN202310377032.2A CN202310377032A CN116110037B CN 116110037 B CN116110037 B CN 116110037B CN 202310377032 A CN202310377032 A CN 202310377032A CN 116110037 B CN116110037 B CN 116110037B
Authority
CN
China
Prior art keywords
image
bar code
bookshelf
unit
bookshelf image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202310377032.2A
Other languages
English (en)
Other versions
CN116110037A (zh
Inventor
张立志
吴旭镇
张立雄
林颖
陈美文
王金楠
占世琳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huato System Co ltd
Original Assignee
Huato System Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huato System Co ltd filed Critical Huato System Co ltd
Priority to CN202310377032.2A priority Critical patent/CN116110037B/zh
Publication of CN116110037A publication Critical patent/CN116110037A/zh
Application granted granted Critical
Publication of CN116110037B publication Critical patent/CN116110037B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/62Text, e.g. of license plates, overlay texts or captions on TV images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/26Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
    • G06V10/267Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/1444Selective acquisition, locating or processing of specific regions, e.g. highlighted text, fiducial marks or predetermined fields
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/15Cutting or merging image elements, e.g. region growing, watershed or clustering-based techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/22Character recognition characterised by the type of writing
    • G06V30/224Character recognition characterised by the type of writing of printed characters having additional code marks or containing code marks
    • G06V30/2247Characters composed of bars, e.g. CMC-7
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Image Analysis (AREA)

Abstract

本申请属于图像处理技术领域,尤其涉及一种基于视觉识别的图书盘点方法、装置和终端设备,包括:获取书架图像并对书架图像进行预处理;对书架图像进行横向识别,对书架图像进行纵向识别,得到条码区域;将书架图像分割为若干个单元图像;由每个单元图像在书架图像中的位置得到单元图像的坐标;对包含条码的单元图像进行清晰化处理;对清晰化处理的单元图像进行条码解析;判断条码解析的结果是否与在库图书对应,若是,根据条码所在的单元图像的坐标与实际空间位置的对应关系确定条码对应的图书的实际位置并登记。本发明通过图像拍摄并处理,可以实现整个书架图像范围内的图书的批量盘点,提高了工作效率,节约了人力。

Description

一种基于视觉识别的图书盘点方法、装置和终端设备
技术领域
本申请属于图像处理技术领域,尤其涉及一种基于视觉识别的图书盘点方法、装置和终端设备。
背景技术
图书馆的馆藏图书可以分为电子图书以及纸质图书两大类,其中纸质图书的流通广泛,针对纸质图书的采购、收藏、服务等一系列工作在图书馆日常工作中占比非常大。在纸质图书的采购,编目,典藏,借阅,咨询,推广等一系列读者服务过程中,典藏和借阅节点中的盘点工作是图书馆日常服务工作的重要环节。
目前常用的图书盘点方案有两种,第一种盘点方案是扫描馆藏条码号盘点,第二种盘点方案是扫描RFID标签盘点。第一种方案使用条码扫描枪扫描图书首页的馆藏条码号,然后人工逐本处理,将扫描数据录入计算机系统。该方案耗时长,劳动强度大,人力成本高。第二种方案预先将每一本图书贴上RFID标签,然后上架,盘点时人工握持RFID阅读器采集图书数据,然后录入计算机系统。该方案比第一种方案在处理速度和数据采集上有较大优势,但是经济成本过高。
如何提高图书的盘点效率是需要解决的问题。
发明内容
有鉴于此,本申请实施例提供了一种基于视觉识别的图书盘点方法、装置和终端设备,可以解决如何提高图书的盘点效率的问题。
本申请实施例的第一方面提供了一种基于视觉识别的图书盘点方法,所述基于视觉识别的图书盘点方法包括:
获取书架图像并对书架图像进行预处理;
利用水平视窗对预处理后的书架图像进行横向识别,利用竖直视窗对预处理后的书架图像进行纵向识别,由横向识别以及纵向识别的结果得到条码区域;
将书架图像分割为若干个单元图像,使书架图像中的每个条码均被分割到独立的单元图像中;
由每个单元图像在书架图像中的位置得到单元图像的坐标;
对包含条码的单元图像进行清晰化处理;
对清晰化处理的单元图像进行条码解析;
判断条码解析的结果是否与在库图书对应,若是,根据条码所在的单元图像的坐标与实际空间位置的对应关系确定条码对应的图书的实际位置并登记;
其中:水平视窗的高度为一个像素,宽度与书架图像的宽度相等;竖直视窗的宽度为一个像素,高度与书架图像的高度相等。
本申请实施例的第二方面提供了一种基于视觉识别的图书盘点装置,所述基于视觉识别的图书盘点装置包括:
获取模块,用于获取书架图像并对书架图像进行预处理;
识别模块,用于利用水平视窗对预处理后的书架图像进行横向识别,利用竖直视窗对预处理后的书架图像进行纵向识别,由横向识别以及纵向识别的结果得到条码区域;
分割模块,用于将书架图像分割为若干个单元图像,使书架图像中的每个条码均被分割到独立的单元图像中;
坐标获取模块,用于由每个单元图像在书架图像中的位置得到单元图像的坐标;
清晰化处理模块,用于对包含条码的单元图像进行清晰化处理;
解析模块,用于对清晰化处理的单元图像进行条码解析;
判断登记模块,用于判断条码解析的结果是否与在库图书对应,若是,根据条码所在的单元图像的坐标与实际空间位置的对应关系确定条码对应的图书的实际位置并登记;
其中:水平视窗的高度为一个像素,宽度与书架图像的宽度相等;竖直视窗的宽度为一个像素,高度与书架图像的高度相等。
本申请实施例的第三方面提供了一种终端设备,所述终端设备包括存储器、处理器,所述存储器上存储有可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如本发明所述基于视觉识别的图书盘点方法的步骤。
本申请实施例与现有技术相比存在的有益效果是:本申请借助图像识别的方式实现对在架图像的批量盘点,区别于现有技术采用扫描枪或者RFID阅读器逐一扫描的方式,本申请的方案可以显著提高盘点效率,减少人力成本。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的基于视觉识别的图书盘点的实现流程示意图;
图2是本申请实施例提供的基于视觉识别的图书盘点装置的结构示意图;
图3是本申请实施例提供的终端设备的示意图。
具体实施方式
以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本申请实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本申请。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本申请的描述。
为了说明本申请所述的技术方案,下面通过具体实施例来进行说明。
图1示出了本申请实施例一提供的基于视觉识别的图书盘点方法,详述如下:一种基于视觉识别的图书盘点方法,所述图像饱和度调整方法包括:
获取书架图像并对书架图像进行预处理;
利用水平视窗对预处理后的书架图像进行横向识别,利用竖直视窗对预处理后的书架图像进行纵向识别,由横向识别以及纵向识别的结果得到条码区域;
将书架图像分割为若干个单元图像,使书架图像中的每个条码均被分割到独立的单元图像中;
由每个单元图像在书架图像中的位置得到单元图像的坐标;
对包含条码的单元图像进行清晰化处理;
对清晰化处理的单元图像进行条码解析;
判断条码解析的结果是否与在库图书对应,若是,根据条码所在的单元图像的坐标与实际空间位置的对应关系确定条码对应的图书的实际位置并登记;
其中:水平视窗的高度为一个像素,宽度与书架图像的宽度相等;竖直视窗的宽度为一个像素,高度与书架图像的高度相等。
在本申请中,书架图像通过摄像头采集,摄像头可以是固定设置于书架上(拍摄对面书架),也可以设置于图书馆天花板上,使得每个摄像头与书架的位置相对固定,从而使拍摄所得图像中的位置与具体的书架位置能够形成对应关系;当然,作为更一般的方案,摄像头设置于天花板上,且采用可旋转摄像头,则一个摄像头可以拍摄多个书架的图像,减少硬件成本。作为另一种可选的具体方案,摄像头可以设置于移动推车上,当需要对图书进行盘点时,由工作人员推动移动推车依次对每个书架进行图像采集,可以实现快速的批量盘点;作为更进一步的方案,图书馆中可以设置移动机器人,由移动机器人在设定时间对书架进行图像采集,此可以实现自动化的图像采集盘点,减少人成本,提高效率。在本申请中,需要说明的是,条码贴附于图书背棱上,图书摆放于书架上时,条码朝外可见,本发明主要针对此种形式的图书进行批量盘点。
在本申请中,对采集到的书架图像进行预处理可以便于后续的图像处理,提高图像处理的准确性。
在本申请中,图书在书架上的摆放通常为竖向或者横向,而贴附于图书上的条码朝向同样为竖向或者横向,故通过水平视察以及竖直视窗分别对采集到的图像进行识别,可以更准确全面地识别出图像中包含的条形码。在本实施例中,通过像素处理可以实现对条码的识别,而不需要使用如神经网络、AI等需要大量数据进行训练的处理模型。
在本申请中,对条码区域进行识别后,对书架图像进行分割从而得到每个单元图像在书架图像中的坐标,便于将条码的位置与书架的实际位置对应,从而实现对图书的盘点。
在本申请中,还包括对包含条码的单元图像进行清晰化处理的步骤,通过对单元图像进行清晰化处理,可以提高单元图像的清晰度,从而便于条码识别器更准确地解晰出条码内容。
在本申请中,获得条码解晰内容后,通过条码所在单元图像的坐标与书架的实际空间坐标的对应确定图书的实际位置(具体到书架号以及层数),从而实现对图书的盘点登记。在本申请中,在库图书是指图书馆内有登记的图像,并不是指在架图书。
本申请借助图像识别的方式实现对在架图像的批量盘点,区别于现有技术采用扫描枪或者RFID阅读器逐一扫描的方式,本申请的方案可以显著提高盘点效率,减少人力成本。
在本申请一个实施例中,所述对书架图像进行预处理,包括:
对书架图像进行缩放处理以使书架图像尺寸标准化;
采用双边滤波对书架图像进行去噪处理。
在本申请中,通过统一尺寸的方式可以便于图像的识别以及对比,具体的图像尺寸可以由用户自行设定,本申请在此不作进一步限定。
在本申请中,双边滤波是一种非线性滤波方法,通过计算邻域像素的加权平均值来替代当前像素的值。双边滤波不仅考虑像素之间的距离,还考虑像素之间的相似度,能够保留图像的边缘信息和细节信息。对于双边滤波的具体参数设定可以参考现有技术,本申请中采用双边滤波用于对书架图像进行去噪,并不会改变书架图像的本质信息,不会对图像的识别处理产生本质影响。
在本申请一个实施例中,所述利用水平视窗对预处理后的书架图像进行横向识别,利用竖直视窗对预处理后的书架图像进行纵向识别,由横向识别以及纵向识别的结果得到条码区域,包括:
将水平视窗置于书架图像顶部,从左往右,识别水平视窗内的黑色像素以及白色像素;
将连续的黑色像素作为一个黑色组,将连续的白色像素作为一个白色组,得到若干个黑色组以及若干个白色组;
筛选像素的数量在设定范围的黑色组以及白色组;
判断筛选结果中是否存在若干相邻且交错排布的黑色组以及白色组,若存在,则得到纵向条码区域;
以一个像素为步距将水平视窗向下移动,识别所有纵向条码区域;
将竖直视窗置于书架图像左侧,从上往下,识别竖直视窗内的黑色像素以及白色像素;
将连续的黑色像素作为一个黑色组,将连续的白色像素作为一个白色组,得到若干个黑色组以及若干个白色组;
筛选像素的数量在设定范围的黑色组以及白色组;
判断筛选结果中是否存在若干相邻且交错排布的黑色组以及白色组,若存在,则得到横向条码区域;
以一个像素为步距将竖直视窗向右移动,识别所有横向条码区域;
合并上下相邻的纵向条码区域、合并左右相邻的横向条码区域。
在本申请中,通过上述方法可以快速准确地实现书架图像中条码的识别,该方法完全基于图像的像素处理,不需要采用复杂的算法模型。在本实施例中,黑像素即RGB色值均为0的像素,而白像素为RGB色值均为255的像素,可以设置一定的容差以防止图像中的色彩偏差无法识别,例如对于黑色像素,色值范围可以放宽到0-30,而对白色像素,色值范围可以放宽到225-255,此为可选的具体设置,本申请对此不作具体限定。
在本申请中,条码是由交错排列的黑白条构成的,本申请通过识别黑白像素的方式识别条码。由于条码的相对宽度是有标准的,故还需要对黑色组以及白色组的像素的数量。本申请是摄像头相对于书架固定的方式来举例,此时图像的大小相对固定,条码中黑色组与白色组的像素的数量是相对固定的,具体的数量由书架图像宽度与其拍摄的实际宽度的比值、条码中条纹的实际宽度可以确定,不同的场景下其值不同,本申请对此不作进一步限定。作为可选的进一步方案,可以通过限定像素最多黑色组与像素最少的白色组的比、像素最多白色组与像素最少的黑色组的比来进行筛选,计算所得的比例应小于等于条码中黑色条纹与白色条纹宽度的最大比值、白色条纹与黑色条纹宽度的最大比值,这种方式不是对单一的组(条纹)进行筛选,这种方式与图像与实际场景的比例无关,但是计算量较前述方式大。
在本申请中,利用水平视窗对纵向的条码(指条码的条纹长度沿纵向)进行识别,利用竖直的视窗对横向的条码(指条码的条纹长度沿横向)进行识别,识别后对上下相邻的纵向条码进行合并、对左右相邻的横向条码进行合并从而可以得到识别出的条码区域。在本实施例中,条码的相邻是指视窗在移动前后识别到的具有相同的黑白组且黑白组的位置同样相同。
在本申请一个实施例中,所述将书架图像分割为若干个单元图像,包括:
根据每个合并后的条码区域的最大横向尺寸以及最大纵向尺寸为分别为每个合并后的条码区域生成一个矩形框;
使生成的矩形框的中心与合并后的条码区域的中心重合;
由生成的矩形框对书架图像进行裁切得到若干个单元图像。
在本申请中,进一步地,使生成的矩形框的边与条码区域的边平行且两者保持一个固定距离,该距离可以设定到3-5个像素的高度或者宽度。利用生成的矩形框对书架图像进行裁切可以得到若干个包含条码的单元图像。
在本申请一个实施例中,所述由每个单元图像在书架图像中的位置得到单元图像的坐标,包括:
选定书架图像的左下角为原点,以书架图像的宽度方向为X轴,以书架图像的高度方向为Y轴,
确定每个单元图像的中心点对应的X坐标以及Y坐标得到每个单元图像的坐标。
在本申请中,通过上述方式可以得到每个单元图像在书架图像中的坐标。在本实施例中,在X 方向可以每个像素的长度作为单位长度,而在Y 方向,可以每个像素的宽度作为单位长度。
在本申请一个实施例中,所述对包含条码的单元图像进行清晰化处理,包括:
采用高斯拉普拉斯算子对包含条码的单元图像进行锐化处理。
在本申请中,锐化滤波是一种通过增强图像边缘信息来提高图像清晰度的方法,本申请采用现有技术提供的高斯拉普拉斯算子实现单元图像的锐化处理。
在本申请一个实施例中,所述对清晰化处理的单元图像进行条码解析,包括:
输出清晰化处理的单元图像到条码识别器,获取条码识别器的解析结果。
在本申请中,对条码图像进行识别处理采用的条码识别器,条码识别器通过扫描包含条码的图像可以识别出条码信息,条码识别器属于现有硬件设备,本申请对于条码识别器的具体构成以及工作原理不作进一步限定。
在本申请一个实施例中,所述根据条码所在的单元图像的坐标与实际空间位置的对应关系确定条码对应的图书的实际位置并登记,包括:
确定每张书架图像对应的书架;
根据条码所在的单元图像的坐标得到该条码在书架的对应位置;
由条码的解析结果得到每个条码对应的书籍信息,将书籍信息确定出的条码所在位置绑定并登记。
在本申请中,当摄像头与书架之间为固定设置时,通过摄像头与书架的对应关系可以直接得到每张书架图像对应的书架;当摄像头与书架非固定设置时,每次采集书架图像时需要设置书架图像与书架的对应关系,例如标记书架图像与书架编号的对应关系等。每个书架均包括若干层,由条码所在的单元图像的纵向坐标可以得到该条码所属的层数,由条码所在单元图像的纵坐标还可以得到对应书籍上书架该层的横的大致位置,本申请至少记录书籍所在的书架以及层数。
对应于上文实施例的方法,图2示出了本申请实施例提供的基于视觉识别的图书盘点装置的结构框图,为了便于说明,仅示出了与本申请实施例相关的部分。图2示例的基于视觉识别的图书盘点装置可以是前述实施例提供的基于视觉识别的图书盘点方法的执行主体。
参照图2,该基于视觉识别的图书盘点装置包括:
获取模块,用于获取书架图像并对书架图像进行预处理;
识别模块,用于利用水平视窗对预处理后的书架图像进行横向识别,利用竖直视窗对预处理后的书架图像进行纵向识别,由横向识别以及纵向识别的结果得到条码区域;
分割模块,用于将书架图像分割为若干个单元图像,使书架图像中的每个条码均被分割到独立的单元图像中;
坐标获取模块,用于由每个单元图像在书架图像中的位置得到单元图像的坐标;
清晰化处理模块,用于对包含条码的单元图像进行清晰化处理;
解析模块,用于对清晰化处理的单元图像进行条码解析;
判断登记模块,用于判断条码解析的结果是否与在库图书对应,若是,根据条码所在的单元图像的坐标与实际空间位置的对应关系确定条码对应的图书的实际位置并登记;
其中:水平视窗的高度为一个像素,宽度与书架图像的宽度相等;竖直视窗的宽度为一个像素,高度与书架图像的高度相等。
本申请实施例提供的基于视觉识别的图书盘点装置中各模块实现各自功能的过程,具体可参考前述图1所示实施例的描述,此处不再赘述。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本申请实施例的实施过程构成任何限定。
应当理解,当在本申请说明书和所附权利要求书中使用时,术语“包括”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
还应当理解,在本申请说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
如在本申请说明书和所附权利要求书中所使用的那样,术语“如果”可以依据上下文被解释为“当...时”或“一旦”或“响应于确定”或“响应于检测到”。类似地,短语“如果确定”或“如果检测到[所描述条件或事件]”可以依据上下文被解释为意指“一旦确定”或“响应于确定”或“一旦检测到[所描述条件或事件]”或“响应于检测到[所描述条件或事件]”。
另外,在本申请说明书和所附权利要求书的描述中,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。还应理解的是,虽然术语“第一”、“第二”等在文本中在一些本申请实施例中用来描述各种元素,但是这些元素不应该受到这些术语的限制。这些术语只是用来将一个元素与另一元素区分开。例如,第一表格可以被命名为第二表格,并且类似地,第二表格可以被命名为第一表格,而不背离各种所描述的实施例的范围。第一表格和第二表格都是表格,但是它们不是同一表格。
在本申请说明书中描述的参考“一个实施例”或“一些实施例”等意味着在本申请的一个或多个实施例中包括结合该实施例描述的特定特征、结构或特点。由此,在本说明书中的不同之处出现的语句“在一个实施例中”、“在一些实施例中”、“在其他一些实施例中”、“在另外一些实施例中”等不是必然都参考相同的实施例,而是意味着“一个或多个但不是所有的实施例”,除非是以其他方式另外特别强调。术语“包括”、“包含”、“具有”及它们的变形都意味着“包括但不限于”,除非是以其他方式另外特别强调。
本申请实施例提供的基于视觉识别的图书盘点方法可以应用于手机、平板电脑、可穿戴设备、车载设备、增强现实(augmented reality,AR)/虚拟现实(virtual reality,VR)设备、笔记本电脑、超级移动个人计算机(ultra-mobile personal computer,UMPC)、上网本、个人数字助理(personal digital assistant,PDA)等终端设备上,本申请实施例对终端设备的具体类型不作任何限制。
例如,所述终端设备可以是WLAN中的站点(STAION,ST),可以是蜂窝电话、无绳电话、会话启动协议(Session InitiationProtocol,SIP)电话、无线本地环路(WirelessLocal Loop,WLL)站、个人数字处理(Personal Digital Assistant,PDA)设备、具有无线通信功能的手持设备、计算设备或连接到无线调制解调器的其它处理设备、车载设备、车联网终端、电脑、膝上型计算机、手持式通信设备、手持式计算设备、卫星无线设备、无线调制解调器卡、电视机顶盒(set top box,STB)、用户驻地设备(customer premise equipment,CPE)和/或用于在无线系统上进行通信的其它设备以及下一代通信系统,例如,5G网络中的移动终端或者未来演进的公共陆地移动网络(Public Land Mobile Network,PLMN)网络中的移动终端等。
作为示例而非限定,当所述终端设备为可穿戴设备时,该可穿戴设备还可以是应用穿戴式技术对日常穿戴进行智能化设计、开发出可以穿戴的设备的总称,如眼镜、手套、手表、服饰及鞋等。可穿戴设备即直接穿在身上,或是整合到用户的衣服或配件的一种便携式设备。可穿戴设备不仅仅是一种硬件设备,更是通过软件支持以及数据交互、云端交互来实现强大的功能。广义穿戴式智能设备包括功能全、尺寸大、可不依赖智能手机实现完整或者部分的功能,如智能手表或智能眼镜等,以及只专注于某一类应用功能,需要和其它设备如智能手机配合使用,如各类进行体征监测的智能手环、智能首饰等。
图3是本申请一实施例提供的终端设备的结构示意图。如图3所示,该实施例的终端设备3包括:至少一个处理器30(图3中仅示出一个)、存储器31,所述存储器31中存储有可在所述处理器30上运行的计算机程序32。所述处理器30执行所述计算机程序32时实现上述各个潜在客户的识别方法实施例中的步骤,例如图1所示的步骤S100至S700。或者,所述处理器30执行所述计算机程序32时实现上述各装置实施例中各模块/单元的功能,例如图2所示模块的功能。
所述终端设备3可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述终端设备可包括,但不仅限于,处理器30、存储器31。本领域技术人员可以理解,图3仅仅是终端设备3的示例,并不构成对终端设备3的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述终端设备还可以包括输入发送设备、网络接入设备、总线等。
所称处理器30可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列 (Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
所述存储器31在一些实施例中可以是所述终端设备3的内部存储单元,例如终端设备3的硬盘或内存。所述存储器31也可以是所述终端设备3的外部存储设备,例如所述终端设备3上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(SecureDigital,SD)卡,闪存卡(Flash Card)等。进一步地,所述存储器31还可以既包括所述终端设备3的内部存储单元也包括外部存储设备。所述存储器31用于存储操作系统、应用程序、引导装载程序(BootLoader)、数据以及其他程序等,例如所述计算机程序的程序代码等。所述存储器31还可以用于暂时地存储已经发送或者将要发送的数据。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
本申请实施例还提供了一种终端设备,所述终端设备包括至少一个存储器、至少一个处理器以及存储在所述至少一个存储器中并可在所述至少一个处理器上运行的计算机程序,所述处理器执行所述计算机程序时,使所述终端设备实现上述任意各个方法实施例中的步骤。
本申请实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现可实现上述各个方法实施例中的步骤。
本申请实施例提供了一种计算机程序产品,当计算机程序产品在终端设备上运行时,使得终端设备执行时实现可实现上述各个方法实施例中的步骤。
所述集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(Read-Only Memory,ROM)、随机存取存储器(RandomAccess Memory,RAM)、电载波信号、电信信号以及软件分发介质等。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
以上所述实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使对应技术方案的本质脱离本申请各实施例技术方案的精神和范围,均应包含在本申请的保护范围之内。

Claims (10)

1.一种基于视觉识别的图书盘点方法,其特征在于,所述基于视觉识别的图书盘点方法包括:
获取书架图像并对书架图像进行预处理;
利用水平视窗对预处理后的书架图像进行横向识别,利用竖直视窗对预处理后的书架图像进行纵向识别,由横向识别以及纵向识别的结果得到条码区域;
将书架图像分割为若干个单元图像,使书架图像中的每个条码均被分割到独立的单元图像中;
由每个单元图像在书架图像中的位置得到单元图像的坐标;
对包含条码的单元图像进行清晰化处理;
对清晰化处理的单元图像进行条码解析;
判断条码解析的结果是否与在库图书对应,若是,根据条码所在的单元图像的坐标与实际空间位置的对应关系确定条码对应的图书的实际位置并登记;
其中:水平视窗的高度为一个像素,宽度与书架图像的宽度相等;竖直视窗的宽度为一个像素,高度与书架图像的高度相等。
2.如权利要求1所述的基于视觉识别的图书盘点方法,其特征在于,所述对书架图像进行预处理,包括:
对书架图像进行缩放处理以使书架图像尺寸标准化;
采用双边滤波对书架图像进行去噪处理。
3.如权利要求1所述的基于视觉识别的图书盘点方法,其特征在于,所述利用水平视窗对预处理后的书架图像进行横向识别,利用竖直视窗对预处理后的书架图像进行纵向识别,由横向识别以及纵向识别的结果得到条码区域,包括:
将水平视窗置于书架图像顶部,从左往右,识别水平视窗内的黑色像素以及白色像素;
将连续的黑色像素作为一个黑色组,将连续的白色像素作为一个白色组,得到若干个黑色组以及若干个白色组;
筛选像素的数量在设定范围的黑色组以及白色组;
判断筛选结果中是否存在若干相邻且交错排布的黑色组以及白色组,若存在,则得到纵向条码区域;
以一个像素为步距将水平视窗向下移动,识别所有纵向条码区域;
将竖直视窗置于书架图像左侧,从上往下,识别竖直视窗内的黑色像素以及白色像素;
将连续的黑色像素作为一个黑色组,将连续的白色像素作为一个白色组,得到若干个黑色组以及若干个白色组;
筛选像素的数量在设定范围的黑色组以及白色组;
判断筛选结果中是否存在若干相邻且交错排布的黑色组以及白色组,若存在,则得到横向条码区域;
以一个像素为步距将竖直视窗向右移动,识别所有横向条码区域;
合并上下相邻的纵向条码区域、合并左右相邻的横向条码区域。
4.如权利要求3所述的基于视觉识别的图书盘点方法,其特征在于,所述将书架图像分割为若干个单元图像,包括:
根据每个合并后的条码区域的最大横向尺寸以及最大纵向尺寸为分别为每个合并后的条码区域生成一个矩形框;
使生成的矩形框的中心与合并后的条码区域的中心重合;
由生成的矩形框对书架图像进行裁切得到若干个单元图像。
5.如权利要求1所述的基于视觉识别的图书盘点方法,其特征在于,所述由每个单元图像在书架图像中的位置得到单元图像的坐标,包括:
选定书架图像的左下角为原点,以书架图像的宽度方向为X轴,以书架图像的高度方向为Y轴,
确定每个单元图像的中心点对应的X坐标以及Y坐标得到每个单元图像的坐标。
6.如权利要求1所述的基于视觉识别的图书盘点方法,其特征在于,所述对包含条码的单元图像进行清晰化处理,包括:
采用高斯拉普拉斯算子对包含条码的单元图像进行锐化处理。
7.如权利要求1所述的基于视觉识别的图书盘点方法,其特征在于,所述对清晰化处理的单元图像进行条码解析,包括:
输出清晰化处理的单元图像到条码识别器,获取条码识别器的解析结果。
8.如权利要求1所述的基于视觉识别的图书盘点方法,其特征在于,所述根据条码所在的单元图像的坐标与实际空间位置的对应关系确定条码对应的图书的实际位置并登记,包括:
确定每张书架图像对应的书架;
根据条码所在的单元图像的坐标得到该条码在书架的对应位置;
由条码的解析结果得到每个条码对应的书籍信息,将书籍信息确定出的条码所在位置绑定并登记。
9.一种基于视觉识别的图书盘点装置,其特征在于,所述基于视觉识别的图书盘点装置包括:
获取模块,用于获取书架图像并对书架图像进行预处理;
识别模块,用于利用水平视窗对预处理后的书架图像进行横向识别,利用竖直视窗对预处理后的书架图像进行纵向识别,由横向识别以及纵向识别的结果得到条码区域;
分割模块,用于将书架图像分割为若干个单元图像,使书架图像中的每个条码均被分割到独立的单元图像中;
坐标获取模块,用于由每个单元图像在书架图像中的位置得到单元图像的坐标;
清晰化处理模块,用于对包含条码的单元图像进行清晰化处理;
解析模块,用于对清晰化处理的单元图像进行条码解析;
判断登记模块,用于判断条码解析的结果是否与在库图书对应,若是,根据条码所在的单元图像的坐标与实际空间位置的对应关系确定条码对应的图书的实际位置并登记;
其中:水平视窗的高度为一个像素,宽度与书架图像的宽度相等;竖直视窗的宽度为一个像素,高度与书架图像的高度相等。
10.一种终端设备,其特征在于,所述终端设备包括存储器、处理器,所述存储器上存储有可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如权利要求1至8任一项所述基于视觉识别的图书盘点方法的步骤。
CN202310377032.2A 2023-04-11 2023-04-11 一种基于视觉识别的图书盘点方法、装置和终端设备 Active CN116110037B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310377032.2A CN116110037B (zh) 2023-04-11 2023-04-11 一种基于视觉识别的图书盘点方法、装置和终端设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310377032.2A CN116110037B (zh) 2023-04-11 2023-04-11 一种基于视觉识别的图书盘点方法、装置和终端设备

Publications (2)

Publication Number Publication Date
CN116110037A CN116110037A (zh) 2023-05-12
CN116110037B true CN116110037B (zh) 2023-06-23

Family

ID=86258249

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310377032.2A Active CN116110037B (zh) 2023-04-11 2023-04-11 一种基于视觉识别的图书盘点方法、装置和终端设备

Country Status (1)

Country Link
CN (1) CN116110037B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117522536B (zh) * 2024-01-04 2024-04-26 深圳市华图测控系统有限公司 一种基于二维码识别的图书盘点方法及系统

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107403124A (zh) * 2017-07-31 2017-11-28 苏州经贸职业技术学院 一种基于视觉图像的条形码检测识别方法
CN110728260A (zh) * 2019-10-23 2020-01-24 北京天工矩阵信息技术有限公司 一种电气施工图的识别方法及装置
CN112183146A (zh) * 2019-07-13 2021-01-05 迅镭智能(广州)科技有限公司 一种条形码的扫描方法、装置、扫描系统及存储介质
WO2021159609A1 (zh) * 2020-02-11 2021-08-19 深圳壹账通智能科技有限公司 一种视频卡顿识别方法、装置及终端设备
CN114417904A (zh) * 2022-01-18 2022-04-29 南京信息职业技术学院 一种基于深度学习的条形码识别方法及图书检索系统
CN114937279A (zh) * 2022-06-07 2022-08-23 来也科技(北京)有限公司 基于rpa和ai实现ia的bom识别方法及装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104915618B (zh) * 2015-07-03 2017-09-26 南京大学 一种基于超高频rfid技术的图书馆典藏方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107403124A (zh) * 2017-07-31 2017-11-28 苏州经贸职业技术学院 一种基于视觉图像的条形码检测识别方法
CN112183146A (zh) * 2019-07-13 2021-01-05 迅镭智能(广州)科技有限公司 一种条形码的扫描方法、装置、扫描系统及存储介质
CN110728260A (zh) * 2019-10-23 2020-01-24 北京天工矩阵信息技术有限公司 一种电气施工图的识别方法及装置
WO2021159609A1 (zh) * 2020-02-11 2021-08-19 深圳壹账通智能科技有限公司 一种视频卡顿识别方法、装置及终端设备
CN114417904A (zh) * 2022-01-18 2022-04-29 南京信息职业技术学院 一种基于深度学习的条形码识别方法及图书检索系统
CN114937279A (zh) * 2022-06-07 2022-08-23 来也科技(北京)有限公司 基于rpa和ai实现ia的bom识别方法及装置

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
An Efficient Bar/QR Code Recognition System for Consumer Service Applications;Arju Aman 等;《 2020 Zooming Innovation in Consumer Technologies Conference》;127-131 *
RFID图书自动盘点机器人应用研究——以武汉大学图书馆为例;夏正伟 等;《图书馆杂志》;第39卷(第1期);61-66 *
基于图像的书脊检测与识别关键技术研究与实现;崔晨;《中国优秀硕士学位论文全文数据库 信息科技辑》;I138-993 *

Also Published As

Publication number Publication date
CN116110037A (zh) 2023-05-12

Similar Documents

Publication Publication Date Title
US10210415B2 (en) Method and system for recognizing information on a card
CN110348439B (zh) 一种自动识别价签的方法、计算机可读介质及系统
CN108090511B (zh) 图像分类方法、装置、电子设备及可读存储介质
CN110119741A (zh) 一种有背景的卡证图像信息识别方法
CN107169458B (zh) 数据处理方法、装置及存储介质
CN106886774A (zh) 识别身份证信息的方法和装置
CN116110037B (zh) 一种基于视觉识别的图书盘点方法、装置和终端设备
CN111899270B (zh) 卡片边框检测方法、装置、设备及可读存储介质
US10943226B2 (en) Method and system of capturing an image of a card
CN111160202A (zh) 基于ar设备的身份核验方法、装置、设备及存储介质
KR20160120953A (ko) 재고 관리 서비스 제공 방법
CN111222382A (zh) 一种基于图像的商品结算方法、装置、介质及电子设备
CN113627411A (zh) 一种基于超分辨率的商品识别与价格匹配方法及系统
CN105426899A (zh) 车辆识别方法、装置和客户端
CN110781890A (zh) 身份证识别方法、装置、电子设备及可读取存储介质
CN110659588A (zh) 一种客流量统计方法、装置及计算机可读存储介质
CN109871751A (zh) 基于人脸表情识别的服务态度评估方法、装置及存储介质
CN110245573A (zh) 一种基于人脸识别的签到方法、装置及终端设备
CN111507119B (zh) 标识码识别方法、装置、电子设备及计算机可读存储介质
Puri et al. Barcode detection using OpenCV-python
CN108021913A (zh) 证件照片信息识别方法及装置
CN110222547B (zh) 条码识别方法及装置
CN110569716A (zh) 一种货架图像翻拍检测方法
Chang Intelligent text detection and extraction from natural scene images
CN104346596A (zh) 一种qr码的识别方法及识别装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant