CN115937840A - 商品库的生成方法和系统 - Google Patents
商品库的生成方法和系统 Download PDFInfo
- Publication number
- CN115937840A CN115937840A CN202211673647.1A CN202211673647A CN115937840A CN 115937840 A CN115937840 A CN 115937840A CN 202211673647 A CN202211673647 A CN 202211673647A CN 115937840 A CN115937840 A CN 115937840A
- Authority
- CN
- China
- Prior art keywords
- commodity
- picture
- basic
- commodity information
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供了一种商品库的生成方法和系统,涉及电商平台技术领域,该方法包括获取待识别的图片,生成任务处理队列;依次调取任务处理队列的图片进行识别扫描获得商品基本信息,其中,商品基本信息包含条码值和商品的文字内容;将商品基本信息进行标注划分得到图片对应的商品信息,并将所述商品信息进行存储获得商品库。解决了目前创建商品库存在的成本高、效率低的问题。
Description
技术领域
本申请属于电商平台技术领域,具体涉及商品库的生成方法和系统。
背景技术
近年来,越来越多的电商平台出现,电商平台载体覆盖网页、小程序、手机软件等,而商品库的建设是每个电商平台面临的问题。目前建立商品库的方式主要有两种:一种是通过从付费平台获取,如中国商品信息服务平台,这种方式成本高,数据个性化程度低,可扩展性较差;另一种是通过人工识别信息的方式,通过将商品条码、规格、品牌名称手动录入到系统的方式,这种方式需要大量的人工成本,效率低。
发明内容
为此,本申请提供商品库的生成方法和系统,有助于帮助解决目前创建商品库存在的成本高、效率低的问题。
为实现以上目的,本申请采用如下技术方案:
一方面,本申请提供一种商品库的生成方法,所述方法包括:
获取待识别的图片,生成任务处理队列;
依次调取所述任务处理队列的图片进行识别扫描获得商品基本信息,其中,商品基本信息包含条码值和商品的文字内容;
将所述商品基本信息进行标注划分得到所述图片对应的商品信息,并将所述商品信息进行存储获得商品库。
进一步地,所述依次调取所述任务处理队列的图片进行识别扫描获得商品基本信息,包括:
利用条码解析库识别扫描所述图片中的条形码获得所述条码值;
利用第一种识别算法识别扫描所述图片中的文字得到所述商品的文字内容
进一步地,所述将所述商品基本信息进行标注划分得到所述图片对应的商品信息,包括:
利用神经网络学将所述商品基本信息中对应的商品名称和商品规格进行识别,并进行标注划分,得到所述图片对应的商品信息。
进一步地,所述获取待识别的图片,包括:
通过采样配置系统扫描商品获得缓存图片,对所述缓存图片进行预处理之后进行存储获得所述待识别的图片。
进一步地,还包括:
利用第二种识别算法识别扫描所述图片获得新的所述商品的文字内容,得到新的所述商品基本信息;
将所述商品基本信息和所述新的所述商品基本信息进行校对得到校对结果,并对所述校对结果中存在问题的商品基本信息进行标注,其中,第一种识别算法和第二种识别算法不同。
另一方面,提供一种商品库的生成系统,包括:
采样模块,用于获取待识别的图片,生成任务处理队列;
扫描模块,用于依次调取所述任务处理队列的图片进行识别扫描获得商品基本信息,其中,商品基本信息包含条码值和商品的文字内容;
标注模块,用于将所述商品基本信息进行标注划分得到所述图片对应的商品信息,并将所述商品信息进行存储获得商品库。
本申请采用以上技术方案,至少具备以下有益效果:
本申请通过获取待识别的图片,生成任务处理队列,依次调取任务处理队列的图片进行识别扫描获得商品基本信息;然后,基于识别扫描得到的商品基本信息进行分类标注,以此得到图片对应的商品信息,并将商品信息进行存储,进而实现通过自动化识别扫描得到商品库,解决了创建商品库成本高、效率低的问题。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本申请。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是根据一示例性实施例示出的一种商品库的生成方法的流程图;
图2是根据一示例性实施例示出的一种机器人流程自动化处理图片数据的流程图;
图3是根据一示例性实施例示出的一种商品库的生成系统框图示意图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将对本申请的技术方案进行详细的描述。显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所得到的所有其它实施方式,都属于本申请所保护的范围。
请参阅图1,图1是根据一示例性实施例示出的一种商品库的生成方法的流程图,该方法包括如下步骤:
S101、获取待识别的图片,生成任务处理队列;
S102、依次调取任务处理队列的图片进行识别扫描获得商品基本信息,其中,商品基本信息包含条码值和商品的文字内容;
S103、将商品基本信息进行标注划分得到图片对应的商品信息,并将商品信息进行存储获得商品库。
在一个实施例中,从商品图片大数据中获取待识别的图片生成任务处理队列,依次调取任务处理队列的图片进行识别扫描获得商品基本信息,商品基本信息包含商品的条码值和商品的文字内容,之后基于该商品基本信息进行标注划分得到图片对应的商品信息,并将该商品信息进行存储,从而获得商品库。本申请中利用机器人流程自动化的方式自动化扫描识别商品图片,进而得到对应的商品信息,并将得到的商品信息存储于本地持久化数据库得到商品库,不需要人工录入信息,节约人工成本,同时大大提高信息录入效率。
具体的,待识别的商品图片存储于商品图片大数据,商品图片大数据通过数据服务提供拉取图片数据的接口获取数据,其中数据接口处理集群由4组,每组5台执行设备,共20台设备组成,每台设备的日处理能力在17万张商品图片,可以为创建商品库提供数据基础,不需要从付费平台获取,节约成本。
进一步地,利用条码解析库识别扫描待识别的图片中的条形码获得条码值。具体的,条码解析库采用TXDecoder(Decoder解析器)进行条码解析,也可以采用其他任何具备条码识别能力的解析库。
进一步地,利用第一种识别算法识别扫描待识别的图片中的文字得到商品的文字内容。
具体的,利用光学字符识别技术识别扫描待识别图片中的文字,光学字符识别技术采用BaiduOCR(Optical Character Recognition,光学字符识别)扫描识别图片中的文字,包含商品品牌名称、广告语、商品生产厂商、商品规格和商品配料等文字内容。
进一步地,利用神经网络学将获得商品基本信息中对应的商品名称和商品规格进行识别,并进行标注划分,得到待识别的图片对应的商品信息。
具体的,通过NLP(Neuro-Linguistic Programming,神经语言程序学)神经网对上述识别扫描获取的商品的文字内容进行划分,识别出商品的品牌名称和商品规格,并进行标注,从而得到待识别的图片对应的商品信息。
本申请中,商品信息包含商品的品牌名称、商品规格和商品的条形码,但商品信息不限于包含商品的品牌名称、商品规格和商品的条形码三个信息,具体的,可以根据需要对上述方法识别扫描出来的其他商品的文字内容进行识别划分,并得到相应的商品信息。
在一个实施例中,将商品信息传回到服务器存储于本地持久化数据库中得到商品库,具体的,将商品信息传回服务器有两种方法,但不限于这两种方法,一种是直接调用服务端提供的更新数据接口,另一种是通过文件拉取服务,配合自建的SMB(Server MessageBlock,信息服务块)服务进行文件同步。
进一步地,通过采样配置系统扫描商品获得缓存图片,对缓存图片进行预处理之后进行存储获得待识别的图片。
具体的,从业务服务中获取采样配置,在本申请中以电商平台的主要客户为社区小店为例做说明,则采样配置系统可以按照市区配置、门店配置、设备型号配置、网络设置配置、采样率控制、软件版本等方面进行配置,在获取采样配置后,根据采样配置系统进行商品扫描,商品扫描后获得商品图片,采样配置系统对商品图片进行缓存并进行本地压缩,通过OpenCV(Open Source Computer Vision Library,开源计算机视觉与机器学习软件库)对图片进行预处理,处理后的图片通过WorkManager上传至服务器后台
进一步地,利用第二种识别算法识别扫描待识别的图片获得新的商品的文字内容,得到新的商品基本信息。
具体的,利用光学字符识别技术识别扫描待识别图片中的文字,第二种识别算法不同于第一种识别算法,可以是MLKit OCR或者PaddleOCR等识别算法,得到新的商品基本信息,将新的商品基本信息和上述利用第一种识别算法得到的商品基本信息进行校对得到校对结果,并对校对结果中存在问题的商品基本信息进行标注,可以手动进行标注,以备后期查询使用。
请参见图2,图2是根据一示例性实施例示出的一种机器人流程自动化处理图片数据的流程图。
在一个实施例中,获取待识别的图片生成任务队列,调取任务队列中第一张待识别的图片,首先通过条码解析库识别扫描条码,获得商品的条码值,之后利用第一种OCR算法识别扫描文字内容,得到商品的文字内容,基于得到的商品的文字内容的基础上,通过NLP识别出商品名称和规格,并标注,进而得到待识别的图片的商品信息,将商品信息存入本地化持久数据库,并进一步判断任务队列中是否还有图片,如果有,则一直执行上述逻辑,直到任务队列中没有待识别的图片,若任务队列中不存在图片,则将持久化的数据上传到服务器,获得商品库。
请参阅图3,图3是根据一示例性实施例示出的一种商品库的生成系统框图示意图,该系统3包括:
采样模块31,用于获取待识别的图片,生成任务处理队列;
扫描模块32,用于依次调取任务处理队列的图片进行识别扫描获得商品基本信息,其中,商品基本信息包含条码值和商品的文字内容;
标注模块33,用于将商品基本信息进行标注划分得到图片对应的商品信息,并将商品信息进行存储获得商品库。
关于上述实施例中的商品库的生成系统,其执行上述商品库的生成方法,具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
可以理解的是,上述各实施例中相同或相似部分可以相互参考,在一些实施例中未详细说明的内容可以参见其他实施例中相同或相似的内容。
需要说明的是,在本申请的描述中,术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性。此外,在本申请的描述中,除非另有说明,“多个”、“多”的含义是指至少两个。
应该理解,当元件被称为“固定于”或“设置于”另一个元件,它可以直接在另一个元件上或者可能同时存在居中元件;当一个元件被称为“连接”另一个元件,它可以是直接连接到另一个元件或者可能同时存在居中元件,此外,这里使用的“连接”可以包括无线连接;使用的措辞“和/或”包括一个或更多个相关联的列出项的任一单元和全部组合。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为:表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本申请的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本申请的实施例所属技术领域的技术人员所理解。
应当理解,本申请的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本申请各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
上述提到的存储介质可以是只读存储器,磁盘或光盘等。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本申请的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
尽管上面已经示出和描述了本申请的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本申请的限制,本领域的普通技术人员在本申请的范围内可以对上述实施例进行变化、修改、替换和变型。
Claims (6)
1.一种商品库的生成方法,其特征在于,所述方法包括:
获取待识别的图片,生成任务处理队列;
依次调取所述任务处理队列的图片进行识别扫描获得商品基本信息,其中,商品基本信息包含条码值和商品的文字内容;
将所述商品基本信息进行标注划分得到所述图片对应的商品信息,并将所述商品信息进行存储获得商品库。
2.根据权利要求1所述的方法,其特征在于,所述依次调取所述任务处理队列的图片进行识别扫描获得商品基本信息,包括:
利用条码解析库识别扫描所述图片中的条形码获得所述条码值;
利用第一种识别算法识别扫描所述图片中的文字得到所述商品的文字内容。
3.根据权利要求2所述的方法,其特征在于,所述将所述商品基本信息进行标注划分得到所述图片对应的商品信息,包括:
利用神经网络学将所述商品基本信息中对应的商品名称和商品规格进行识别,并进行标注划分,得到所述图片对应的商品信息。
4.根据权利要求3所述的方法,其特征在于,所述获取待识别的图片,包括:
通过采样配置系统扫描商品获得缓存图片,对所述缓存图片进行预处理之后进行存储获得所述待识别的图片。
5.根据权利要求1-4任一项所述的方法,其特征在于,还包括:
利用第二种识别算法识别扫描所述图片获得新的所述商品的文字内容,得到新的所述商品基本信息;
将所述商品基本信息和所述新的所述商品基本信息进行校对得到校对结果,并对所述校对结果中存在问题的商品基本信息进行标注,其中,第一种识别算法和第二种识别算法不同。
6.一种商品库的生成系统,其特征在于,包括:
采样模块,用于获取待识别的图片,生成任务处理队列;
扫描模块,用于依次调取所述任务处理队列的图片进行识别扫描获得商品基本信息,其中,商品基本信息包含条码值和商品的文字内容;
标注模块,用于将所述商品基本信息进行标注划分得到所述图片对应的商品信息,并将所述商品信息进行存储获得商品库。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211673647.1A CN115937840A (zh) | 2022-12-26 | 2022-12-26 | 商品库的生成方法和系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211673647.1A CN115937840A (zh) | 2022-12-26 | 2022-12-26 | 商品库的生成方法和系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115937840A true CN115937840A (zh) | 2023-04-07 |
Family
ID=86697529
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211673647.1A Pending CN115937840A (zh) | 2022-12-26 | 2022-12-26 | 商品库的生成方法和系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115937840A (zh) |
-
2022
- 2022-12-26 CN CN202211673647.1A patent/CN115937840A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108416403B (zh) | 商品与标签的自动关联方法、系统、设备及存储介质 | |
CN111680124B (zh) | 基于rpa的大规模定制客户需求获取、查询方法 | |
CN108229341B (zh) | 分类方法和装置、电子设备、计算机存储介质 | |
US11790632B2 (en) | Method and apparatus for sample labeling, and method and apparatus for identifying damage classification | |
CN110781925B (zh) | 软件页面的分类方法、装置、电子设备及存储介质 | |
CN112396079A (zh) | 号码识别模型训练方法、号码识别方法及装置 | |
CN110780965A (zh) | 基于视觉的流程自动化方法、设备及可读存储介质 | |
CN110765293A (zh) | 自动开启二维码的方法、系统、电子设备及存储介质 | |
JP2023507043A (ja) | データ処理方法、装置、機器、記憶媒体及びコンピュータプログラム | |
US11704516B2 (en) | Electronic label management apparatus and method | |
CN110610169A (zh) | 图片标注方法和装置、存储介质及电子装置 | |
CN110532448B (zh) | 基于神经网络的文档分类方法、装置、设备及存储介质 | |
CN107239453B (zh) | 信息写入方法和装置 | |
CN116189200A (zh) | 硬盘身份字符识别方法、系统、终端及存储介质 | |
CN115937840A (zh) | 商品库的生成方法和系统 | |
CN110597765A (zh) | 一种大零售呼叫中心异构数据源数据处理方法及装置 | |
US20190045025A1 (en) | Distributed Recognition Feedback Acquisition System | |
CN114693435A (zh) | 催收名单的智能回访的方法、装置、电子设备及存储介质 | |
CN114492306A (zh) | 语料标注方法、装置、电子设备及存储介质 | |
CN115205869A (zh) | 结构化文档信息的生成方法、装置、电子设备及存储介质 | |
KR102399691B1 (ko) | 취향중심 또는 상황중심으로 의류 추천 정보를 제공하는 방법, 이를 이용하는 서버 및 프로그램 | |
CN114360171A (zh) | 一种图书馆移动智慧借阅方法、系统及可存储介质 | |
CN111860263A (zh) | 信息录入方法、装置及计算机可读存储介质 | |
CN115565201B (zh) | 禁忌图片识别方法、设备及存储介质 | |
CN112308709B (zh) | 一种用于信用卡获客平台的分流方法、系统及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |