CN115994772B - 图书资料处理方法及系统、图书快速铺货方法、电子设备 - Google Patents

图书资料处理方法及系统、图书快速铺货方法、电子设备 Download PDF

Info

Publication number
CN115994772B
CN115994772B CN202310152118.5A CN202310152118A CN115994772B CN 115994772 B CN115994772 B CN 115994772B CN 202310152118 A CN202310152118 A CN 202310152118A CN 115994772 B CN115994772 B CN 115994772B
Authority
CN
China
Prior art keywords
data
book
detection
marketing
text
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202310152118.5A
Other languages
English (en)
Other versions
CN115994772A (zh
Inventor
张文超
付鹏
罗庚
张建庆
金津吉
李�杰
赵晓刚
丁檬
李忠强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Citic United Cloud Technology Co ltd
Original Assignee
Citic United Cloud Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Citic United Cloud Technology Co ltd filed Critical Citic United Cloud Technology Co ltd
Priority to CN202310152118.5A priority Critical patent/CN115994772B/zh
Publication of CN115994772A publication Critical patent/CN115994772A/zh
Application granted granted Critical
Publication of CN115994772B publication Critical patent/CN115994772B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Processing Or Creating Images (AREA)

Abstract

本申请提出图书资料处理方法及系统、图书快速铺货方法、电子设备,该图书资料处理方法包括以下步骤:获取图书原始资料,所述图书原始资料包括:图像和文字;对所述图书原始资料进行编辑,得到图书营销资料,形成第一图书文档;对所述图书营销资料进行数据识别,得到第一图像检出资料和第一文字检出资料,形成第二图文文档;对所述第一图像检出资料和所述第一文字检出资料进行资料合规检测,资料合规检测通过后,形成第三图文文档;对所述第三图文文档进行产品经理审核,审核通过后得到合规图书资料数据。本申请提供的技术方案,能够高效地对图书原始资料进行合规处理,提高资料合规检测的准确性。

Description

图书资料处理方法及系统、图书快速铺货方法、电子设备
技术领域
本申请涉及图书管理技术领域,尤其涉及一种基于数据识别的图书资料处理方法;本申请还涉及一种基于数据识别的图书资料处理方法;本申请还涉及一种图书快速铺货方法;本申请还涉及一种电子设备。
背景技术
随着图书市场的发展,新书的种类繁多,需要上架的平台多;现有技术中通常通过人工的方式进行图书资料的输入、整理、检测及上架,且各个环节相互独立,图书检测及图书上架的效率慢。
具体的现有技术方案存在以下技术缺陷:第一、通常图书资料由专门的编辑人员录入,所有数据录入完成之后,再将所有数据以纯文字的形式导出,输入到第三方的检测插件中,找出违禁词。这种方式存在如下两个问题:1、现有的查找违禁词工具都是基于一段文字,这类工具检测异常词语后,只能给到文字的坐标,但对于用户而言,即便拿到坐标,也很难再对应到图书的具体信息项中,例如:三方工具找到“最强”发现是一个违规的广告推荐词,但是用户并不能很快定位到是营销语、还是书名、亦或是图书封面的编辑推荐语中。2、对于图片中的文字,这类工具是无法处理的,需要先借助图片识别的工具,将图片中的文字先识别出来,才能再进行检测。综上存在图书资料合规处理效率慢,准确性低的问题。
因此,如何提供一种基于数据识别的图书资料处理方法,其能够高效地对图书原始资料进行合规处理,提高资料合规检测的准确性。是本领域技术人员亟待解决的技术问题。
发明内容
针对上述现有技术的不足,本发明的目的在于能够高效地对图书原始资料进行合规处理,提高资料合规检测的准确性。本发明提供一种基于数据识别的图书资料处理方法,包括以下步骤:获取图书原始资料,所述图书原始资料包括:图像和文字;对所述图书原始资料进行编辑,得到图书营销资料,形成第一图书文档;对所述图书营销资料进行数据识别,得到第一图像检出资料和第一文字检出资料,形成第二图文文档;对所述第一图像检出资料和所述第一文字检出资料进行资料合规检测,资料合规检测通过后,形成第三图文文档;对所述第三图文文档进行产品经理审核,审核通过后得到合规图书资料数据。
根据本发明的第一个实施方案,提供基于数据识别的图书资料处理方法:
基于数据识别的图书资料处理方法,包括以下步骤:获取图书原始资料,所述图书原始资料包括:图像和文字;对所述图书原始资料进行编辑,得到图书营销资料,形成第一图书文档;对所述图书营销资料进行数据识别,得到第一图像检出资料和第一文字检出资料,形成第二图文文档;对所述第一图像检出资料和所述第一文字检出资料进行资料合规检测,资料合规检测通过后,形成第三图文文档;对所述第三图文文档进行产品经理审核,审核通过后得到合规图书资料数据。
进一步地,作为本发明一种更为优选地实施方案,所述“获取图书原始资料”具体为:由图书供应商端直接导入,与待录入图书信息关联的所述图书原始资料。
进一步地,作为本发明一种更为优选地实施方案,所述“获取图书原始资料”具体为:通过爬虫技术,根据待录入图书信息直接从网络上获取所述图书原始资料。
进一步地,作为本发明一种更为优选地实施方案,所述“获取图书原始资料”具体为:从第三方图书资料库中,直接待录入图书信息获取所述图书原始资料。
进一步地,作为本发明一种更为优选地实施方案,所述“对所述图书原始资料进行编辑,得到图书营销资料”包括以下步骤:获取与所述待录入图书信息关联的营销语、广告词、推荐语以及商品图片;根据所述营销语、所述广告词、所述推荐语以及所述商品图片,输出单品标准个图;根据营销套餐,将多个所述单品标准个图,排列生成多品标准套图;对所述单品标准个图或所述多品标准套图进行营销化处理,所述营销化处理包括:添加水印、logo、背景、边框。
进一步地,作为本发明一种更为优选地实施方案,所述“对所述图书营销资料进行数据识别,得到第一图像检出资料和第一文字检出资料”具体为:通过人工智能的人像识别算法,从所述图书营销资料的图像中获取所述第一图像检出资料;通过人工智能的文字识别算法,从所述图书营销资料的图像/文字中获取所述第一文字检出资料。
进一步地,作为本发明一种更为优选地实施方案,所述“资料合规检测”包括如下步骤:对所述第一图像检出资料进行肖像侵权检测,若检测到侵权肖像则进行法务审核;对所述第一文字检出资料进行违禁词匹配检测,若检测到违禁词则进行法务审核;法务审核通过,则资料合规检测通过;法务审核未通过,则资料合规检测未通过;若未检测到违禁词和/或侵权肖像,则资料合规检测通过。
进一步地,作为本发明一种更为优选地实施方案,所述“进行法务审核”包括:将检测到的侵权肖像/违禁词以第一列表的形式展示给到法务端;所述第一产品列表包括如下信息:产品分类、一级上架分类、二级上架分类、出版时间、是否有人像、违禁词查看入口;点击所述违禁词查看入口,将弹出第二违禁词列表;所述第二违禁词列表包括如下信息:违禁词所属字段、违禁词内容、等级、标签、检测时间。
根据本发明的第二个实施方案,提供基于数据识别的图书资料处理系统:
基于数据识别的图书资料处理系统,执行上述的基于数据识别的图书资料处理方法;该资料处理系统包括:用于存储图片、视频、数据资料的数据存储服务器;与所述数据存储服务器数据连接,用于对接外部图书系统的书讯系统服务器,所述书讯系统服务器包括:商品管理模块、数据审核模块、征订管理模块、类目映射模块、商品上架模块、WEB端交互模块;其中,所述商品管理模块用于与供应链系统连接;所述数据审核模块用于与第三方人脸识别服务系统、图片文字识别服务系统连接;所述征订管理模块用于连接外部平台,提供企业服务、B2B/EDI服务;所述类目映射模块用于快速映射图书信息;所述商品上架模块用于与第三方电商平台连接;所述WEB端交互模块用于为上游供应商、下游经销商提供操作端口。
根据本发明的第三个实施方案,提供基于数据识别的图书资料处理系统:
基于数据识别的图书资料处理系统,执行上述的基于数据识别的图书资料处理方法;该资料处理系统包括:用于获取图书原始资料的第一获取模块; 用于对所述图书原始资料进行编辑,得到图书营销资料,形成第一图书文档的第一处理模块;用于对所述图书营销资料进行数据识别,得到第一图像检出资料和第一文字检出资料,形成第二图文文档的第二处理模块;用于对所述第一图像检出资料和所述第一文字检出资料进行资料合规检测,资料合规检测通过后,形成第三图文文档的第三处理模块;用于对所述第三图文文档进行产品经理审核,审核通过后得到合规图书资料数据的审核输出模块。
根据本发明的第四个实施方案,提供一种图书快速铺货方法:
一种图书快速铺货方法,包括:上述的基于数据识别的图书资料处理方法;根据电商平台上架规则,对所述合规图书资料数据进行适应性上架调整,并上传至对应电商平台;所述适应性上架调整包括:简称提取,品牌适配,图片切割,图片拼接,图片尺寸调整。
根据本发明的第五个实施方案,提供一种电子设备:
电子设备,包括:计算机程序,所述计算机程序用于执行上述的基于数据识别的图书资料处理方法;存储器,所述存储器用于存储所述计算机程序;处理器,所述处理器用于执行所述计算机程序。
与现有技术相比,本申请提供的技术方案中,在获取到图书原始资料后,将自动对图书原始资料进行编辑,首先生成图书营销资料,形成第一图书文档。接着对第一图书文档进行数据识别,识别出人物图像和文字,得到第一图像检出资料和第二文字检出资料,形成第二图文文档。再对第二图文文档中的第一图像检出资料和第一文字检出资料进行合规检测,检测通过后形成第三图文文档;再由产品经理对第三图文文档进行最终审核,得到合规图书资料数据。通过提供一种基于数据识别的图书资料处理方法实现文字资料和图片资料的快速识别检出;并自动进行资料合规检测,避免了现有技术中还需要将图片、文字单独导出,在第三方软件处理的麻烦。通过上述步骤,实现了对图书原始资料的快速处理审核,提高了图文原始资料的合规处理速度。本申请提供的技术方案,能够高效地对图书原始资料进行合规处理,提高资料合规检测的准确性。
与现有技术相比,本申请具有如下技术效果:
1、本申请的技术方案,将整理图书营销资料、图片资料和图书营销资料的合规合法检测统一在一起。实现了录入资料过程中实时反馈给用户存在的潜在问题,如文案违法广告法,文案中存在违禁词,图片中引用未授权的肖像权等。
2、本申请的技术方案,实现了自适应的套装图自动生成算法,可以实现1-20中不同数量组合的套装立体封生成。
3、本申请的技术方案,实现了一次图书资料编写,自动适配不同电商平台的图书商品铺货,有效解决了不同平台对资料格式要求不同,图片尺寸、数量不一致等异构问题。
附图说明
图1为本申请方案的实施例中基于数据识别的图书资料处理方法的流程图;
图2为本申请方案的实施例中图书快速铺货方法的流程图;
图3为本申请方案的实施例中图书资料输入、合规检测、上架环节流程图;
图4为本申请方案的实施例中基于数据识别的图书资料处理系统及图书快速铺货系统结构图;
图5为本申请方案的实施例中第一列表示意图;
图6为本申请方案的实施例中第二列表示意图;
图7为本申请方案的实施例中体现具体图书资料存储关系的ER关系图:
图8为本申请方案的实施例中上架确认管理界面。
具体实施方式
为了使本领域的技术人员更好地理解本申请中的技术方案,下面将结合本申请实施例中的附图对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请的一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
需要说明的是,当元件被称为“固定于”或“设置于”另一个元件上,它可以直接在另一个元件上或者间接设置在另一个元件上;当一个元件被称为是“连接于”另一个元件,它可以是直接连接到另一个元件或间接连接至另一个元件上。
需要理解的是,术语“长度”、“宽度”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本申请和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本申请的限制。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。在本申请的描述中,“多个”、“若干个”的含义是两个或两个以上,除非另有明确具体的限定。
须知,本说明书附图所绘示的结构、比例、大小等,均仅用以配合说明书所揭示的内容,以供熟悉此技术的人士了解与阅读,并非用以限定本申请可实施的限定条件,故不具技术上的实质意义,任何结构的修饰、比例关系的改变或大小的调整,在不影响本申请所能产生的功效及所能达成的目的下,均应仍落在本申请所揭示的技术内容得能涵盖的范围内。
根据本发明的第一个实施方案,提供基于数据识别的图书资料处理方法:
基于数据识别的图书资料处理方法,包括以下步骤:获取图书原始资料,所述图书原始资料包括:图像和文字;对所述图书原始资料进行编辑,得到图书营销资料,形成第一图书文档;对所述图书营销资料进行数据识别,得到第一图像检出资料和第一文字检出资料,形成第二图文文档;对所述第一图像检出资料和所述第一文字检出资料进行资料合规检测,资料合规检测通过后,形成第三图文文档;对所述第三图文文档进行产品经理审核,审核通过后得到合规图书资料数据。
本申请提供了一种基于数据识别的图书资料处理方法的技术方案。在该技术方案中,在获取到图书原始资料后,将自动对图书原始资料进行编辑,首先生成图书营销资料,形成第一图书文档。接着对第一图书文档进行数据识别,识别出人物图像和文字,得到第一图像检出资料和第二文字检出资料,形成第二图文文档。再对第二图文文档中的第一图像检出资料和第一文字检出资料进行合规检测,检测通过后形成第三图文文档;再由产品经理对第三图文文档进行最终审核,得到合规图书资料数据。通过提供一种基于数据识别的图书资料处理方法实现文字资料和图片资料的快速识别检出;并自动进行资料合规检测,避免了现有技术中还需要将图片、文字单独导出,在第三方软件处理的麻烦。通过上述步骤,实现了对图书原始资料的快速处理审核,提高了图文原始资料的合规处理速度。本申请提供的技术方案,能够高效地对图书原始资料进行合规处理,提高资料合规检测的准确性。
需要说明的是,在现有技术中,通常图书原始资料由专门的编辑人员录入,所有数据录入完成之后,再将所有数据以纯文字的形式导出,输入到第三方的检测插件中,找出违禁词。这种方式存在如下两个问题:1、现有的查找违禁词工具都是基于一段文字,这类工具检测异常词语后,只能给到文字的坐标,但对于用户而言,即便拿到坐标,也很难再对应到图书的具体信息项中,例如:三方工具找到“最强”发现是一个违规的广告推荐词,但是用户并不能很快定位到是营销语、还是书名、亦或是图书封面的编辑推荐语中。2、对于图片中的文字,这类工具是无法处理的,需要先借助图片识别的工具,将图片中的文字先识别出来,才能再进行检测。
“获取图书原始资料”具有3种具体的实施方式:
具体地进行阐述,在本发明实施例中,所述“获取图书原始资料”具体为:由图书供应商端直接导入,与待录入图书信息关联的所述图书原始资料。
需要说明的是,图书原始资料可由图书供应商直接在系统中进行导入;避免了自身安排人员导入的麻烦。
具体地进行阐述,在本发明实施例中,所述“获取图书原始资料”具体为:通过爬虫技术,根据待录入图书信息直接从网络上获取所述图书原始资料。
需要说明的是,针对一些公开平台上已经上架的图书信息,本申请方案可通过爬虫技术直接从网页端爬取相关信息,再进行数据核对后导入系统中,提高图书信息的导入效率。上一个实施例还需输入图书信息,而本实施例只需要核对图书信息,因此效率更高。
具体地进行阐述,在本发明实施例中,所述“获取图书原始资料”具体为:从第三方图书资料库中,直接待录入图书信息获取所述图书原始资料。
需要说明的是,若需要导入的图书信息,已存储在可信的第三方图书资料库中,则直接从第三方图书资料库进行导入,进一步的还省去了图书原始资料核对的过程。
需要补充说明的是,图书原始资料核对包括:书名核对、外观图片核对、目录内容核对、简介内容核对、广告内容核对、推荐语核对、营销语核对。
具体地进行阐述,在本发明实施例中,所述“对所述图书原始资料进行编辑,得到图书营销资料”包括以下步骤:获取与所述待录入图书信息关联的营销语、广告词、推荐语以及商品图片;根据所述营销语、所述广告词、所述推荐语以及所述商品图片,输出单品标准个图;根据营销套餐,将多个所述单品标准个图,排列生成多品标准套图;对所述单品标准个图或所述多品标准套图进行营销化处理,所述营销化处理包括:添加水印、logo、背景、边框。
需要说明的是,本技术方案中的创新点在于,在收到图书原始资料后,直接先进行图书营销资料的输出,精简后期需要进行资料合规检测的数据量,降低系统运行压力。进一步的,供应商输入的图书原始资料,包括多种数据内容,部分数据内容为重复内容,或不达标内容;若为重复内容则进行提示去除;若为不达标内容则直接提示图书原始资料上传端口重新上传。进一步的,根据按照标准要求输入的营销语、广告词、推荐语及商品图片,快速输出单品标准个图,另外根据营销套餐要求,将多个单品标准个图排列生成多品标准套图。单品标准个图和多品标准套图均为透明图格式,即png格式,以方便后期更换展示背景和边框操作。进一步的,在营销化处理中,为单品标准个图和多品标准套图添加水印、logo、背景和边框,快速提高图片的营销属性。
具体地进行阐述,在本发明实施例中,所述“对所述图书营销资料进行数据识别,得到第一图像检出资料和第一文字检出资料”具体为:通过人工智能的人像识别算法,从所述图书营销资料的图像中获取所述第一图像检出资料;通过人工智能的文字识别算法,从所述图书营销资料的图像/文字中获取所述第一文字检出资料。
需要说明的是,本技术方案采用的人像识别算法和文字识别算法均为现有技术,通过打通第三方的对应服务实现该项功能,如通过百度AI服务实现人像识别、图像文字识别、文字抓取。进一步的,通过自动化的人像/文字抓取,能够快速地与数据库中的人像授权情况和违禁词库相匹配,快速识别侵权肖像和违禁词。
需要说明的是,第三方的对应服务具体为:第三方人像识别服务为:阿里云人像检测服务facebody。第三方文字识别服务为:有道云OCR图片文字识别开放平台。
具体地进行阐述,在本发明实施例中,所述“资料合规检测”包括如下步骤:对所述第一图像检出资料进行肖像侵权检测,若检测到侵权肖像则进行法务审核;对所述第一文字检出资料进行违禁词匹配检测,若检测到违禁词则进行法务审核;法务审核通过,则资料合规检测通过;法务审核未通过,则资料合规检测未通过;若未检测到违禁词和/或侵权肖像,则资料合规检测通过。
需要说明的是,对初步检测到侵权肖像和违禁词的条目,均转至法务进行审核,法务审核不通过,则直接反馈至供应商的上传端口,达到快速反馈问题,修改调整问题的目的;确保进入系统的图书原始数据均为合规数据,提高系统数据处理的效率和准确性。
具体地进行阐述,在本发明实施例中,所述“进行法务审核”包括:将检测到的侵权肖像/违禁词以第一列表的形式展示给到法务端;所述第一产品列表包括如下信息:产品分类、一级上架分类、二级上架分类、出版时间、是否有人像、违禁词查看入口;点击所述违禁词查看入口,将弹出第二违禁词列表;所述第二违禁词列表包括如下信息:违禁词所属字段、违禁词内容、等级、标签、检测时间。
需要说明的是,通过第一列表和第二列表的形式,能够提高法务审核侵权肖像/违禁词的效率。
根据本发明的第二个实施方案,提供基于数据识别的图书资料处理系统:
基于数据识别的图书资料处理系统,执行上述的基于数据识别的图书资料处理方法;该资料处理系统包括:用于存储图片、视频、数据资料的数据存储服务器;与所述数据存储服务器数据连接,用于对接外部图书系统的书讯系统服务器,所述书讯系统服务器包括:商品管理模块、数据审核模块、征订管理模块、类目映射模块、商品上架模块、WEB端交互模块;其中,所述商品管理模块用于与供应链系统连接;所述数据审核模块用于与第三方人脸识别服务系统、图片文字识别服务系统连接;所述征订管理模块用于连接外部平台,提供企业服务、B2B/EDI服务;所述类目映射模块用于快速映射图书信息;所述商品上架模块用于与第三方电商平台连接;所述WEB端交互模块用于为上游供应商、下游经销商提供操作端口。
本实施方案提供了一种基于数据识别的图书资料处理系统的技术方案。该技术方案同样具有上述的有益效果。
根据本发明的第三个实施方案,提供基于数据识别的图书资料处理系统:
基于数据识别的图书资料处理系统,执行上述的基于数据识别的图书资料处理方法;该资料处理系统包括:用于获取图书原始资料的第一获取模块; 用于对所述图书原始资料进行编辑,得到图书营销资料,形成第一图书文档的第一处理模块;用于对所述图书营销资料进行数据识别,得到第一图像检出资料和第一文字检出资料,形成第二图文文档的第二处理模块;用于对所述第一图像检出资料和所述第一文字检出资料进行资料合规检测,资料合规检测通过后,形成第三图文文档的第三处理模块;用于对所述第三图文文档进行产品经理审核,审核通过后得到合规图书资料数据的审核输出模块。
本实施方案还提供了一种基于数据识别的图书资料处理系统的技术方案。该技术方案同样具有上述的有益效果。
根据本发明的第四个实施方案,提供一种图书快速铺货方法:
一种图书快速铺货方法,包括:上述的基于数据识别的图书资料处理方法;根据电商平台上架规则,对所述合规图书资料数据进行适应性上架调整,并上传至对应电商平台;所述适应性上架调整包括:简称提取,品牌适配,图片切割,图片拼接,图片尺寸调整。
本实施方案提供了一种图书快速铺货方法的技术方案。该技术方案同样具有上述的有益效果。进一步的,该图书快速铺货方法包括了上述基于数据识别的图书资料处理方法的技术方案,并在此基础上,根据电商平台上架规则,直接对合规图书资料进行适应性上架调整后,直接上传至各个电商平台,提高图书电商铺货上架的效率。
需要说明的是,各电商平台均有方便商家上架的数据接口;通过获取各个平台的数据接口或数据上传的模板,能够根据各个平台上传规则,生成对应上传数据包;如:简称提取,品牌适配,图片切割,图片拼接,图片尺寸调整等均是现有技术中能够批量性实现的技术效果。
根据本发明的第五个实施方案,提供一种电子设备:
电子设备,包括:计算机程序,所述计算机程序用于执行上述的基于数据识别的图书资料处理方法;存储器,所述存储器用于存储所述计算机程序;处理器,所述处理器用于执行所述计算机程序。
实施例1
基于数据识别的图书资料处理方法,包括以下步骤:获取图书原始资料,所述图书原始资料包括:图像和文字;对所述图书原始资料进行编辑,得到图书营销资料,形成第一图书文档;对所述图书营销资料进行数据识别,得到第一图像检出资料和第一文字检出资料,形成第二图文文档;对所述第一图像检出资料和所述第一文字检出资料进行资料合规检测,资料合规检测通过后,形成第三图文文档;对所述第三图文文档进行产品经理审核,审核通过后得到合规图书资料数据。
实施例2-1
重复实施例1,只是所述“获取图书原始资料”具体为:由图书供应商端直接导入,与待录入图书信息关联的所述图书原始资料。
实施例2-2
重复实施例1,只是所述“获取图书原始资料”具体为:通过爬虫技术,根据待录入图书信息直接从网络上获取所述图书原始资料。
实施例2-3
重复实施例1,只是所述“获取图书原始资料”具体为:从第三方图书资料库中,直接待录入图书信息获取所述图书原始资料。
实施例3
重复实施例2,只是所述“对所述图书原始资料进行编辑,得到图书营销资料”包括以下步骤:获取与所述待录入图书信息关联的营销语、广告词、推荐语以及商品图片;根据所述营销语、所述广告词、所述推荐语以及所述商品图片,输出单品标准个图;根据营销套餐,将多个所述单品标准个图,排列生成多品标准套图;对所述单品标准个图或所述多品标准套图进行营销化处理,所述营销化处理包括:添加水印、logo、背景、边框。
实施例4
重复实施例1,只是所述“对所述图书营销资料进行数据识别,得到第一图像检出资料和第一文字检出资料”具体为:通过人工智能的人像识别算法,从所述图书营销资料的图像中获取所述第一图像检出资料;通过人工智能的文字识别算法,从所述图书营销资料的图像/文字中获取所述第一文字检出资料。
实施例5
重复实施例4,只是所述“资料合规检测”包括如下步骤:对所述第一图像检出资料进行肖像侵权检测,若检测到侵权肖像则进行法务审核;对所述第一文字检出资料进行违禁词匹配检测,若检测到违禁词则进行法务审核;法务审核通过,则资料合规检测通过;法务审核未通过,则资料合规检测未通过;若未检测到违禁词和/或侵权肖像,则资料合规检测通过。
实施例6
重复实施例5,只是所述“进行法务审核”包括:将检测到的侵权肖像/违禁词以第一列表的形式展示给到法务端;所述第一产品列表包括如下信息:产品分类、一级上架分类、二级上架分类、出版时间、是否有人像、违禁词查看入口;点击所述违禁词查看入口,将弹出第二违禁词列表;所述第二违禁词列表包括如下信息:违禁词所属字段、违禁词内容、等级、标签、检测时间。
实施例7
基于数据识别的图书资料处理系统,执行上述的基于数据识别的图书资料处理方法;该资料处理系统包括:用于存储图片、视频、数据资料的数据存储服务器;与所述数据存储服务器数据连接,用于对接外部图书系统的书讯系统服务器,所述书讯系统服务器包括:商品管理模块、数据审核模块、征订管理模块、类目映射模块、商品上架模块、WEB端交互模块;其中,所述商品管理模块用于与供应链系统连接;所述数据审核模块用于与第三方人脸识别服务系统、图片文字识别服务系统连接;所述征订管理模块用于连接外部平台,提供企业服务、B2B/EDI服务;所述类目映射模块用于快速映射图书信息;所述商品上架模块用于与第三方电商平台连接;所述WEB端交互模块用于为上游供应商、下游经销商提供操作端口。
实施例8
基于数据识别的图书资料处理系统,执行上述的基于数据识别的图书资料处理方法;该资料处理系统包括:用于获取图书原始资料的第一获取模块; 用于对所述图书原始资料进行编辑,得到图书营销资料,形成第一图书文档的第一处理模块;用于对所述图书营销资料进行数据识别,得到第一图像检出资料和第一文字检出资料,形成第二图文文档的第二处理模块;用于对所述第一图像检出资料和所述第一文字检出资料进行资料合规检测,资料合规检测通过后,形成第三图文文档的第三处理模块;用于对所述第三图文文档进行产品经理审核,审核通过后得到合规图书资料数据的审核输出模块。
实施例9
一种图书快速铺货方法,包括:上述的基于数据识别的图书资料处理方法;根据电商平台上架规则,对所述合规图书资料数据进行适应性上架调整,并上传至对应电商平台;所述适应性上架调整包括:简称提取,品牌适配,图片切割,图片拼接,图片尺寸调整。
实施例10
电子设备,包括:计算机程序,所述计算机程序用于执行上述的基于数据识别的图书资料处理方法;存储器,所述存储器用于存储所述计算机程序;处理器,所述处理器用于执行所述计算机程序。
需要补充说明的是,当前图书营销的现状及问题如下:
现状一:通常图书资料由专门的编辑人员录入,所有数据录入完成之后,再将所有数据以纯文字的形式导出,输入到第三方的检测插件中,找出违禁词。这种方式存在如下两个问题:1、现有的查找违禁词工具都是基于一段文字,这类工具检测异常词语后,只能给到文字的坐标,但对于用户而言,即便拿到坐标,也很难再对应到图书的具体信息项中,例如:三方工具找到“最强”发现是一个违规的广告推荐词,但是用户并不能很快定位到是营销语、还是书名、亦或是图书封面的编辑推荐语中。2、对于图片中的文字,这类工具是无法处理的,需要先借助图片识别的工具,将图片中的文字先识别出来,才能再进行检测。
现状二:对于图书资料中的立体封图、平封图、轮播图、实拍图等相关图片中,用户会关心这些图片中是否会存在未经授权的作者肖像。因此,肖像权检测存在如下问题:1、通常都是通过使用第三方一些图片识别系统,识别出人像,仅仅是孤立的图片人脸识别,是脱离图书整体资料的应用,仍还需要人工判断哪类图片引用了肖像权,如主图或者封面图。2、就是有一些图片是经过作者授权,此类图片应该被过滤,没有可参考的授权库,仅仅依靠三方识别工具,是无法办到的。
现状三:现有的应用都是将图书资料的准备和图书营销使用资料完全的割裂开。现实中图书资料的准备,其目的就是为了将图书资料应用于营销渠道。对于出版行业而言就是为了进行铺货。目前行业均是采用现有图书编辑将资料准备好,再由营销编辑搬运到各个商家的电商后台,铺货过程中存在大量的重复数据迁移工作和图片尺寸适配工作,相当于营销人员又要把编辑做好资料,按照各营销渠道的格式要求再转换一遍,才能将图书上架资料发布到电商后台,存在电商资料上架极慢的问题。
为了解决上述技术问题,本申请提供的技术方案达到了如下技术效果:
(1) 提高图书资料录入的高效性和合规性,系统在接收用户录入数据或者上传图片时,实时进行数据识别和图片识别,一旦发现有违规资料,直接通知用户进行调整。
(2) 对于一些套装图片,是需要将套装包含的单品组装成一张合成图,这种合成往往需要编辑将所有单品图片找出来,进行重组。本申请方案可直接生成多品标准套图。
(3) 编辑人员设计出一张800px*800px的标准透明图,同时还要根据图片的不同应用在改图的基础上再设计出如:不同背景图,不同边框图,带logo标识的图,带水印的图等等,对于所有的图都会重复制作出另外10多种不同样式的其他图,极大影响做图效率。本申请方案可先输出单品标准个图和多品标准套图的透明图格式,可快速替换和生成不同的背景、边框、logo、水印等。
(4) 同一种商品资料和营销图不能完全适配不同的销售渠道,如天猫、京东、拼多多,抖店对主图的尺寸要求不同,对商品名称的规范不同,用户想要将图书资料发布到商家后台进行售卖,往往又要将商品资料针对不同平台商品资料和图片往往都需要重新再做一遍,但往往不同之处只是格式、尺寸、不同而已,本申请提供的方案可做到快速一键上架。
需要补充说明的是,数据处理流程如图:
1、先由编辑任用编辑图书资料,图书资料录入过程中或者图片上传时,系统违禁词和肖像权检测工具完成对资料的检测和实时提示。
2、资料编辑完成后提交资料时,系统还会再整体检测一遍,同时给出检测出的违禁词列表、坐标、所属数据项、违禁词等级以及标签。
3、再提交给法务和产品经理审核,审核通过后,营销人员可进行上架铺货。
4、营销人员使用一键上架功能,选择系统已经对接的分销平台,即可完成上架铺货。
具体的,如图5-6所示,文案图片等肖像权/违禁词检测时,用户提交数据之后,系统自动先对图片进行识别,提取文字和人像,然后同时进行违禁词检测,不仅可以标记出文字中的违禁词,同时标记出违禁词位于图书资料确定的字段项并高亮标记出。同时系统还为违禁词打标出等级和标签。
具体的,自适应套装图片生成算法,系统自研实现了可支持1-20种不同图书立体封中进行自适应套装主图生成算法,该算法自动实现单品图大小不一致、单品数量不统一的自适应。
需要补充说明的是,整体上本发明实现了一套从图书资料录入到图书营销电商渠道的上架系统完整的解决方案。
第一步,对于图书商品资料获取方面,系统提供了三种进行文案获取的实现途径。第一,系统提供了供应商端图书资料录入工具,图书的供应商可将图书产品相关资料导入系统。第二,系统提供了爬虫功能,可以将互联网图书资料爬取并解析到本系统中。第三,从第三方系统直接获取图书资料。
第二步,商品资料获取到后,先由营销编辑对商品资料进行加工,主要完成营销语、广告词、推荐语以及商品图片的设计和制作。通常做法编辑会设计多张立封图,多张平封图,才能满足上架的图片需求,本系统开创性的设计思路是只要编辑人员设计出一张800px*800px的标准透明图,系统根据该图采用图片处理算法和人工智能技术,自动生成其他不同的图,如水印图,带logo图,换背景图,带边框。进一步的,对于套装图更是直接省去了编辑重新做图的工作量,系统应用了自研的自适应套装图组合算法,可根据套装的单品图直接生成组套的800px*800px标准透明图,图片的批量生成,极大节省了编辑制作图书资料的效率。
第三步,商品资料提交后系统采用人工智能的识别算法进行图片文字识别,人脸识别,然后再统一对整个图书资料的每个数据项进行违禁词检测以及肖像权检测。发现存在违禁词之后会将检测到的违禁词和商品资料推送给法务进行审核,如果法务通过或者未检测到违禁词,便可以进行上架。
第四步,就是完成图书铺货上架,系统研究了国内主流的电商平台,抽取了共同上架规则模式,实现了通用上架组件,该规则几乎可以适配90%的国内各个大电商平台,同时针对不同平台对资料的不一致要求,系统使用,上架配置进行规则控制,然后再上架时进行资料内容转换,如简称提取,品牌适配,图片切割,图片拼接,图片尺寸调整等,使一套资料适配所有分销渠道。
本系统旨在为了解决出版发行行业商品资料合规性和快速进行渠道分销。
1、面对当前人工编写图书资料出现的文案不合法,广告语违反广告法,以及商品图片上的各类广告推荐语,图片中使用未经授权的肖像权的问题时常出现,系统通过引入人工智能技术,可以快速高效识别提取图片文字和图像,结合自研的违禁词检测工具可以有效检测出商品各数据项的出现的违禁词。极大减少了图书资料营销过程中产品的法律纠纷和各类投诉,使投诉率减少60%。
2、图书为了抢占市场资源需要快速实现在各大销售渠道的铺货,系统通过抽象通用的适配规则,实现了对接国内主流的平台分销应用,可以一键将商品铺货到天猫、京东、抖店、拼多多等共计17个主流平台,极大提高商品铺货能力。
需要进一步补充的是。所述图书资料包括文字和图片,所述图书资料的具体存储结构为使用7张数据库表结构进行关系存储,如图7所示。
1、图书基本信息表(goods_index):存储图书元基本信息,包括图书主键码,条形码,商品全称,商品五级分类,定价,出版时间,印刷时间,商品类型,出版社,上架审核状态等包含图书核心的查询字段。
2、图书上架详情数据表(goods_basic):与图书基本信息表使用图书唯一码进行关联,包含全量需要审核的核心上架数据,包括:商品上架名称、CIP分类号、中图法分类号、内容简介、目录、一句话推荐、读者对象、关键词、主题词、正文语种、编辑推荐、精彩书摘、媒体评论、精彩书评、名人推荐、广告语、营销语。
3、作者信息表,以及图书作者关系表(goods_author_rela,author_info):包括作者名称、性别、国籍、朝代、作者简介、
4、文件(图片)信息表,以及图书文件关系表(file_info,goods_file):文件名称、文件地址URL、文件类型(文档、图片、视频);图书文件关系表存储,图书和文件关联关系,以及图片文件具体的图书图像类型,包括:版权页图,条形码定价图,CIP全文,立体封,平封、封底,主图,实拍图,高清图,商品详情图,内页插图,音视频,头图视频等。
5、电商平台特有字段数据表(platform_channel_field):存储不同平台特有的商品资料,如天猫平台:适用读者,包括平台编号,字段名称,字段值。
需要进一步补充的是,为了实现多个平台快速上传,并且降低输出传输量的技术效果。本申请方案还提供如下方法:
1、首先对现有数据进行所有违禁词检测,保证现有资料数据的资料通过审核。
2、为每个平台配置与现有数据的字段映射关系和部分数据字段转换函数。
3、为配置每个平台独有的数据字段配置上架配置属性。
4、根据现有数据和映射关系,和平台配置属性,直接生成每个电商平台的上传资料数据包如图8所示。
5、数据仅存储一份数据资料和映射关系,铺货的时候在根据不同的铺货平台和系统配置的映射关系进行数据生成;
6、上架后,在数据系统中展现已上架平台管理。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其他实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (1)

1.一种图书快速铺货方法,其特征在于,包括:
基于数据识别的图书资料处理方法;
所述基于数据识别的图书资料处理方法包括以下步骤:
获取图书原始资料,所述图书原始资料包括:图像和文字;
对所述图书原始资料进行编辑,得到图书营销资料,形成第一图书文档;
对所述图书营销资料进行数据识别,得到第一图像检出资料和第一文字检出资料,形成第二图文文档;
对所述第一图像检出资料和所述第一文字检出资料进行资料合规检测,资料合规检测通过后,形成第三图文文档;
对所述第三图文文档进行产品经理审核,审核通过后得到合规图书资料数据;
所述“对所述图书营销资料进行数据识别,得到第一图像检出资料和第一文字检出资料”具体为:
通过人工智能的人像识别算法,从所述图书营销资料的图像中获取所述第一图像检出资料;
通过人工智能的文字识别算法,从所述图书营销资料的图像/文字中获取所述第一文字检出资料;所述“资料合规检测”包括如下步骤:
对所述第一图像检出资料进行肖像侵权检测,若检测到侵权肖像则进行法务审核;
对所述第一文字检出资料进行违禁词匹配检测,若检测到违禁词则进行法务审核;
法务审核通过,则资料合规检测通过;法务审核未通过,则资料合规检测未通过;
若未检测到违禁词和/或侵权肖像,则资料合规检测通过;
所述“获取图书原始资料”具体为:
由图书供应商端直接导入,与待录入图书信息关联的所述图书原始资料;或
所述“获取图书原始资料”具体为:
通过爬虫技术,根据待录入图书信息直接从网络上获取所述图书原始资料;或
所述“获取图书原始资料”具体为:
从第三方图书资料库中,直接待录入图书信息获取所述图书原始资料;所述“对所述图书原始资料进行编辑,得到图书营销资料”包括以下步骤:
获取与所述待录入图书信息关联的营销语、广告词、推荐语和/或商品图片;
根据所述营销语、所述广告词、所述推荐语和/或所述商品图片,输出单品标准个图;
根据营销套餐,将多个所述单品标准个图,排列生成多品标准套图;
对所述单品标准个图或所述多品标准套图进行营销化处理,所述营销化处理包括:添加水印、logo、背景和/或边框;
所述“进行法务审核”包括:
将检测到的侵权肖像/违禁词以第一产品列表的形式展示给到法务端;
所述第一产品列表包括如下信息:产品分类、一级上架分类、二级上架分类、出版时间、是否有人像和/或违禁词查看入口;
点击所述违禁词查看入口,将弹出第二违禁词列表;
所述第二违禁词列表包括如下信息:
违禁词所属字段、违禁词内容、等级、标签和/或检测时间;
所述基于数据识别的图书资料处理方法由基于数据识别的图书资料处理系统执行,
所述基于数据识别的图书资料处理系统包括:用于存储图片、视频和/或数据资料的数据存储服务器;
与所述数据存储服务器数据连接,用于对接外部图书系统的书讯系统服务器,所述书讯系统服务器包括:商品管理模块、数据审核模块、征订管理模块、类目映射模块、商品上架模块和/或WEB端交互模块;
其中,所述商品管理模块用于与供应链系统连接;
所述数据审核模块用于与第三方人脸识别服务系统、图片文字识别服务系统连接;
所述征订管理模块用于连接外部平台,提供企业服务、B2B服务和/或EDI服务;
所述类目映射模块用于快速映射图书信息;
所述商品上架模块用于与第三方电商平台连接;
所述WEB端交互模块用于为上游供应商和/或下游经销商提供操作端口;
根据电商平台上架规则,对所述合规图书资料数据进行适应性上架调整,并上传至对应电商平台;
所述适应性上架调整包括:简称提取、品牌适配、图片切割、图片拼接和/或图片尺寸调整;
还包括步骤:对现有数据进行所有违禁词检测,保证现有资料数据的资料通过审核;为每个平台配置与现有数据的字段映射关系和部分数据字段转换函数,为每个平台独有的数据字段配置上架配置属性;根据现有数据、字段映射关系和平台配置属性,直接生成每个电商平台的上传资料数据包;数据仅存储一份数据资料和字段映射关系,铺货的时候在根据不同的铺货平台和系统配置的字段映射关系进行数据生成;上架后,在数据系统中展现已上架平台管理。
CN202310152118.5A 2023-02-22 2023-02-22 图书资料处理方法及系统、图书快速铺货方法、电子设备 Active CN115994772B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310152118.5A CN115994772B (zh) 2023-02-22 2023-02-22 图书资料处理方法及系统、图书快速铺货方法、电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310152118.5A CN115994772B (zh) 2023-02-22 2023-02-22 图书资料处理方法及系统、图书快速铺货方法、电子设备

Publications (2)

Publication Number Publication Date
CN115994772A CN115994772A (zh) 2023-04-21
CN115994772B true CN115994772B (zh) 2024-03-08

Family

ID=85993492

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310152118.5A Active CN115994772B (zh) 2023-02-22 2023-02-22 图书资料处理方法及系统、图书快速铺货方法、电子设备

Country Status (1)

Country Link
CN (1) CN115994772B (zh)

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111814425A (zh) * 2020-07-03 2020-10-23 角远悠 一种基于图书文字信息的图书自动排版实现方法
CN111932704A (zh) * 2020-07-17 2020-11-13 苏州企智信息科技有限公司 一种基于视频行为识别的经营规范智能巡查方法
CN112306507A (zh) * 2020-10-12 2021-02-02 北京自如信息科技有限公司 一种图片资源处理方法、装置、终端及存储介质
CN113485704A (zh) * 2021-06-21 2021-10-08 上海百秋电子商务有限公司 一种用于电商平台商品活动页的信息处理方法及系统
WO2021237570A1 (zh) * 2020-05-28 2021-12-02 深圳市欢太科技有限公司 影像审核方法及装置、设备、存储介质
CN113920085A (zh) * 2021-10-09 2022-01-11 焦点科技股份有限公司 一种产品展示视频自动化审核方法和系统
CN114003750A (zh) * 2021-10-29 2022-02-01 平安银行股份有限公司 物料上线方法、装置、设备及存储介质
CN114119121A (zh) * 2020-09-01 2022-03-01 阿里巴巴集团控股有限公司 发布商品素材的方法、装置、存储介质和处理器
CN114298733A (zh) * 2021-12-02 2022-04-08 苏州多次元数据有限公司 一种基于数字化内容分发的数字化营销系统
CN115271808A (zh) * 2022-07-27 2022-11-01 阿里云计算有限公司 营销海报的生成方法及电子设备

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021237570A1 (zh) * 2020-05-28 2021-12-02 深圳市欢太科技有限公司 影像审核方法及装置、设备、存储介质
CN111814425A (zh) * 2020-07-03 2020-10-23 角远悠 一种基于图书文字信息的图书自动排版实现方法
CN111932704A (zh) * 2020-07-17 2020-11-13 苏州企智信息科技有限公司 一种基于视频行为识别的经营规范智能巡查方法
CN114119121A (zh) * 2020-09-01 2022-03-01 阿里巴巴集团控股有限公司 发布商品素材的方法、装置、存储介质和处理器
CN112306507A (zh) * 2020-10-12 2021-02-02 北京自如信息科技有限公司 一种图片资源处理方法、装置、终端及存储介质
CN113485704A (zh) * 2021-06-21 2021-10-08 上海百秋电子商务有限公司 一种用于电商平台商品活动页的信息处理方法及系统
CN113920085A (zh) * 2021-10-09 2022-01-11 焦点科技股份有限公司 一种产品展示视频自动化审核方法和系统
CN114003750A (zh) * 2021-10-29 2022-02-01 平安银行股份有限公司 物料上线方法、装置、设备及存储介质
CN114298733A (zh) * 2021-12-02 2022-04-08 苏州多次元数据有限公司 一种基于数字化内容分发的数字化营销系统
CN115271808A (zh) * 2022-07-27 2022-11-01 阿里云计算有限公司 营销海报的生成方法及电子设备

Also Published As

Publication number Publication date
CN115994772A (zh) 2023-04-21

Similar Documents

Publication Publication Date Title
US11741290B2 (en) Automated testing materials in electronic document publishing
US10672047B2 (en) Intelligent multimedia e-catalog
CN102662950B (zh) 基于互联网图片的主动式广告的生成方法
US11127057B2 (en) Intelligent multimedia e-catalog
US20130191723A1 (en) Web Browser Device for Structured Data Extraction and Sharing via a Social Network
US20130311875A1 (en) Web browser embedded button for structured data extraction and sharing via a social network
US10528626B2 (en) Document processing
US20130139053A1 (en) Data Visualization Based on Visual Object Elements
US20130124972A1 (en) Electronic Content Management and Delivery Platform
US20230214895A1 (en) Methods and systems for product discovery in user generated content
US20200226168A1 (en) Methods and systems for optimizing display of user content
US20060253773A1 (en) Web-based client/server interaction method and system
CN110352427A (zh) 用于收集与网络化环境中的欺诈性内容相关联的数据的系统和方法
CN107861971A (zh) 一种商品搜索方法和装置
WO2020081873A1 (en) Methods and systems for user generated content integration
CN115994772B (zh) 图书资料处理方法及系统、图书快速铺货方法、电子设备
KR20090076575A (ko) 표준 상품카탈로그 제공 방법, 그를 위한 카탈로그 서버,전자상거래 시스템 및 저장매체
US11410418B2 (en) Methods and systems for tagged image generation
Velios Online event-based conservation documentation: A case study from the IIC website
CN110716775A (zh) 一种溯源模板配置方法、电子设备、存储介质及系统
CN114090630A (zh) 基于分布式微服务集群商品数据整合方法
CN108197687A (zh) 一种网页二维码生成方法
KR101347420B1 (ko) 사용자 제작 콘텐츠를 활용한 상품 판매 방법 및 시스템
CN113127597A (zh) 搜索信息的处理方法、装置及电子设备
CN110555177A (zh) 一种互联网商品数据分析归集方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant