CN114693405A - 电商信息安全检测方法及其装置、设备、介质、产品 - Google Patents
电商信息安全检测方法及其装置、设备、介质、产品 Download PDFInfo
- Publication number
- CN114693405A CN114693405A CN202210383173.0A CN202210383173A CN114693405A CN 114693405 A CN114693405 A CN 114693405A CN 202210383173 A CN202210383173 A CN 202210383173A CN 114693405 A CN114693405 A CN 114693405A
- Authority
- CN
- China
- Prior art keywords
- information
- commodity
- security
- detection
- detection result
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/901—Indexing; Data structures therefor; Storage structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
- G06F16/90335—Query processing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/906—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Data Mining & Analysis (AREA)
- Finance (AREA)
- Computational Linguistics (AREA)
- Accounting & Taxation (AREA)
- Software Systems (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Artificial Intelligence (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请公开一种电商信息安全检测方法及其装置、设备、介质、产品,所述方法包括:响应安全检测请求,获取该请求所携带的存储地址,根据该存储地址获得待检测的商品信息;构造索引项,该索引项包含当前启用的安全分类模型的版本信息及所述存储地址的编码映射信息;从缓存区中获取与该索引项相映射的检测结果,当获取失败时,调用当前启用的安全分类模型对所述商品信息实施信息安全检测以获得所述检测结果,将该检测结果与所述索引项相映射存储于所述缓存区中;推送所述检测结果以应答所述安全检测请求。本申请可为独立站发布的商品信息快速调用其信息安全检测结果,方便独立站决定是否发布所述的商品信息。
Description
技术领域
本申请涉及电商信息技术领域,尤其涉及一种电商信息安全检测方法及其相应的装置、计算机设备、计算机可读存储介质,以及计算机程序产品。
背景技术
电商平台中,特别是基于独立站的电商平台,每个独立站通常运行一个线上店铺的实例,店铺的管理用户可以通过其线上店铺的后台录入商品描述信息发布新的商品,或者针已上线的商品对其中的商品描述信息进行修改后重新提交发布。对应的商品描述信息被后台视为一个独立的商品单元相对应的信息存储于商品数据库中。
独立站的技术支持由电商平台实施,但独立站部署可能分布在各国、各地区的服务器,而各国、各地区有自身的信息安全管理法规,据此,商家用户发布的商品描述信息是否违规,电商平台需要提供相关检测服务的支持,一般是通过提供经预先训练至收敛状态的神经网络模型对商品描述信息中的某些具体商品信息进行分类检测,以确定商品信息相对应的安全类别,根据安全类别是否属于违规类型而控制商品描述信息的发布。
为了实现技术升级,电商平台会持续更新所述的神经网络模型,使相应的检测服务可以不断及时修正和提升判断安全类别的精准度。所述检测服务一般实现为独立且并发地服务于各个独立站调用,并独立管理模型所采用和产生的各种数据,于是,此一服务采用不同版本的神经网络模型长期并发处理海量的商品信息,会产生大量的相关数据,这些数据如何利用,将影响到电商平台的后台计算机设备的运行资源能否被高效调度,也影响到能否保证各个独立站实现信息安全检测的及时性。
发明内容
本申请的首要目的在于解决上述问题至少之一而提供一种电商信息安全检测方法及其相应的装置、计算机设备、计算机可读存储介质、计算机程序产品。
为满足本申请的各个目的,本申请采用如下技术方案:
适应本申请的目的之一而提供的一种电商信息安全检测方法,包括如下步骤:
响应安全检测请求,获取该请求所携带的存储地址,根据该存储地址获得待检测的商品信息;
构造索引项,该索引项包含当前启用的安全分类模型的版本信息及所述存储地址的编码映射信息;
从缓存区中获取与该索引项相映射的检测结果,当获取失败时,调用当前启用的安全分类模型对所述商品信息实施信息安全检测以获得所述检测结果,将该检测结果与所述索引项相映射存储于所述缓存区中;
推送所述检测结果以应答所述安全检测请求。
深化的部分实施例中,构造索引项,包括如下步骤:
获取当前启用的安全分类模型的版本号作为其版本信息;
应用数字摘要算法计算所述存储地址的散列值,作为该存储地址的编码映射信息;
将所述版本信息与所述编码映射信息拼接为待检测的商品信息的索引项。
深化的部分实施例中,从缓存区中获取与该索引项相映射的检测结果,包括如下步骤:
查询缓存区内键值对映射表中是否存在包含所述索引项的目标键值对,当存在该目标键值对时,获取该目标键值对的值域中的检测结果;
当不存在该目标键值对时,访问所述存储地址调用所述商品信息,将该商品信息输入当前启用的安全分类模型中实施信息安全检测,获得相应的检测结果;
以所述索引项为键域,以所述安全分类模型输出的检测结果为值域,构造为所述商品信息相对应的键值对,存储于所述缓存区的键值对映射表中。
扩展的部分实施例中,响应安全检测请求的步骤之前,包括如下步骤:
接收并分布式存储独立站点编辑提交的商品描述信息,所述商品描述信息包含用于描述商品对象的图片信息和/或文本信息;
根据当前启用的安全分类模型所定义的输入参数而确定该商品描述信息中的图片信息和/或文本信息作为待检测的商品信息,获得该商品信息相应的存储地址;
触发安全检测请求以获取所述商品信息的检测结果,在该请求中包含待检测的商品信息的存储地址。
扩展的部分实施例中,推送所述检测结果以应答所述安全检测请求的步骤之后,包括如下步骤:
根据所述检测结果所包括的多个安全类别相对应的置信度,确定其中置信度最高的安全类别为商品信息相对应的检测类别;
判断所述检测类别是否属于预设的允许类别,当为允许类别时,向线上店铺发布所述商品对象。
深化的部分实施例中,所述安全分类模型对所述商品信息实施信息安全检测的过程,包括如下步骤:
对所述商品信息进行预处理;
采用语义特征提取模型对预处理后的商品信息提取深层语义特征,获得所述商品信息的语义特征信息;
将所述语义特征信息映射到分类空间获得该商品信息对应所述分类空间的各个安全类别的置信度,构成所述商品信息的检测结果。
扩展的部分实施例中,推送所述检测结果以应答所述安全检测请求的步骤之后,还包括如下步骤:
响应定时任务到达事件,获取当前启用的安全分类模型的版本信息;
检索出所述缓存区中未包含所述版本信息的索引项,将该索引项所在的键值对从缓存区中清除。
适应本申请的目的之一而提供的一种电商信息安全检测装置,包括请求响应模块、索引构造模块、结果获取模块,以及推送应答模块,其中:所述请求响应模块,用于响应安全检测请求,获取该请求所携带的存储地址,根据该存储地址获得待检测的商品信息;所述索引构造模块,用于构造索引项,该索引项包含当前启用的安全分类模型的版本信息及所述存储地址的编码映射信息;所述结果获取模块,用于从缓存区中获取与该索引项相映射的检测结果,当获取失败时,调用当前启用的安全分类模型对所述商品信息实施信息安全检测以获得所述检测结果,将该检测结果与所述索引项相映射存储于所述缓存区中;所述推送应答模块,用于推送所述检测结果以应答所述安全检测请求。
深化的部分实施例中,所述索引构造模块,包括:版本查询单元,用于获取当前启用的安全分类模型的版本号作为其版本信息;编码映射单元,用于应用数字摘要算法计算所述存储地址的散列值,作为该存储地址的编码映射信息;拼接索引单元,用于将所述版本信息与所述编码映射信息拼接为待检测的商品信息的索引项。
深化的部分实施例中,所述结果获取模块,包括:缓存调用单元,用于查询缓存区内键值对映射表中是否存在包含所述索引项的目标键值对,当存在该目标键值对时,获取该目标键值对的值域中的检测结果;模型调用单元,用于当不存在该目标键值对时,访问所述存储地址调用所述商品信息,将该商品信息输入当前启用的安全分类模型中实施信息安全检测,获得相应的检测结果;结果缓存单元,用于以所述索引项为键域,以所述安全分类模型输出的检测结果为值域,构造为所述商品信息相对应的键值对,存储于所述缓存区的键值对映射表中。
扩展的部分实施例中,本申请的电商信息安全检测装置还包括先于所述请求响应模块运行的如下模块:提交处理模块,用于接收并分布式存储独立站点编辑提交的商品描述信息,所述商品描述信息包含用于描述商品对象的图片信息和/或文本信息;信息调用模块,用于根据当前启用的安全分类模型所定义的输入参数而确定该商品描述信息中的图片信息和/或文本信息作为待检测的商品信息,获得该商品信息相应的存储地址;请求触发模块,用于触发安全检测请求以获取所述商品信息的检测结果,在该请求中包含待检测的商品信息的存储地址。
扩展的部分实施例中,本申请的电商信息安全检测装置还包括后于所述推送应答模块运行的如下模块:类别确定模块,用于根据所述检测结果所包括的多个安全类别相对应的置信度,确定其中置信度最高的安全类别为商品信息相对应的检测类别;商品发布模块,用于判断所述检测类别是否属于预设的允许类别,当为允许类别时,向线上店铺发布所述商品对象。
深化的部分实施例中,所述安全分类模型包括:预处理单元,用于对所述商品信息进行预处理;特征提取单元,用于采用语义特征提取模型对预处理后的商品信息提取深层语义特征,获得所述商品信息的语义特征信息;分类映射单元,用于将所述语义特征信息映射到分类空间获得该商品信息对应所述分类空间的各个安全类别的置信度,构成所述商品信息的检测结果。
扩展的部分实施例中,本申请的电商信息安全检测装置还包括后于所述推送应答模块运行的如下模块:任务响应模块,用于响应定时任务到达事件,获取当前启用的安全分类模型的版本信息;缓存清理模块,用于检索出所述缓存区中未包含所述版本信息的索引项,将该索引项所在的键值对从缓存区中清除。
适应本申请的目的之一而提供的一种计算机设备,包括中央处理器和存储器,所述中央处理器用于调用运行存储于所述存储器中的计算机程序以执行本申请所述的电商信息安全检测方法的步骤。
适应本申请的另一目的而提供的一种计算机可读存储介质,其以计算机可读指令的形式存储有依据所述的电商信息安全检测方法所实现的计算机程序,该计算机程序被计算机调用运行时,执行该方法所包括的步骤。
适应本申请的另一目的而提供的一种计算机程序产品,包括计算机程序/指令,该计算机程序/指令被处理器执行时实现本申请任意一种实施例中所述方法的步骤。
相对于现有技术,本申请的技术方案包含多方面的技术优势,包括但不限于如下各方面:
首先,本申请实现一种商品信息安全检测服务,在独立站触发安全检测请求后,响应于该安全检测请求而确定据以检测的商品信息的存储地址,然后根据当前启用的安全分类模型的版本信息及所述存储地址的编码映射信息构造出具有索引项,索引项顾名思义具有唯一性特征的作用,根据该索引项查询系统缓存区,优先利用缓存区中由该安全分类模型在历史服务过程中生成的检测结果,只有在未能从缓存区中获得所述的检测结果时,才调用该安全分类模型对所述的商品信息进行安全检测,确定出相应的检测结果,并将该检测结果关联所述的索引项存储于所述的缓存区中以备后续优先调用。据此,对于同一商品信息,同一版本的安全分类模型的检测结果可以从所述的缓存区中复用,即使用户多次修改同一商品的商品信息,也只需针对其商品信息调用一次安全分类模型确定其检测结果,对于需要并发响应多个独立站的安全检测请求的计算机设备来说,可以大大节省系统开销,并且提升返回检测结果的即时性。
其次,由于在所述的索引项中关联了安全分类模型的版本信息,可以确保安全分类模型一旦被其新版本替换,所构造的索引项随着版本信息被替换而无法在缓存区中查找到相应的检测结果,于是自动调用该新版本的安全分类模型重新获取商品信息的检测结果,从而可以确保自动适应安全分类模型的升级换代而确保始终为商品信息的安全检测提供最新版本的检测结果。
此外,本申请的技术方案所实现的服务,作为一个相对独立于独立站的安全检测服务,功能相对集中,能够根据商品信息的存储地址获取商品信息,能够并发地响应海量的安全检测请求,能够使用缓存机制最小化对安全分类模型的调用,这些手段结合的后果,使得电商平台的安全检测服务实现以最小代价部署而提供最大经济价值的服务。
附图说明
本申请上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1为本申请的电商信息安全检测方法的典型实施例的流程示意图;
图2为本申请实施例中构造索引项的过程的流程示意图;
图3为本申请实施例中获取商品信息的检测结果的过程的流程示意图;
图4为本申请实施例中触发安全检测请求的过程的流程示意图;
图5为本申请实施例中安全分类模型的工作过程的流程示意图;
图6为本申请实施例中进一步清理缓存区的过程的流程示意图;
图7为本申请的电商信息安全检测装置的原理框图;
图8为本申请所采用的一种计算机设备的结构示意图。
具体实施方式
下面详细描述本申请的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本申请,而不能解释为对本申请的限制。
本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本申请的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。应该理解,当我们称元件被“连接”或“耦接”到另一元件时,它可以直接连接或耦接到其他元件,或者也可以存在中间元件。此外,这里使用的“连接”或“耦接”可以包括无线连接或无线耦接。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的全部或任一单元和全部组合。
本技术领域技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语),具有与本申请所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语,应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样被特定定义,否则不会用理想化或过于正式的含义来解释。
本技术领域技术人员可以理解,这里所使用的“客户端”、“终端”、“终端设备”既包括无线信号接收器的设备,其仅具备无发射能力的无线信号接收器的设备,又包括接收和发射硬件的设备,其具有能够在双向通信链路上,进行双向通信的接收和发射硬件的设备。这种设备可以包括:蜂窝或其他诸如个人计算机、平板电脑之类的通信设备,其具有单线路显示器或多线路显示器或没有多线路显示器的蜂窝或其他通信设备;PCS(PersonalCommunications Service,个人通信系统),其可以组合语音、数据处理、传真和/或数据通信能力;PDA(Personal Digital Assistant,个人数字助理),其可以包括射频接收器、寻呼机、互联网/内联网访问、网络浏览器、记事本、日历和/或GPS(Global PositioningSystem,全球定位系统)接收器;常规膝上型和/或掌上型计算机或其他设备,其具有和/或包括射频接收器的常规膝上型和/或掌上型计算机或其他设备。这里所使用的“客户端”、“终端”、“终端设备”可以是便携式、可运输、安装在交通工具(航空、海运和/或陆地)中的,或者适合于和/或配置为在本地运行,和/或以分布形式,运行在地球和/或空间的任何其他位置运行。这里所使用的“客户端”、“终端”、“终端设备”还可以是通信终端、上网终端、音乐/视频播放终端,例如可以是PDA、MID(Mobile Internet Device,移动互联网设备)和/或具有音乐/视频播放功能的移动电话,也可以是智能电视、机顶盒等设备。
本申请所称的“服务器”、“客户端”、“服务节点”等名称所指向的硬件,本质上是具备个人计算机等效能力的电子设备,为具有中央处理器(包括运算器和控制器)、存储器、输入设备以及输出设备等冯诺依曼原理所揭示的必要构件的硬件装置,计算机程序存储于其存储器中,中央处理器将存储在外存中的程序调入内存中运行,执行程序中的指令,与输入输出设备交互,借此完成特定的功能。
需要指出的是,本申请所称的“服务器”这一概念,同理也可扩展到适用于服务器机群的情况。依据本领域技术人员所理解的网络部署原理,所述各服务器应是逻辑上的划分,在物理空间上,这些服务器既可以是互相独立但可通过接口调用的,也可以是集成到一台物理计算机或一套计算机机群的。本领域技术人员应当理解这一变通,而不应以此约束本申请的网络部署方式的实施方式。
本申请的一个或数个技术特征,除非明文指定,既可部署于服务器实施而由客户端远程调用获取服务器提供的在线服务接口来实施访问,也可直接部署并运行于客户端来实施访问。
本申请中所引用或可能引用到的神经网络模型,除非明文指定,既可部署于远程服务器且在客户端实施远程调用,也可部署于设备能力胜任的客户端直接调用,某些实施例中,当其运行于客户端时,其相应的智能可通过迁移学习来获得,以便降低对客户端硬件运行资源的要求,避免过度占用客户端硬件运行资源。
本申请所涉及的各种数据,除非明文指定,既可远程存储于服务器,也可存储于本地终端设备,只要其适于被本申请的技术方案所调用即可。
本领域技术人员对此应当知晓:本申请的各种方法,虽然基于相同的概念而进行描述而使其彼此间呈现共通性,但是,除非特别说明,否则这些方法都是可以独立执行的。同理,对于本申请所揭示的各个实施例而言,均基于同一发明构思而提出,因此,对于相同表述的概念,以及尽管概念表述不同但仅是为了方便而适当变换的概念,应被等同理解。
本申请即将揭示的各个实施例,除非明文指出彼此之间的相互排斥关系,否则,各个实施例所涉的相关技术特征可以交叉结合而灵活构造出新的实施例,只要这种结合不背离本申请的创造精神且可满足现有技术中的需求或解决现有技术中的某方面的不足即可。对此变通,本领域技术人员应当知晓。
本申请的一种电商信息安全检测方法,可被编程为计算机程序产品,部署于客户端或服务器中运行而实现,例如在本申请的电商平台应用场景中,一般部署在服务器中实施,藉此可以通过访问该计算机程序产品运行后开放的接口,通过图形用户界面与该计算机程序产品的进程进行人机交互而执行该方法。
请参阅图1,本申请的电商信息安全检测方法,可被实现为一个功能相对独立的在线服务,服务于电商平台的各个独立站点的信息安全检测,而并发响应各个独立站点的调用,为此,在其典型实施例中,包括如下步骤:
步骤S1100、响应安全检测请求,获取该请求所携带的存储地址,根据该存储地址获得待检测的商品信息:
当任意一个独立站点调用本申请实现的在线服务时,即信息安全检测服务时,可触发安全检测请求发送给该检测服务,在该检测请求中携带线上店铺的管理用户上传的商品信息的存储地址。
所述的商品信息,属于用户所发布的商品相对应的商品描述信息。电商平台上发布的商品,以所述的商品描述信息进行定义,从而在数据层面定义出一个商品对象,以便以商品对象对各个商品实施相应的调用。所述的商品描述信息,包括各种图片信息和文本信息,所述的图片信息,通常是用于展示商品的样貌的相关图片,包括商品主要图片和商品详情中的各个细节、环境图片等;所述的文本信息,可以包括商品标题、商品详情、商品简介以及商品的属性数据等任意文本类信息。
所述安全检测请求所携带的存储地址所指向的商品信息,可以是该商品描述信息中的图片信息、文本信息或者两者的结合,具体根据本申请所采用的安全分类模型的输入参数要求也即其据以分类的基础信息而灵活适配即可。
独立站点可以提交新的商品相对应的商品描述信息,也可以针对已经发布到线上的商品的商品描述信息进行编辑提交,每次提交所述的商品描述信息后,相应的商品描述信息被传输到数据库引擎进行存储,从而获得各个具体商品描述信息相对应的所述存储地址,例如一个商品图片的存储地址,或一个商品文本相对应的存储地址等,于是,只要调用其中的某种图片信息和/或文本信息,便可相应获得所述图片信息和/或文本信息相应的各个存储地址,反之,根据各个存储地址,便可相应获得各个存储地址所指向的图片信息或文本信息的二进制数据。考虑到电商平台存在海量的商品描述信息的事实,平台一般采用分布式存储系统对商品描述信息进行存储,因而,当需要向本申请的信息安全检测服务传递相应的商品信息时,通过在所述的安全检测请求中携带相应商品信息的存储地址进行传输,可节省服务集群之间的传输带宽,而由相应的服务自行根据存储地址调用相应的待检测的商品信息即可。
步骤S1200、构造索引项,该索引项包含当前启用的安全分类模型的版本信息及所述存储地址的编码映射信息:
本申请中,由所述安全分类模型对商品信息实施安全检测所获得的检测结果被预存储至系统缓存区中,以便对其进行高效复用,避免重复调用安全分类模型对同一商品信息进行重复的分类识别,从而节省系统开销,并且通过缓存机制提升检测结果获取效率。
所述的缓存区中,示例而言,可采用Redis机制,对商品信息与其检测结果之间的映射关系进行存储,为此,会为每个商品信息构造一个索引项,通过该索引项建立起与具体商品信息之间的唯一性对应关系,起到唯一性特征的作用,然后将该索引项与相应的检测结果进行关联存储即可。基于Redis键值对存储机制,所述的索引项可以存储为键值对中的键域的数据,所述的检测结果可以存储为键值对中的值域的数据。由此,缓存区实际上存储一个键值对映射表,根据一个商品信息的索引项,便可获得其相对应的检测结果。
所述的索引项,是以存储地址为单位进行一一对应的,例如,当所述存储地址指向一张商品图片时,该索引项便对应该商品图片;当所述存储地址指向一部分集中存储的文本时,该索引项便对应所述的文本。
所述的索引项,包括两部分信息,第一部分为当前启用的安全分类模型的版本信息,第二部分为根据所述存储地址进行编码所得的编码映射信息。不难理解,第一部分的版本信息是对应安全分类模型的不同版本而设置的,一般可直接采用该安全分类模型的版本号或其他能够指示不同版本的特征信息例如数字签名MD5散列值构成,具有区别不同版本的安全分类模型所产生的检测结果的作用。第二部分的编码映射信息,则是根据存储地址所编码产生的,具有唯一性对应具体的商品信息的作用,因此索引项与具体商品信息之间的一一对应关系,具体反映为其中的第二部分的编码映射信息与所述商品信息的存储地址之间的一一对应关系。
根据以上的原理,构造所述安全检测请求中的存储地址的索引项时,先将所述的存储地址按照预设的编码算法转换为相对应的编码映射信息,然后再将当前启用的安全分类模型的版本信息与所述的编码映射信息组合为索引项,该索引项由于编码映射信息与版本信息的共同作用,而具有唯一性特征的作用,可以用于确定针对某一存储地址所指向的某个具体商品信息在某个版本的安全分类模型所获得的检测结果。
步骤S1300、从缓存区中获取与该索引项相映射的检测结果,当获取失败时,调用当前启用的安全分类模型对所述商品信息实施信息安全检测以获得所述检测结果,将该检测结果与所述索引项相映射存储于所述缓存区中:
构造出所述安全检测请求中的存储地址相对应的索引项后,便可从所述的缓存区中查询该索引项相对应的键值对,然后从该键值对中确定与该索引项相映射的检测结果。如果所述的存储地址所指向的商品信息事先已经由当前版本的安全分类模型检测过,该缓存区中便会预存相应的检测结果,由此,便存在该键值对,便可从该键值对中获得相应的检测结果,否则,如果不存在与该索引项相对应的键值对,表明缓存区中不存在相应的检测结果,从缓存区中获取该索引项相应的检测结果已经失败,也意味着所述安全检测请求中的存储地址所指向的商品信息,并未被当前版本的安全分类模型检测过,因此,有必要转而调用当前启用的安全分类模型对该商品信息实施信息安全检测。
当调用当前启用的安全分类模型对所述安全检测请求中的存储地址所指向的商品信息进行检测时,先根据该存储地址从数据库中获得相应的商品信息,然后根据安全分类模型的需要,对该商品信息进行适当的预处理后,将其输入安全分类模型中实施检测即可获得相应的检测结果。
所述的安全分类模型,可以是基于规则、基于机器学习或者基于深度学习构造的预设模型,使其适于根据相应的商品信息而输出相应的检测结果即可,可由本领域技术人员根据实际需求而实现,并且可以不断升级迭代,不影响本申请的创造精神的体现。
所述安全分类模型可以是适于单独处理图片信息或文本信息,或者联立图片信息和文本信息而得出检测结果,具体视本领域技术人员对模型的构造而定,也不影响本申请的创造精神的体现,相应的,所述安全检测请求在提供所述的商品信息的存储地址时,应根据安全分类模型的构造所要求的输入而提供相应具体商品信息相对应的一个或多个存储地址。
所述安全分类模型针对所述存储地址所指向的商品信息确定出所述的检测结果之后,后续可以复用,因而,可将其存储于所述的缓存区中。为此,根据以上揭示的缓存区的实现原理,可以存储地址所对应的索引项关联安全分类模型根据该存储地址所指向的商品信息而确定的检测结果,构造为映射关系数据,即所述的键值对,存储于缓存区的键值对映射表中即可。
当所述安全分类模型仅单独针对单个存储地址所指向的单个图片信息或单个文本信息确定检测结果的情况下,该单个存储地址与所述检测结果的映射关系数据,便表征该存储地址所指向的商品信息的检测结果。
当所述安全分类模型针对单个图片信息与单个文本信息的结合进行综合检测获得所述的检测结果时,安全检测请求中对应所述单个图片信息与所述单个文本信息分别提供独立对应的存储地址,故而可获得两个索引项,此时,可将每个索引项与所述检测结构构造一个键值对,即获得两个键值对,存储于所述的缓存区的键值对映射表中,后续如果触发新的安全检测请求并提供该两个存储地址时,便可对应调用出两个键值对,根据两个键值对的检测结果是否相同,在两个检测结果相同时确认为真实的检测结果即可。如果两个检测结果不相同,则可重新调用所述的安全分类模型进行重新确定所述的检测结果,最终与此处同理可缓存最新的检测结果。
保存到所述缓存区中的最新检测结果,由于其关联了所述的索引项,因而,后续再根据相同的索引项进行检索,便可获得相对应的检测结果,而无需重新调用所述安全分类模型实施重复检测。
当所述的安全分类模型被升级,而出现版本号的更换时,根据前一步骤所构造出的索引项,由于版本信息变化而与安全分类模型未升级前不同,因而,将无法从所述缓存区中找到对应的键值对,这种情况下,便只能重新调用最新版本的安全分类模型进行重新确定检测结果,因而,实际上通过索引项的构造机制实现了一个自适应安全分类模型升级而更新缓存区中的检测结果的机制。
步骤S1400、推送所述检测结果以应答所述安全检测请求:
根据前述各步骤,可以看出,响应于所述的安全检测请求后,根据存储地址的索引项,或者从所述的缓存区中获得该存储地址相应的商品信息的检测结果,或者在缓存区中不存在所述的检测结果的情况下调用安全分类模型获得相应的检测结果,无论如何,均可获得该安全检测请求所期望的检测结果,因而,便可将所述的检测结果用于应答所述的安全检测请求,返回给相应的请求方,由相应的请求方实现进一步的业务流程,根据该检测结果控制相应的商品信息是否可以发布等。
由此可见,基于本申请将其技术方案实现为在线服务的能力,可以响应海量的并发的安全检测请求,海量安全检测请求对应产生的海量的检测结果,均可被缓存管理,实现高效调度。
根据本申请的典型实施例及其变通实施例可以知晓,相对于现有技术,本申请的技术方案包含多方面的技术优势,包括但不限于如下各方面:
首先,本申请实现一种商品信息安全检测服务,在独立站触发安全检测请求后,响应于该安全检测请求而确定据以检测的商品信息的存储地址,然后根据当前启用的安全分类模型的版本信息及所述存储地址的编码映射信息构造出具有索引项,索引项顾名思义具有唯一性特征的作用,根据该索引项查询系统缓存区,优先利用缓存区中由该安全分类模型在历史服务过程中生成的检测结果,只有在未能从缓存区中获得所述的检测结果时,才调用该安全分类模型对所述的商品信息进行安全检测,确定出相应的检测结果,并将该检测结果关联所述的索引项存储于所述的缓存区中以备后续优先调用。据此,对于同一商品信息,同一版本的安全分类模型的检测结果可以从所述的缓存区中复用,即使用户多次修改同一商品的商品信息,也只需针对其商品信息调用一次安全分类模型确定其检测结果,对于需要并发响应多个独立站的安全检测请求的计算机设备来说,可以大大节省系统开销,并且提升返回检测结果的即时性。
其次,由于在所述的索引项中关联了安全分类模型的版本信息,可以确保安全分类模型一旦被其新版本替换,所构造的索引项随着版本信息被替换而无法在缓存区中查找到相应的检测结果,于是自动调用该新版本的安全分类模型重新获取商品信息的检测结果,从而可以确保自动适应安全分类模型的升级换代而确保始终为商品信息的安全检测提供最新版本的检测结果。
此外,本申请的技术方案所实现的服务,作为一个相对独立于独立站的安全检测服务,功能相对集中,能够根据商品信息的存储地址获取商品信息,能够并发地响应海量的安全检测请求,能够使用缓存机制最小化对安全分类模型的调用,这些手段结合的后果,使得电商平台的安全检测服务实现以最小代价部署而提供最大经济价值的服务。
请参阅图2,深化的部分实施例中,所述步骤S1200、构造索引项,包括如下步骤:
步骤S1210、获取当前启用的安全分类模型的版本号作为其版本信息:
本实施例中,构造索引项时,先检测当前启用的安全分类模型的版本号,当前启用的安全分类模型即为已经配置为本申请的安全检测服务所使用的安全分类模型,其可以在所述的安全分类模型被重新训练并达致收敛后对原有的安全分类模型进行升级所获得,相应的,其版本号被更新,故而可在此处调用。
步骤S1220、应用数字摘要算法计算所述存储地址的散列值,作为该存储地址的编码映射信息:
继而,可以采用预设的数字摘要算法,例如MD5算法,对所述安全检测请求中提供的各个存储地址计算散列值,所述散列值一般为256位的二进制数值或32位的十六进制数值,该散列值即为所述的各个存储地址相对应的编码映射信息。根据数字摘要算法的原理,该散列值一般具有唯一性。同理,也可采用其他数字摘要算法予以实现,例如MD4等,本领域技术人员可灵活实施。
步骤S1230、将所述版本信息与所述编码映射信息拼接为待检测的商品信息的索引项:
进一步,将所述安全分类模型相对应的版本信息,即其版本号,与所述的编码映射信息,即所述的散列值做顺序拼接,由此获得一个字符串,即可作为所述存储地址相对应的索引项。
本实施例中,采用安全分类模型的版本号与存储地址的散列值构造出相应的索引项,其中的版本号可以用于区分不同版本的安全分类模型,其中的散列值可以用于区分不同的商品信息,因而,后续在根据索引项查询缓存区中的键值对时,无论是安全分类模型的版本出现变化,还是针对不同的商品信息所引起的变动,均可通过该索引项反映,从而,使本申请的安全检测服务能够自适应这些信息的变动,而灵活决定调用缓存区中的对应检测结果还是调用安全分类模型重新获取检测结果。
请参阅图3,深化的部分实施例中,所述步骤S1300、从缓存区中获取与该索引项相映射的检测结果,包括如下步骤:
步骤S1310、查询缓存区内键值对映射表中是否存在包含所述索引项的目标键值对,当存在该目标键值对时,获取该目标键值对的值域中的检测结果:
当针对一个存储地址完成其索引项的构造后,需要从缓存区中查询与该索引项相对应的键值对。据此,先在所述缓存区中查询是否存在与该索引项相一致的键,当存在时,即确认存在相对应的键值对,从而可以从该键值对中直接调用出与该索引项相映射的检测结果。
步骤S1320、当不存在该目标键值对时,访问所述存储地址调用所述商品信息,将该商品信息输入当前启用的安全分类模型中实施信息安全检测,获得相应的检测结果:
如果前一步骤中在缓存区中未查询到所述索引项相对应的键值对,即表示从缓存区中获取所述索引项相对应的检测结果失败,据此,便需调用当前正在启用的安全分类模型重新确定所述索引项相对应的商品信息的检测结果。
为了实施对所述商品信息的安全检测,首先根据所述的存储地址从数据库中获得相应的商品信息,例如所述的图片信息或文本信息。然后,根据安全分类模型的要求以所述商品信息做预处理后,输入至该安全分类模型中实施检测,最终获得模型输出的检测结果。根据安全分类模型的构造不同,所述的检测结果所包含的内容也相应不同,不影响本申请的创造精神的体现。
步骤S1330、以所述索引项为键域,以所述安全分类模型输出的检测结果为值域,构造为所述商品信息相对应的键值对,存储于所述缓存区的键值对映射表中:
为了实现对安全分类模型所获得的最新的检测结果的缓存,根据缓存区的构造原理,将与存储地址相对应的所述索引项作为键,将其相应的检测结果作为值,构造为新的键值对,存储于所述缓存区的键值对映射表中即可。
本实施例体现根据缓存区中的键值对映射表实现所述的索引项与检测结果之间映射关系的存储和调用的过程,根据该过程可以知晓,所述缓存区中的检测结果被置于优先调用的顺序中,从而确保安全检测请求可以迅速获取相应的检测结果,并且避免针对每次请求都调用安全分类模型实施检测,可以节省系统开销。而当缓存区不存在与索引项相对应的检测结果时,又能自适应调用安全分类模型实施即时检测而获得检测结果,因而能适应安全分类模型的升级换代而及时自适应更新缓存区中的检测结果,确保安全检测请求能够获得最新的检测服务。
请参阅图4,扩展的部分实施例中,所述步骤S1100、响应安全检测请求的步骤之前,包括如下步骤:
步骤S1010、接收并分布式存储独立站点编辑提交的商品描述信息,所述商品描述信息包含用于描述商品对象的图片信息和/或文本信息:
对于独立站点而言,为独立站点提供商品对象的商品描述信息的发布和维护的服务,在其接收了各独立站点出于发布或更新某个商品对象的目的而提交的商品描述信息,可以对其进行分布式存储到数据仓库中,由此生成所述商品描述信息相对应的存储地址。具体而言,可以生成所述商品描述信息中的各个具体商品信息的存储地址,例如其中的各张商品图片的存储地址,或者其中的某一部分文本单元相对应的存储地址。
通常,无论是商品首次发布时,还是对已发布的商品的商品描述信息进行编辑,都是批量处理多个商品信息的,例如,对于一个商品对象,其商品描述信息会包括其商品标题、商品主要图片、商品详情文本、商品细节图片等,这些商品信息一般会通过同一页面进行统一编辑,在编辑后可统一提交,由此,当商品描述信息每次被统一提交并存储时,均能确定其中各个具体商品信息相对应的存储地址,无论其对应的商品信息是否在是次提交中被更新。
一般而言,针对所述的商品图片,以单张图片进行独立存储,因此,每张商品图片拥有一个对应的存储地址;针对所述的文本信息,一般可将一个商品对象相对应的所有文本信息视为一个组,提供单一存储地址供调用即可,或者也可划分为多组而相应提供多个存储地址,对此,本领域技术人员可灵活实施。
步骤S1020、根据当前启用的安全分类模型所定义的输入参数而确定该商品描述信息中的图片信息和/或文本信息作为待检测的商品信息,获得该商品信息相应的存储地址:
理论上,针对所述商品描述信息中的各个具体商品信息,均需进行信息安全检测,因此,可以每项商品信息为单位,视安全分类模型的输入参数要求,而确定组织何种待检测的商品信息,提供这些商品信息的存储地址,封装为安全检测请求相对应携带的数据。
一种实施例中,所述的安全分类模型适于对单张商品图片实施安全检测,对应的,其通过输入参数定义输入单张商品图片,据此,可将各个商品图片视为相互独立的图片信息,适应各张商品图片分别提供存储地址调用本申请的安全检测服务进行检测。
另一实施例中,所述的安全分类模型适于对单组文本信息实施安全检测,对应的,其通过输入参数定义输入单组文本信息,据此,可将各组文本信息视为相互独立的文本信息,适应各组分别提供存储地址调用本申请的安全检测服务进行检测。
再一实施例中,所述的安全分类模型被实现为同时利用图片信息和文本信息进行信息安全检测,由此通过其输入参数的定义,而要求同时提供所述的图片信息和文本信息相对应的存储地址,通常是单张商品图片的存储地址和单组文本信息的存储地址,由是,两个存储地址被作为传参,调用本申请的安全检测服务进行检测。
步骤S1030、触发安全检测请求以获取所述商品信息的检测结果,在该请求中包含待检测的商品信息的存储地址:
对应所述的安全分类模型构造好要传递的存储地址后,便可调用安全检测请求,将所述的存储地址作为该请求所携带的参数,传递给本申请的安全检测服务,本申请的安全检测服务便可根据其中的存储地址,执行本申请前述各个实施例所揭示的业务逻辑,从而获得相应的检测结果。
本实施例进一步揭示适应安全分类模型所定义的参数而对应处理用户提交的商品描述信息而确定提供给本申请的安全检测服务的存储地址,可见,对于本申请的安全检测服务而言,只要规范好相应的接口,然后由电商平台在需要实施信息安全检测时,对应提供相应的商品信息的存储地址,即可实现兼容对接,而根据本申请所创新的业务逻辑获得期望的检测结果。
扩展的部分实施例中,在前一实施例的基础上,所述步骤S1400、推送所述检测结果以应答所述安全检测请求的步骤之后,包括如下步骤:
步骤S1511、根据所述检测结果所包括的多个安全类别相对应的置信度,确定其中置信度最高的安全类别为商品信息相对应的检测类别:
所述的安全分类模型,本实施例中,为基于深度学习实现的神经网络模型,其通过对输入其中的商品信息提取深层语义特征,然后在该深层语义特征的基础上做分类映射,获得其映射到预设的分类空间的各个具体安全类别相对应的置信度,也即其属于每个安全类别的分类概率。该分类空间相对应的各个安全类别及其置信度,便构成安全分类模型检测获得的检测结果。
调用本申请的安全检测服务获得所述的检测结果后,便可解析该检测结果,而获得其中各个安全类别相对应的置信度,然后,便可从中确定置信度最高的安全类别作为提供给安全检测服务检测的商品信息相对应的检测类别。
所述分类空间所包含的各个安全类别,是适应独立站所在的国家或地区的法律法规而预先规划的类别,可以预先为这些类别赋予相应的含义,例如“涉黄类”、“涉毒类”、“涉赌类”、“健康类”等,具体可由本领域技术人员根据实际需求而灵活预设。
步骤S1512、判断所述检测类别是否属于预设的允许类别,当为允许类别时,向线上店铺发布所述商品对象:
可以根据各国各地区而预设处理不同安全类别的业务逻辑,例如,确定出商品信息相对应的检测类别后,先判断所述的检测类别是否属于预设的允许类别,例如“健康类”属于允许类别,当一个商品信息被检测为该类别时,便可将包含此一商品信息的商品描述信息发布至独立站的线上店铺,使其对公众可见,否则,如果不属于所述的允许类别,则可提醒用户重新编辑修改。
本实施例进一步完善了线上店铺发布商品对象相对应的商品描述信息的业务流程,实现业务闭环,据此可以看出,在本申请所实现的安全检测服务的缓存机制的支持下,线上店铺在发布其商品的商品描述信息时,能够借助该安全检测服务快速确定其中的商品信息的安全性,避免每次编辑同一商品的商品描述信息均需对商品描述信息中的每个已存的具体商品信息重复调用安全分类模型进行安全检测,而是通过对缓存的灵活利用,而实现高效快速的检测,获得相应的检测结果,依据检测结果迅速更新商品描述信息。
请参阅图5,深化的部分实施例中,所述安全分类模型对所述商品信息实施信息安全检测的过程,包括如下步骤:
步骤S2100、对所述商品信息进行预处理:
根据安全分类模型的构造不同,其所依赖的输入数据不同,可能需要进行不同的预处理。例如:
当安全分类模型依赖于图片信息进行检测时,可对所述的图片信息进行常规的图像预处理,包括图像缩放、裁剪、商品定位等,本领域技术人员可根据实际情况预先选取可采用的预处理手段实施之。
当安全分类模型依赖于文本信息进行检测时,可对所述的文本信息进行去除停用词、去除空格、分词等预处理,同理也可由本领域技术人员灵活实施。
当安全分类模型同时依赖图片信息和文本信息进行综合检测时,则两分别对该两种商品信息进行相应的预处理。
步骤S2200、采用语义特征提取模型对预处理后的商品信息提取深层语义特征,获得所述商品信息的语义特征信息:
所述的安全分类模型,对应其构造而包括语义特征提取模型,根据其构造的不同,所包含的语义特征提取模型可以不同。例如:
当安全分类模型被构造为用于对图片信息进行安全识别时,所述语义特征提取模型可采用基于CNN实现的神经网络模型来实施,例如FastCNN、Resnet系列等基础模型,用于实现对所述的图片信息的特征表示,获得相应的语义特征信息。
当安全分类模型被构造为用于对文本信息进行识别时,所述语义特征提取模型可采用诸如Bert、TextCNN、LSTM等适于处理文本的神经网络模型来实施,用于实现对所述文本信息的特征表示,获得相应的语义特征信息。
而当安全分类模型被构造为同时利用图片信息和文本信息进行安全识别,可以并行两路,分别采取上述图片信息和文本信息相对应的模型,各自进行特征表示获得其各自的语义特征信息之后,再经由一拼接层将两路语义特征信息结合为同一语义特征信息即可。
步骤S2300、将所述语义特征信息映射到分类空间获得该商品信息对应所述分类空间的各个安全类别的置信度,构成所述商品信息的检测结果:
所述安全分类模型在获得其输入的商品信息相对应的最后的语义特征信息后,便可通过全连接层将该语义特征信息映射到预设的分类空间,从而获得该分类空间预设的各个安全类别相对应的置信度,也就获得了所输入的商品信息相对应的检测结果。
可以理解,所述的安全分类模型,可以采用训练数据集实施迭代训练至收敛状态而获得安全检测能力,从而实现其升级换代,然后重新部署至本申请的安全检测服务中使用,对应也更新其版本号,从而提供区别于历史版本的版本信息,也将导致所述的缓存区中已经存在的商品信息的检测结果需要重新获取,以实现对所述的检测结果的更新。当安全分类模型的安全识别准确性提升的,所述缓存区中的检测结果的准确性也必然得以提升。
由本实施例可知,本申请的安全分类模型基于深度学习而习得对所输入的商品信息的智能分类能力而服务于所述商品信息的安全类别检测,而深度学习模型可以适应数据集的升级而不断升级其安全检测能力,从而提升本申请的安全检测服务的服务能力,提升其安全识别的精准度,使电商平台的商品描述信息的安全检测更为准确可靠,自动为电商平台过滤不安全的商品信息,起到维护电商平台及其独立站点的健康运营的作用。
请参阅图6,扩展的部分实施例中,所述步骤S1400、推送所述检测结果以应答所述安全检测请求的步骤之后,还包括如下步骤:
步骤S1521、响应定时任务到达事件,获取当前启用的安全分类模型的版本信息:
如前所述,本申请的缓存区,由于长期存储海量的并发安全检测请求而积累大量的键值对,而所述的安全分类模型则不断升级换代,安全分类模型历史版本相对应的检测结果,如果由其继续占用缓存区消耗系统开销将不再不实用意义,因而,可以对该缓存区进行定期清理。
为了实现对缓存的定期清理,可以通过定时任务来实现。系统运行定时计划任务,当定时到达时,便触发相应的定时任务到达事件。响应该事件,获取当前启用的安全分类模型的版本信息,以便确定最新的安全分类模型。
步骤S1522、检索出所述缓存区中未包含所述版本信息的索引项,将该索引项所在的键值对从缓存区中清除:
进而,从所述的缓存区的键值对映射表中,检索出键域也即其索引项中未包含所述版本信息的所有的键值对,这些键值对便是存储老版本的安全分类模型的检测结果的键值对,将这些键值对从缓存区中删除,便实现了对旧版本的安全分类模型所产生的历史数据的清除,完成对所述缓存区的清理。
本实施例通过定时任务自动清理缓存区中的冗余信息,可以避免对缓存资源的无效占用,提升缓存访问效率,节约系统开销,从而提升系统的响应速度,提升本申请的安全检测服务的服务成效。
请参阅图7,适应本申请的目的之一而提供的一种电商信息安全检测装置,是对本申请的电商信息安全检测方法的功能化体现,该装置包括请求响应模块1100、索引构造模块1200、结果获取模块1300,以及推送应答模块1400,其中:所述请求响应模块1100,用于响应安全检测请求,获取该请求所携带的存储地址,根据该存储地址获得待检测的商品信息;所述索引构造模块1200,用于构造索引项,该索引项包含当前启用的安全分类模型的版本信息及所述存储地址的编码映射信息;所述结果获取模块1300,用于从缓存区中获取与该索引项相映射的检测结果,当获取失败时,调用当前启用的安全分类模型对所述商品信息实施信息安全检测以获得所述检测结果,将该检测结果与所述索引项相映射存储于所述缓存区中;所述推送应答模块1400,用于推送所述检测结果以应答所述安全检测请求。
深化的部分实施例中,所述索引构造模块1200,包括:版本查询单元,用于获取当前启用的安全分类模型的版本号作为其版本信息;编码映射单元,用于应用数字摘要算法计算所述存储地址的散列值,作为该存储地址的编码映射信息;拼接索引单元,用于将所述版本信息与所述编码映射信息拼接为待检测的商品信息的索引项。
深化的部分实施例中,所述结果获取模块1300,包括:缓存调用单元,用于查询缓存区内键值对映射表中是否存在包含所述索引项的目标键值对,当存在该目标键值对时,获取该目标键值对的值域中的检测结果;模型调用单元,用于当不存在该目标键值对时,访问所述存储地址调用所述商品信息,将该商品信息输入当前启用的安全分类模型中实施信息安全检测,获得相应的检测结果;结果缓存单元,用于以所述索引项为键域,以所述安全分类模型输出的检测结果为值域,构造为所述商品信息相对应的键值对,存储于所述缓存区的键值对映射表中。
扩展的部分实施例中,本申请的电商信息安全检测装置还包括先于所述请求响应模块1100运行的如下模块:提交处理模块,用于接收并分布式存储独立站点编辑提交的商品描述信息,所述商品描述信息包含用于描述商品对象的图片信息和/或文本信息;信息调用模块,用于根据当前启用的安全分类模型所定义的输入参数而确定该商品描述信息中的图片信息和/或文本信息作为待检测的商品信息,获得该商品信息相应的存储地址;请求触发模块,用于触发安全检测请求以获取所述商品信息的检测结果,在该请求中包含待检测的商品信息的存储地址。
扩展的部分实施例中,本申请的电商信息安全检测装置还包括后于所述推送应答模块1400运行的如下模块:类别确定模块,用于根据所述检测结果所包括的多个安全类别相对应的置信度,确定其中置信度最高的安全类别为商品信息相对应的检测类别;商品发布模块,用于判断所述检测类别是否属于预设的允许类别,当为允许类别时,向线上店铺发布所述商品对象。
深化的部分实施例中,所述安全分类模型包括:预处理单元,用于对所述商品信息进行预处理;特征提取单元,用于采用语义特征提取模型对预处理后的商品信息提取深层语义特征,获得所述商品信息的语义特征信息;分类映射单元,用于将所述语义特征信息映射到分类空间获得该商品信息对应所述分类空间的各个安全类别的置信度,构成所述商品信息的检测结果。
扩展的部分实施例中,本申请的电商信息安全检测装置还包括后于所述推送应答模块1400运行的如下模块:任务响应模块,用于响应定时任务到达事件,获取当前启用的安全分类模型的版本信息;缓存清理模块,用于检索出所述缓存区中未包含所述版本信息的索引项,将该索引项所在的键值对从缓存区中清除。
为解决上述技术问题,本申请实施例还提供计算机设备。如图8所示,计算机设备的内部结构示意图。该计算机设备包括通过系统总线连接的处理器、计算机可读存储介质、存储器和网络接口。其中,该计算机设备的计算机可读存储介质存储有操作系统、数据库和计算机可读指令,数据库中可存储有控件信息序列,该计算机可读指令被处理器执行时,可使得处理器实现一种电商信息安全检测方法。该计算机设备的处理器用于提供计算和控制能力,支撑整个计算机设备的运行。该计算机设备的存储器中可存储有计算机可读指令,该计算机可读指令被处理器执行时,可使得处理器执行本申请的电商信息安全检测方法。该计算机设备的网络接口用于与终端连接通信。本领域技术人员可以理解,图8中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
本实施方式中处理器用于执行图7中的各个模块及其子模块的具体功能,存储器存储有执行上述模块或子模块所需的程序代码和各类数据。网络接口用于向用户终端或服务器之间的数据传输。本实施方式中的存储器存储有本申请的电商信息安全检测装置中执行所有模块/子模块所需的程序代码及数据,服务器能够调用服务器的程序代码及数据执行所有子模块的功能。
本申请还提供一种存储有计算机可读指令的存储介质,计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器执行本申请任一实施例的电商信息安全检测方法的步骤。
本申请还提供一种计算机程序产品,包括计算机程序/指令,该计算机程序/指令被一个或多个处理器执行时实现本申请任一实施例所述方法的步骤。
本领域普通技术人员可以理解实现本申请上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,该计算机程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,前述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)等计算机可读存储介质,或随机存储记忆体(Random Access Memory,RAM)等。
综上所述,本申请可为独立站发布的商品信息快速调用其信息安全检测结果,方便独立站决定是否发布所述的商品信息。
本技术领域技术人员可以理解,本申请中已经讨论过的各种操作、方法、流程中的步骤、措施、方案可以被交替、更改、组合或删除。进一步地,具有本申请中已经讨论过的各种操作、方法、流程中的其他步骤、措施、方案也可以被交替、更改、重排、分解、组合或删除。进一步地,现有技术中的具有与本申请中公开的各种操作、方法、流程中的步骤、措施、方案也可以被交替、更改、重排、分解、组合或删除。
以上所述仅是本申请的部分实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本申请的保护范围。
Claims (10)
1.一种电商信息安全检测方法,其特征在于,包括如下步骤:
响应安全检测请求,获取该请求所携带的存储地址,根据该存储地址获得待检测的商品信息;
构造索引项,该索引项包含当前启用的安全分类模型的版本信息及所述存储地址的编码映射信息;
从缓存区中获取与该索引项相映射的检测结果,当获取失败时,调用当前启用的安全分类模型对所述商品信息实施信息安全检测以获得所述检测结果,将该检测结果与所述索引项相映射存储于所述缓存区中;
推送所述检测结果以应答所述安全检测请求。
2.根据权利要求1所述的电商信息安全检测方法,其特征在于,构造索引项,包括如下步骤:
获取当前启用的安全分类模型的版本号作为其版本信息;
应用数字摘要算法计算所述存储地址的散列值,作为该存储地址的编码映射信息;
将所述版本信息与所述编码映射信息拼接为待检测的商品信息的索引项。
3.根据权利要求1所述的电商信息安全检测方法,其特征在于,从缓存区中获取与该索引项相映射的检测结果,包括如下步骤:
查询缓存区内键值对映射表中是否存在包含所述索引项的目标键值对,当存在该目标键值对时,获取该目标键值对的值域中的检测结果;
当不存在该目标键值对时,访问所述存储地址调用所述商品信息,将该商品信息输入当前启用的安全分类模型中实施信息安全检测,获得相应的检测结果;
以所述索引项为键域,以所述安全分类模型输出的检测结果为值域,构造为所述商品信息相对应的键值对,存储于所述缓存区的键值对映射表中。
4.根据权利要求1所述的电商信息安全检测方法,其特征在于,响应安全检测请求的步骤之前,包括如下步骤:
接收并分布式存储独立站点编辑提交的商品描述信息,所述商品描述信息包含用于描述商品对象的图片信息和/或文本信息;
根据当前启用的安全分类模型所定义的输入参数而确定该商品描述信息中的图片信息和/或文本信息作为待检测的商品信息,获得该商品信息相应的存储地址;
触发安全检测请求以获取所述商品信息的检测结果,在该请求中包含待检测的商品信息的存储地址。
5.根据权利要求4所述的电商信息安全检测方法,其特征在于,推送所述检测结果以应答所述安全检测请求的步骤之后,包括如下步骤:
根据所述检测结果所包括的多个安全类别相对应的置信度,确定其中置信度最高的安全类别为商品信息相对应的检测类别;
判断所述检测类别是否属于预设的允许类别,当为允许类别时,向线上店铺发布所述商品对象。
6.根据权利要求1所述的电商信息安全检测方法,其特征在于,所述安全分类模型对所述商品信息实施信息安全检测的过程,包括如下步骤:
对所述商品信息进行预处理;
采用语义特征提取模型对预处理后的商品信息提取深层语义特征,获得所述商品信息的语义特征信息;
将所述语义特征信息映射到分类空间获得该商品信息对应所述分类空间的各个安全类别的置信度,构成所述商品信息的检测结果。
7.根据权利要求1至6中任意一项所述的电商信息安全检测方法,其特征在于,推送所述检测结果以应答所述安全检测请求的步骤之后,还包括如下步骤:
响应定时任务到达事件,获取当前启用的安全分类模型的版本信息;
检索出所述缓存区中未包含所述版本信息的索引项,将该索引项所在的键值对从缓存区中清除。
8.一种电商信息安全检测装置,其特征在于,包括:
请求响应模块,用于响应安全检测请求,获取该请求所携带的存储地址,根据该存储地址获得待检测的商品信息;
索引构造模块,用于构造索引项,该索引项包含当前启用的安全分类模型的版本信息及所述存储地址的编码映射信息;
结果获取模块,用于从缓存区中获取与该索引项相映射的检测结果,当获取失败时,调用当前启用的安全分类模型对所述商品信息实施信息安全检测以获得所述检测结果,将该检测结果与所述索引项相映射存储于所述缓存区中;
推送应答模块,用于推送所述检测结果以应答所述安全检测请求。
9.一种计算机设备,包括中央处理器和存储器,其特征在于,所述中央处理器用于调用运行存储于所述存储器中的计算机程序以执行如权利要求1至7中任意一项所述的方法的步骤。
10.一种计算机可读存储介质,其特征在于,其以计算机可读指令的形式存储有依据权利要求1至7中任意一项所述的方法所实现的计算机程序,该计算机程序被计算机调用运行时,执行相应的方法所包括的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210383173.0A CN114693405A (zh) | 2022-04-12 | 2022-04-12 | 电商信息安全检测方法及其装置、设备、介质、产品 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210383173.0A CN114693405A (zh) | 2022-04-12 | 2022-04-12 | 电商信息安全检测方法及其装置、设备、介质、产品 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114693405A true CN114693405A (zh) | 2022-07-01 |
Family
ID=82142985
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210383173.0A Pending CN114693405A (zh) | 2022-04-12 | 2022-04-12 | 电商信息安全检测方法及其装置、设备、介质、产品 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114693405A (zh) |
-
2022
- 2022-04-12 CN CN202210383173.0A patent/CN114693405A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US12007996B2 (en) | Management of distributed computing framework components | |
US11748639B2 (en) | Case-based reasoning as a cloud service | |
US11455306B2 (en) | Query classification and processing using neural network based machine learning | |
US7895176B2 (en) | Entry group tags | |
US20160162470A1 (en) | Semantic Application Logging and Analytics | |
US20130290323A1 (en) | Systems and methods for automatically associating tags with files in a computer system | |
US11481412B2 (en) | Data integration and curation | |
CN106911782A (zh) | 一种数据读取方法及装置 | |
US11379268B1 (en) | Affinity-based routing and execution for workflow service | |
CN111966692A (zh) | 针对数据仓库的数据处理方法、介质、装置和计算设备 | |
US20230367743A1 (en) | Automatically assigning application shortcuts to folders with user-defined names | |
US9965812B2 (en) | Generating a supplemental description of an entity | |
US20200184014A1 (en) | Internet of everything | |
US10810166B2 (en) | Reconciliation of data in a distributed system | |
CN113127906A (zh) | 基于c/s架构的统一权限管理平台、方法及存储介质 | |
CN114693405A (zh) | 电商信息安全检测方法及其装置、设备、介质、产品 | |
CN113342866B (zh) | 关键词更新方法、装置、计算机设备及存储介质 | |
CN115510116A (zh) | 数据目录构建方法、装置、介质及设备 | |
CN114282541A (zh) | 直播平台信息安全检测方法及其装置、设备、介质、产品 | |
US9659059B2 (en) | Matching large sets of words | |
CN114579398A (zh) | 一种日志的存储方法、装置、设备及存储介质 | |
US11537559B2 (en) | Client generated aggregated indices | |
CN116401260B (zh) | 物品的nft信息树构建方法、装置、计算机设备及存储介质 | |
CN112861036B (zh) | 用户收藏夹访问方法及其装置、设备与介质 | |
US11928423B1 (en) | Transaction entity prediction through learned embeddings |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |