CN109214843B - 一种创意审核方法、装置及服务器 - Google Patents

一种创意审核方法、装置及服务器 Download PDF

Info

Publication number
CN109214843B
CN109214843B CN201710529904.7A CN201710529904A CN109214843B CN 109214843 B CN109214843 B CN 109214843B CN 201710529904 A CN201710529904 A CN 201710529904A CN 109214843 B CN109214843 B CN 109214843B
Authority
CN
China
Prior art keywords
creative
signature
characters
signatures
audited
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710529904.7A
Other languages
English (en)
Other versions
CN109214843A (zh
Inventor
裴宇昕
田新
鲁晨光
马良
李宁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba China Co Ltd
Original Assignee
Alibaba China Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba China Co Ltd filed Critical Alibaba China Co Ltd
Priority to CN201710529904.7A priority Critical patent/CN109214843B/zh
Publication of CN109214843A publication Critical patent/CN109214843A/zh
Application granted granted Critical
Publication of CN109214843B publication Critical patent/CN109214843B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0242Determining effectiveness of advertisements
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0635Risk analysis of enterprise or organisation activities

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • Development Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Economics (AREA)
  • Physics & Mathematics (AREA)
  • Accounting & Taxation (AREA)
  • Marketing (AREA)
  • Finance (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Game Theory and Decision Science (AREA)
  • Educational Administration (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明实施例提供一种创意审核方法、装置及服务器。该方法包括:首先,根据预存词表生成用于一级审核的签名数据库;然后,根据关键词和与创意词条中的创意通配符相邻的预设个字符生成至少一个待审核的签名;最后,将待审核的签名与签名数据库中的各个签名进行匹配,如果全部匹配失败,则判定创意审核通过,反之则判定创意一级审核未通过。这种一级审核方式可以在大量的待审核创意中高效的筛选出大部分完全安全的创意,而对于其余小部分存在风险的创意可以采取精细化审核进一步的确定其是否可以上线投放。这样能够有效提升创意审核效率,满足快速的广告创意过审需求,提升广告创意投放效率。

Description

一种创意审核方法、装置及服务器
技术领域
本发明涉及互联网技术领域,具体而言,涉及一种创意审核方法、装置及服务器。
背景技术
目前,竞价创意发布采用的是“先审核后发布”机制,即,只有审核通过的创意才能在网络上线发布。所述创意是指一种用于竞价宣传的广告创作脚本。当用户创建或编辑创意的词条时,服务器通常直接接受用户提交的创建信息或编辑信息,并不对用户所提交的信息做任何处理。根据对词条的审核通过与否来判断词条是否可以在搜索引擎里搜索到,如果词条在审核时因不合规定而被驳回,则搜索引擎中无法找到该词条。
为了优化创意,使广告主的创意词条更吸引网民的点击,找出对应的创意的关键词,将创意标题或描述中添加竞价创意通配符,可提高广告创意的相关度。不过,这样虽然为广告主提供了便利,但同时也给广告风险控制带来了困难。随着广告词条的爆炸式增加,原有的自动审核引擎效率已不足以支撑快速的广告过审,严重的影响了广告投放。
发明内容
有鉴于此,本发明的目的在于提供一种创意审核方法、装置及服务器,以改善上述问题。
本发明较佳实施例提供一种创意审核方法,该方法包括:根据预存词表中的字符生成多个签名,以获得用于一级审核的签名数据库,其中,每个签名由所述预存词表中相邻的至少两个字符生成;获取待审核的创意,该创意中包括创意词条及关键词;根据所述关键词和与所述创意词条中的创意通配符相邻的预设个字符生成至少一个待审核的签名;将所述至少一个待审核的签名与所述签名数据库中的签名进行匹配,若全部匹配失败,则判定该创意审核通过,若任意一个匹配成功,则判定该创意一级审核未通过。
本发明另一较佳实施例提供一种创意审核装置,该装置包括:第一签名生成模块,用于根据预存词表中的字符生成多个签名,以获得用于一级审核的签名数据库,其中,每个签名由所述预存词表中相邻的至少两个字符生成;创意获取模块,用于获取待审核的创意,该创意中包括创意词条及关键词;第二签名生成模块,用于根据所述关键词和与所述创意词条中的创意通配符相邻的预设个字符生成至少一个待审核的签名;创意一级审核模块,用于将所述至少一个待审核的签名与所述签名数据库中的签名进行匹配,若全部匹配失败,则判定该创意审核通过,若任意一个匹配成功,则判定该创意一级审核未通过。
本发明另一较佳实施例提供一种服务器,所述服务器包括:存储器;处理器;以及,创意审核装置,该装置安装于所述存储器中并包括一个或多个由所述处理器执行的软件功能模块,该装置包括:第一签名生成模块,用于根据预存词表中的字符生成多个签名,以获得用于一级审核的签名数据库,其中,每个签名由所述预存词表中相邻的至少两个字符生成;创意获取模块,用于获取待审核的创意,该创意中包括创意词条及关键词;第二签名生成模块,用于根据所述关键词和与所述创意词条中的创意通配符相邻的预设个字符生成至少一个待审核的签名;创意一级审核模块,用于将所述至少一个待审核的签名与所述签名数据库中的签名进行匹配,若全部匹配失败,则判定该创意审核通过,若任意一个匹配成功,则判定该创意一级审核未通过。
本发明实施例提供的创意审核方法、装置及服务器,首先根据预存的词表生成用于一级审核(也可以称为粗审核)的签名数据库(相应地,也可以称为粗审过滤器),然后使用创意中的关键词替换创意通配符得到与该关键词关联的创意词条,以在该关联的创意词条中根据所述关键词和与该创意通配符相邻的预设个字符生成至少一个待审核的签名,最后将待审核的签名与签名数据库中的各个签名进行匹配,如果全部待审核的签名均没有匹配成功,则表示该创意中的创意词条及其关键词完全安全,判定其通过审核,可进行上线发布,如果任意一个待审核的签名匹配成功,则表示该创意中的创意词条及其关键词有不符合规定的风险,判定其一级审核未通过,暂不允许其上线发布。这种创意审核方法可以在大量的待审核词条中高效的筛选出大部分完全安全的词条,对于其余小部分存在风险的词条可以采取精细化审核,以进一步的确定其是否可以进行上线投放。如此,这种创意审核方式能够有效提升创意审核效率,满足快速的广告创意过审需求,提升广告创意投放效率。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本发明实施例提供的一种用于执行创意审核方法的服务器的方框示意图;
图2为本发明实施例提供的一种创意审核方法的流程图;
图3为本发明实施例提供的一示例中采用BitSet构建签名数据库的示意图;
图4为本发明实施例提供的另一种创意审核方法的流程图;
图5为本发明实施例提供的现有创意审核方法与本发明实施例提供的创意审核方法的试验结果数据对比图;
图6为本发明实施例提供的一种创意审核装置的功能模块框图。
图标:100-服务器;110-创意审核装置;120-存储器;130-处理器;1102-第一签名生成模块;1104-创意获取模块;1106-第二签名生成模块;1108-创意一级审核模块;1110-字典树生成模块;1112-创意二级审核模块。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。
因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1,是本发明实施例提供的一种用于执行创意审核方法的服务器100的方框示意图。所述服务器100可以是网络服务器、数据库服务器、文件传输协议服务器等,但不限于此。该服务器100包括创意审核装置110、存储器120以及处理器130。
所述存储器120与处理器130之间直接或间接地电性连接,以实现数据的传输或交互。所述创意审核装置110包括至少一个可以软件或固件的形式存储于所述存储器120中或固化在所述服务器100的操作系统中的软件功能模块。所述处理器130用于执行所述存储器120中存储的可执行模块,例如所述创意审核装置110所包括的软件功能模块及计算机程序等。所述处理器130可以在接收到执行指令后,执行所述程序。
另外,可以理解的是,除了所述服务器100外,还可以由其他计算设备如个人计算机执行所述创意审核方法,本发明实施例中对所述方法的具体执行设备不做具体限定。
请参阅图2,是本发明实施例提供的一种创意审核方法的流程图,应用于图1所示的服务器100。所应说明的是,本实施例提供的方法不以图2及以下所述的具体顺序为限制。下面将对图2中所示的各步骤进行详细的阐述。
步骤S101,根据预存词表中的字符生成多个签名,以获得用于一级审核的签名数据库。
本实施例中,所述预存词表可以是后台审核人员预先提供的由多个与待审核的创意词条相关的词所构成的词表。
本实施例中,需要根据已有的数字签名算法及该预存词表中的字符生成多个签名,以构成签名数据库。所述签名数据库可以用于对用户提交的创意进行一级审核。这里的所述一级审核还可以称为粗审核,对应地,所述签名数据库还可以称为用于粗审核的粗审过滤器。
作为一种实施方式,每个所述签名可以是由所述预存词表中相邻的两个或两个以上的字符生成。例如,假设所述预存词表中存在词语“茉莉花瓣”,则根据该词语可以生成对应于相邻两个字符的“茉莉”、“莉花”以及“花瓣”的签名,还可以生成对应于相邻三个字符的“茉莉花”和“莉花瓣”的签名,或者还可以生成对应于该整个词语“茉莉花瓣”的签名。
步骤S103,获取待审核的创意。
本实施例中,所述待审核的创意可以是由用户编辑并提交至服务器后台的。所述创意包括创意词条及一个或多个关键词。该创意词条中设有一个或多个创意通配符。其中,所述创意通配符是在创意中使用的关键词替换控制符。插入创意通配符的创意在展现时,将以被触发的关键词替换创意通配符后进行展现。如果替换后创意的标题或描述超过限制长度,将以创意通配符内输入的默认关键词来替代创意通配符进行展现。
例如,假设用户提交的创意中,创意词条为“购买{茉莉花}请联系张三”,关键词为“郁金香花”。其中“{}”表示创意通配符,“茉莉花”为该创意通配符的默认关键词。当用户在搜索引擎中输入搜索词“郁金香花”时,该创意将以该触发的关键词“郁金香花”替换所述创意通配符,并展现为“购买郁金香花请联系张三”。当然,若替换后的创意超过限制长度,则该创意将使用所述默认关键词替换该创意通配符,并展现为“购买茉莉花请联系张三”。
步骤S105,根据所述关键词和与该创意词条中的创意通配符相邻的预设个字符生成至少一个待审核的签名。
本实施例中,作为一种实施方式,与所述创意通配符相邻的预设个字符可以是指与该创意通配符前、后相邻的一个或多个字符。换句话说,可以选择所述关键词中的至少一个字符和与所述创意通配符相邻的至少一个字符进行结合,并生成对应的待审核签名。
例如,仍以创意词条为“购买{}请联系张三”,关键词为“郁金香花”为例。所述待审核签名可以通过以下方式获得:根据关键词的首、尾字符各自分别与创意通配符之前的最后一个字符和创意通配符之后的第一个字符进行结合,得到两个包含两个字符的词,然后分别针对这两个包含两个字符的词生成对应的签名,即为所述待审核的签名。也就是说,根据结合得到的“买郁”、“花请”所分别生成的待审核的签名。
或者,所述待审核签名还可以是根据所述创意通配符之前的最后两个字符与所述关键词的首字符进行结合、以及所述关键词的尾字符与所述创意通配符之后的第一个字符进行结合所得到的两个包含三个字符的词所生成的待审核签名。也就是说,根据结合得到的“购买郁”、“花请”分别生成对应的待审核签名。
可以理解,所述待审核签名的生成方式还有多种,不限制于上述的示例。例如,在其他实施方式中,还可以提取创意通配符之前的最后一个字符“买”和关键词中的前两个字符“郁金”进行结合得到“买郁金”,然后生成对应“买郁金”的待审核签名。
另外,需要说明的是,上述待审核的签名所对应的词包含的字符数应至少与所述签名数据库中一部分签名所对应的词包含的字符数相同。例如,假设某一待审核的签名对应的词为“购买郁金香”,其包含5个字符,而根据所述预存词表生成的签名数据库中不存在对应包含5个字符的词的签名,这将导致后续无法通过该签名数据库对该待审核的签名进行一级审核。
从上述的描述可以看出,可以针对每个创意生成一个或多个待审核的签名。每个待审核的签名所对应的词包含的字符数可以是一个、两个或两个以上。但优选地是,每个待审核的签名对应的词中应至少包含所述关键词中的一个字符以及在所述关联创意词条中除所述关键词外的至少一个字符。
步骤S107,将所述至少一个待审核的签名与所述签名数据库中的签名进行匹配。若所述至少一个待审核的签名全部匹配失败,则执行下述步骤S109;若任意一个待审核的签名匹配成功,则执行下述步骤S111。
这里需要说明的是,待审核的签名匹配失败表示所述签名数据库中不存在与该待审核的签名相同的签名,待审核的签名匹配成功表示所述签名数据库中存在与该待审核的签名相同的签名。
步骤S109,判定该创意审核通过。
本实施例中,判定创意审核通过则表示该创意可以上线发布,用户可以在网络中通过搜索引擎搜索到该创意。
步骤S111,判定该创意一级审核未通过。
本实施例中,判定创意一级审核未通过时,可以选择直接驳回该创意,拒绝将其进行上线发布,或者选择通过其他审核方式进行进一步地的审核,以确定是否进行驳回。
下面提供一具体的示例,以便进一步地阐述本发明实施例。
本示例中,仍以待审核的创意中,创意词条为“购买{}请联系张三”,关键词为“郁金香花”为例进行说明。
首先,分别对预存词表中的每两个相邻字符生成对应的签名,所生成的所有签名构成用于一级审核的签名数据库。
然后,使用所述关键词“郁金香花”替换所述创意词条中的创意通配符,得到与该关键词关联的创意词条“购买郁金香花请联系张三”。在得到的该关联的创意词条中,提取所述创意通配符之前的最后一个字符“买”和所述关键词的首字符“郁”,将两个字符进行结合得到“买郁”并生成对应“买郁”的第一待审核签名;再提取所述关键词的尾字符“花”和所述创意通配符之后的第一个字符“请”,将两个字符进行结合得到“花请”并生成对应“花请”的第二待审核签名。其中,该第一待审核签名和该第二待审核签名构成上述的至少一个待审核的签名。
最后,将上述得到的第一待审核签名和该第二待审核签名分别与所述签名数据库中的各个签名进行匹配。如果全部匹配失败,则判定该创意审核通过,否则,判定该创意一级审核未通过。
另外,需要说明的是,本示例的创意中还可以包括多个关键词,例如除所述“郁金香花”外,还可以包括关键词“玫瑰”、“百合”等。这样在获取所述待审核签名时,其实现方式可以是:
首先,分别使用每个所述关键词替换所述创意词条中的创意通配符,得到与每个所述关键词关联的创意词条。
其次,在每个所述关联的创意词条中,分别提取该创意通配符之前的最后一个字符和每个所述关键词的首字符,将分别提取到的每两个字符进行结合并生成对应的第一待审核签名,得到多个所述第一待审核签名。以“郁金香花”、“玫瑰”、“百合”三个关键词为例,所得到的三个第一待审核签名对应的词分别为“买郁”、“买玫”、“买百”。
再次,在每个所述关联的创意词条中,分别提取每个所述关键词的尾字符和该创意通配符之后的第一个字符,将分别提取到的每两个字符进行结合并生成对应的第二待审核签名,得到多个所述第二待审核签名。仍以“郁金香花”、“玫瑰”、“百合”三个关键词为例,所得到的三个第二待审核签名对应的词分别为“花请”、“瑰请”、“合请”。
其中,多个所述第一待审核签名和多个所述第二待审核签名构成上述的至少一个待审核的签名。
最后,将多个所述第一待审核签名和多个所述第二待审核签名分别与所述签名数据库中的各个签名进行匹配,如果全部匹配失败,则判定该创意审核通过,否则,判定该创意一级审核未通过。
此外,可以理解的是,所述创意的创意词条中也可以包括多个创意通配符。例如,所述创意词条可以是“购买{}请联系张三,不同种类{}售价不同”。仍以“郁金香花”为关键词为示例,这样在获取所述待审核签名时,其实现方式可以是:
首先,使用所述关键词替换所述创意词条中的每个创意通配符,得到与该关键词关联的创意词条。例如,本示例中得到的所述关联的创意词条为“购买郁金香花请联系张三,不同种类郁金香花售价不同”。
其次,在该关联的创意词条中,分别提取每个所述创意通配符之前的最后一个字符和所述关键词的首字符,将分别提取到的每两个字符进行结合并生成对应的第一待审核签名,得到多个所述第一待审核签名。例如,本示例中,生成的两个第一待审核签名对应的词分别为“买郁”、“类郁”。
再次,在该关联的创意词条中,分别提取所述关键词的尾字符和每个所述创意通配符之后的第一个字符,将分别提取到的每两个字符进行结合并生成对应的第二待审核签名,得到多个所述第二待审核签名。例如,本示例中,生成的两个第二待审核签名对应的词分别为“花请”、“花售”。
其中,多个所述第一待审核签名和多个所述第二待审核签名构成上述的至少一个待审核的签名。
最后,将多个所述第一待审核签名和多个所述第二待审核签名分别与所述签名数据库中的各个签名进行匹配,如果全部匹配失败,则判定该创意审核通过,否则,判定该创意一级审核未通过。
当然,还可以理解的是,在其他示例中,所述创意的创意词条中可以设有多个创意通配符,同时该创意还包括多个关键词。这样情况下生成待审核签名的原理与上述相同,在此无需再赘述。
另外,需要说明的是,当用户对提交的创意中的关键词进行新增、删除或修改操作时,需要重新按照变化后的关键词生成至少一个待审核的签名,然后根据重新生成的所述至少一个待审核签名以及所述签名数据库进行一级审核。
下面再提供一具体的示例,以便再进一步地阐述本发明实施例。
本示例中可以采用bloom filter的设计思想构建一级审核的签名数据库,以便快速的判别出审核通过的创意。
作为一种实施方式,该签名数据库可以采用BitSet构建,将规则的字符连接进行哈希(hash)计算。例如,以预存词表中的“海东商城”为例,其构建过程如图3所示。
假设用户提交的创意中,创意词条为“欢迎登陆上海{}网站”,关键词为“东方红”。在进行一级审核时,需要分别校验“海东”、“红网”是否在上述构建得到的BitSet中。
请参阅图4,是本发明实施例提供的另一种创意审核方法的流程图。如图4所示,本实施例中的方法包括如下步骤:
步骤S201,根据预存词表中的字符生成多个签名,以获得用于一级审核的签名数据库。
步骤S203,获取待审核的创意,该创意中包括创意词条及关键词。
步骤S205,根据所述关键词和与该创意词条中的创意通配符相邻的预设个字符生成至少一个待审核的签名。
步骤S207,将所述至少一个待审核的签名与所述签名数据库中的签名进行匹配。若全部匹配失败,则执行下述步骤S209,若任意一个匹配成功,则执行下述步骤S211。
步骤S209,判定该创意审核通过。
步骤S211,判定该创意一级审核未通过。
本实施例中,上述步骤S201~步骤S211的实现方式及原理与图2所示实施例中步骤S101~步骤S111的实现方式及原理相同,在此不再赘述。
本实施例中,在所述步骤S211后,还包括下述步骤:
步骤S213,根据所述预存词表,生成用于二级审核的字典树。
本实施例中,所述二级审核还可以称为细审核,对应于上述的粗审核。使用所述预存词表可以初始化用于细审核的字典树。
步骤S215,根据所述字典树对所述创意进行多模式匹配。若匹配失败,则返回上述步骤S209,若匹配成功,则执行下述步骤S217。
作为一种实施方式,对待审核的创意进行多模式匹配的过程可以是:将该创意中的每个关键词分别代入到创意词条中得到与该关键词关联的创意词条,然后通过字典树对每个所述关联的创意词条进行多模式匹配,如果字典树中存在与任意所述关联的词条匹配的模式串,则表示该创意匹配成功,判定该创意二级审核失败,反之,则表示该创意匹配失败,判定其审核通过。
本实施例中,可以采用基于AC自动机的多模式匹配算法对一级审核未通过的创意进行二级审核,但不限于此。
另外,为了提高二级审核时的效率,在一级审核未通过时可以返回一匹配索引。进行二级审核的多模式匹配时,从该匹配索引所指向的字符开始进行匹配,这样就可以跳过前方不匹配的字符串,直接从可能匹配的字符串的第一个字符开始匹配,进而可以提升二级审核的效率。
步骤S217,判定该创意二级审核未通过。
本实施例中,在模式匹配成功时,表示该创意无法进行上线发布,此时可以记录字典树中所有匹配的模式串,记录词汇,并组织友好的提示语给投放平台。
在实际的试验过程中发现,对于当前待审核的多个创意,通过一级审核(粗审核)可以直接判定70%的创意审核通过,该70%的创意可以直接上线发布,剩余的30%的创意需要进行二级审核(细审核),进一步判定是否可以上线发布。由于一级审核的审核过程简单,匹配速度快,审核效率基本上是二级审核的10倍以上,所以先采用一级审核进行高效率的粗审,直接判定完全符合投放要求的创意审核通过并可上线发布,再对于其余存在不符合投放要求风险的创意通过二级审核进行进一步的细审,这种两级审核的审核方式相较于现有技术而言,审核效率明显提升,特别是相较于现有的倒排索引审核方式而言,效率可以提升10倍以上。
更为具体地,应用现有的创意审核方式(如倒排索引)对8亿的创意自动巡检需要4天完成一次,而应用本实施例提供的两级审核的创意审核方式可以在3小时52分左右完成对16亿创意的审核,具体可参见图5,是本实施例提供的一个试验结果数据图。
请参阅图6,是本发明实施例提供的一种创意审核装置110的功能模块框图。该创意审核装置110包括第一签名生成模块1102、创意获取模块1104、第二签名生成模块1106、创意一级审核模块1108、字典树生成模块1110、创意二级审核模块1112。
所述第一签名生成模块1102,用于根据预存词表中的字符生成多个签名,以获得用于一级审核的签名数据库,其中,每个签名由所述预存词表中相邻的至少两个字符生成。该第一签名生成模块1102可用于执行图2中的步骤S101和图4中的步骤S201,其具体的操作方法可参照上述对步骤S101的详细描述。
所述创意获取模块1104,用于获取待审核的创意,该创意中包括创意词条及关键词。该创意获取模块1104可用于执行图2中的步骤S103和图4中的步骤S203,其具体的操作方法可参照上述对步骤S103的详细描述。
所述第二签名生成模块1106,用于根据所述关键词和与该创意词条中的创意通配符相邻的预设个字符生成至少一个待审核的签名。该第二签名生成模块1106可用于执行图2中的步骤S105和图4中的步骤S205,其具体的操作方法可参照上述对步骤S105的详细描述。
所述创意一级审核模块1108,用于将所述至少一个待审核的签名与所述签名数据库中的签名进行匹配,若全部匹配失败,则判定该创意审核通过,若任意一个匹配成功,则判定该创意一级审核未通过。该创意一级审核模块1108可用于执行图2中的步骤S107~步骤S111和图4中的步骤S207~步骤S211,其具体的操作方法可参照上述对步骤S107~步骤S111的详细描述。
所述字典树生成模块1110,用于根据所述预存词表,生成用于二级审核的字典树。该字典树生成模块1110可用于执行图4中的步骤S213,其具体的操作方法可参照上述对步骤S213的详细描述。
所述创意二级审核模块1112,用于根据所述字典树对所述创意进行多模式匹配,若匹配失败,则判定该创意审核通过,若匹配成功,则判定该创意二级审核未通过。该创意二级审核模块1112可用于执行图4中的步骤S215、步骤S209以及步骤S217,其具体的操作方法可参照上述对步骤S215、步骤S209以及步骤S217的详细描述。
以上各模块可以是由软件代码实现,此时,上述的各模块可存储于服务器100的存储器内。以上各模块同样可以由硬件例如集成电路芯片实现。
需要说明的是,本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
本发明实施例所提供的创意审核装置,其实现原理及产生的技术效果和前述方法实施例相同,为简要描述,装置实施例部分未提及之处,可参考前述方法实施例中相应内容。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本发明的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
另外,在本发明各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器、随机存取存储器、磁碟或者光盘等各种可以存储程序代码的介质。需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。

Claims (21)

1.一种创意审核方法,其特征在于,该方法包括:
根据预存词表中的字符生成多个签名,以获得用于一级审核的签名数据库,其中,每个签名由所述预存词表中相邻的至少两个字符生成;
获取待审核的创意,该创意中包括创意词条及关键词;
根据所述关键词和与所述创意词条中的创意通配符相邻的预设个字符生成至少一个待审核的签名;
将所述至少一个待审核的签名与所述签名数据库中的签名进行匹配,若全部匹配失败,则判定该创意审核通过,若任意一个匹配成功,则判定该创意一级审核未通过。
2.根据权利要求1所述的创意审核方法,其特征在于,在判定该创意一级审核未通过之后,该方法还包括:
根据所述预存词表,生成用于二级审核的字典树;
根据所述字典树对所述创意进行多模式匹配,若匹配失败,则判定该创意审核通过,若匹配成功,则判定该创意二级审核未通过。
3.根据权利要求2所述的创意审核方法,其特征在于,当一级审核未通过时,返回一匹配索引,该匹配索引对应的位置略过先前不匹配的字符串并直接指向可能匹配的字符串的首字符,所述根据所述字典树对所述创意进行多模式匹配的步骤,包括:
从所述匹配索引所指向的位置开始进行模式匹配。
4.根据权利要求1所述的创意审核方法,其特征在于,所述根据预存词表中的字符生成多个签名,以获得用于以及一级审核的签名数据库的步骤,包括:
分别对预存词表中的每两个相邻字符生成对应的签名。
5.根据权利要求4所述的创意审核方法,其特征在于,所述根据所述关键词和与所述创意词条中的创意通配符相邻的预设个字符生成至少一个待审核的签名的步骤,包括:
使用所述关键词替换所述创意词条中的创意通配符,得到与该关键词关联的创意词条;
在该关联的创意词条中,提取所述关键词的首字符和该创意通配符之前的最后一个字符,将两个字符进行结合并生成与其对应的第一待审核签名;及
提取所述关键词的尾字符和该创意通配符之后的第一个字符,将两个字符进行结合并生成与其对应的第二待审核签名,所述至少一个待审核的签名包括该第一待审核签名和该第二待审核签名。
6.根据权利要求4所述的创意审核方法,其特征在于,所述创意中包括多个关键词,所述根据所述关键词和与所述创意词条中的所述创意通配符相邻的预设个字符生成至少一个待审核的签名的步骤,包括:
分别使用每个关键词替换所述创意词条中的创意通配符,得到与每个关键词关联的创意词条;
在每个关联的创意词条中,分别提取每个关键词的首字符和该创意通配符之前的最后一个字符,将分别提取到的每两个字符进行结合并生成与其对应的第一待审核签名,得到多个所述第一待审核签名;及
分别提取每个关键词的尾字符和该创意通配符之后的第一个字符,将分别提取到的每两个字符进行结合并生成与其对应的第二待审核签名,得到多个第二待审核签名,所述至少一个待审核的签名包括该多个第一待审核签名和该多个第二待审核签名。
7.根据权利要求4所述的创意审核方法,其特征在于,所述创意词条中包括多个创意通配符,所述根据所述关键词和与所述创意词条中的所述创意通配符相邻的预设个字符生成至少一个待审核的签名的步骤,包括:
使用所述关键词替换所述创意词条中的每个创意通配符,得到与该关键词关联的创意词条;
在该关联的创意词条中,分别提取所述关键词的首字符和每个创意通配符之前的最后一个字符,将分别提取到的每两个字符进行结合并生成与其对应的第一待审核签名,得到多个第一待审核签名;及
分别提取所述关键词的尾字符和每个创意通配符之后的第一个字符,将分别提取到的每两个字符进行结合并生成与其对应的第二待审核签名,得到多个第二待审核签名,所述至少一个待审核的签名包括该多个第一待审核签名和该多个第二待审核签名。
8.一种创意审核装置,其特征在于,该装置包括:
第一签名生成模块,用于根据预存词表中的字符生成多个签名,以获得用于一级审核的签名数据库,其中,每个签名由所述预存词表中相邻的至少两个字符生成;
创意获取模块,用于获取待审核的创意,该创意中包括创意词条及关键词;
第二签名生成模块,用于根据所述关键词和与所述创意词条中的创意通配符相邻的预设个字符生成至少一个待审核的签名;
创意一级审核模块,用于将所述至少一个待审核的签名与所述签名数据库中的签名进行匹配,若全部匹配失败,则判定该创意审核通过,若任意一个匹配成功,则判定该创意一级审核未通过。
9.根据权利要求8所述的创意审核装置,其特征在于,该装置还包括:
字典树生成模块,用于根据所述预存词表,生成用于二级审核的字典树;
创意二级审核模块,用于根据所述字典树对所述创意进行多模式匹配,若匹配失败,则判定该创意审核通过,若匹配成功,则判定该创意二级审核未通过。
10.根据权利要求9所述的创意审核装置,其特征在于,当一级审核未通过时,返回一匹配索引,该匹配索引对应的位置略过先前不匹配的字符串并直接指向可能匹配的字符串的首字符,所述创意二级审核模块根据所述字典树对所述创意进行多模式匹配的方式,包括:
并从该匹配索引所指向的位置开始进行模式匹配。
11.根据权利要求8所述的创意审核装置,其特征在于,所述第一签名生成模块根据预存词表中的字符生成多个签名,以获得用于以及一级审核的签名数据库的方式,包括:
分别对预存词表中的每两个相邻字符生成对应的签名。
12.根据权利要求11所述的创意审核装置,其特征在于,所述第二签名生成模块根据所述关键词和与所述创意通配符相邻的预设个字符生成至少一个待审核的签名的方式,包括:
使用所述关键词替换所述创意词条中的创意通配符,得到与该关键词关联的创意词条;
在该关联的创意词条中,提取所述关键词的首字符和该创意通配符之前的最后一个字符,将两个字符进行结合并生成与其对应的第一待审核签名;及
提取所述关键词的尾字符和该创意通配符之后的第一个字符,将两个字符进行结合并生成与其对应的第二待审核签名,所述至少一个待审核的签名包括该第一待审核签名和该第二待审核签名。
13.根据权利要求11所述的创意审核装置,其特征在于,所述创意中包括多个所述关键词,所述第二签名生成模块根据所述关键词和与所述创意通配符相邻的预设个字符生成至少一个待审核的签名的方式,包括:
分别使用每个关键词替换所述创意词条中的创意通配符,得到与每个关键词关联的创意词条;
在每个关联的创意词条中,分别提取每个关键词的首字符和该创意通配符之前的最后一个字符,将分别提取到的每两个字符进行结合并生成与其对应的第一待审核签名,得到多个第一待审核签名;及
分别提取每个关键词的尾字符和该创意通配符之后的第一个字符,将分别提取到的每两个字符进行结合并生成与其对应的第二待审核签名,得到多个第二待审核签名,所述至少一个待审核的签名包括该多个第一待审核签名和该多个第二待审核签名。
14.根据权利要求11所述的创意审核装置,其特征在于,所述创意词条中包括多个所述创意通配符,所述第二签名生成模块根据所述关键词和与所述创意通配符相邻的预设个字符生成至少一个待审核的签名的方式,包括:
使用所述关键词替换所述创意词条中的每个创意通配符,得到与该关键词关联的创意词条;
在该关联的创意词条中,分别提取所述关键词的首字符和每个创意通配符之前的最后一个字符,将分别提取到的每两个字符进行结合并生成与其对应的第一待审核签名,得到多个第一待审核签名;及
分别提取所述关键词的尾字符和每个创意通配符之后的第一个字符,将分别提取到的每两个字符进行结合并生成与其对应的第二待审核签名,得到多个第二待审核签名,所述至少一个待审核的签名包括该多个第一待审核签名和该多个第二待审核签名。
15.一种服务器,其特征在于,所述服务器包括:
存储器;
处理器;及
创意审核装置,该装置安装于所述存储器中并包括一个或多个由所述处理器执行的软件功能模块,该装置包括:
第一签名生成模块,用于根据预存词表中的字符生成多个签名,以获得用于一级审核的签名数据库,其中,每个签名由所述预存词表中相邻的至少两个字符生成;
创意获取模块,用于获取待审核的创意,该创意中包括创意词条及关键词;
第二签名生成模块,用于根据所述关键词和与所述创意词条中的创意通配符相邻的预设个字符生成至少一个待审核的签名;
创意一级审核模块,用于将所述至少一个待审核的签名与所述签名数据库中的签名进行匹配,若全部匹配失败,则判定该创意审核通过,若任意一个匹配成功,则判定该创意一级审核未通过。
16.根据权利要求15所述的服务器,其特征在于,该创意审核装置还包括:
字典树生成模块,用于根据所述预存词表,生成用于二级审核的字典树;
创意二级审核模块,用于根据所述字典树对所述创意进行多模式匹配,若匹配失败,则判定该创意审核通过,若匹配成功,则判定该创意二级审核未通过。
17.根据权利要求16所述的服务器,其特征在于,当一级审核未通过时,返回一匹配索引,该匹配索引对应的位置略过先前不匹配的字符串并直接指向可能匹配的字符串的首字符,所述创意二级审核模块根据所述字典树对所述创意进行多模式匹配的方式,包括:
从该匹配索引所指向的位置开始进行模式匹配。
18.根据权利要求15所述的服务器,其特征在于,所述第一签名生成模块根据预存词表中的字符生成多个签名,以获得用于以及一级审核的签名数据库的方式,包括:
分别对预存词表中的每两个相邻字符生成对应的签名。
19.根据权利要求18所述的服务器,其特征在于,所述第二签名生成模块根据所述关键词和与该创意词条中的创意通配符相邻的预设个字符生成至少一个待审核的签名的方式,包括:
使用所述关键词替换所述创意词条中的创意通配符,得到与该关键词关联的创意词条;
在该关联的创意词条中,提取所述关键词的首字符和该创意通配符之前的最后一个字符,将两个字符进行结合并生成与其对应的第一待审核签名;及
提取所述关键词的尾字符和该创意通配符之后的第一个字符,将两个字符进行结合并生成与其对应的第二待审核签名,所述至少一个待审核的签名包括该第一待审核签名和该第二待审核签名。
20.根据权利要求18所述的服务器,其特征在于,所述创意中包括多个关键词,所述第二签名生成模块根据所述关键词和与所述创意通配符相邻的预设个字符生成至少一个待审核的签名的方式,包括:
分别使用每个关键词替换所述创意词条中的创意通配符,得到与每个关键词关联的创意词条;
在每个关联的创意词条中,分别提取每个关键词的首字符和该创意通配符之前的最后一个字符,将分别提取到的每两个字符进行结合并生成与其对应的第一待审核签名,得到多个所述第一待审核签名;及
分别提取每个关键词的尾字符和该创意通配符之后的第一个字符,将分别提取到的每两个字符进行结合并生成与其对应的第二待审核签名,得到多个第二待审核签名,所述至少一个待审核的签名包括该多个第一待审核签名和该多个第二待审核签名。
21.根据权利要求18所述的服务器,其特征在于,所述创意词条中包括多个创意通配符,所述第二签名生成模块根据所述关键词和与所述创意通配符相邻的预设个字符生成至少一个待审核的签名的方式,包括:
使用所述关键词替换所述创意词条中的每个创意通配符,得到与该关键词关联的创意词条;
在该关联的创意词条中,分别提取所述关键词的首字符和每个创意通配符之前的最后一个字符,将分别提取到的每两个字符进行结合并生成与其对应的第一待审核签名,得到多个第一待审核签名;及
分别提取所述关键词的尾字符和每个创意通配符之后的第一个字符,将分别提取到的每两个字符进行结合并生成与其对应的第二待审核签名,得到多个第二待审核签名,所述至少一个待审核的签名包括该多个第一待审核签名和该多个第二待审核签名。
CN201710529904.7A 2017-06-29 2017-06-29 一种创意审核方法、装置及服务器 Active CN109214843B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710529904.7A CN109214843B (zh) 2017-06-29 2017-06-29 一种创意审核方法、装置及服务器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710529904.7A CN109214843B (zh) 2017-06-29 2017-06-29 一种创意审核方法、装置及服务器

Publications (2)

Publication Number Publication Date
CN109214843A CN109214843A (zh) 2019-01-15
CN109214843B true CN109214843B (zh) 2020-08-18

Family

ID=64992190

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710529904.7A Active CN109214843B (zh) 2017-06-29 2017-06-29 一种创意审核方法、装置及服务器

Country Status (1)

Country Link
CN (1) CN109214843B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112650813B (zh) * 2020-12-28 2023-12-29 杭州趣链科技有限公司 分布式审核的数据共享方法
CN113379444A (zh) * 2021-05-13 2021-09-10 北京沃东天骏信息技术有限公司 一种广告检测方法、设备、系统及计算机可读存储介质
CN114240355A (zh) * 2021-12-13 2022-03-25 中国建设银行股份有限公司 创意审核流转方法、装置、设备及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103885937A (zh) * 2014-04-14 2014-06-25 焦点科技股份有限公司 基于核心词相似度判断企业中文名称重复的方法
CN104036012A (zh) * 2014-06-24 2014-09-10 中国科学院计算技术研究所 字典学习、视觉词袋特征提取方法及检索系统
CN106446232A (zh) * 2016-10-08 2017-02-22 深圳市彬讯科技有限公司 一种基于规则的敏感文本过滤方法
CN106682870A (zh) * 2016-12-12 2017-05-17 武汉图灵创客科技有限公司 创客教育社交平台系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11514096B2 (en) * 2015-09-01 2022-11-29 Panjiva, Inc. Natural language processing for entity resolution

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103885937A (zh) * 2014-04-14 2014-06-25 焦点科技股份有限公司 基于核心词相似度判断企业中文名称重复的方法
CN104036012A (zh) * 2014-06-24 2014-09-10 中国科学院计算技术研究所 字典学习、视觉词袋特征提取方法及检索系统
CN106446232A (zh) * 2016-10-08 2017-02-22 深圳市彬讯科技有限公司 一种基于规则的敏感文本过滤方法
CN106682870A (zh) * 2016-12-12 2017-05-17 武汉图灵创客科技有限公司 创客教育社交平台系统

Also Published As

Publication number Publication date
CN109214843A (zh) 2019-01-15

Similar Documents

Publication Publication Date Title
US11157956B2 (en) Application recommendation method and server
CN108519970B (zh) 文本中敏感信息的鉴定方法、电子装置及可读存储介质
Patel et al. A survey on fake review detection using machine learning techniques
US9361377B1 (en) Classifier for classifying digital items
JP4750814B2 (ja) コンテキスト広告情報を露出する広告方法及びそのシステム
CN109214843B (zh) 一种创意审核方法、装置及服务器
US11599586B2 (en) Method and system for providing alternative result for an online search previously with no result
US9405825B1 (en) Automatic review excerpt extraction
CN110569502A (zh) 一种违禁广告语的识别方法、装置、计算机设备及存储介质
CN101799802A (zh) 利用结构信息进行实体关系提取的方法和系统
Radovanović et al. Review spam detection using machine learning
US9558462B2 (en) Identifying and amalgamating conditional actions in business processes
CN108664501B (zh) 广告审核方法、装置及服务器
CN115809662A (zh) 一种文本内容异常检测的方法、装置、设备及介质
Melli Shallow semantic parsing of product offering titles (for better automatic hyperlink insertion)
CN109766552B (zh) 一种基于公告信息的指代消解方法及装置
Grusky Rogue scores
CN113934834A (zh) 一种问句匹配的方法、装置、设备和存储介质
CN116306621B (zh) 一种招标文本的违规检测方法、装置及电子设备
KR102299525B1 (ko) 제품 평가 마이닝 방법 및 이를 수행하는 장치
Nasiri et al. Aspect category detection on indonesian e-commerce mobile application review
CN107315831A (zh) 一种挖掘规则关联模型未知关联关系的方法及装置
US20110066622A1 (en) Product line extraction
Huynh et al. Argh! automated rumor generation hub
CN112691379A (zh) 游戏资源文本审核方法及装置、存储介质、计算机设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20200609

Address after: 310052 room 508, floor 5, building 4, No. 699, Wangshang Road, Changhe street, Binjiang District, Hangzhou City, Zhejiang Province

Applicant after: Alibaba (China) Co.,Ltd.

Address before: 510000 Guangdong city of Guangzhou province Whampoa Tianhe District Road No. 163 Xiping Yun Lu Yun Ping square B radio tower 13 layer self unit 01 (only for office use)

Applicant before: GUANGZHOU SHENMA MOBILE INFORMATION TECHNOLOGY Co.,Ltd.

TA01 Transfer of patent application right
GR01 Patent grant
GR01 Patent grant