CN103514227A - 一种更新数据库的方法及装置 - Google Patents

一种更新数据库的方法及装置 Download PDF

Info

Publication number
CN103514227A
CN103514227A CN201210226389.2A CN201210226389A CN103514227A CN 103514227 A CN103514227 A CN 103514227A CN 201210226389 A CN201210226389 A CN 201210226389A CN 103514227 A CN103514227 A CN 103514227A
Authority
CN
China
Prior art keywords
auditing
database
data
keyword
rule
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201210226389.2A
Other languages
English (en)
Other versions
CN103514227B (zh
Inventor
杨志雄
苏煜
刘志强
龙荣深
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201210226389.2A priority Critical patent/CN103514227B/zh
Publication of CN103514227A publication Critical patent/CN103514227A/zh
Application granted granted Critical
Publication of CN103514227B publication Critical patent/CN103514227B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/23Updating

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请公开了一种更新数据库的方法及装置以及一种对处理对象进行审核的方法及装置,其中,更新数据库的方法应用在包含有对处理对象进行审核的智能审核系统的第一服务器中,其中,第一服务器连接于一包含海量数据库的第二服务器和/或一包含人工审核系统的第三服务器,智能审核系统对应有包含M条审核规则的第一数据库,该方法包括:从海量数据库中获取第一特征数据,和/或从人工审核系统中获取第二特征数据;从第一特征数据和/或第二特征数据中提取用于对第一数据库中的M条审核规则进行更新的更新数据;基于更新数据对M条审核规则进行更新,获得N条审核规则,其中,在N条审核规则中至少有一条审核规则与M条审核规则中任一审核规则不同。

Description

一种更新数据库的方法及装置
技术领域
本申请涉及数据处理领域,尤其涉及一种更新数据库的方法及装置。
背景技术
电子商务网站每天都有海量的处理对象(比如:产品信息)被发布,通常情况下需要对发布的处理对象在规定的时间内进行审核。所述对处理对象进行审核的方法可应用于一大型网络购物平台,所述网络购物平台具体包括:
(1)信息发布端,用于获得用户发布的处理对象,比如:产品信息;
(2)第一服务器:包含对处理对象进行审核的智能审核系统;
(3)审核规则库:连接于第一服务器,包含对处理对象进行智能审核时的所用的审核规则的第一数据库;
(4)第二服务器:连接于第一服务器,包含对处理对象进行审核的人工审核系统。
如图1所示,为现有技术中对发布的产品信息进行审核的流程图:
S101:信息发布端获得用户发布的处理对象;
S102:将所述处理对象发送至第一服务器,以供智能审核系统进行审核,如果所述处理对象通过审核,将所述处理对象发送至一网站系统的一网页上,当用户访问所述网页时,可以看到所述处理对象;而如果所述处理对象没有通过审核,转向步骤S103:
S103:将没有通过审核的处理对象发送至第二服务器,以供人工审核系统进行审核,如果所述处理对象通过审核,如步骤S102所述,将其输出至一显示界面,如果所述处理对象没有通过审核不对该处理对象输出。
比如,在审核规则库中确定包含“废料”二字的处理对象均不符合业务规则而没法通过审核,故而第一服务器会将包含“废料”的处理对象发送至第二服务器,在某些情况下,该处理对象可能是“废料处理机”等符合业务规则的,在这种情况下,人工审核人员将允许将该处理对象输出至一网页界面。
比如:有些产品供应商为了提高产品被搜索或被查看的概率,将实际为苹果(水果类)的供应信息发布到苹果电脑的行业中,或者将产品的价格定的超低以吸引用户的联系等,这些都是不符合审核规则的,故而不将其输出。
在实现本申请实施例中技术方案的过程中,申请人发现现有技术中
由于需要将智能审核系统审核没有通过的数据发送到人工审核系统,再加上智能审核系统不会基于人工审核系统或海量数据库的数据进行优化和完善,所以,在智能审核系统的审核准确率不高的时候,现有技术中就会至少出现如下技术问题:
(1)在人工审核系统所在第三服务器与智能审核系统所在的第一服务器间会存在大量的数据需要进行传输,这在一定程度上会消耗第一服务器的处理资源;
(2)由于存在大量的数据需要进行传输,所以,在传输的过程中,就有可能出现传输通道阻塞,或数据传输丢失的可能,而这些,都将延长审核的时间,降低审核的效率。
发明内容
本申请提供一种更新数据库的方法及装置以及一种对处理对象进行审核的方法及装置,用以解决现有技术中由于在人工审核系统所在第三服务器与智能审核系统所在的第一服务器间会存在大量的数据需要进行传输,而存在的在一定程度上会消耗第一服务器的处理资源的技术问题。
本申请通过本申请中的实施例,提供如下技术方案:
一方面,本申请通过本申请中的一个实施例,提供如下技术方案:
一种更新数据库的方法,所述方法应用在包含有对处理对象进行审核的智能审核系统的第一服务器中,其中,所述第一服务器连接于一包含海量数据库的第二服务器和/或一包含人工审核系统的第三服务器,所述智能审核系统对应有包含M条审核规则的第一数据库,其中,M为大于等于1的整数,所述方法包括:
从所述海量数据库中获取第一特征数据,和/或从所述人工审核系统中获取第二特征数据;
从所述第一特征数据和/或所述第二特征数据中提取用于对所述第一数据库中的M条审核规则进行更新的更新数据;
基于所述更新数据对所述M条审核规则进行更新,获得N条审核规则,其中,在所述N条审核规则中至少有一条审核规则与所述M条审核规则中任一审查规则不相同,其中,N为大于等于1的整数,M和N为相同或不相同的整数。
另一方面,本申请通过本申请中的另一实施例提供如下技术方案:
一种对处理对象进行审核的方法,所述方法应用在包含智能审核系统及与所述智能审核系统对应的包含M条审核规则的第一数据库的第一服务器中,所述方法包括:
获取第一处理对象,所述第一处理对象中包含用于对所述第一处理对象进行审核的待匹配数据;
基于所述第一分类信息或所述待匹配数据,从所述第一数据库中获取用于对所述第一处理对象进行审核的至少一条审核规则,其中,所述第一数据库为基于所述更新数据库的方法所更新过的数据库;
基于所述至少一条审核规则以及所述待匹配数据对所述第一处理对象进行审核,以获得第一审核结果;
判断所述第一审核结果是否满足一预设条件;
如果所述第一审核结果满足所述预设条件时,确定所述第一处理对象为已经通过审核的处理对象。
另一方面,本申请通过本申请中的另一实施例提供如下技术方案:
一种更新数据库的装置,所述系统应用在包含有对处理对象进行审核的智能审核系统的第一服务器中,其中,所述第一服务器连接于一包含海量数据库的第二服务器和/或一包含人工审核系统的第三服务器,所述智能审核系统对应有包含M条审核规则的第一数据库,其中,M为大于等于1的整数,所述装置包括:
获取模块:用于从所述海量数据库中获取第一特征数据,和/或从所述人工审核系统中获取第二特征数据;
提取模块:用于从所述第一特征数据和/或所述第二特征数据中提取用于对所述第一数据库中的M条审核规则进行更新的更新数据;
更新模块:用于基于所述更新数据对所述M条审核规则进行更新,获得N条审核规则,其中,在所述N条审核规则中至少有一条审核规则与所述M条审核规则中任一审查规则不相同,其中,N为大于等于1的整数,M和N为相同或不相同的整数。
另一方面,本申请通过本申请中的另一实施例提供如下技术方案:
一种对处理对象进行审核的装置,所述装置应用在包含智能审核系统及与所述智能审核系统对应的包含M条审核规则的第一数据库的第一服务器中,所述装置包括:
第一获取模块:用于获取第一处理对象,所述第一处理对象中包含用于对所述第一处理对象进行审核的待匹配数据以及所述第一处理对象的第一分类信息;
第二获取模块:用于基于所述第一分类信息或所述待匹配数据,从所述第一数据库中获取用于对所述第一处理对象进行审核的至少一条审核规则,其中,所述第一数据库为基于权利要求1-10中任一权利要求所述方法更新过的数据库;
审核模块:用于基于所述至少一条审核规则以及所述待匹配数据对所述第一处理对象进行审核,以获得第一审核结果;
判断模块:用于判断所述第一审核结果是否满足一预设条件;
确定模块:用于如果所述第一审核结果满足所述预设条件时,确定所述第一处理对象为已经通过审核的处理对象。
本申请实施例中提供的一个或多个技术方案,至少具有如下技术效果或优点:
(1)在本申请实施例中,对于智能审核系统中的审核规则库,由于会基于人工审核系统和/或海量数据库中的数据进行更新和完善,故而会导致本申请实施例中的智能审核系统相较于现有技术中智能审核系统,在审核的准确率上,会得到极大提高;
(2)在智能审核系统的审核准确率提高后,相较于现有技术而言,在本申请实施例中需要人工审核系统进行审核的处理对象就会大大减少,甚至于在审核规则库足够完善的情况下,会出现不需要人工审核系统进行审核的技术效果,显然,这必将在整体上降低审核所需要的时间,提高审核的效率;
(3)由于人工审核系统需要审核的处理对象减少了,所以,相较于现有技术,本申请实施例中需要在人工审核系统所在的第三服务器与智能审核系统所在的第一服务器间传输的数据量就会大大降低,进而就能有效降低现有技术中出现数据传输阻塞或丢失的可能性;
(4)由于在本申请实施例中,在对智能审核系统中的审核规则库进行更新和完善时,主要实现过程包括:①从海量数据库中获得第一特征数据,例如:对海量数据库中的所有处理对象的标题信息进行分词从而获得的每个第一关键词的词频信息、基于用户输入搜索词搜索进而获得的每个第二关键词的点击率等等;②从人工审核系统中获得第二特征数据,例如:对处理对象的描述与处理对象类目不一致的处理对象的信息、对处理对象的描述与处理对象的类目一致的处理对象的信息等等;③基于第一特征数据及第二特征数据对审核规则库进行更新,所以,基于上述技术方案而获得的智能审核系统的审核规则库相较于现有技术中的审核规则库,便具有更完善和准确的特点,而使用具有这一特点的审核规则库进行审核,相较现有技术,就自然具有审核准确率更高和更快的技术效果。
附图说明
图1为现有技术中对发布的产品信息进行审核的流程图;
图2为本申请实施例一中网络购物平台的系统架构图;
图3为本申请实施例一中更新数据库的方法的流程图;
图4为本申请实施例一中基于第一种方法获取更新数据的流程图;
图5为本申请实施例一中基于第二种方法获取更新数据的流程图;
图6为本申请实施例一中基于第三种方法获取更新数据的流程图;
图7为本申请实施例二中对处理对象进行审核的方法的流程图;
图8为本申请实施例三中更新数据库的装置的方框图;
图9为本申请实施例四中对处理对象进行审核的装置的方框图。
具体实施方式
在现有技术中,由于需要将智能审核系统审核没有通过的数据发送到人工审核系统,再加上智能审核系统不会基于人工审核系统或海量数据库的数据进行优化和完善,所以,在智能审核系统的审核准确率不高的时候,现有技术中就会至少出现如下技术问题:
(1)在人工审核系统所在第三服务器与智能审核系统所在的第一服务器间会存在大量的数据需要进行传输,这在一定程度上会消耗第一服务器的处理资源;
(2)由于存在大量的数据需要进行传输,所以,在传输的过程中,就有可能出现传输通道阻塞,或数据传输丢失的可能,而这些,都将延长审核的时间,降低审核的效率。
为此,本申请实施例提供了一种更新数据库的方法,该方法能及时有效地、基于人工审核系统和/或海量数据库中的数据对智能审核系统中的审核规则库进行更新和完善,故而会导致本申请实施例中的智能审核系统相较于现有技术中智能审核系统,在审核的准确率上,会得到极大提高;
而在利用更新过规则库的智能审核系统进行审核时,由于智能审核系统的审核准确率得到提高,故而,相较于现有技术而言,在本申请实施例中需要人工审核系统进行审核的处理对象就会大大减少,甚至于在审核规则库足够完善的情况下,会出现不需要人工审核系统进行审核的技术效果,显然,这必将在整体上降低审核所需要的时间,提高审核的效率;
另外,由于人工审核系统需要审核的处理对象减少了,所以,相较于现有技术,本申请实施例中需要在人工审核系统所在的第三服务器与智能审核系统所在的第一服务器间传输的数据量就会大大降低,进而就能有效降低现有技术中出现数据传输阻塞或丢失的可能性;
并且,在本申请实施例中,在对智能审核系统中的审核规则库进行更新和完善时,主要实现过程包括:①从海量数据库中获得第一特征数据,例如:对海量数据库中的所有处理对象的标题信息进行分词从而获得的每个第一关键词的词频信息、基于用户输入搜索词搜索进而获得的每个第二关键词的点击率等等;②从人工审核系统中获得第二特征数据,例如:对处理对象的描述与处理对象类目不一致的处理对象的信息、对处理对象的描述与处理对象的类目一致的处理对象的信息等等;③基于第一特征数据及第二特征数据对审核规则库进行更新,所以,基于上述技术方案而获得的智能审核系统的审核规则库相较于现有技术中的审核规则库,便具有更完善和准确的特点,而使用具有这一特点的审核规则库进行审核,相较现有技术,就自然具有审核准确率更高和更快的技术效果。
为了使本申请所属技术领域中的技术人员更清楚地理解本申请,下面结合附图,通过具体实施例对本申请技术方案作详细描述。
实施例一
请参考图2至图7,本申请实施例一提供一种更新数据库的方法,所述方法应用在包含有对处理对象进行审核的智能审核系统的第一服务器中,其中,所述第一服务器连接于一包含海量数据库的第二服务器和/或一包含人工审核系统的第三服务器,所述智能审核系统对应有包含M条审核规则的第一数据库,其中,M为大于等于1的整数。在具体实施过程中,所述更新数据库的方法一般应用在大型的数据处理系统中,比如网络购物平台、网络教学系统等等。为了更好的理解本申请实施例中的技术方案,在下面结合附图进行详细描述的过程中,将以该方法应用在网络购物平台中为具体的例子,来进行描述。
如图2所示,为所述网络购物平台的架构图,具体包括如下结构:
信息发布端201:一般用于获得处理对象,比如:用户发布的产品信息、求购信息等等,为了便于理解,在后续介绍中,将以处理对象为产品信息为例,来作详细介绍。所述信息发布端201可以为个人计算机、掌上电脑、平板电脑等一切能发布信息的电子设备,本申请不作限制;
第一服务器202:包含对产品信息进行智能审核的智能审核系统,所述智能审核系统一般用于基于审核规则对产品信息进行智能审核;第一数据库203:连接于所述第一服务器202,用于存储基于第一服务器202的智能审核系统对产品信息进行审核的审核规则,本申请实施例一主要介绍如何更新所述存放审核规则的第一数据库203,所述第一数据库203同样为所述智能审核系统的一部分;
第三服务器204:连接于所述第一服务器202,包含对产品信息进行人工审核的人工审核系统,用于基于人工对产品信息进行审核,故而相对智能审核系统而言,其审核的准确性更高,但是也更耗费人力和时间。
第二服务器205:连接于所述第一服务器202,包含有用于存放该网络购物平台中已经发布(也就是通过审核)的所有产品信息以及基于用户的搜索产生的一些关键词信息的海量数据库;
如图3所示,所述更新数据库的方法包括如下步骤:
S301:从所述海量数据库中获取第一特征数据,和/或从所述人工审核系统中获取第二特征数据;
在具体实施过程中,基于对数据库的更新方法的不同,所提取的数据也不同,具体来讲,主要包括如下三种数据:
(1)从海量数据库中获取的用于表征每一个处理对象的标题的第一信息,比如所述网络购物平台中已经通过审核的产品中包含如下标题信息:
“超薄iphone4手机壳iPhone4s手机壳苹果4手机壳手机套外壳”
“苹源帝山东烟台苹果正宗栖霞红富士苹果新鲜水果85MM”等等。
(2)从海量数据库中获取的用户基于搜索词搜索而获得的L个第二关键词。比如:基于用户向一搜索框输入“苹果”而进行相关商品信息搜索时,搜索引擎会根据搜索查询词展现相关商品信息所属的类目,当用户选择一具体类目后,搜索引擎会在该选定的类目中进一步进行商品信息的查询,该商品信息所属的类目即为本实施例所述第二关键词。对应用户输入的查询词“苹果”,可以获得如下第二关键词(括号中为这些第二关键词被所有用户搜索到后的被点击的次数):
手机(900)、笔记本电脑(1000)、MP3/MP4/iPod/录音笔(400)、3C数码配件市场(300)、粮油/蔬果/干货/水产(400)、男装(100)、女装(100)、项链/耳饰/发饰/戒指(50)、男鞋(50)、台式机/一体机/服务器(100)等等。
在获得上述第二关键词之后,用户就会点击实际需要查看的第二关键词,比如用户输入苹果的目的在于查看苹果手机,那么可能会点击第一个第二关键词,也就是:手机。
(3)从人工审核系统中获取对所述处理对象的描述与处理对象类目不一致的处理对象的信息,得到第二信息,比如:描述为“新鲜汇水果苹果山东烟台苹果红富士烟台红富士苹果栖霞红富士苹果”的产品应该为水果,但是用户在提交产品信息时,将其设置为“数码产品”类目,故而将其设置为第二信息。
从所述人工审核系统中获取处理对象描述与处理对象类目一致的处理对象的信息,得到第三信息。比如:描述为“Apple/苹果iPhone3GS(16G)8G32G现货超级好货疯狂热销中”的产品,用户在提交产品信息时,将其设置为“数码产品”的类目,从其描述可以知道这的确为数码产品,故而将其设置为第三信息。
当然,在具体实施过程中,可以基于不同的应用场景获取不同的特征数据,本申请对于基于何种特征数据更新数据库,不作限制。
S302:从所述第一特征数据和/或所述第二特征数据中提取用于对所述第一数据库中的M条审核规则进行更新的更新数据;
在基于步骤S301获得第一特征数据或第二特征数据之后,所述智能审核系统就可以从中提取出用于对第一数据库中的M条审核规则进行更新的更新数据,基于第一特征数据或第二特征数据的不同,所获取的更新数据也不同,还是以步骤S301中获得的三种数据为例,来分别介绍如何获得更新数据。
(1)步骤S301中所获得的数据为用于表征每一个处理对象的标题的第一信息。那么如图4所示,采用如下步骤获得更新数据:
S401:对所述第一信息进行切分,以获得P个第一关键词;
在具体实施过程中,可以采用termweight算法对第一信息进行切分,取修饰词、型号词、产品词、核心产品词等等,然后,对相同一个产品、相同词类型的词进行去重,比如:苹果一词,可能出现在修饰词中、也可能出现在产品词中,如果在一个标题中,苹果一词在修饰词中出现两次、在产品词中出现一次,那么只取其一次修饰词、一次产品词。
假设基于所述智能审核系统对步骤S301所获得的第一信息进行切分,获得如下关键词(括号中为词频):
修饰词:山东烟台(600)、新鲜水果(1200)、85MM(600)
型号词:红富士(400)
产品词:手机壳(300)、手机套(200)、苹果4(20)、
核心产品词:iphone4手机壳(100)、iPhone4s手机壳(70)、苹果(1000)、红富士苹果(200)
其他词:苹源帝(10)
S402:基于第一预设条件过滤掉词频低于第一预设阈值的第一关键词,获得Q个第一关键词,其中,Q为小于等于P的整数;
在具体实施过程中,所述第一预设条件可以包括很多种,比如词频、类目、词类型等等。假设只统计步骤S401中获得关键词中在电子设备类目下的产品名称,并过滤掉词频低于200的关键词,那么将获得如下关键词:
苹果(1000)、手机壳(300)、手机套(200)。
S403:对所述Q个第一关键词按照词频做排序。
那么基于步骤S403中获得的Q个关键词将作如下排序:苹果(1000)手机壳(300)手机套(200)。
(2)步骤S301中所获得的数据为用户基于搜索词搜索而获得的L个第二关键词。那么如图5所示,采用如下步骤获得更新数据:
S501:过滤掉点击数低于第二预设阈值的所述L个第二关键词,获得S个第二关键词,其中,S为小于等于L的整数;
在具体实施过程中,假设第二预设阈值为200,那么基于步骤S301中获得的第二关键词过滤掉点击数低于200的关键词之后,将获得如下关键词:
手机(900)、笔记本电脑(1000)、MP3/MP4/iPod/录音笔(400)、3C数码配件市场(300)、粮油/蔬果/干货/水产(400)。
S502:对所述S个第二关键词按照点击数作降序排列。
在基于步骤S502获得S个第二关键词之后,将其进行如下排序:
笔记本电脑(1000)、手机(900)、MP3/MP4/iPod/录音笔(400)、粮油/蔬果/干货/水产(400)、3C数码配件市场(300)。
当然,本实施例也可对第二关键词按点击数作升序排列,本申请对此并不作限制。
(3)步骤S301中所获得的数据为第二特征数据。那么如图6所示,采用如下步骤获得更新数据:
S601:将所述第二信息进行切分,获得用于对所述M条审核规则进行更新的R个第三关键词;
假设基于步骤S301中获得的第二信息,将其切分,获得如下关键词:
新鲜、水果、苹果、山东烟台、红富士、烟台红富士苹果、栖霞红富士苹果。
S602:将所述第三信息进行切分,获得用于对所述M条审核规则进行更新的T个第四关键词。
假设,基于步骤S301中获得的第三信息,将其进行切分,获得如下关键词:
Apple/苹果、iPhone3GS。
在具体实施过程中,步骤S601和步骤S602的顺序可以互换,对于将步骤S601和步骤S602中的哪一个步骤置于前面,本申请不作限制。
S303:基于所述更新数据对所述M条审核规则进行更新,获得N条审核规则,其中,在所述N条审核规则中至少有一条审核规则与所述M条审核规则中任一审核规则不相同,其中,N为大于等于1的整数,M和N为相同或不相同的整数。
在具体实施过程中,基于获得的更新数据的不同,那么对M条审核规则进行更新的方式也不相同。下面还是基于上面三种情况对其分别进行介绍。
(1)所述更新数据为步骤S302中获得的第一关键词。那么将基于如下步骤获得N条审核规则:
基于步骤S302中获得Q个第一关键词所占的不同比例(也就是每个第一关键词的词频占总的词频的比重),为所述Q个第一关键词中的每一个第一关键词设置不同的第一权重值;
然后基于所述Q个第一权重值就可以获得所述N条审核规则。
比如步骤S401中获得苹果的词频为1000,总的点击数为:4520,那么苹果所占的比重就为:22.12%
依次类推:求得其他第一关键词所占比重分别为:
修饰词:山东烟台(13.27%)、新鲜水果(26.55%)、85MM(13.27%)
型号词:红富士(8.85%)
产品词:手机壳(6.64%)、手机套(4.42%)、苹果4(0.4%)
核心产品词:iphone4手机壳(2.21%)、iPhone4s手机壳(1.55%)、苹果(22.12%)、红富士苹果(4.42%)
在获得上述第一关键词的比重之后,就可以对其中的每个第一关键词设置一个权重值,比如:按照比重值分别乘以一个数值,就得到其权重值,又比如:将这些比重值按大小顺序排列,基于其排列位置,分别对其设置不同的权重值,以获得Q个第一权重值。
假设在审核规则库已存在如下规则:
在水果类目下:
Figure BDA00001832649000131
在电子产品类目下:
Figure BDA00001832649000132
Figure BDA00001832649000141
那么可以基于获得Q个第一权重值,对审核规则库的N条规则进行更新。
比如,如果所述智能审核系统确定所述第一关键词在所述第一数据库203中已经存在,那么判断其在所述第一数据库203中的分值是否和其对应的权重值匹配,其中,第一关键词所对应的权重值越大,其分值越高。
如果不匹配,将其分值更新为与权重值相匹配的分值,比如前面获得的新鲜水果关键词,其所占的比例为26.55%,故而其权重值比较高,但是从那条审核规则可以看出,其分值比较低,故而将其分值增加,以和其权重值对应,比如设置为:2,当然也可以与权值能够相匹配的其他数值;而如果第一关键词在第一数据库203中并不存在,那么将第一关键词加入所述第一数据库203中,并给其赋予与其权重值相匹配的分值,比如:红富士一词,在审核规则库中不存在,但是从上面的权重值可以看出,红富士的权重很高,故而将其加入规则库中的水果类目下,并赋予一个与其权重值匹配的分值,比如1,当然,也可以是其他能与权重值匹配的分值。
另外,在具体实施过程中,还可以不仅基于第一关键词的词频对其赋予第一权重值,比如,所述智能审核系统确定一个关键词(例如:苹果)同时出现在水果、数码产品等多个类目下,即使其词频很高,但是也降低其第一权重值,仅仅将其设置为辅助词,比如:由上面的两条审核规则可以看出,苹果一词既出现在水果类目下,又出现在电子产品类目下,故而即使其词频很高,但是还是降低其权重值以及分值,例如将其分值设置为:1。
基于上面的更新,上面的两条规则将变成如下:
在水果类目下:
Figure BDA00001832649000142
Figure BDA00001832649000151
在电子产品类目下:
Figure BDA00001832649000152
(2)所述更新数据为步骤S302中获得的第二关键词。那么将基于如下步骤获得N条审核规则:
基于所述S个第二关键词的所述点击数,为所述S个第二关键词中的每一个第二关键词设置不同的第二权重值;
基于所述S个第二权重值获得所述N条审核规则。
由于第二关键词被用户点击的次数越多,则说明该第二关键词越符合用户的搜索期待,故而如果其本来在规则库中的权重值较低,那么将其的第二权重值设置为较大权重值,而如果第二关键词被用户点击的次数较少,则说明其不满足用户的期望,故而如果其在规则库的第二权重值较高,那么降低其第二权重值。
基于第二关键值的第二权重值的不同,给其设置不同的分值,进而更新规则库中的审核规则,以获得N条审核规则。
(3)所述更新数据为步骤S302中获得的第三关键词或第四关键词。那么将基于如下步骤获得N条审核规则:
将所述R个第三关键词中的每一个第三关键词的权重值设置为负值;以及
将所述T个第四关键词中的每一个第四关键词的权重值设置为最大权重值,以获得所述N条审核规则。
比如,在步骤S601中获得的多个第三关键词经人工审核判断其产品描述与产品类目不一致,故而确定其没有通过审核,因为经人工审核其准确率最高,一般不会出现失误,故而将这些第三关键词在电子设备类目下的权重值皆设置为负值,进而将其在第一数据库203中对应的分值也设置为负值;
而在步骤S602中获得多个第四关键词经人工审核人工审核判断其产品描述与产品类目一致,故而将这些第三关键词在电子设备类目下的权重值皆设置为最大值,进而将其在第一数据库203中的分值也设置为最大值。
在具体实施过程中,可以仅仅使用上面三种方式中的一种方式对数据库进行更新,也可以采用多种方式对其进行更新,本申请不作限制,比如,采用三种方式同时对数据库进行更新。
在采用三种方式同时对数据库进行更新时,获取更新数据的方式与前面相同,只是三种数据皆要获取,并且在获取三种数据后,对三种数据的处理也和前面相同,具体为:
将第三关键词的分值设置为最大值;
将第四关键词的分值设置为负值;
对第一关键词和第二关键词中的权重值较大的关键词取设定值与词频分之和;
而对第一关键词和第二关键词中的权重值较小的关键词和辅助词则取较小分值。
当然,在具体实施过程中,对于采样何种规则设置第一关键词、第二关键词、第三关键词以及第四关键词的分值,本申请亦不作限制。只要所采用的更新规则,能够对符合审核规则和不符合审核规则的关键词赋予合适的分值,都属于本申请的范围。
另外,上述对第一数据库203进行更新的方式,所采用的数据皆是基于对产品进行类目划分而获得,但是在具体实施过程中,还可以对类目进行细分,来获得产品的属性数据,从而对产品的审核更加详细和精准,其更新过程与基于类目数据的更新过程相同,故而不再赘述。
基于以上描述可知,本申请实施例至少存在如下有益效果:
由于在本申请实施例中,在对智能审核系统中的审核规则库进行更新和完善时,主要实现过程包括:①从海量数据库中获得第一特征数据,例如:对海量数据库中的所有处理对象的标题信息进行分词从而获得的每个第一关键词的词频信息、基于用户输入搜索词搜索进而获得的每个第二关键词的点击率等等;②从人工审核系统中获得第二特征数据,例如:对处理对象的描述与处理对象类目不一致的处理对象的信息、对处理对象的描述与处理对象的类目一致的处理对象的信息等等;③基于第一特征数据及第二特征数据对审核规则库进行更新,所以,基于上述技术方案而获得的智能审核系统的审核规则库相较于现有技术中的审核规则库,便具有更完善和准确的特点,而使用具有这一特点的审核规则库进行审核,相较现有技术,就自然具有审核准确率更高和更快的技术效果。
实施例二
请参考图7,基于同一发明构思,本申请实施例二提供一种对处理对象进行审核的方法,所述方法应用在包含智能审核系统及与所述智能审核系统对应的包含M条审核规则的第一数据库的第一服务器中。
如图7所示,所述方法包括如下步骤:
S701:获取第一处理对象,所述第一处理对象中包含用于对所述第一处理对象进行审核的待匹配数据以及所述第一处理对象的分类信息;
在具体实施过程中,所述待匹配数据为:所述第一处理对象的标题信息。为了便于理解,还是以处理对象为产品信息为例,来做详细介绍。比如:某一产品信息的标题为“特价七省包邮/新鲜水果/85mm/正宗烟台苹果红富士栖霞苹果”。
所述第一处理对象的分类信息,可以为所述第一处理对象的类目信息、属性信息等等。通常情况下,用户在向所述智能审核系统提交产品信息时,所述智能审核系统会在提交页面让用户给产品信息选择一个分类信息,在本实施例中以分类信息为类目信息为例。
S702:基于所述第一分类信息或所述待匹配信息,从所述第一数据库中获取用于对所述第一处理对象进行审核的至少一条审核规则,其中,所述第一数据库为基于本申请实施例一所述方法更新过的数据库;
在具体实施过程中,所述获得至少一条审核规则的过程,可以包括多种情况,下面列举两种情况,当然,在具体实施过程中,不限于以下两种情况:
(1)基于所述第一分类信息,从所述第一数据库中获取用于对所述第一处理对象进行审核的至少一条审核规则。
在具体实施过程中,基于分类信息的不同,所述智能审核系统从所述第一数据库中所调用的审核规则的类型也不同,比如:如果产品的类目信息为数码产品,那么通常所调用的审核规则为型号、功能等等;而如果类目信息为水果,那么通常所调用的审核规则为产地、尺寸等等。
(2)基于所述待匹配数据,从所述第一数据库中获取用于对所述第一处理对象进行审核的至少一条审核规则。
在具体实施过程中,也可以先不管第一处理对象的分类信息,直接基于待匹配数据从第一数据库中获得至少一条审核规则,这些审核规则,可能对应多个分类信息,比如步骤S701中获得的待匹配数据,其可能在水果分类信息、数码产品分类信息下,都包含多条审核规则。
S703:基于所述至少一条审核规则以及所述待匹配数据对所述第一处理对象进行审核,以获得第一审核结果;
在具体实施过程中,基于步骤S702中所获得至少一条审核规则的方法不同,所述获得第一审核结果的过程也不同,下面还是分两种情况进行介绍。
(1)基于所述第一分类信息,获得所述至少一条审核规则。在这种情况下,采用如下方式获得第一审核结果:
将所述待匹配数据分词,获得至少一第五关键词;
比如对步骤S701中获得的标题信息进行分词,获得如下关键词:
苹果、特价、包邮、新鲜水果、85mm、烟台苹果、红富士、栖霞苹果。
基于所述至少一条审核规则对所述至少一第五关键词评分,获得一审核分值。
在本申请实施例一中已知,在上一步获得的第五关键词中的每一个第五关键词,在第一数据库203的不同的类目下,都会对应一个分值。由本申请实施例一中更新过的审核规则可知:
①在数码产品类目下,这些关键词对应的分值分别为(其中,如果在规则库中不存在的话,则表明其分值为0):
苹果(1)、特价(0.5)、包邮(0.5)、新鲜水果(0)、水果(0)、80mm(0)、烟台苹果(0)、红富士苹果(0)、栖霞苹果(0)。
那么所述智能审核系统将这些分值求和即可获得所述待匹配数据库的审核分值:2。
而如果是基于现有技术中的规则库,这些关键词分别对应如下分值:
苹果(2)、特价(0.5)、包邮(0.5)、新鲜水果(0)、水果(0)、80mm(0)、烟台苹果(0)、红富士苹果(0)、栖霞苹果(0)
故而求的其审核分值为:3。
②在水果类目下,经过更新过的规则库,这些关键词对应的分值为:
苹果(1)、特价(0.5)、包邮(0.5)、新鲜水果(2)、85mm(0.5)、烟台苹果(0.5)、红富士(1)、栖霞苹果(0.5)。
那么其审核分值应该为:6.5。
而如果是基于现有技术中的规则库,这些关键词的分值为:
苹果(2)、特价(0.5)、包邮(0.5)、新鲜水果(0.5)、85mm(0.5)、烟台苹果(0.5)、红富士(1)、栖霞苹果(0.5)。
那么其审核分值应该为:6。
(2)基于所述待审核数据,获得所述至少一条审核规则。在这种情况下,采用如下方式获得第一审核结果:
基于所述至少一条审核规则对所述待匹配数据进行审核,以获得所述待匹配数据的至少一个第二分类信息。
在步骤S701中,获得的所述待匹配数据,基于不同的规则库分别对应不同的分值,下面分别对其进行列举。
①在水果分类信息下,如果是基于更新过的规则库,每个关键词的分值分别为:
苹果(1)、特价(0.5)、包邮(0.5)、新鲜水果(2)、85mm(0.5)、烟台苹果(0.5)、红富士(1)、栖霞苹果(0.5)。
那么其在水果类目下的分值为:6.5。
而如果是基于现有技术中的规则库,这些关键词的分值分别为:
苹果(2)、特价(0.5)、包邮(0.5)、新鲜水果(0.5)、85mm(0.5)、烟台苹果(0.5)、红富士(1)、栖霞苹果(0.5)。
那么其审核分值应该为:6。
②在数码产品类目下,基于更新过的规则库,每个关键词的分值分别为:
苹果(1)、特价(0.5)、包邮(0.5)、新鲜水果(0)、水果(0)、80mm(0)、烟台苹果(0)、红富士苹果(0)、栖霞苹果(0)。
那么其在数码产品类目下的分值为:2。
而如果是基于现有技术中的规则库,这些关键词的分值分别为:
苹果(2)、特价(0.5)、包邮(0.5)、新鲜水果(0)、水果(0)、80mm(0)、烟台苹果(0)、红富士苹果(0)、栖霞苹果(0)
故而求的其审核分值为:3。
在获得所述待匹配数据在各个类目下的分值之后,判断其分值是否大于一预设阈值,比如:2.5(当然在具体实施过程中,所述预设阈值可以基于具体的实际情况,设置不同的值,在此不作限制),那么如果是采用经更新过的规则库对第一处理对象进行审核,由于只有水果类目下第一处理对象的分值才大于2.5,故而可以获得所述第一处理对象的第二分类信息即为:水果类目。
而如果是采用现有技术中的规则库对第一处理对象进行审核,由于不管是水果类目还是电子产品类目下,其分值都是大于2.5,所以也就是第一处理对象包含了水果类目和电子产品类目等两个类目。
S704:判断所述第一审核结果是否满足一预设条件;
在具体实施过程中,基于不同的情况,所述预设条件也不同,还是以上面所列举的两种情况为例来作介绍,当然,在具体实施过程中,所述预设条件不限于以下两种。
(1)假设步骤S703中所获得的第一审核结果具体为:一审核分值。
那么,在具体实施过程中,所述预设条件可以为一预设分值,所述判断第一审核结果是否满足所述预设条件,就是判断所述第一审核结果是否大于预设分值。
在具体实施过程中,假设在所述智能审核系统中预设分值为2.5。当然,也可以基于不同的应用环境,将其设置为其他分值,本申请不作限制。在步骤S703中,如果是基于更新过的规则库对第一处理对象进行审核,那么获得的水果类目下的审核分值为:6.5,数码产品类目下的审核分值为2,故而可知道水果类目下的审核分值满足预设条件,而数码产品类目下的审核分值不满足预设条件。
而如果是基于现有技术中的规则库对第一处理对象进行审核,那么获得的水果类目下的分值为6,数码产品类目下的分值为3,也就是这两个类目都满足预设条件。
(2)假设步骤S703中所获得的第一审核结果具体为:第二分类信息。
那么在具体实施过程中,所述判断所述第一审核结果是否满足一预设条件,具体为:
判断所述第一分类信息是否包含在所述第二分类信息中。
假设在步骤S701中,所述第一处理对象的第一分类信息为:水果类目;
在步骤S703中,不管是基于更新过的规则库还是现有技术中的规则库,所获得的第二分类信息皆包括:水果类目;故而第一分类信息包含在第二分类信息中,也就是所述第一审核结果满足预设条件。
但是如果步骤S701中,所述第一处理对象的第一分类信息为:数码产品类目,由于在步骤S703中基于更新过的规则库获得的第二分类信息为:水果类目,故而其也就不满足预设条件。但是如果是基于现有技术中的规则库获得的第二分类信息包括:电子产品类目,故而其满足预设条件,这显然是不对的。
S705:如果所述第一审核结果满足所述预设条件时,确定所述第一处理对象为已经通过审核的处理对象。
基于步骤S703中的分值可知,如果步骤S701中所获得的产品信息产品设置于水果类目下,所述智能审核系统判断所述产品信息的分值大于预设分值2.5或者其第一分类信息包含在第二分类信息中,故而将其通过审核,输出至一网页界面;
在具体实施过程中,在基于步骤S704判断所述第一审核结果是否满足一预设条件之后,所述方法还包括如下步骤:
S706:如果所述第一审核结果不满足所述预设条件时,确定所述第一处理对象为没有通过审核的处理对象。
由此可知,如果第一分类信息为水果类目,那么不管是基于更新过的规则库还是现有技术中的规则库,都将其通过审核,输出至一显示界面;但是如果第一分类信息为电子产品类目,如果是基于更新过的规则库,那么所述第一处理对象是没法通过审核,不能输出至一显示界面的;而如果是基于现有技术中的规则库,则可以将其通过审核,但是由第一处理对象可知,其明显应该属于水果类目,如果将其划分入电子产品类目是不准确的。由此可知,基于现有技术中的规则库对第一处理对象进行审核时,其审核并不准确,故而还需要将数据发送至人工审核系统,供其抽样复查。
在具体实施过程中,在所述如果所述第一审核结果不满足所述预设条件时,确定所述第一处理对象为没有通过审核的处理对象之后,所述方法还包括:
将所述没有通过审核的处理对象的信息发送至包含所述人工审核系统的第三服务器;
基于所述人工审核系统对所述没有通过审核的处理对象进行审核,以获得第二审核结果。
在所述基于所述人工审核系统对所述没有通过审核的处理对象进行审核,以获得第二审核结果之后,所述方法还包括:
基于所述第二审核结果更新所述智能审核系统所包含的第一数据库。
由于基于人工审核系统获得的第二审核结果对包含智能审核系统的第一数据库进行更新,在本申请实施例一中已经作详细介绍,故而在此不再赘述。
基于上述描述,可知本申请实施例二至少存在如下有益效果:
(1)在本申请实施例中,对于智能审核系统中的审核规则库,由于会基于人工审核系统和/或海量数据库中的数据进行更新和完善,故而会导致本申请实施例中的智能审核系统相较于现有技术中智能审核系统,在审核的准确率上,会得到极大提高;
(2)在智能审核系统的审核准确率提高后,相较于现有技术而言,在本申请实施例中需要人工审核系统进行审核的处理对象就会大大减少,甚至于在审核规则库足够完善的情况下,会出现不需要人工审核系统进行审核的技术效果,显然,这必将在整体上降低审核所需要的时间,提高审核的效率;
(3)由于人工审核系统需要审核的处理对象减少了,所以,相较于现有技术,本申请实施例中需要在人工审核系统所在的第三服务器与智能审核系统所在的第一服务器间传输的数据量就会大大降低,进而就能有效降低现有技术中出现数据传输阻塞或丢失的可能性。
实施例三
请参考图8,基于同一发明构思,本申请实施例三提供一种更新数据库的装置,所述系统应用在包含有对处理对象进行审核的智能审核系统的第一服务器中,其中,所述第一服务器连接于一包含海量数据库的第二服务器和/或一包含人工审核系统的第三服务器,所述智能审核系统对应有包含M条审核规则的第一数据库,其中,M为大于等于1的整数。
如图8所示,所述装置包括:
获取模块801:用于从所述海量数据库中获取第一特征数据,和/或从所述人工审核系统中获取第二特征数据;
提取模块802:用于从所述第一特征数据和/或所述第二特征数据中提取用于对所述第一数据库中的M条审核规则进行更新的更新数据;
更新模块803:用于基于所述更新数据对所述M条审核规则进行更新,获得N条审核规则,其中,在所述N条审核规则中至少有一条审核规则与所述M条审核规则中任一审查规则不相同,其中,N为大于等于1的整数,M和N为相同或不相同的整数。
由于本申请实施三中的装置为与实施本申请实施例一中的方法所对应的装置,所以基于本申请实施例一中的方法,本领域所属技术人员能够了解本申请实施三中的装置的具体实施方法以及本申请实施三的装置的各种变化形式。所以在此对于该装置的运行不再详细介绍,只要本领域所属技术人员基于本申请实施例一中的方法所采用的装置,都属于本申请所欲保护的范围。
实施例四
请参考图9,基于同一发明构思,本申请实施四提供一种对处理对象进行审核的装置,所述装置应用在包含智能审核系统及与所述智能审核系统对应的包含M条审核规则的第一数据库的第一服务器中。
如图9所示,所述装置包括:
第一获取模块901:用于获取第一处理对象,所述第一处理对象中包含用于对所述第一处理对象进行审核的待匹配数据;
第二获取模块902:用于基于所述第一分类信息或所述待匹配数据,从所述第一数据库中获取用于对所述第一处理对象进行审核的至少一条审核规则,其中,所述第一数据库为基于本申请实施例一中任一权利要求所述方法更新过的数据库;
审核模块903:用于基于所述至少一条审核规则以及所述待匹配数据对所述第一处理对象进行审核,以获得第一审核结果;
判断模块904:用于判断所述第一审核结果是否满足一预设条件;
确定模块905:用于如果所述第一审核结果满足所述预设条件时,确定所述第一处理对象为已经通过审核的处理对象。
由于本申请实施四中的装置为与实施本申请实施例二中的方法所对应的装置,所以基于本申请实施例二中的方法,本领域所属技术人员能够了解本申请实施四中的装置的具体实施方法以及本申请实施四的装置的各种变化形式。所以在此对于该装置的运行不再详细介绍,只要本领域所属技术人员基于本申请实施例二中的方法所采用的装置,都属于本申请所欲保护的范围。
本申请提供的一个或多个技术方案,至少具有如下技术效果或优点:
(1)在本申请实施例中,对于智能审核系统中的审核规则库,由于会基于人工审核系统和/或海量数据库中的数据进行更新和完善,故而会导致本申请实施例中的智能审核系统相较于现有技术中智能审核系统,在审核的准确率上,会得到极大提高;
(2)在智能审核系统的审核准确率提高后,相较于现有技术而言,在本申请实施例中需要人工审核系统进行审核的处理对象就会大大减少,甚至于在审核规则库足够完善的情况下,会出现不需要人工审核系统进行审核的技术效果,显然,这必将在整体上降低审核所需要的时间,提高审核的效率;
(3)由于人工审核系统需要审核的处理对象减少了,所以,相较于现有技术,本申请实施例中需要在人工审核系统所在的第三服务器与智能审核系统所在的第一服务器间传输的数据量就会大大降低,进而就能有效降低现有技术中出现数据传输阻塞或丢失的可能性;
(4)由于在本申请实施例中,在对智能审核系统中的审核规则库进行更新和完善时,主要实现过程包括:①从海量数据库中获得第一特征数据,例如:对海量数据库中的所有处理对象的标题信息进行分词从而获得的每个第一关键词的词频信息、基于用户输入搜索词搜索进而获得的每个第二关键词的点击率等等;②从人工审核系统中获得第二特征数据,例如:对处理对象的描述与处理对象类目不一致的处理对象的信息、对处理对象的描述与处理对象的类目一致的处理对象的信息等等;③基于第一特征数据及第二特征数据对审核规则库进行更新,所以,基于上述技术方案而获得的智能审核系统的审核规则库相较于现有技术中的审核规则库,便具有更完善和准确的特点,而使用具有这一特点的审核规则库进行审核,相较现有技术,就自然具有审核准确率更高和更快的技术效果。
尽管已描述了本申请的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本申请范围的所有变更和修改。
显然,本领域的技术人员应该明白,本申请的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本申请不限制于任何特定的硬件和软件结合。
显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。

Claims (21)

1.一种更新数据库的方法,所述方法应用在包含有对处理对象进行审核的智能审核系统的第一服务器中,其中,所述第一服务器连接于一包含海量数据库的第二服务器和/或一包含人工审核系统的第三服务器,所述智能审核系统对应有包含M条审核规则的第一数据库,其中,M为大于等于1的整数,其特征在于,所述方法包括:
从所述海量数据库中获取第一特征数据,和/或从所述人工审核系统中获取第二特征数据;
从所述第一特征数据和/或所述第二特征数据中提取用于对所述第一数据库中的M条审核规则进行更新的更新数据;
基于所述更新数据对所述M条审核规则进行更新,获得N条审核规则,其中,在所述N条审核规则中至少有一条审核规则与所述M条审核规则中任一审核规则不相同,其中,N为大于等于1的整数,M和N为相同或不相同的整数。
2.如权利要求1所述的方法,其特征在于,所述第一特征数据,具体为:
用于表征每一个处理对象的标题的第一信息。
3.如权利要求2所述的方法,其特征在于,所述从所述第一特征数据和/或所述第二特征数据中提取用于对所述第一数据库中的M条审核规则进行更新的更新数据,具体包括:
对所述第一信息进行切分,以获得P个第一关键词;
基于第一预设条件过滤掉词频低于第一预设阈值的第一关键词,获得Q个第一关键词,其中,Q为小于等于P的整数;
对所述Q个第一关键词按照词频做排序。
4.如权利要求3所述的方法,其特征在于,所述基于所述更新数据对所述M条审核规则进行更新,获得N条审核规则,具体包括:
基于所述Q个第一关键词所占的不同比例,为所述Q个第一关键词中的每一个第一关键词设置不同的第一权重值;
基于所述Q个第一权重值获得所述N条审核规则。
5.如权利要求1所述的方法,其特征在于,所述第一特征数据,具体为:
用户基于搜索词搜索而获得的L个第二关键词。
6.如权利要求5所述的方法,其特征在于,所述从所述第一特征数据和/或所述第二特征数据中提取用于对所述第一数据库中的M条审核规则进行更新的更新数据,具体包括:
过滤掉点击数低于第二预设阈值的所述L个第二关键词,获得S个第二关键词,其中,S为小于等于L的整数;
对所述S个第二关键词按照点击数作排序。
7.如权利要求6所述的方法,其特征在于,所述所述基于所述更新数据对所述M条审核规则进行更新,获得N条审核规则,具体包括:
基于所述S个第二关键词的所述点击数,为所述S个第二关键词中的每一个第二关键词设置不同的第二权重值;
基于所述S个第二权重值获得所述N条审核规则。
8.如权利要求1所述的方法,其特征在于,所述从所述人工审核系统中获取第二特征数据,具体包括:
从所述人工审核系统中获取对所述处理对象的描述与处理对象类目不一致的处理对象的信息,得到第二信息;
从所述人工审核系统中获取处理对象描述与处理对象类目一致的处理对象的信息,得到第三信息。
9.如权利要求8所述的方法,其特征在于,从所述第一特征数据和/或所述第二特征数据中提取用于对所述第一数据库中的M条审核规则进行更新的更新数据,具体包括:
将所述第二信息进行切分,获得用于对所述M条审核规则进行更新的R个第三关键词;
将所述第三信息进行切分,获得用于对所述M条审核规则进行更新的T个第四关键词。
10.如权利要求9所述的方法,其特征在于,所述基于所述更新数据对所述M条审核规则进行更新,获得N条审核规则,具体包括:
将所述R个第三关键词中的每一个第三关键词的权重值设置为负值;以及
将所述T个第四关键词中的每一个第四关键词的权重值设置为最大权重值,以获得所述N条审核规则。
11.一种对处理对象进行审核的方法,所述方法应用在包含智能审核系统及与所述智能审核系统对应的包含M条审核规则的第一数据库的第一服务器中,其特征在于,所述方法包括:
获取第一处理对象,所述第一处理对象中包含用于对所述第一处理对象进行审核的待匹配数据以及所述第一处理对象的第一分类信息;
基于所述第一分类信息或所述待匹配数据,从所述第一数据库中获取用于对所述第一处理对象进行审核的至少一条审核规则,其中,所述第一数据库为基于权利要求1-10中任一权利要求所述方法更新过的数据库;
基于所述至少一条审核规则以及所述待匹配数据对所述第一处理对象进行审核,以获得第一审核结果;
判断所述第一审核结果是否满足一预设条件;
如果所述第一审核结果满足所述预设条件时,确定所述第一处理对象为已经通过审核的处理对象。
12.如权利要求11所述的方法,其特征在于,在所述判断所述第一审核结果是否满足一预设条件之后,所述方法还包括:
如果所述第一审核结果不满足所述预设条件时,确定所述第一处理对象为没有通过审核的处理对象。
13.如权利要求11所述的方法,其特征在于,所述待匹配数据具体为:所述第一处理对象的标题信息以及类目信息。
14.如权利要求11所述的方法,其特征在于,当所述基于所述第一分类信息或所述待匹配数据,从所述第一数据库中获取用于对所述第一处理对象进行审核的至少一条审核规则,具体为:基于所述第一分类信息,从所述第一数据库中获取用于对所述第一处理对象进行审核的至少一条审核规则时;
所述基于所述至少一条审核规则以及所述待匹配数据对所述第一处理对象进行审核,以获得第一审核结果,具体包括:
将所述待匹配数据分词,获得至少一第五关键词;
基于所述至少一条审核规则对所述至少一第五关键词评分,获得一审核分值。
15.如权利要求14所述的方法,其特征在于,所述判断所述第一审核结果是否满足一预设条件,具体为:
判断所述审核分值是否大于一预设分数阈值。
16.如权利要求11所述的方法,其特征在于,当所述基于所述第一分类信息或所述待匹配数据,从所述第一数据库中获取用于对所述第一处理对象进行审核的至少一条审核规则,具体为:基于所述待匹配数据,从所述第一数据库中获取用于对所述第一处理对象进行审核的至少一条审核规则时;
所述基于所述至少一条审核规则以及所述待匹配数据对所述第一处理对象进行审核,以获得第一审核结果,具体为:
基于所述至少一条审核规则对所述待匹配数据进行审核,以获得所述待匹配数据的至少一个第二分类信息。
17.如权利要求16所述的方法,其特征在于,所述判断所述第一审核结果是否满足一预设条件,具体为:
判断所述第一分类信息是否包含在所述第二分类信息中。
18.如权利要求12所述的方法,其特征在于,在所述如果所述第一审核结果不满足所述预设条件时,确定所述第一处理对象为没有通过审核的处理对象之后,所述方法还包括:
将所述没有通过审核的处理对象的信息发送至包含所述人工审核系统的第三服务器;
基于所述人工审核系统对所述没有通过审核的处理对象进行审核,以获得第二审核结果。
19.如权利要求18所述的方法,其特征在于,在所述基于所述人工审核系统对所述没有通过审核的处理对象进行审核,以获得第二审核结果之后,所述方法还包括:
基于所述第二审核结果更新所述智能审核系统所包含的第一数据库。
20.一种更新数据库的装置,所述系统应用在包含有对处理对象进行审核的智能审核系统的第一服务器中,其中,所述第一服务器连接于一包含海量数据库的第二服务器和/或一包含人工审核系统的第三服务器,所述智能审核系统对应有包含M条审核规则的第一数据库,其中,M为大于等于1的整数,其特征在于,所述装置包括:
获取模块:用于从所述海量数据库中获取第一特征数据,和/或从所述人工审核系统中获取第二特征数据;
提取模块:用于从所述第一特征数据和/或所述第二特征数据中提取用于对所述第一数据库中的M条审核规则进行更新的更新数据;
更新模块:用于基于所述更新数据对所述M条审核规则进行更新,获得N条审核规则,其中,在所述N条审核规则中至少有一条审核规则与所述M条审核规则中任一审核规则不相同,其中,N为大于等于1的整数,M和N为相同或不相同的整数。
21.一种对处理对象进行审核的装置,所述装置应用在包含智能审核系统及与所述智能审核系统对应的包含M条审核规则的第一数据库的第一服务器中,其特征在于,所述装置包括:
第一获取模块:用于获取第一处理对象,所述第一处理对象中包含用于对所述第一处理对象进行审核的待匹配数据以及所述第一处理对象的第一分类信息;
第二获取模块:用于基于所述第一分类信息或所述待匹配数据,从所述第一数据库中获取用于对所述第一处理对象进行审核的至少一条审核规则,其中,所述第一数据库为基于权利要求1-10中任一权利要求所述方法更新过的数据库;
审核模块:用于基于所述至少一条审核规则以及所述待匹配数据对所述第一处理对象进行审核,以获得第一审核结果;
判断模块:用于判断所述第一审核结果是否满足一预设条件;
确定模块:用于如果所述第一审核结果满足所述预设条件时,确定所述第一处理对象为已经通过审核的处理对象。
CN201210226389.2A 2012-06-29 2012-06-29 一种更新数据库的方法及装置 Active CN103514227B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210226389.2A CN103514227B (zh) 2012-06-29 2012-06-29 一种更新数据库的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210226389.2A CN103514227B (zh) 2012-06-29 2012-06-29 一种更新数据库的方法及装置

Publications (2)

Publication Number Publication Date
CN103514227A true CN103514227A (zh) 2014-01-15
CN103514227B CN103514227B (zh) 2016-12-21

Family

ID=49896959

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210226389.2A Active CN103514227B (zh) 2012-06-29 2012-06-29 一种更新数据库的方法及装置

Country Status (1)

Country Link
CN (1) CN103514227B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110717788A (zh) * 2019-10-12 2020-01-21 北京搜狐新媒体信息技术有限公司 一种目标用户的筛选方法及装置
CN111653135A (zh) * 2020-05-21 2020-09-11 山东畅想云教育科技有限公司 一种课程指定教材的选用和审核方法
CN113127495A (zh) * 2019-12-31 2021-07-16 深圳云天励飞技术有限公司 一种数据库的更新方法及装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101059810A (zh) * 2007-03-16 2007-10-24 华为技术有限公司 一种实现数据库系统自动优化的系统和方法
CN101819601A (zh) * 2010-05-11 2010-09-01 同方知网(北京)技术有限公司 学术文献自动分类的方法
CN101923540A (zh) * 2010-07-20 2010-12-22 陈洁 语言翻译质量审核方法
US8001064B1 (en) * 2006-06-01 2011-08-16 Monster Worldwide, Inc. Learning based on feedback for contextual personalized information retrieval
WO2012083892A1 (zh) * 2010-12-24 2012-06-28 北大方正集团有限公司 一种网络不良信息的过滤方法及装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8001064B1 (en) * 2006-06-01 2011-08-16 Monster Worldwide, Inc. Learning based on feedback for contextual personalized information retrieval
CN101059810A (zh) * 2007-03-16 2007-10-24 华为技术有限公司 一种实现数据库系统自动优化的系统和方法
CN101819601A (zh) * 2010-05-11 2010-09-01 同方知网(北京)技术有限公司 学术文献自动分类的方法
CN101923540A (zh) * 2010-07-20 2010-12-22 陈洁 语言翻译质量审核方法
WO2012083892A1 (zh) * 2010-12-24 2012-06-28 北大方正集团有限公司 一种网络不良信息的过滤方法及装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110717788A (zh) * 2019-10-12 2020-01-21 北京搜狐新媒体信息技术有限公司 一种目标用户的筛选方法及装置
CN113127495A (zh) * 2019-12-31 2021-07-16 深圳云天励飞技术有限公司 一种数据库的更新方法及装置
CN111653135A (zh) * 2020-05-21 2020-09-11 山东畅想云教育科技有限公司 一种课程指定教材的选用和审核方法

Also Published As

Publication number Publication date
CN103514227B (zh) 2016-12-21

Similar Documents

Publication Publication Date Title
CN102236663B (zh) 一种基于垂直搜索的查询方法、系统和装置
US9934293B2 (en) Generating search results
CN108885624B (zh) 信息推荐系统及方法
CN110418200A (zh) 一种视频推荐方法、装置及终端设备
CN103514178A (zh) 一种基于点击率的搜索排序方法及装置
CN103763361A (zh) 一种基于用户行为推荐应用的方法、系统及推荐服务器
CN107730346A (zh) 物品聚类的方法和装置
CN103514181A (zh) 一种搜索方法和装置
CN102486781A (zh) 一种搜索排序方法和装置
CN107679916A (zh) 用于获取用户兴趣度的方法及装置
CN106156135A (zh) 查询数据的方法及装置
CN109977316A (zh) 一种并行式文章推荐方法、装置、设备及存储介质
CN110516033A (zh) 一种计算用户偏好的方法和装置
CN109299993A (zh) 产品功能推荐方法、终端设备及计算机可读存储介质
WO2014110950A1 (en) Method and device for pushing information
CN110309142A (zh) 规则管理的方法和装置
CN107798622A (zh) 一种识别用户意图的方法和装置
CN111126442A (zh) 一种物品关键属性生成方法、物品分类方法和装置
CN109242544A (zh) 产品信息推送的处理方法、装置、计算机设备及存储介质
CN110019813A (zh) 寿险案例检索方法、检索装置、服务器及可读存储介质
CN112667770A (zh) 一种对物品进行分类的方法和装置
EP2316063A1 (en) Method and apparatus for providing data statistics
CN107104875B (zh) 信息推送的方法和装置
CN103514227A (zh) 一种更新数据库的方法及装置
CN114445179A (zh) 业务推荐方法、装置、电子设备和计算机可读介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant