CN105677677A - 一种信息分类方法及装置 - Google Patents

一种信息分类方法及装置 Download PDF

Info

Publication number
CN105677677A
CN105677677A CN201410670076.5A CN201410670076A CN105677677A CN 105677677 A CN105677677 A CN 105677677A CN 201410670076 A CN201410670076 A CN 201410670076A CN 105677677 A CN105677677 A CN 105677677A
Authority
CN
China
Prior art keywords
information
classification
probability
attribute word
sorted
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201410670076.5A
Other languages
English (en)
Inventor
付杨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201410670076.5A priority Critical patent/CN105677677A/zh
Publication of CN105677677A publication Critical patent/CN105677677A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请公开了一种信息分类方法及装置,用以解决现有技术中由于信息分类出现错误而导致后续的信息处理不准确的问题。该方法对待分类信息进行分词,得到该待分类信息中的各属性词,再根据预先保存的各属性词属于指定类目的概率,确定该待分类信息属于该指定类目的概率,当确定的概率大于预设阈值时,将该待分类信息分入该指定类目下。上述方法可有效提高信息分类的准确性,从而提高后续信息处理的准确性。

Description

一种信息分类方法及装置
技术领域
本申请涉及计算机技术领域,尤其涉及一种信息分类方法及装置。
背景技术
随着计算机信息技术和互联网的飞速发展,用户已经可以通过网络浏览各种信息,目前,大多服务提供商都要将可提供给用户的信息进行分类,一方面可提高用户浏览信息的便利性,另一方面也可提高处理信息的便利性和准确性。
例如,在电子商务领域,服务提供商会为用户提供大量的商品信息,为了便于管理这些商品信息,以对用户的交易进行风控,服务提供商就需要将这些商品信息进行分类。
一般的,可将商品信息粗略的分为实物商品和虚拟商品两大类,实物商品包括服装、电器、食品等,虚拟商品包括手机充值卡、游戏充值卡等。显然,由于购买虚拟商品更容易出现风险,因此,对实物商品和虚拟商品所采用的风控策略也不尽相同,一般对虚拟商品所采用的风控策略会更严格一些。
可见,服务提供商后续对信息的处理往往要基于信息所属的类目,一旦对信息的分类出现错误,就会导致后续对该信息的处理不准确。
继续沿用上例,假设某商品本属于虚拟商品类目,但错将该商品分在了实物商品类目下,则会导致对该商品所采用的风控策略过于宽松,这样势必会提高用户购买该商品的风险。
发明内容
本申请实施例提供一种信息分类方法及装置,用以解决现有技术中由于信息分类出现错误而导致后续的信息处理不准确的问题。
本申请实施例提供的一种信息分类方法,包括:
对待分类信息进行分词,得到所述待分类信息中的各属性词;
根据预先保存的各属性词属于指定类目的概率,确定所述待分类信息属于所述指定类目的概率;
当所述待分类信息属于所述指定类目的概率大于预设阈值时,将所述待分类信息分入所述指定类目下。
本申请实施例提供的一种信息分类装置,包括:
分词模块,用于对待分类信息进行分词,得到所述待分类信息中的各属性词;
确定模块,用于根据预先保存的各属性词属于指定类目的概率,确定所述待分类信息属于所述指定类目的概率;
分类模块,用于当所述待分类信息属于所述指定类目的概率大于预设阈值时,将所述待分类信息分入所述指定类目下。
本申请实施例提供一种信息分类方法及装置,该方法对待分类信息进行分词,得到该待分类信息中的各属性词,再根据预先保存的各属性词属于指定类目的概率,确定该待分类信息属于该指定类目的概率,当确定的概率大于预设阈值时,将该待分类信息分入该指定类目下。上述方法可有效提高信息分类的准确性,从而提高后续信息处理的准确性。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1为本申请实施例提供的信息分类的过程;
图2为本申请实施例提供的信息分类装置结构示意图。
具体实施方式
在现有技术中,一般的信息分类方法是人工对信息进行分类,这不可避免的会产生人为错误,导致信息分类不准确。现有技术中也存在按一定的规则自动进行信息分类的方法,例如,在电子商务领域,一个卖家开的店铺是卖服装的店铺,则服务器会将该卖家所发布的所有商品信息都分在实物商品类目下,但是,如果该卖家的店铺同时也卖手机充值卡,则该卖家发布的手机充值卡的商品信息也会被分在实物商品类目下,显然这也会导致信息分类不准确,从而导致后续的诸如风控等信息处理不准确。
本申请实施例为了提高信息分类的准确性,以提高后续信息处理的准确性,可预先确定各属性词属于指定类目的概率并保存在服务器中,则对于一个待分类信息,服务器可根据该待分类信息中包含的各属性词,确定该待分类信息属于指定类目的概率,并当确定的概率大于预设阈值时,将该待分类信息分入该指定类目下。
为使本申请的目的、技术方案和优点更加清楚,下面将结合本申请具体实施例及相应的附图对本申请技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
图1为本申请实施例提供的信息分类的过程,具体包括以下步骤:
S101:对待分类信息进行分词,得到该待分类信息中的各属性词。
在本申请实施例中,针对一个待分类信息,服务器可先采用预设的分词算法对该待分类信息进行分词,得到该待分类信息中包含的各属性词。其中,预设的分词算法可包括中文分词算法、英文分词算法等。
S102:根据预先保存的各属性词属于指定类目的概率,确定该待分类信息属于该指定类目的概率。
在本申请实施例中,服务器可预先保存各属性词属于指定类目的概率,则通过步骤S101得到该待分类信息中包含的各属性词后,即可确定该待分类信息属于该指定类目的概率。其中,在电子商务领域中,本申请实施例中所述的待分类信息包括但不限于商品信息,具体可以是商品名称信息,所述的指定类目包括但不限于虚拟商品类目。当然,在其他领域中,所述的待分类信息也可以是其他类型的信息,如普通的文本信息等,所述的指定类目可以是新闻、体育、生活等类目。
下面以待分类信息为商品信息,指定类目为虚拟商品类目为例进行说明。
例如,假设待分类信息为“运营商A手机充值卡”,则通过预设的分词算法,服务器可得到该待分类信息中包含的各属性词为“运营商A”、“手机”、“充值卡”。假设服务器预先保存的“运营商A”属于虚拟商品类目的概率为0.6,“手机”属于虚拟商品类目的概率为0.3,“充值卡”属于虚拟商品类目的概率为0.9,则服务器可根据预先保存的这三个属性词属于虚拟商品类目的概率,确定待分类信息“运营商A手机充值卡”属于虚拟商品类目的概率。
具体的,服务器在根据预先保存的各属性词属于指定类目的概率,确定该待分类信息属于所述指定类目的概率时,具体可确定该待分类信息中包含的各属性词属于该指定类目的概率的乘积,作为该待分类信息属于该指定类目的概率。
继续沿用上例,服务器可确定“运营商A”、“手机”、“充值卡”这三个属性词属于虚拟商品类目的概率的乘积0.6×0.3×0.9=0.162,则该乘积0.162就是该待分类信息“运营商A手机充值卡”属于虚拟商品类目的概率。
S103:判断该待分类信息属于该指定类目的概率是否大于预设阈值,若是,则执行步骤S104,否则执行步骤S105。
S104:将该待分类信息分入该指定类目下。
S105:不将该待分类信息分入该指定类目下。
在本申请实施例中,该预设阈值可根据需要进行设定,当步骤S102确定的概率大于该预设阈值时,服务器则可将该待分类信息分入该指定类目下,否则,服务器可针对其他类目,采用同样的方法确定该待分类信息属于其他类目的概率,并判断是否将该待分类信息分入其他类目下。
继续沿用上例,假设预设阈值为0.1,则由于确定的待分类信息“运营商A手机充值卡”属于虚拟商品类目的概率0.162大于预设阈值0.1,因此,服务器将“运营商A手机充值卡”分入虚拟商品类目下。
而如果预设阈值为0.2,则由于确定的待分类信息“运营商A手机充值卡”属于虚拟商品类目的概率0.162不大于预设阈值0.2,因此,服务器不将“运营商A手机充值卡”分入虚拟商品类目下,假设除虚拟商品类目以外,还有实物商品类目,则服务器可针对实物商品类目,继续采用如图1所示的方法,确定“运营商A手机充值卡”属于实物商品类目的概率,并根据确定的概率判断是否将“运营商A手机充值卡”分入实物商品类目下。
通过上述方法,在对待分类信息进行分类时,根据该待分类信息中包含的各属性词属于指定类目的概率,确定该待分类信息属于该指定类目的概率,并据此判断是否将该待分类信息分入该指定类目下,该方法既不依赖于人工分类,也不依赖于该待分类信息的某一特定属性(如,当该待分类信息为商品信息时,仅依赖于发布该待分类信息的商家的店铺类型),因此可有效提高信息分类的准确性,从而可有效提高后续的信息处理的准确性。
考虑到在实际应用场景中,用户浏览过一个信息后,通常都会相应的产生一条历史记录(如,浏览记录等)保存在服务器中,而且很多用户也会对浏览过的信息进行评价,在其评价里往往会存在该信息实际所属的类目,即,实际类目,因此,在本申请实施例中,服务器预先保存各属性词属于指定类目的概率的方法具体可以为:服务器针对每个属性词,预先根据保存的历史记录,确定包含该属性词的历史记录的数量,作为第一数量,在包含该属性词的各历史记录中,确定实际类目为该指定类目的历史记录的数量,作为第二数量,将该第二数量与第一数量的商作为该属性词属于该指定类目的概率保存。
其中,服务器可根据保存的指定时间段内(如,过去半年内)的历史记录,确定该属性词属于指定类目的概率并保存。
另外,服务提供方也可人工的查看每条历史记录,并人工确定每条历史记录的实际类目,再通过服务器根据已确定实际类目的历史记录,确定各属性词属于指定类目的概率。
例如,假设在电子商务领域中,针对属性词“充值卡”,包含“充值卡”的交易记录(即,历史记录)共有10条,其中,已确定实际类目为虚拟商品类目的交易记录有9条,已确定实际类目为实物商品类目的交易记录有1条,则该属性词“充值卡”属于虚拟商品类目的概率为9÷10=0.9,属于实物商品类目的概率为1÷10=0.1。
考虑到在实际应用场景中,分类错误的信息毕竟是少数,因此,在本申请实施例中,也可根据各已分类信息确定各属性词属于指定类目的概率,这并不会对整体分类结果有过多的影响,也即,服务器预先保存各属性词属于指定类目的概率的方法还可以是:针对每个属性词,预先根据已分类信息,确定包含该属性词的已分类信息的数量,作为第三数量,在包含该属性词的已分类信息中,确定属于该指定类目的已分类信息的数量,作为第四数量,将该第四数量与第三数量的商作为该属性词属于该指定类目的概率保存。
例如,假设针对属性词“充值卡”,包含“充值卡”的已分类信息共有10条,其中,属于虚拟商品信息的已分类信息有9条,属于实物商品信息的已分类信息有1条,则该属性词“充值卡”属于虚拟商品类目的概率为9÷10=0.9,属于实物商品类目的概率为1÷10=0.1。
另外,当采用如图1所示的步骤S101~S102确定出一个待分类信息属于一个指定类目的概率后,也可不根据预设阈值判断是否将该待分类信息分入该指定类目下,还可以继续采用步骤S101~S102确定出该待分类信息属于其他每个类目的概率,并将该待分类信息分入确定的概率最大的类目下。
例如,假设待分类信息“运营商A手机充值卡”中包含的属性词“运营商A”、“手机”、“充值卡”属于虚拟商品类目的概率分别是0.6、0.3、0.9,属于实物商品类目的概率分别是0.4、0.7、0.1,则服务器可确定待分类信息“运营商A手机充值卡”属于虚拟商品类目的概率为0.6×0.3×0.9=0.162,属于实物商品类目的概率为0.4×0.7×0.1=0.028,从而,确定出的概率最大的类目为虚拟商品类目,因此服务器可将待分类信息“运营商A手机充值卡”分入虚拟商品类目下。
以上为本申请实施例提供的信息分类方法,基于同样的思路,本申请实施例还提供了一种信息分类装置,如图2所示。
图2为本申请实施例提供的信息分类装置结构示意图,具体包括:
分词模块201,用于对待分类信息进行分词,得到所述待分类信息中的各属性词;
确定模块202,用于根据预先保存的各属性词属于指定类目的概率,确定所述待分类信息属于所述指定类目的概率;
分类模块203,用于当所述待分类信息属于所述指定类目的概率大于预设阈值时,将所述待分类信息分入所述指定类目下。
所述待分类信息包括商品信息;
所述指定类目包括虚拟商品类目。
所述确定模块202具体用于,针对每个属性词,预先根据保存的历史记录,确定包含该属性词的历史记录的数量,作为第一数量,在包含该属性词的各历史记录中,确定实际类目为所述指定类目的历史记录的数量,作为第二数量,将所述第二数量与所述第一数量的商作为该属性词属于所述指定类目的概率保存。
所述确定模块202具体用于,针对每个属性词,预先根据已分类信息,确定包含该属性词的已分类信息的数量,作为第三数量,在包含该属性词的已分类信息中,确定属于所述指定类目的已分类信息的数量,作为第四数量,将所述第四数量与所述第三数量的商作为该属性词属于所述指定类目的概率保存。
所述确定模块202具体用于,确定各属性词属于所述指定类目的概率的乘积,作为所述待分类信息属于所述指定类目的概率。
具体的上述如图2所示的装置可以位于服务器中。
本申请实施例提供一种信息分类方法及装置,该方法对待分类信息进行分词,得到该待分类信息中的各属性词,再根据预先保存的各属性词属于指定类目的概率,确定该待分类信息属于该指定类目的概率,当确定的概率大于预设阈值时,将该待分类信息分入该指定类目下。上述方法可有效提高信息分类的准确性,从而提高后续信息处理的准确性。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flashRAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitorymedia),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
以上所述仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。

Claims (10)

1.一种信息分类方法,其特征在于,包括:
对待分类信息进行分词,得到所述待分类信息中的各属性词;
根据预先保存的各属性词属于指定类目的概率,确定所述待分类信息属于所述指定类目的概率;
当所述待分类信息属于所述指定类目的概率大于预设阈值时,将所述待分类信息分入所述指定类目下。
2.如权利要求1所述的方法,其特征在于,所述待分类信息包括商品信息;
所述指定类目包括虚拟商品类目。
3.如权利要求1所述的方法,其特征在于,预先保存各属性词属于指定类目的概率,具体包括:
针对每个属性词,预先根据保存的历史记录,确定包含该属性词的历史记录的数量,作为第一数量;
在包含该属性词的各历史记录中,确定实际类目为所述指定类目的历史记录的数量,作为第二数量;
将所述第二数量与所述第一数量的商作为该属性词属于所述指定类目的概率保存。
4.如权利要求1所述的方法,其特征在于,预先保存各属性词属于指定类目的概率,具体包括:
针对每个属性词,预先根据已分类信息,确定包含该属性词的已分类信息的数量,作为第三数量;
在包含该属性词的已分类信息中,确定属于所述指定类目的已分类信息的数量,作为第四数量;
将所述第四数量与所述第三数量的商作为该属性词属于所述指定类目的概率保存。
5.如权利要求1所述的方法,其特征在于,根据预先保存的各属性词属于指定类目的概率,确定所述待分类信息属于所述指定类目的概率,具体包括:
确定各属性词属于所述指定类目的概率的乘积,作为所述待分类信息属于所述指定类目的概率。
6.一种信息分类装置,其特征在于,包括:
分词模块,用于对待分类信息进行分词,得到所述待分类信息中的各属性词;
确定模块,用于根据预先保存的各属性词属于指定类目的概率,确定所述待分类信息属于所述指定类目的概率;
分类模块,用于当所述待分类信息属于所述指定类目的概率大于预设阈值时,将所述待分类信息分入所述指定类目下。
7.如权利要求6所述的装置,其特征在于,所述待分类信息包括商品信息;
所述指定类目包括虚拟商品类目。
8.如权利要求6所述的装置,其特征在于,所述确定模块具体用于,针对每个属性词,预先根据保存的历史记录,确定包含该属性词的历史记录的数量,作为第一数量,在包含该属性词的各历史记录中,确定实际类目为所述指定类目的历史记录的数量,作为第二数量,将所述第二数量与所述第一数量的商作为该属性词属于所述指定类目的概率保存。
9.如权利要求6所述的装置,其特征在于,所述确定模块具体用于,针对每个属性词,预先根据已分类信息,确定包含该属性词的已分类信息的数量,作为第三数量,在包含该属性词的已分类信息中,确定属于所述指定类目的已分类信息的数量,作为第四数量,将所述第四数量与所述第三数量的商作为该属性词属于所述指定类目的概率保存。
10.如权利要求6所述的装置,其特征在于,所述确定模块具体用于,确定各属性词属于所述指定类目的概率的乘积,作为所述待分类信息属于所述指定类目的概率。
CN201410670076.5A 2014-11-20 2014-11-20 一种信息分类方法及装置 Pending CN105677677A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410670076.5A CN105677677A (zh) 2014-11-20 2014-11-20 一种信息分类方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410670076.5A CN105677677A (zh) 2014-11-20 2014-11-20 一种信息分类方法及装置

Publications (1)

Publication Number Publication Date
CN105677677A true CN105677677A (zh) 2016-06-15

Family

ID=56957964

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410670076.5A Pending CN105677677A (zh) 2014-11-20 2014-11-20 一种信息分类方法及装置

Country Status (1)

Country Link
CN (1) CN105677677A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109146395A (zh) * 2018-06-29 2019-01-04 阿里巴巴集团控股有限公司 一种数据处理的方法、装置及设备
CN109543940A (zh) * 2018-10-12 2019-03-29 中国平安人寿保险股份有限公司 活动评估方法、装置、电子设备及存储介质
CN110941715A (zh) * 2019-10-23 2020-03-31 北京精英系统科技有限公司 一种实体对象分类判断的方法
CN111966515A (zh) * 2020-07-16 2020-11-20 招联消费金融有限公司 业务异常数据处理方法、装置、计算机设备和存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101833555A (zh) * 2009-03-12 2010-09-15 富士通株式会社 信息提取方法和装置
CN102141977A (zh) * 2010-02-01 2011-08-03 阿里巴巴集团控股有限公司 一种文本分类的方法及装置
US20120288207A1 (en) * 2010-02-02 2012-11-15 Alibaba Group Holding Limited Method and System for Text Classification
CN103646343A (zh) * 2013-12-18 2014-03-19 世纪禾光科技发展(北京)有限责任公司 一种基于文本的商品分类处理方法及其系统
CN103793385A (zh) * 2012-10-29 2014-05-14 深圳市世纪光速信息技术有限公司 一种文本特征提取方法和装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101833555A (zh) * 2009-03-12 2010-09-15 富士通株式会社 信息提取方法和装置
CN102141977A (zh) * 2010-02-01 2011-08-03 阿里巴巴集团控股有限公司 一种文本分类的方法及装置
US20120288207A1 (en) * 2010-02-02 2012-11-15 Alibaba Group Holding Limited Method and System for Text Classification
CN103793385A (zh) * 2012-10-29 2014-05-14 深圳市世纪光速信息技术有限公司 一种文本特征提取方法和装置
CN103646343A (zh) * 2013-12-18 2014-03-19 世纪禾光科技发展(北京)有限责任公司 一种基于文本的商品分类处理方法及其系统

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109146395A (zh) * 2018-06-29 2019-01-04 阿里巴巴集团控股有限公司 一种数据处理的方法、装置及设备
CN109146395B (zh) * 2018-06-29 2022-04-05 创新先进技术有限公司 一种数据处理的方法、装置及设备
CN109543940A (zh) * 2018-10-12 2019-03-29 中国平安人寿保险股份有限公司 活动评估方法、装置、电子设备及存储介质
CN109543940B (zh) * 2018-10-12 2024-04-09 中国平安人寿保险股份有限公司 活动评估方法、装置、电子设备及存储介质
CN110941715A (zh) * 2019-10-23 2020-03-31 北京精英系统科技有限公司 一种实体对象分类判断的方法
CN111966515A (zh) * 2020-07-16 2020-11-20 招联消费金融有限公司 业务异常数据处理方法、装置、计算机设备和存储介质

Similar Documents

Publication Publication Date Title
CN109447469A (zh) 一种文本检测方法、装置及设备
CN109002443B (zh) 一种文本信息的分类方法及装置
CN104835134B (zh) 一种计算商品图像牛皮癣分值的方法和装置
CN110781971B (zh) 一种商户类型识别方法、装置、设备和可读介质
CN103049562B (zh) 一种识别相似网页的方法及装置
US10496999B2 (en) Method and apparatus of controlling network payment
CN105335409A (zh) 一种目标用户的确定方法、设备和网络服务器
CN104731816A (zh) 一种处理异常业务数据的方法和装置
CN105740667A (zh) 一种基于用户行为的信息识别方法及装置
CN106485566A (zh) 一种信息推荐方法及装置
CN109344406A (zh) 词性标注方法、装置和电子设备
CN107066519A (zh) 一种任务检测方法及装置
CN105677677A (zh) 一种信息分类方法及装置
CN112672184A (zh) 一种视频审核及发布方法
CN106325826A (zh) 检测配置文件方法及装置
CN106899426A (zh) 用户访问数量统计方法及其系统
CN106991090A (zh) 舆情事件实体的分析方法及装置
CN110390182A (zh) 一种确定小程序类目的方法、系统及设备
CN110689211A (zh) 网站服务能力的评估方法及装置
CN104102662A (zh) 一种用户兴趣偏好相似度确定方法及装置
CN111125088B (zh) 多层级数据处理方法和装置
CN105787004A (zh) 一种文本分类方法及装置
CN106649374B (zh) 导航标签排序的方法及装置
CN104572904A (zh) 一种标签关联程度的确定方法及装置
CN107133163A (zh) 一种验证描述类api的方法与设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20160615