CN103605815B - 一种适用于b2b电子商务平台的商品信息自动分类推荐方法 - Google Patents

一种适用于b2b电子商务平台的商品信息自动分类推荐方法 Download PDF

Info

Publication number
CN103605815B
CN103605815B CN201310674950.8A CN201310674950A CN103605815B CN 103605815 B CN103605815 B CN 103605815B CN 201310674950 A CN201310674950 A CN 201310674950A CN 103605815 B CN103605815 B CN 103605815B
Authority
CN
China
Prior art keywords
commodity
classification
string
word
feature words
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201310674950.8A
Other languages
English (en)
Other versions
CN103605815A (zh
Inventor
薛春香
王美瑄
邹苇
李莉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing University of Science and Technology
Focus Technology Co Ltd
Original Assignee
Nanjing University of Science and Technology
Focus Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing University of Science and Technology, Focus Technology Co Ltd filed Critical Nanjing University of Science and Technology
Priority to CN201310674950.8A priority Critical patent/CN103605815B/zh
Publication of CN103605815A publication Critical patent/CN103605815A/zh
Application granted granted Critical
Publication of CN103605815B publication Critical patent/CN103605815B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/353Clustering; Classification into predefined classes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising

Abstract

本发明公开了一种适用于B2B电子商务平台的商品信息自动分类推荐方法,用于辅助B2B电子商务平台卖家发布准确的商品分类信息。该方法为:获取电子商务平台商品信息数据库中已处理的商品信息形成商品分类知识库;抽取卖家新提交商品的标题和描述信息并进行表征;将表征结果与商品分类知识库中的信息进行相似度计算;将最相关的分类结果推荐给该新商品。本发明提出一种基于已有商品分类实例构建分类知识库来实现商品自动分类的方法,充分利用已有商品分类信息,采用实例匹配算法快速准确地实现商品分类,为B2B电子商务平台卖家提交商品时推荐分类,降低卖家提交商品信息时的分类负担。

Description

一种适用于B2B电子商务平台的商品信息自动分类推荐方法
技术领域
本发明涉及数据处理领域,特别涉及一种数据分类的方法。
背景技术
商品分类目录是电子商务平台组织、管理和展示商品信息的一种主要方式。在B2B电子商务平台,为了生成商品目录,需要卖家在提交商品信息时为其商品从网站已有的商品分类表中选择一个或多个分类目录。由于卖家对网站的分类目录整体设置并不熟悉,往往难以准确地为所提交的商品选择分类。因此,从服务卖家、提高分类精度的角度出发,电子商务平台应该提供一个自动推荐商品分类目录的功能。
目前B2B电子商务平台商品信息往往先由卖家根据模板进行提交,再由B2B电子中介服务商的信息编辑人员进行审核校正。由于商品分类目录体系庞杂,无论是对卖家还是电子商务平台信息编辑人员而言,对商品进行分类都是一件有难度的工作。因此,高效精准的商品自动分类方法对电子商务平台商品信息管理至关重要。
发明内容
针对当前B2B电子商务平台卖家提交商品分类信息时存在的问题和困难,本发明提供了一种适用于B2B电子商务平台的商品信息自动分类推荐方法。通过对B2B电子商务平台中已有的商品分类信息进行处理,生成商品分类知识库,将卖家新提交的商品标题和描述信息进行抽取和表征,将表征结果与商品分类知识库中的记录进行相似度计算,找出最相似的记录,将其对应的分类信息推荐给卖家。本发明通过利用已有商品分类信息来实现新提交商品的自动分类,降低卖家提交商品信息时的分类负担,提高商品分类的准确性。
本发明提供一种适用于B2B电子商务平台的商品信息自动分类推荐方法,具体包括:
收集B2B电子商务平台上已处理的商品信息,基于已分类商品信息(分类实例)构建商品分类知识库;
对卖家新提交的商品标题和描述信息进行分词、抽词、频次统计和位置加权,形成商品特征词串;
将新提交商品的特征词串与分类知识库中每一条记录中的类目特征词串进行相似度计算,将相似度最高的记录中的分类代码推荐给新提交的商品。
优选地,基于已处理的商品信息构建商品分类知识库,包括:
收集B2B电子商务平台中已处理过的商品数据,形成初始的商品实例数据库,该数据库中每一条记录应包括基本的商品编号、商品标题、商品描述信息、商品分类代码;
对商品实例数据库中存在的一个商品对应多个分类代码的情况进行处理,对应几个分类代码就拆分成几条记录,使每一条记录中每个商品只对应一个分类代码;
对商品实例数据库中的商品标题和描述信息进行分词、抽词、频次统计和位置加权处理,形成类目特征词串;
采用支持度、置信度来衡量类目特征词串与分类代码之间的对应关系;
将支持度、置信度达到一定阈值的记录保留,生成商品分类知识库。
附图说明
包含在本文中并成为本说明书一部分的附图以及说明,示出了本发明,并进一步用于解释本发明的原理并使相关领域技术人员能够进行和使用本发明。
图1示出根据本发明实施例的B2B电子商务平台商品信息自动分类推荐方法的流程图。
图2示出根据本发明实施例的商品分类知识库的构建流程图。
具体实施方式
为使本发明的实施例的目的、技术方案和优点更加清楚,下面结合附图和具体实施方式对本发明做进一步阐述。
本实施例的适用于B2B电子商务平台的商品信息自动分类推荐方法,基于已分类商品信息进行采集,获取商品标题、描述信息和对应分类代码,形成包含商品编号、商品标题、描述信息、分类代码的商品分类实例库;如果某一商品对应多个分类代码,则将其拆分成多条分类实例;对商品实例中的商品信息标题和描述信息进行分词、抽词、频次统计和位置加权,形成基于关键词串的特征表示,提炼商品名和其他相关特征作为类目特征词串;统计整个实例库中类目出现频次、特征词串频次、类目-词串同现频次;采用数据挖掘中关联规则建立的度量方法,使用支持度和置信度来删除不准确的类目-词串对应关系,衡量类目与类目特征词串之间的关联程度;
支持度
所谓支持度表示类目和特征词串在整个商品数据库中同时出现的频度,即共现频次。共现频次越大,表示该类目与特征词串之间的对应关系越成立。
置信度
置信度揭示了当特征词串出现时,对应类目出现的概率。置信度越大表示该类目和特征词串的同现概率越大。在本实施例中将支持度和置信度达到特定阈值的记录保留,生成商品分类知识库。
抽取卖家新提交商品的标题和描述信息;将新提交的商品信息进行商品特征表示,并将其与分类知识库中每一条记录中的类目特征词串进行相似度计算;
将新商品的特征词串(T)与分类知识库中每条记录中的类目特征词串(S)进行相似度计算。相似度计算的公式如下:
S i m ( T , S ) = α × ( M a t c h ( T , S ) N u m ( T ) + M a t c h ( T , S ) N u m ( S ) ) / 2 + β × γ × ( Σ M a t c h ( T i ) Σ 1 m i + Σ M a t c h ( S j ) Σ 1 n j ) / 2
式中,T,S分别表示新商品的特征词串和分类知识库中的每条记录中的类目特征词串
α:两词串中含有相同单词的个数对语义相似度的影响权重,在此系统中设为0.6;
β:相同元素在词串中的位置关系影响权重,在此系统中是设为0.4;
γ:位置系数,γ=Min(Num(T)/Num(S),Num(S)/Num(T));
Match(T,S):表示两个词串中含有相同单词的个数;
Num(T)、Num(S):分别表示词串T,S中所含单词总数;
分别表示相同单词在T、S中各自频次、位置加权之和。
将匹配到的相似度最大的记录所对应的分类信息推荐给该新商品。
图1示出根据本发明实施例的B2B电子商务平台商品信息自动分类推荐方法的流程图。
步骤101,采集B2B电子商务平台中已分类的商品信息,通过一系列处理后,生成一个基于实例的商品分类知识库。
图2示出根据本发明实施例的商品分类知识库构建流程图
具体地,步骤201,以B2B电子商务平台确定的分类目录为框架,采集电子商务平台中已有的商品分类数据,主要包括商品编号、商品标题、商品描述信息、商品分类代码。
步骤202,对采集来的商品分类数据进行预处理,具体为:
首先,数据筛选,保证每条数据至少包含商品标题、商品分类代码两项内容,尽可能包含较详细的商品描述信息。
其次,对于出现一条商品信息包含多个商品分类代码的情况,以拆分的方式,将其拆分成多条分类实例数据,保证一条数据中只包含一个分类代码,形成初始分类实例库。
步骤203,对初始分类实例库中的每条数据进行处理,以通用的分词软件对标题和商品描述信息进行分词、词频统计。考虑到商品标题中往往蕴含重要的品名信息,因此采用权重方案,对出现在标题中的词汇进行频次加权。优选地,构建一个基本的商品品名表,用来对商品标题和描述信息进行抽词,以便更准确地抽取商品品名。
例如,一条分类实例如下:
经过上述分词、位置加权、频次统计后,形成类目“2626000000拉杆箱和行李箱”一个特征词串“拉杆包【6】拉杆【2】滑轮【2】出行【2】旅游【2】耐用材料【1】拉链【1】功能区【1】物品【1】”,以记录形式表示如下:
优选地,根据频度统计结果,将类目特征词串中的低频词过滤,如上例可生成如下记录:
优选地,也可依据DF/IDF、信息增益等方案来重新计算各分词的频度值,将频度值超过一定阈值的分词保留,其余过滤掉。
对所有分类实例均采用上述方法处理,生成如下的数据表:
步骤204,基于支持度、置信度的兴趣度过滤来衡量类目和类目特征词串的关联程度。
首先,对整个分类实例库中类目和类目特征词串同现的记录进行合并、同现频次,并依赖平均数对类别特征词串中的每个分词重新计算频度,
之后,依据支持度、置信度公式,统计整个分类实例库中分类代码和类目特征词串的支持度和置信度,结果如下:
之后,对支持度、置信度达到设定某一阈值的记录进行保留,低于阈值的记录进行过滤。
步骤205,将过滤后的结果按照分类代码序化生成分类知识库,主要包括分类代码和类目特征词串两个字段;同时,将所有类别特征词串中的分词进行收集、去重,形成一个商品信息分词词表用于对新商品的分词、抽词处理。
分类知识库构建完成后,当有新提交的商品,通过对卖家提供的商品标题和描述信息处理,形成商品特征词串,将商品特征词串与分类知识库中所有记录中的类别特征词串计算相似度来找对最合适的分类代码。
具体地,步骤102,对新提交待分类商品的标题和描述信息进行分词。优选地,将分类知识库中形成的分词词典添加进来用来进行抽词,提高分词的准确性;
之后,对新商品信息的分词结果进行频次统计、位置加权,建立新商品信息的描述特征词串。例如,某新商品的特征词串如下
步骤103,依据相似度计算公式,将新商品的特征词串与商品分类知识库中每一条记录的类目特征词串进行相似度计算。优选地,可以加入同义词表,进行语义相似度计算。
步骤104,将相似度最大的记录的分类代码推荐给新商品。优选地,当相似度最大值有多条记录时,可以采用投票机制将相似度最大的记录集中同一类目出现次数最多的类目信息进行推荐。优选地,考虑一个商品可能出现在多个分类目录下,可以推荐多个分类。
随着B2B电子商务平台的运行,分类处理过的商品信息越来越多,分类知识库经过不断更新将越来越完善,分类精度也将随之提高。
采用上述方法,能够充分利用B2B电子商务平台中已经经过网站编辑人员审核校正的商品分类信息,且随着平台中商品分类数据越来越多,分类知识库将不断优化;基于实例进行相似度计算来匹配最相关的商品分类类目,算法复杂度低;通过自动分类为B2B电子商务平台卖家推荐商品分类信息能降低其提交商品信息时的负担,通过自动分类推荐分类目录也能降低网站编辑人员的工作负担。
以上所公开的仅为本发明的一种具体实施例而已,当然不能以此来限定本发明的保护范围,依照本发明权利要求的技术实质所做的改变或等同变化,仍落入本发明所涵盖的范围。

Claims (2)

1.一种适用于B2B电子商务平台的商品信息自动分类推荐方法,通过对B2B电子商务平台中已有的商品分类信息进行处理,生成商品分类知识库,将卖家新提交的商品标题和描述信息进行抽取和表征,将表征结果与商品分类知识库中的记录进行相似度计算,找出最相似的记录,将其对应的分类信息推荐给卖家;其特征在于,具体步骤包括:
步骤一、收集B2B电子商务平台中已处理过的商品数据,形成初始的商品实例数据库,该数据库中每一条记录应包括基本的商品编号、商品标题、商品描述信息、商品分类代码;
步骤二、对商品实例数据库中存在的一个商品对应多个分类代码的情况进行处理,对应几个分类代码就拆分成几条记录,使每一条记录中每个商品只对应一个分类代码;
步骤三、对商品实例数据库中的商品标题和描述信息进行分词、抽词、频次统计和位置加权处理,形成类目特征词串;
步骤四、采用支持度、置信度来衡量类目特征词串与分类代码之间的对应关系;
步骤五、将支持度、置信度达到一定阈值的记录保留,生成商品分类知识库;
对初始的商品实例数据库中的每条数据进行处理,以通用的分词软件对标题和商品描述信息进行分词、词频统计,构建一个基本的商品品名表,用来对商品标题和描述信息进行抽词,以便更准确地抽取商品品名;将过滤后的结果按照分类代码序化生成分类知识库,包括分类代码和类目特征词串两个字段;同时,将所有类别特征词串中的分词进行收集、去重,形成一个商品信息分词词表用于对新商品的分词、抽词处理;分类知识库构建完成后,当有新提交的商品,通过对卖家提供的商品标题和描述信息处理,形成商品特征词串,将商品特征词串与分类知识库中所有记录中的类别特征词串计算相似度来找对最合适的分类代码;
依据相似度计算公式,将新商品的特征词串与商品分类知识库中每一条记录的类目特征词串进行相似度计算和语义相似度计算;当相似度最大值有多条记录时,将相似度最大的记录集中同一类目出现次数最多的类目信息进行推荐,或者推荐多个分类;
相似度计算的公式如下:
S i m ( T , S ) = α × ( M a t c h ( T , S ) N u m ( T ) + M a t c h ( T , S ) N u m ( S ) ) / 2 + β × γ × ( Σ M a t c h ( T i ) Σ 1 m i + Σ M a t c h ( S j ) Σ 1 m j ) / 2
式中,T,S分别表示新商品的特征词串和分类知识库中的每条记录中的类目特征词串
α:两词串中含有相同单词的个数对语义相似度的影响权重,在B2B电子商务平台系统中设为0.6;
β:相同元素在词串中的位置关系影响权重,在B2B电子商务平台系统中是设为0.4;
γ:位置系数,γ=Min(Num(T)/Num(S),Num(S)/Num(T));
Match(T,S):表示两个词串中含有相同单词的个数;
Num(T)、Num(S):分别表示词串T,S中所含单词总数;
分别表示相同单词在T、S中各自频次、位置加权之和。
2.一种适用于B2B电子商务平台的商品信息自动分类推荐方法,其特征在于,包括:
基于已分类商品信息构建商品分类知识库;包括:
对已分类商品信息进行采集,获取商品标题、描述信息和对应分类代码,形成包含商品编号、商品标题、描述信息、分类代码的商品分类实例库;
如果某一商品对应多个分类代码,则将其拆分成多条分类实例;
对商品实例中的商品标题和描述进行分词、抽词、频次统计和位置加权,提炼商品名和其他相关特征作为类目特征词串;
统计整个实例库中类目出现频次、特征词串频次、类目-词串同现频次;
采用数据挖掘中关联规则建立的度量方法,使用支持度和置信度来删除不准确的类目-词串对应关系,衡量类目与类目特征词串之间的关联程度;
支持度表示类目和特征词串在整个商品数据库中同时出现的频度,即共现频次;共现频次越大,表示该类目与特征词串之间的对应关系越成立;
置信度揭示当特征词串出现时,对应类目出现的概率;置信度越大表示该类目和特征词串的同现概率越大;
将支持度和置信度达到特定阈值的记录保留,生成商品分类知识库;
抽取卖家新提交商品的标题和描述信息;
对新提交商品信息标题和描述信息进行分词、抽词、频次统计、加权,形成基于关键词串的特征表示;
将新提交商品特征词串与商品分类知识库中的分类实例通过相似度计算进行实例匹配;将新提交的商品信息进行商品特征表示,并将其与分类知识库中每一条记录中的类目特征词串进行相似度计算;
将最相似的实例所对应的分类信息推荐给用户;
支持度
置信度
将新商品的特征词串(T)与分类知识库中每条记录中的类目特征词串(S)进行相似度计算,相似度计算的公式如下:
S i m ( T , S ) = α × ( M a t c h ( T , S ) N u m ( T ) + M a t c h ( T , S ) N u m ( S ) ) / 2 + β × γ × ( Σ M a t c h ( T i ) Σ 1 m i + Σ M a t c h ( S j ) Σ 1 m j ) / 2
式中,T,S分别表示新商品的特征词串和分类知识库中的每条记录中的类目特征词串;
α:两词串中含有相同单词的个数对语义相似度的影响权重,在B2B电子商务平台系统中设为0.6;
β:相同元素在词串中的位置关系影响权重,在B2B电子商务平台系统中是设为0.4;
γ:位置系数,γ=Min(Num(T)/Num(S),Num(S)/Num(T));
Match(T,S):表示两个词串中含有相同单词的个数;
Num(T)、Num(S):分别表示词串T,S中所含单词总数;
分别表示相同单词在T、S中各自频次、位置加权之和;
将匹配到的相似度最大的记录所对应的分类信息推荐给该新商品。
CN201310674950.8A 2013-12-11 2013-12-11 一种适用于b2b电子商务平台的商品信息自动分类推荐方法 Expired - Fee Related CN103605815B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310674950.8A CN103605815B (zh) 2013-12-11 2013-12-11 一种适用于b2b电子商务平台的商品信息自动分类推荐方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310674950.8A CN103605815B (zh) 2013-12-11 2013-12-11 一种适用于b2b电子商务平台的商品信息自动分类推荐方法

Publications (2)

Publication Number Publication Date
CN103605815A CN103605815A (zh) 2014-02-26
CN103605815B true CN103605815B (zh) 2016-08-31

Family

ID=50124037

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310674950.8A Expired - Fee Related CN103605815B (zh) 2013-12-11 2013-12-11 一种适用于b2b电子商务平台的商品信息自动分类推荐方法

Country Status (1)

Country Link
CN (1) CN103605815B (zh)

Families Citing this family (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105279155B (zh) * 2014-05-28 2019-06-25 腾讯科技(深圳)有限公司 一种访问对象的数据处理方法及装置
CN105630827B (zh) * 2014-11-05 2019-04-02 阿里巴巴集团控股有限公司 一种信息处理方法、系统及辅助系统
CN106296208B (zh) * 2015-06-05 2021-09-14 创新先进技术有限公司 一种商品分类方法及装置
CN104915440B (zh) * 2015-06-26 2018-12-11 苏宁易购集团股份有限公司 一种商品排重方法和系统
CN105045872A (zh) * 2015-07-16 2015-11-11 北京京东尚科信息技术有限公司 信息的筛选方法及装置
CN105117426B (zh) * 2015-07-31 2019-04-16 重庆龙工场跨境电子商务投资有限公司 一种海关编码智能搜索方法
CN105069086B (zh) * 2015-07-31 2017-07-11 焦点科技股份有限公司 一种优化电子商务商品搜索的方法及系统
CN106445974B (zh) * 2015-08-12 2021-01-26 腾讯科技(深圳)有限公司 数据推荐方法及装置
CN105320778B (zh) * 2015-11-25 2019-04-02 焦点科技股份有限公司 一种适用于电子商务中文网站商品标签化的方法
CN105701170A (zh) * 2015-12-31 2016-06-22 广州东海网络科技有限公司 分类信息调整方法及分类信息调整装置
CN105701631B (zh) * 2016-01-06 2019-12-31 北京京东尚科信息技术有限公司 一种商品入库方法和仓库管理系统
CN106997340B (zh) * 2016-01-25 2020-07-31 阿里巴巴集团控股有限公司 词库的生成以及利用词库的文档分类方法及装置
CN107203548A (zh) * 2016-03-17 2017-09-26 阿里巴巴集团控股有限公司 属性获取方法和装置
CN106095759B (zh) * 2016-06-20 2019-05-24 西安交通大学 一种基于启发式规则的发票货物归类方法
CN106096042A (zh) * 2016-06-28 2016-11-09 乐视控股(北京)有限公司 数据信息分类方法及系统
CN107730336A (zh) * 2016-08-12 2018-02-23 苏宁云商集团股份有限公司 一种在线交易中的商品推送方法及装置
CN108241677A (zh) * 2016-12-26 2018-07-03 航天信息股份有限公司 一种获得商品的税收分类编码的方法及系统
CN107016116A (zh) * 2017-04-18 2017-08-04 赖灿 一种通过引用特定知识进行商品生产的方法
CN110019798B (zh) * 2017-11-20 2021-02-05 航天信息股份有限公司 一种用于对进销项商品种类差异进行度量的方法及系统
CN108491873B (zh) * 2018-03-19 2019-05-14 广州蓝深科技有限公司 一种基于数据分析的商品分类方法
CN108595418A (zh) * 2018-04-03 2018-09-28 上海透云物联网科技有限公司 一种商品分类方法及系统
CN110766486A (zh) * 2018-07-09 2020-02-07 北京京东尚科信息技术有限公司 确定物品类目的方法和装置
CN108665358A (zh) * 2018-08-03 2018-10-16 北京引领海逛科技有限公司 产品信息快速匹配多个平台的方法和装置
CN110889769B (zh) * 2018-08-21 2022-09-20 湖南共睹互联网科技有限责任公司 交易保障关联方法、计算机装置及计算机可读存储介质
CN110189188A (zh) * 2019-04-15 2019-08-30 深圳平安综合金融服务有限公司 商品管理方法、装置、计算机设备及存储介质
CN110189187A (zh) * 2019-04-15 2019-08-30 深圳平安综合金融服务有限公司 商品管理方法、装置、计算机设备及存储介质
CN111563168B (zh) * 2020-03-03 2022-12-13 天津蒙比利埃创新网络科技有限公司 一种基于ai知识图谱算法用于通关商品智能归类的方法
CN113657951A (zh) * 2020-05-12 2021-11-16 阿里巴巴集团控股有限公司 商品推荐方法及装置、商品发布处理方法及装置
CN111915391A (zh) * 2020-06-16 2020-11-10 北京迈格威科技有限公司 商品数据的处理方法、装置及电子设备
CN112232906A (zh) * 2020-09-29 2021-01-15 平潭综合实验区澄心贸易有限公司 一种用于直播销售的商品推荐系统及其工作方法
CN112837076A (zh) * 2021-02-24 2021-05-25 上海悦易网络信息技术有限公司 一种商品订单自动生成的方法、系统及设备
CN113159881B (zh) * 2021-03-15 2022-08-12 杭州云搜网络技术有限公司 一种数据聚类及b2b平台客户偏好获取方法、系统
CN113570427A (zh) * 2021-07-22 2021-10-29 上海普洛斯普新数字科技有限公司 一种提取识别线上或系统商品特征信息的系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102929937A (zh) * 2012-09-28 2013-02-13 福州博远无线网络科技有限公司 基于文本主题模型的商品分类的数据处理方法
CN103294798A (zh) * 2013-05-27 2013-09-11 北京尚友通达信息技术有限公司 基于二元切词和支持向量机的商品自动分类方法
CN102193936B (zh) * 2010-03-09 2013-09-18 阿里巴巴集团控股有限公司 一种数据分类的方法及装置
CN102207961B (zh) * 2011-05-25 2013-10-23 盛乐信息技术(上海)有限公司 一种网页自动分类方法及装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102193936B (zh) * 2010-03-09 2013-09-18 阿里巴巴集团控股有限公司 一种数据分类的方法及装置
CN102207961B (zh) * 2011-05-25 2013-10-23 盛乐信息技术(上海)有限公司 一种网页自动分类方法及装置
CN102929937A (zh) * 2012-09-28 2013-02-13 福州博远无线网络科技有限公司 基于文本主题模型的商品分类的数据处理方法
CN103294798A (zh) * 2013-05-27 2013-09-11 北京尚友通达信息技术有限公司 基于二元切词和支持向量机的商品自动分类方法

Also Published As

Publication number Publication date
CN103605815A (zh) 2014-02-26

Similar Documents

Publication Publication Date Title
CN103605815B (zh) 一种适用于b2b电子商务平台的商品信息自动分类推荐方法
US10176427B2 (en) System and/or method for generating clean records from imperfect data using model stack(s) including classification model(s) and confidence model(s)
CN103631859B (zh) 一种面向科技项目的评审专家智能推荐方法
EP1736901B1 (en) Method for classifying sub-trees in semi-structured documents
CN103914478B (zh) 网页训练方法及系统、网页预测方法及系统
KR101681109B1 (ko) 대표 색인어와 유사도를 이용한 문서 자동 분류 방법
CN106600372A (zh) 一种基于用户行为的商品推荐方法及系统
KR101134701B1 (ko) 상품평 극성 분류를 위한 특징별 서술어 긍정 및 부정 사전 자동 구축 시스템 및 방법
KR20200048004A (ko) 사용자 구매 기준 및 상품 리뷰 기반 상품 추천 시스템 및 방법
Watrianthos Sentiment analysis of traveloka app using naïve bayes classifier method
TWI645346B (zh) 商品碼分析系統及商品碼分析程式
CN108199951A (zh) 一种基于多算法融合模型的垃圾邮件过滤方法
CN103646343A (zh) 一种基于文本的商品分类处理方法及其系统
CN106844632A (zh) 基于改进支持向量机的产品评论情感分类方法及装置
CN106294466A (zh) 分类模型构建方法、分类模型构建设备和分类方法
CN102156747B (zh) 一种引入社会化标签的协作过滤评分预测方法及装置
CN106780273A (zh) 旅客航班需求分析方法和系统
CN107194617A (zh) 一种app软件工程师软技能分类系统及方法
CN110569273A (zh) 一种基于相关性排序的专利检索系统及方法
Udayakumar et al. Demographics analysis of twitter users who tweeted on psychological articles and tweets analysis
CN109710725A (zh) 一种基于文本分类的中文表格列标签恢复方法和系统
US7356461B1 (en) Text categorization method and apparatus
EP3800560A1 (en) Semantic matching system and method
KR101753768B1 (ko) 가중치에 의한 다수 분야별 검색 기능을 구비한 지식관리 시스템
CN106055614A (zh) 基于多个语义摘要的内容相似性分析方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20160831

CF01 Termination of patent right due to non-payment of annual fee