CN105354194A - 商品智能归类方法和系统 - Google Patents

商品智能归类方法和系统 Download PDF

Info

Publication number
CN105354194A
CN105354194A CN201410409080.6A CN201410409080A CN105354194A CN 105354194 A CN105354194 A CN 105354194A CN 201410409080 A CN201410409080 A CN 201410409080A CN 105354194 A CN105354194 A CN 105354194A
Authority
CN
China
Prior art keywords
commodity
participle
dictionary
classification
sorted out
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201410409080.6A
Other languages
English (en)
Inventor
毛嘉元
耿亚东
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Zhongyitong Information Technology Co Ltd
Original Assignee
Shanghai Zhongyitong Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Zhongyitong Information Technology Co Ltd filed Critical Shanghai Zhongyitong Information Technology Co Ltd
Priority to CN201410409080.6A priority Critical patent/CN105354194A/zh
Publication of CN105354194A publication Critical patent/CN105354194A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种商品智能归类方法和系统,可以让众多归类信息无缝融合在一起,并以最简单的搜索方式快速呈现给用户归类的建议结果。其技术方案为:接收商品描述的输入;基于分词字典对商品关键字进行分词,将短语切分到符合商品归类因素的词上;根据商品分词结果对商品数据进行匹配;基于匹配结果,根据显示规则展示商品归类建议数据。

Description

商品智能归类方法和系统
技术领域
本发明涉及归类方法和系统,尤其涉及对商品归类的智能化归类方法和系统。
背景技术
对于国外代购的普通老百姓、跨境电商、加工贸易企业,对商品需要有一个相对准确的归类。所谓商品归类,是指在《商品名称及编码协调公约》商品分类目录体系下,以《中华人民共和国进出口税则》为基础,按照《进口税则商品及品目注释》、《中华人民共和国进出口税则本国子目注释》以及海关总署发布的关于商品归类的行政裁定、商品归类决定的要求,确定进出口货物商品编码及个人行邮编码的活动。
而在这些浩瀚的商品归类信息海洋中,通常查询商品归类迷失方向,普通老百姓连商品归类的定义都无法理解,用户不能准确迅速地找到所需要的信息。而且由于影响商品归类的基础数据因素太多,参考税则文献每年发生变化,更增加了对商品进行准确归类的难度。
发明内容
以下给出一个或多个方面的简要概述以提供对这些方面的基本理解。此概述不是所有构想到的方面的详尽综览,并且既非旨在指认出所有方面的关键性或决定性要素亦非试图界定任何或所有方面的范围。其唯一的目的是要以简化形式给出一个或多个方面的一些概念以为稍后给出的更加详细的描述之序。
本发明的目的在于解决上述问题,提供了一种商品智能归类方法和系统,可以让众多归类信息无缝融合在一起,并以最简单的搜索方式快速呈现给用户归类的建议结果。
本发明的技术方案为:本发明揭示了一种商品智能归类方法,包括:
接收商品描述的输入;
基于分词字典对商品关键字进行分词,将短语切分到符合商品归类因素的词上;
根据商品分词结果对商品数据进行匹配;
基于匹配结果,根据显示规则展示商品归类建议数据。
根据本发明的商品智能归类方法的一实施例,分词字典来源于商品归类字典,其中分词字典包含商品中文名称分词、商品成分分词、商品工艺分词、商品用途分词、以及商品功能分词;商品归类字典是依据《进口税则商品及品目注释》、《中华人民共和国进出口税则本国子目注释》以及海关总署发布的关于商品归类的行政裁定、多年来用户的在线搜索及在线客服咨询商品归类问题的来源,人工录入/调整、建立/补充商品归类字典,其中商品归类字典将影响归类因素做了分类,其中包含了商品中文名称、商品成分描述、商品工艺描述、商品用途描述、商品功能描述及其他描述、货物商品编码、个人行邮编码等,根据归类的特性对其进行了匹配权重设置。
根据本发明的商品智能归类方法的一实施例,在分词过程中,依据分词在商品归类字典中权重分值统计每个分词总得分结果,其中依据用户输入中文习惯特性,若某分词在短语中是最后且最长分词则该分词权重得分后再乘上某个倍数。
根据本发明的商品智能归类方法的一实施例,该方法还包括:
当商品分词结果在商品归类字典中无匹配项时进行模糊匹配,模糊匹配的原则是短句之间以空格切分作为查询条件且合并条件进行商品归类数据的获取,若模糊匹配成功则进行展示,否则进行人工归类的提交并基于人工归类的结果调整商品归类字典和分词字典。
根据本发明的商品智能归类方法的一实施例,分词字典和商品归类字典是自定义的。
本发明还揭示了一种商品智能归类系统,包括:
接收装置,接收商品描述的输入;
存储装置,存储分词字典和商品归类字典;
分词装置,连接接收装置和存储装置,基于分词字典对商品关键字进行分词,将短语切分到符合商品归类因素的词上;
匹配装置,连接分词装置和存储装置,根据商品分词结果对商品数据进行匹配;
展示装置,连接匹配装置,基于匹配结果,根据显示规则展示商品归类建议数据。
根据本发明的商品智能归类系统的一实施例,分词字典来源于商品归类字典,其中分词字典包含商品中文名称分词、商品成分分词、商品工艺分词、商品用途分词、以及商品功能分词;商品归类字典是依据《进口税则商品及品目注释》、《中华人民共和国进出口税则本国子目注释》以及海关总署发布的关于商品归类的行政裁定、多年来用户的在线搜索及在线客服咨询商品归类问题的来源,人工录入/调整、建立/补充商品归类字典,其中商品归类字典将影响归类因素做了分类,其中包含了商品中文名称、商品成分描述、商品工艺描述、商品用途描述、商品功能描述及其他描述、货物商品编码、个人行邮编码等,根据归类的特性对其进行了匹配权重设置。
根据本发明的商品智能归类系统的一实施例,在分词装置中,依据分词在商品归类字典中权重分值统计每个分词总得分结果,其中依据用户输入中文习惯特性,若某分词在短语中是最后且最长分词则该分词权重得分后再乘上某个倍数。
根据本发明的商品智能归类系统的一实施例,该匹配装置中还包括模糊匹配模块,所述系统还包括人工归类装置和人工调整装置,其中:
所述模糊匹配模块,当商品分词结果在商品归类字典中无匹配项时进行模糊匹配,模糊匹配的原则是短句之间以空格切分作为查询条件且合并条件进行商品归类数据的获取,若模糊匹配成功则进行通过展示装置进行展示,否则提交到人工归类装置进行人工归类,并通过人工调整装置基于人工归类的结果调整存储装置中的商品归类字典和分词字典。
根据本发明的商品智能归类系统的一实施例,存储装置中的分词字典和商品归类字典是自定义的。
本发明对比现有技术有如下的有益效果:本发明通过自建商品归类字典、自建分词字典,基于这些字典对商品描述的输入进行分词、匹配,基于匹配结果进行展示。相较于传统技术而言,本发明使得众多杂乱繁复的归类信息无缝融合起来,再经过准确的分词和匹配,从而定位到符合的归类之下,并通过最简单的搜索界面和用户互动,将结果快速呈现给用户。
附图说明
图1示出了本发明的商品智能归类方法的一实施例的流程图。
图2示出了本发明的商品智能归类方法的另一实施例的流程图。
图3示出了本发明的商品智能归类方法的另一实施例的流程图。
图4示出了本发明的商品智能归类系统的一实施例的原理图。
图5示出了本发明的商品智能归类系统的另一实施例的原理图。
图6示出了本发明的商品智能归类系统的另一实施例的原理图。
图7示出了本发明的商品智能归类的整体流程图。
具体实施方式
在结合以下附图阅读本公开的实施例的详细描述之后,能够更好地理解本发明的上述特征和优点。在附图中,各组件不一定是按比例绘制,并且具有类似的相关特性或特征的组件可能具有相同或相近的附图标记。
图1示出了本发明的商品智能归类方法的一实施例的流程。请参见图1,本实施例的流程详述如下。
步骤S10:接收商品描述的输入。
步骤S11:基于分词字典对商品关键字进行分词,将短语切分到符合商品归类因素的词上,对商品数据进行精确匹配。
分词字典来源于商品归类字典,其中分词字典包含商品中文名称分词、商品成分分词、商品工艺分词、商品用途分词、以及商品功能分词。而商品归类字典是依据《进口税则商品及品目注释》、《中华人民共和国进出口税则本国子目注释》以及海关总署发布的关于商品归类的行政裁定、多年来用户的在线搜索及在线客服咨询商品归类问题的来源用户每日查询及咨询商品归类数据的来源,人工录入/调整、建立/补充商品归类字典,其中商品归类字典将影响归类因素做了分类,其中包含了商品中文名称、商品成分描述、商品工艺描述、商品用途描述、商品功能描述及其他描述、货物商品编码、个人行邮编码等,根据归类的特性对其进行了匹配权重设置。
在本实施例中,在分词过程中,依据分词在商品归类字典中权重分值统计每个分词总得分结果,其中依据用户输入中文习惯特性,若某分词在短语中最后一个最长分词则该分词权重得分后再乘上某个倍数N。
例如,短语1拆分分词3个:分词1、分词2、分词3,其中分词3是短语最后且最长分词。
步骤S12:基于匹配结果,根据显示规则展示商品归类建议数据。
显示规则依据分词总得分依次从高到低,得分相同的依据商品中文关键词最少优先、入库时间最新优先的原则、商品编码法律依据优先的原则展示。
图2示出了本发明的商品智能归类方法的另一实施例的流程。请参见图1,本实施例的流程详述如下。
步骤S20:接收商品描述的输入。
步骤S21:基于分词字典对商品关键字进行分词,将短语切分到符合商品归类因素的词上,对商品数据进行精确匹配。
分词字典来源于商品归类字典,其中分词字典包含商品中文名称分词、商品成分分词、商品工艺分词、商品用途分词、以及商品功能分词。而商品归类字典是依据《进口税则商品及品目注释》、《中华人民共和国进出口税则本国子目注释》以及海关总署发布的关于商品归类的行政裁定、用户每日查询及咨询商品归类数据的来源,人工录入/调整、建立/补充商品归类字典,其中商品归类字典将影响归类因素做了分类,其中包含了商品中文名称、商品成分描述、商品工艺描述、商品用途描述、商品功能描述及其他描述、货物商品编码、个人行邮编码等,根据归类的特性对其进行了匹配权重设置。
在本实施例中,在分词过程中,依据分词在商品归类字典中权重分值统计每个分词总得分结果,其中依据用户输入中文习惯特性,若某分词在短语中最后一个最长分词则该分词权重得分后再乘上某个倍数N。
例如,短语1拆分分词3个:分词1、分词2、分词3,其中分词3是短语最后且最长分词。
对于匹配结果,若能够匹配到相应的商品数据,则进入步骤S23,若无法匹配到相应的商品数据,则进入步骤S22。
步骤S22:进行模糊匹配,并进入步骤S23。
步骤S23:基于匹配结果,根据显示规则展示商品归类建议数据。
本实施例中,本步骤的匹配结果既可以是精确匹配的结果,也可以是模糊匹配的结果。而展示过程中的显示规则是依据分词总得分依次从高到低,得分相同的依据商品中文关键词最少优先、入库时间最新优先的原则、货物商品编码法律依据优先的原则展示。
图3示出了本发明的商品智能归类方法的另一实施例的流程。请参见图1,本实施例的流程详述如下。
步骤S30:接收商品描述的输入。
步骤S31:基于分词字典对商品关键字进行分词,将短语切分到符合商品归类因素的词上,对商品数据进行精确匹配。
分词字典来源于商品归类字典,其中分词字典包含商品中文名称分词、商品成分分词、商品工艺分词、商品用途分词、以及商品功能分词。而商品归类字典是依据《进口税则商品及品目注释》、《中华人民共和国进出口税则本国子目注释》以及海关总署发布的关于商品归类的行政裁定、多年来用户的在线搜索及在线客服咨询商品归类问题的来源,人工录入/调整、建立/补充商品归类字典,其中商品归类字典将影响归类因素做了分类,其中包含了商品中文名称、商品成分描述、商品工艺描述、商品用途描述、商品功能描述及其他描述、货物商品编码、个人行邮编码等,根据归类的特性对其进行了匹配权重设置。
在本实施例中,在分词过程中,依据分词在商品归类字典中权重分值统计每个分词总得分结果,其中依据用户输入中文习惯特性,若某分词在短语中是最后且最长分词则该分词权重得分后再乘上某个倍数N。
例如,短语1拆分分词3个:分词1、分词2、分词3,其中分词3是短语最后且最长分词。
对于匹配结果,若能够匹配到相应的商品数据,则进入步骤S35,若无法匹配到相应的商品数据,则进入步骤S32。
步骤S32:进行模糊匹配,若模糊匹配可以匹配到商品数据,则进入步骤,若模糊匹配也无法匹配到商品数据则进入步骤S33。
步骤S33:提交到人工归类,然后进入步骤S34。
步骤S34:基于人工归类的数据对商品归类字典进行人工调整,进而影响分词字典及商品归类字典。
商品归类字典和分词字典中的内容经过人工的调整之后,反过来回到步骤S31,用更新后的分词字典和商品归类字典再次对商品关键字进行分词。
步骤S35:基于匹配结果,根据显示规则展示商品归类建议数据。
本实施例中,本步骤的匹配结果既可以是精确匹配的结果,也可以是模糊匹配的结果。而展示过程中的显示规则是依据分词总得分依次从高到低,得分相同的依据商品中文关键词最少优先、入库时间最新优先的原则、商品编码法律依据优先的原则展示。
以上的实施例中,分词字典和商品归类字典都是自定义的,并且可以通过人工调整或者人工录入的方式更新分词字典和商品归类字典。而图7示出了本发明的最佳实施方案的流程。
图4示出了本发明的商品智能归类系统的实施例的原理。请参见图4,本实施例的系统包括接收装置10、存储装置11、分词装置12、匹配装置13以及展示装置14。
接收装置10接收商品描述的输入。存储装置11存储分词字典和商品归类字典。在本实施例中,分词字典包含商品中文名称分词、商品成分分词、商品工艺分词、商品用途分词、以及商品功能分词;商品归类字典是依据《进口税则商品及品目注释》、《中华人民共和国进出口税则本国子目注释》以及海关总署发布的关于商品归类的行政裁定、多年来用户的在线搜索及在线客服咨询商品归类问题的来源,人工录入/调整、建立/补充商品归类字典。而商品归类字典将影响归类因素做了分类,其中包含了商品中文名称、商品成分描述、商品工艺描述、商品用途描述、商品功能描述及其他描述、货物商品编码、个人行邮编码等,根据归类的特性对其进行了匹配权重设置。分词字典和商品归类字典都是自定义的,并且可以通过人工调整或者人工录入的方式更新分词字典和商品归类字典。
分词装置12连接接收装置10和存储装置11,基于分词字典对商品关键字进行分词,将短语切分到符合商品归类因素的词上。再由连接存储装置11和分词装置12的匹配装置13根据商品分词结果对商品数据进行匹配。
在本实施例中,在分词过程中,依据分词在商品归类字典中权重分值统计每个分词总得分结果,其中依据用户输入中文习惯特性,若某分词在短语中是最后且最长分词则该分词权重得分后再乘上某个倍数N。
例如,短语1拆分分词3个:分词1、分词2、分词3,其中分词3是短语最后且最长分词。
最后,连接匹配装置13的展示装置14基于匹配结果,根据显示规则展示商品归类建议数据。展示过程中的显示规则是依据分词总得分依次从高到低,得分相同的依据商品中文关键词最少优先、入库时间最新优先的原则、商品编码法律依据优先的原则展示。
图5示出了本发明的商品智能归类系统的另一实施例的原理。请参见图5,本实施例的系统包括接收装置20、存储装置21、分词装置22、匹配装置23以及展示装置24。
接收装置20接收商品描述的输入。存储装置21存储分词字典和商品归类字典。在本实施例中,分词字典包含商品中文名称分词、商品成分分词、商品工艺分词、商品用途分词、以及商品功能分词;商品归类字典是依据《进口税则商品及品目注释》、《中华人民共和国进出口税则本国子目注释》以及海关总署发布的关于商品归类的行政裁定、多年来用户的在线搜索及在线客服咨询商品归类问题的来源,人工录入/调整、建立/补充商品归类字典。而商品归类字典将影响归类因素做了分类,其中包含了商品中文名称、商品成分描述、商品工艺描述、商品用途描述、商品功能描述及其他描述、货物商品编码、个人行邮编码等,根据归类的特性对其进行了匹配权重设置。分词字典和商品归类字典都是自定义的,并且可以通过人工调整或者人工录入的方式更新分词字典和商品归类字典。
分词装置22连接接收装置20和存储装置21,基于分词字典对商品关键字进行分词,将短语切分到符合商品归类因素的词上。再由连接存储装置21和分词装置22的匹配装置23根据商品分词结果对商品数据进行匹配。
在本实施例中,在分词过程中,依据分词在商品归类字典中权重分值统计每个分词总得分结果,其中依据用户输入中文习惯特性,若某分词在短语中最后一个最长分词则该分词权重得分后再乘上某个倍数N。
例如,短语1拆分分词3个:分词1、分词2、分词3,其中分词3是短语最后且最长分词。
不同于前一实施例,在本实施例中匹配装置23中还设有模糊匹配模块230。当商品分词结果在商品归类字典中无精确匹配项时通过模糊匹配模块230进行模糊匹配,模糊匹配的原则是短句之间以空格切分作为查询条件且合并条件进行商品归类数据的获取。
最后,连接匹配装置23的展示装置24基于匹配结果(包括了精确匹配和模糊匹配的结果),根据显示规则展示商品归类建议数据。展示过程中的显示规则是依据分词总得分依次从高到低,得分相同的依据商品中文关键词最少优先、入库时间最新优先的原则、商品编码法律依据优先的原则展示。
图6示出了本发明的商品智能归类系统的另一实施例的原理。请参见图6,本实施例的系统包括接收装置30、存储装置31、分词装置32、匹配装置33以及展示装置34。
接收装置30接收商品描述的输入。存储装置31存储分词字典和商品归类字典。在本实施例中,分词字典包含商品中文名称分词、商品成分分词、商品工艺分词、商品用途分词、以及商品功能分词;商品归类字典是依据《进口税则商品及品目注释》、《中华人民共和国进出口税则本国子目注释》以及海关总署发布的关于商品归类的行政裁定、多年来用户的在线搜索及在线客服咨询商品归类问题的来源,人工录入/调整、建立/补充商品归类字典。而商品归类字典将影响归类因素做了分类,其中包含了商品中文名称、商品成分描述、商品工艺描述、商品用途描述、商品功能描述及其他描述、货物商品编码、个人行邮编码等,根据归类的特性对其进行了匹配权重设置。分词字典和商品归类字典都是自定义的,并且可以通过人工调整或者人工录入的方式更新分词字典和商品归类字典。
分词装置32连接接收装置30和存储装置31,基于分词字典对商品关键字进行分词,将短语切分到符合商品归类因素的词上。再由连接存储装置31和分词装置32的匹配装置33根据商品分词结果对商品数据进行匹配。
在本实施例中,在分词过程中,依据分词在商品归类字典中权重分值统计每个分词总得分结果,其中依据用户输入中文习惯特性,若某分词在短语中是最后且最长分词则该分词权重得分后再乘上某个倍数N。
例如,短语1拆分分词3个:分词1、分词2、分词3,其中分词3是短语最后且最长分词。
不同于前一实施例,在本实施例中匹配装置33中还设有模糊匹配模块330。当商品分词结果在商品归类字典中无精确匹配项时通过模糊匹配模块330进行模糊匹配,模糊匹配的原则是短句之间以空格切分作为查询条件且合并条件进行商品归类数据的获取。
然而,当模糊匹配模块330依然无法匹配到相应的商品数据后,本实施例的系统还包括人工归类装置35和人工调整装置36。当模糊匹配也不能成功时,提交到人工归类装置35进行人工归类,再通过人工调整装置36基于人工归类的结果调整存储装置31中的商品归类字典和分词字典。
最后,连接匹配装置33的展示装置34基于匹配结果(包括了精确匹配和模糊匹配的结果),根据显示规则展示商品归类建议数据。展示过程中的显示规则是依据分词匹配算法后总得分依次从高到低,得分相同的依据商品中文关键词最少优先、入库时间最新优先的原则、货物商品编码法律依据优先的原则展示。
尽管为使解释简单化将上述方法图示并描述为一系列动作,但是应理解并领会,这些方法不受动作的次序所限,因为根据一个或多个实施例,一些动作可按不同次序发生和/或与来自本文中图示和描述或本文中未图示和描述但本领域技术人员可以理解的其他动作并发地发生。
本领域技术人员将进一步领会,结合本文中所公开的实施例来描述的各种解说性逻辑板块、模块、电路、和算法步骤可实现为电子硬件、计算机软件、或这两者的组合。为清楚地解说硬件与软件的这一可互换性,各种解说性组件、框、模块、电路、和步骤在上面是以其功能性的形式作一般化描述的。此类功能性是被实现为硬件还是软件取决于具体应用和施加于整体系统的设计约束。技术人员对于每种特定应用可用不同的方式来实现所描述的功能性,但这样的实现决策不应被解读成导致脱离了本发明的范围。
结合本文所公开的实施例描述的各种解说性逻辑板块、模块、和电路可用通用处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)或其它可编程逻辑器件、分立的门或晶体管逻辑、分立的硬件组件、或其设计成执行本文所描述功能的任何组合来实现或执行。通用处理器可以是微处理器,但在替换方案中,该处理器可以是任何常规的处理器、控制器、微控制器、或状态机。处理器还可以被实现为计算设备的组合,例如DSP与微处理器的组合、多个微处理器、与DSP核心协作的一个或多个微处理器、或任何其他此类配置。
结合本文中公开的实施例描述的方法或算法的步骤可直接在硬件中、在由处理器执行的软件模块中、或在这两者的组合中体现。软件模块可驻留在RAM存储器、闪存、ROM存储器、EPROM存储器、EEPROM存储器、寄存器、硬盘、可移动盘、CD-ROM、或本领域中所知的任何其他形式的存储介质中。示例性存储介质耦合到处理器以使得该处理器能从/向该存储介质读取和写入信息。在替换方案中,存储介质可以被整合到处理器。处理器和存储介质可驻留在ASIC中。ASIC可驻留在用户终端中。在替换方案中,处理器和存储介质可作为分立组件驻留在用户终端中。
在一个或多个示例性实施例中,所描述的功能可在硬件、软件、固件或其任何组合中实现。如果在软件中实现为计算机程序产品,则各功能可以作为一条或更多条指令或代码存储在计算机可读介质上或藉其进行传送。计算机可读介质包括计算机存储介质和通信介质两者,其包括促成计算机程序从一地向另一地转移的任何介质。存储介质可以是能被计算机访问的任何可用介质。作为示例而非限定,这样的计算机可读介质可包括RAM、ROM、EEPROM、CD-ROM或其它光盘存储、磁盘存储或其它磁存储设备、或能被用来携带或存储指令或数据结构形式的合意程序代码且能被计算机访问的任何其它介质。任何连接也被正当地称为计算机可读介质。例如,如果软件是使用同轴电缆、光纤电缆、双绞线、数字订户线(DSL)、或诸如红外、无线电、以及微波之类的无线技术从web网站、服务器、或其它远程源传送而来,则该同轴电缆、光纤电缆、双绞线、DSL、或诸如红外、无线电、以及微波之类的无线技术就被包括在介质的定义之中。如本文中所使用的盘(disk)和碟(disc)包括压缩碟(CD)、激光碟、光碟、数字多用碟(DVD)、软盘和蓝光碟,其中盘(disk)往往以磁的方式再现数据,而碟(disc)用激光以光学方式再现数据。上述的组合也应被包括在计算机可读介质的范围内。
提供对本公开的先前描述是为使得本领域任何技术人员皆能够制作或使用本公开。对本公开的各种修改对本领域技术人员来说都将是显而易见的,且本文中所定义的普适原理可被应用到其他变体而不会脱离本公开的精神或范围。由此,本公开并非旨在被限定于本文中所描述的示例和设计,而是应被授予与本文中所公开的原理和新颖性特征相一致的最广范围。

Claims (10)

1.一种商品智能归类方法,包括:
接收商品描述的输入;
基于分词字典对商品关键字进行分词,将短语切分到符合商品归类因素的词上;
根据商品分词结果对商品数据进行匹配;
基于匹配结果,根据显示规则展示商品归类建议数据。
2.根据权利要求1所述的商品智能归类方法,其特征在于,分词字典来源于商品归类字典,其中分词字典包含商品中文名称分词、商品成分分词、商品工艺分词、商品用途分词、以及商品功能分词;商品归类字典是依据《进口税则商品及品目注释》、《中华人民共和国进出口税则本国子目注释》以及海关总署发布的关于商品归类的行政裁定、多年来用户的在线搜索及在线客服咨询商品归类问题的用户每日查询及咨询商品归类数据的来源,人工录入/调整、建立/补充商品归类字典,其中商品归类字典将影响归类因素做了分类,其中包含了商品中文名称、商品成分描述、商品工艺描述、商品用途描述、商品功能描述及其他描述、货物商品编码、个人行邮编码等,根据归类的特性对其进行了匹配权重设置。
3.根据权利要求2所述的商品智能归类方法,其特征在于,在分词过程中,依据分词在商品归类字典中权重分值统计每个分词总得分结果,其中依据用户输入中文习惯特性,若某分词在短语中是最后且最长分词则该分词权重得分后再乘上某个倍数。
4.根据权利要求3所述的商品智能归类方法,其特征在于,该方法还包括:
当商品分词结果在商品归类字典中无匹配项时进行模糊匹配,模糊匹配的原则是短句之间以空格切分作为查询条件且合并条件进行商品归类数据的获取,若模糊匹配成功则进行展示,否则进行人工归类的提交并基于人工归类的结果调整商品归类字典和分词字典。
5.根据权利要求1至4中任一项所述的商品智能归类方法,其特征在于,分词字典和商品归类字典是自定义的。
6.一种商品智能归类系统,包括:
接收装置,接收商品描述的输入;
存储装置,存储分词字典和商品归类字典;
分词装置,连接接收装置和存储装置,基于分词字典对商品关键字进行分词,将短语切分到符合商品归类因素的词上;
匹配装置,连接分词装置和存储装置,根据商品分词结果对商品数据进行匹配;
展示装置,连接匹配装置,基于匹配结果,根据显示规则展示商品归类建议数据。
7.根据权利要求1所述的商品智能归类系统,其特征在于,分词字典来源于商品归类字典,其中分词字典包含商品中文名称分词、商品成分分词、商品工艺分词、商品用途分词、以及商品功能分词;商品归类字典是依据《进口税则商品及品目注释》、《中华人民共和国进出口税则本国子目注释》以及海关总署发布的关于商品归类的行政裁定、多年来用户的在线搜索及在线客服咨询商品归类问题的来源,人工录入/调整、建立/补充商品归类字典,其中商品归类字典将影响归类因素做了分类,其中包含了商品中文名称、商品成分描述、商品工艺描述、商品用途描述、商品功能描述及其他描述、货物商品编码、个人行邮编码等,根据归类的特性对其进行了匹配权重设置。
8.根据权利要求7所述的商品智能归类系统,其特征在于,在分词装置中,依据分词在商品归类字典中权重分值统计每个分词总得分结果,其中依据用户输入中文习惯特性,若某分词在短语中最后一个最长分词则该分词权重得分后再乘上某个倍数。
9.根据权利要求8所述的商品智能归类系统,其特征在于,该匹配装置中还包括模糊匹配模块,所述系统还包括人工归类装置和人工调整装置,其中:
所述模糊匹配模块,当商品分词结果在商品归类字典中无匹配项时进行模糊匹配,模糊匹配的原则是短句之间以空格切分作为查询条件且合并条件进行商品归类数据的获取,若模糊匹配成功则进行通过展示装置进行展示,否则提交到人工归类装置进行人工归类,并通过人工调整装置基于人工归类的结果调整存储装置中的商品归类字典和分词字典。
10.根据权利要求6至9中任一项所述的商品智能归类系统,其特征在于,存储装置中的分词字典和商品归类字典是自定义的。
CN201410409080.6A 2014-08-19 2014-08-19 商品智能归类方法和系统 Pending CN105354194A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410409080.6A CN105354194A (zh) 2014-08-19 2014-08-19 商品智能归类方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410409080.6A CN105354194A (zh) 2014-08-19 2014-08-19 商品智能归类方法和系统

Publications (1)

Publication Number Publication Date
CN105354194A true CN105354194A (zh) 2016-02-24

Family

ID=55330167

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410409080.6A Pending CN105354194A (zh) 2014-08-19 2014-08-19 商品智能归类方法和系统

Country Status (1)

Country Link
CN (1) CN105354194A (zh)

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106095759A (zh) * 2016-06-20 2016-11-09 西安交通大学 一种基于启发式规则的发票货物归类方法
CN108241677A (zh) * 2016-12-26 2018-07-03 航天信息股份有限公司 一种获得商品的税收分类编码的方法及系统
CN108334522A (zh) * 2017-01-20 2018-07-27 阿里巴巴集团控股有限公司 确定海关编码的方法,以及确定类型信息的方法和系统
CN109189838A (zh) * 2018-07-16 2019-01-11 安徽信尔联信息科技有限公司 一种商品整理归类方法
CN109598517A (zh) * 2017-09-29 2019-04-09 阿里巴巴集团控股有限公司 商品通关处理、对象的处理及其类别预测方法和装置
CN109710650A (zh) * 2018-12-19 2019-05-03 中国联合网络通信集团有限公司 案例信息管理方法、装置及设备
CN110287218A (zh) * 2019-06-26 2019-09-27 浙江诺诺网络科技有限公司 一种税收分类编码匹配的方法、系统及设备
CN110335114A (zh) * 2019-06-28 2019-10-15 香港乐蜜有限公司 产品的分类方法、装置及设备
CN110347801A (zh) * 2019-07-17 2019-10-18 安徽航天信息有限公司 一种商品分类编码匹配方法及系统
CN110471948A (zh) * 2019-07-10 2019-11-19 北京交通大学 一种基于历史数据挖掘的海关报关商品智能归类方法
CN110781296A (zh) * 2019-09-16 2020-02-11 中国平安人寿保险股份有限公司 基于深度学习的数据归类方法、及其相关设备
CN110781365A (zh) * 2018-07-13 2020-02-11 阿里巴巴集团控股有限公司 商品搜索方法、装置、系统及电子设备
CN110858219A (zh) * 2018-08-17 2020-03-03 菜鸟智能物流控股有限公司 物流对象信息处理方法、装置及计算机系统
CN111401977A (zh) * 2018-12-28 2020-07-10 航天信息股份有限公司 一种税收分类编码确定方法及装置
CN113361787A (zh) * 2021-06-11 2021-09-07 上海跨境电子商务公共服务有限公司 商品归类系统、方法、存储介质及终端

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102332137A (zh) * 2011-09-23 2012-01-25 纽海信息技术(上海)有限公司 商品匹配方法及系统
WO2012036764A1 (en) * 2010-09-15 2012-03-22 Cbs Interactive, Inc. Mapping product identification information to a product
CN103838883A (zh) * 2014-03-31 2014-06-04 上海久科信息技术有限公司 智能sku匹配方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012036764A1 (en) * 2010-09-15 2012-03-22 Cbs Interactive, Inc. Mapping product identification information to a product
CN102332137A (zh) * 2011-09-23 2012-01-25 纽海信息技术(上海)有限公司 商品匹配方法及系统
CN103838883A (zh) * 2014-03-31 2014-06-04 上海久科信息技术有限公司 智能sku匹配方法

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106095759A (zh) * 2016-06-20 2016-11-09 西安交通大学 一种基于启发式规则的发票货物归类方法
CN106095759B (zh) * 2016-06-20 2019-05-24 西安交通大学 一种基于启发式规则的发票货物归类方法
CN108241677A (zh) * 2016-12-26 2018-07-03 航天信息股份有限公司 一种获得商品的税收分类编码的方法及系统
CN108334522A (zh) * 2017-01-20 2018-07-27 阿里巴巴集团控股有限公司 确定海关编码的方法,以及确定类型信息的方法和系统
CN108334522B (zh) * 2017-01-20 2021-12-14 阿里巴巴集团控股有限公司 确定海关编码的方法,以及确定类型信息的方法和系统
CN109598517B (zh) * 2017-09-29 2023-09-12 阿里巴巴集团控股有限公司 商品通关处理、对象的处理及其类别预测方法和装置
CN109598517A (zh) * 2017-09-29 2019-04-09 阿里巴巴集团控股有限公司 商品通关处理、对象的处理及其类别预测方法和装置
CN110781365A (zh) * 2018-07-13 2020-02-11 阿里巴巴集团控股有限公司 商品搜索方法、装置、系统及电子设备
CN110781365B (zh) * 2018-07-13 2023-04-28 阿里巴巴集团控股有限公司 商品搜索方法、装置、系统及电子设备
CN109189838A (zh) * 2018-07-16 2019-01-11 安徽信尔联信息科技有限公司 一种商品整理归类方法
CN110858219A (zh) * 2018-08-17 2020-03-03 菜鸟智能物流控股有限公司 物流对象信息处理方法、装置及计算机系统
CN109710650A (zh) * 2018-12-19 2019-05-03 中国联合网络通信集团有限公司 案例信息管理方法、装置及设备
CN111401977A (zh) * 2018-12-28 2020-07-10 航天信息股份有限公司 一种税收分类编码确定方法及装置
CN110287218A (zh) * 2019-06-26 2019-09-27 浙江诺诺网络科技有限公司 一种税收分类编码匹配的方法、系统及设备
CN110335114A (zh) * 2019-06-28 2019-10-15 香港乐蜜有限公司 产品的分类方法、装置及设备
CN110471948A (zh) * 2019-07-10 2019-11-19 北京交通大学 一种基于历史数据挖掘的海关报关商品智能归类方法
CN110347801A (zh) * 2019-07-17 2019-10-18 安徽航天信息有限公司 一种商品分类编码匹配方法及系统
CN110781296A (zh) * 2019-09-16 2020-02-11 中国平安人寿保险股份有限公司 基于深度学习的数据归类方法、及其相关设备
CN113361787A (zh) * 2021-06-11 2021-09-07 上海跨境电子商务公共服务有限公司 商品归类系统、方法、存储介质及终端

Similar Documents

Publication Publication Date Title
CN105354194A (zh) 商品智能归类方法和系统
US20230020599A1 (en) Method and system for sentiment analysis of information
CN107766371B (zh) 一种文本信息分类方法及其装置
US20240028651A1 (en) System and method for processing documents
US10558627B2 (en) Method and system for cleansing and de-duplicating data
WO2019109918A1 (zh) 摘要文本生成方法、计算机可读存储介质和计算机设备
CN103218364B (zh) 一种搜索方法和系统
CN110428322A (zh) 一种业务数据的适配方法及装置
EP2192500A2 (en) System and method for providing robust topic identification in social indexes
CN107895037A (zh) 一种问答数据处理方法、装置、设备和计算机可读介质
CN110134931A (zh) 媒介标题生成方法、装置、电子设备及可读介质
CN104933152A (zh) 命名实体识别方法及装置
CN106682878A (zh) 一种设计师匹配平台及方法
CN103996055B (zh) 基于影像档案电子资料识别系统中分类器的识别方法
CN109582788A (zh) 垃圾评论训练、识别方法、装置、设备及可读存储介质
CN108052668A (zh) 基于商品编码的智能赋码方法及系统
CN106326243A (zh) 一种数据处理方法及装置
CN110955767A (zh) 一种机器人对话系统中生成意图候选集列表集合的算法及装置
CN109003013A (zh) 一种基于语音技术的商品盘点方法
CN110874534A (zh) 数据处理方法和数据处理装置
CN101470699B (zh) 信息提取模型训练装置、信息提取装置和信息提取系统及其方法
Khemani et al. A review on reddit news headlines with nltk tool
CN111814481A (zh) 购物意图识别方法、装置、终端设备及存储介质
CN107506407A (zh) 一种文件分类、调用的方法及装置
CN110750643A (zh) 上市公司非定期公告的分类方法、装置及存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: No. 2667, Zu Chong Road, Pudong New Area, Shanghai

Applicant after: Shanghai Shunyi Mdt InfoTech Ltd

Address before: No. 2667, Zu Chong Road, Pudong New Area, Shanghai

Applicant before: SHANGHAI ZHONGYITONG INFORMATION TECHNOLOGY CO., LTD.

RJ01 Rejection of invention patent application after publication

Application publication date: 20160224

RJ01 Rejection of invention patent application after publication