CN102542061A - 一种产品的智能分类方法 - Google Patents

一种产品的智能分类方法 Download PDF

Info

Publication number
CN102542061A
CN102542061A CN2011104558314A CN201110455831A CN102542061A CN 102542061 A CN102542061 A CN 102542061A CN 2011104558314 A CN2011104558314 A CN 2011104558314A CN 201110455831 A CN201110455831 A CN 201110455831A CN 102542061 A CN102542061 A CN 102542061A
Authority
CN
China
Prior art keywords
product
classification
key word
sorting key
current production
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2011104558314A
Other languages
English (en)
Other versions
CN102542061B (zh
Inventor
潘海东
梅春
曾庆义
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Interactive Encyclopedia Network Technology Co.,Ltd.
Beijing ByteDance Network Technology Co Ltd
Original Assignee
Interactive Online (beijing) Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Interactive Online (beijing) Technology Co Ltd filed Critical Interactive Online (beijing) Technology Co Ltd
Priority to CN201110455831.4A priority Critical patent/CN102542061B/zh
Publication of CN102542061A publication Critical patent/CN102542061A/zh
Application granted granted Critical
Publication of CN102542061B publication Critical patent/CN102542061B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及一种产品的智能分类方法,该方法包括以下步骤:建立包含多个产品分类且每个产品分类包含至少一个分类关键字的分类数据库;遍历需要添加分类的产品的数据,为各产品提炼出至少一个产品关键字;将各产品的产品关键字与所述分类数据库的分类关键字进行匹配;将匹配得到的分类关键字所属的产品分类作为当前产品的分类添加到该产品的分类属性。通过本发明,可以更快地为产品添加分类标签,通过机器智能分析产品描述文字,由机器来判断产品的分类,大大解放了人工的工作量。

Description

一种产品的智能分类方法
技术领域
本发明涉及一种产品的智能分类方法,根据需要分类的产品的数据,进行智能分析,自动为该产品添加分类属性标签。
背景技术
现在的电子产品信息数据越来越多,而且每天都会产生新数据,面对这些海量的数据,需要对其逐个分门别类。每天产生的新产品数据需要尽快及时地添加分类标签,方便用户检索。目前对产品进行分类,主要是通过人工手段,人工逐个阅读产品描述,判断产品所属分类后添加分类。面对海量的产品数据,人工判断效率极低,需要很长时间的工作量,浪费了大量的人力。因此,需要一种能够更有效率地为产品添加分类的方法。
发明内容
以上这些问题在本发明中得到了有效解决。
根据本发明,提供一种产品的智能分类方法,该方法包括以下步骤:
建立包含多个产品分类且每个产品分类包含至少一个分类关键字的分类数据库;
遍历需要添加分类的产品的数据,为各产品提炼出至少一个产品关键字;
将各产品的产品关键字与所述分类数据库的分类关键字进行匹配;
将匹配得到的分类关键字所属的产品分类作为当前产品的分类添加到该产品的分类属性。
优选地,建立包含多个产品分类且每个产品分类包含至少一个分类关键字的分类数据库包括:
建立包含多个产品分类的数据库; 
针对所述各产品分类,采集互联网上已有的分类数据;
将所采集到的分类数据进行分词和提炼得到至少一个分类关键字;
将所述至少一个分类关键字与所述产品分类的相应分类进行关联。
优选地,将匹配得到的分类关键字所属的产品分类作为当前产品的分类添加到该产品的分类属性包括:
将匹配到的第一个分类关键字所属的产品分类作为当前产品的分类添加到该产品的分类属性,或
将匹配得到的所有分类关键字所属的产品分类作为当前产品的分类添加到该产品的分类属性,或
将匹配得到与当前产品的关键字最为相关的分类关键字所属的产品分类作为当前产品的分类添加到该产品的分类属性。
通过本发明,可以更快地为产品添加分类标签,通过机器智能分析产品描述文字,由机器来判断产品的分类,大大解放了人工的工作量。这种智能分类方法,分类的准确率达到80%以上,通过这种方法,为产品的分类工作减少了80%的人工量。
附图说明
图1示出根据本发明实施例的产品的智能分类方法的流程图。
具体实施方式
下面结合附图和具体实施方式对本发明做进一步阐述。
图1示出根据本发明实施例的产品的智能分类方法的流程图。
在步骤S11中,建立包含多个产品分类且每个产品分类包含至少一个分类关键字的分类数据库。
具体地,可建立包含多个产品分类的数据库,例如“手机”,“笔记本”,“台式机”等若干分类。针对每一个分类,建立至少一个相关的分类关键字。优选地,分类关键字可通过采集程序,采集互联网上已有的分类的数据,对采集到的数据进行分词和提炼得到至少一个关键字,再把经过分词和提炼得到的关键字跟相应的产品分类关联起来,从而完成数据库的建立。
例如,针对“手机”分类,通过采集程序去京东商城等第三方网站,采集手机分类的产品数据,通过分析程序对采集到的手机分类的产品数据进行分词和提炼,得到至少一个手机分类下产品的关键字,把得到的关键字添加到“手机”分类的数据库里。例如分析程序在手机分类的产品里提炼得到“iphone4”这个关键字,就会把“iphone4”添加到“手机”分类的关键字数据库中。
在步骤S12中,遍历需要添加分类的产品的数据,为各产品提炼出至少一个产品关键字。
具体地,提取需要添加分类的产品的标题和描述文本,通过分析程序对文本进行分词,过滤无用的关键字,找到集中的一个或多个关键字。例如,在遍历需要添加分类的电子产品列表过程中,分析程序针对其中的某个产品提炼出了“iphone4”这个关键字。
在步骤S13中,将各产品的产品关键字与所述分类数据库的分类关键字进行匹配。
具体地,把各个产品的关键字放到分类数据库中进行搜索,以便匹配到数据库中的分类关键字。
在步骤S14中,将匹配得到的分类关键字所属的产品分类作为当前产品的分类添加到该产品的分类属性。
具体地,如果在分类数据库中搜索到某产品的关键字,就取出该关键字在数据库中对应的分类,这个分类就是该产品的分类,把该分类添加产品的属性中去。
在实践中,有可能匹配得到属于多个产品分类的分类关键字,根据本发明实施例,可以将匹配到的第一个分类关键字所属的产品分类作为当前产品的分类添加到该产品的分类属性,或将匹配得到的所有分类关键字所属的产品分类作为当前产品的分类添加到该产品的分类属性,或将匹配得到与当前产品的关键字最为相关的分类关键字所属的产品分类作为当前产品的分类添加到该产品的分类属性。
以上借助实施例对本发明进行了具体说明。应当理解,本发明的上述描述是示例性的而非限制性的。本领域技术人员通过阅读本说明书,在不偏离本发明精神的情况下可以对本发明进行修改和变型。本发明的保护范围仅由所附权利要求限定。

Claims (3)

1.一种产品的智能分类方法,其特征在于,该方法包括以下步骤:
建立包含多个产品分类且每个产品分类包含至少一个分类关键字的分类数据库;
遍历需要添加分类的产品的数据,为各产品提炼出至少一个产品关键字;
将各产品的产品关键字与所述分类数据库的分类关键字进行匹配;
将匹配得到的分类关键字所属的产品分类作为当前产品的分类添加到该产品的分类属性。
2.根据权利要求1所述的方法,其特征在于,建立包含多个产品分类且每个产品分类包含至少一个分类关键字的分类数据库包括:
建立包含多个产品分类的数据库; 
针对所述各产品分类,采集互联网上已有的分类数据;
将所采集到的分类数据进行分词和提炼得到至少一个分类关键字;
将所述至少一个分类关键字与所述产品分类的相应分类进行关联。
3.根据权利要求1所述的方法,其特征在于,将匹配得到的分类关键字所属的产品分类作为当前产品的分类添加到该产品的分类属性包括:
将匹配到的第一个分类关键字所属的产品分类作为当前产品的分类添加到该产品的分类属性,或
将匹配得到的所有分类关键字所属的产品分类作为当前产品的分类添加到该产品的分类属性,或
将匹配得到与当前产品的关键字最为相关的分类关键字所属的产品分类作为当前产品的分类添加到该产品的分类属性。
CN201110455831.4A 2011-12-30 2011-12-30 一种产品的智能分类方法 Active CN102542061B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201110455831.4A CN102542061B (zh) 2011-12-30 2011-12-30 一种产品的智能分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201110455831.4A CN102542061B (zh) 2011-12-30 2011-12-30 一种产品的智能分类方法

Publications (2)

Publication Number Publication Date
CN102542061A true CN102542061A (zh) 2012-07-04
CN102542061B CN102542061B (zh) 2014-03-26

Family

ID=46348940

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201110455831.4A Active CN102542061B (zh) 2011-12-30 2011-12-30 一种产品的智能分类方法

Country Status (1)

Country Link
CN (1) CN102542061B (zh)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103064990A (zh) * 2013-02-04 2013-04-24 广州太平洋电脑信息咨询有限公司 一种利用索引数据文件查询方法
CN103678382A (zh) * 2012-09-17 2014-03-26 联想(北京)有限公司 一种信息处理的方法和电子设备
CN104008101A (zh) * 2013-02-21 2014-08-27 纽海信息技术(上海)有限公司 货物分类检验方法及检验装置
CN104216979A (zh) * 2014-09-01 2014-12-17 西北工业大学 中文工艺专利自动分类系统及利用该系统进行专利分类的方法
CN105138680A (zh) * 2015-09-14 2015-12-09 郑州悉知信息科技股份有限公司 关键词分类方法、装置及产品搜索方法、装置
WO2015196352A1 (en) * 2014-06-24 2015-12-30 The Nielsen Company (Us), Llc Methods and apparatus to categorize items
CN105447719A (zh) * 2015-12-01 2016-03-30 苏州铭冠软件科技有限公司 一种适用于大数据分析的数据处理方法
CN106557505A (zh) * 2015-09-28 2017-04-05 北京国双科技有限公司 一种信息分类方法及装置
CN106919619A (zh) * 2015-12-28 2017-07-04 阿里巴巴集团控股有限公司 一种商品聚类方法、装置及电子设备
CN108415948A (zh) * 2018-02-01 2018-08-17 谢春旺 一种信访信息自动化管理方法、电子设备及存储介质
CN110941715A (zh) * 2019-10-23 2020-03-31 北京精英系统科技有限公司 一种实体对象分类判断的方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101520788A (zh) * 2008-02-27 2009-09-02 株式会社Pfu 图像文件分类方法、图像文件分类设备和计算机程序产品
CN102259757A (zh) * 2011-08-02 2011-11-30 北京万源瀚德汽车密封系统有限公司 一种物料自动识别仓储系统及其物料入库方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101520788A (zh) * 2008-02-27 2009-09-02 株式会社Pfu 图像文件分类方法、图像文件分类设备和计算机程序产品
CN102259757A (zh) * 2011-08-02 2011-11-30 北京万源瀚德汽车密封系统有限公司 一种物料自动识别仓储系统及其物料入库方法

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103678382A (zh) * 2012-09-17 2014-03-26 联想(北京)有限公司 一种信息处理的方法和电子设备
CN103064990A (zh) * 2013-02-04 2013-04-24 广州太平洋电脑信息咨询有限公司 一种利用索引数据文件查询方法
CN103064990B (zh) * 2013-02-04 2014-03-26 广州太平洋电脑信息咨询有限公司 一种利用索引数据文件查询方法
CN104008101A (zh) * 2013-02-21 2014-08-27 纽海信息技术(上海)有限公司 货物分类检验方法及检验装置
CN104008101B (zh) * 2013-02-21 2019-02-12 北京京东尚科信息技术有限公司 货物分类检验方法及检验装置
WO2015196352A1 (en) * 2014-06-24 2015-12-30 The Nielsen Company (Us), Llc Methods and apparatus to categorize items
CN104216979B (zh) * 2014-09-01 2017-12-05 西北工业大学 中文工艺专利自动分类系统及利用该系统进行专利分类的方法
CN104216979A (zh) * 2014-09-01 2014-12-17 西北工业大学 中文工艺专利自动分类系统及利用该系统进行专利分类的方法
CN105138680A (zh) * 2015-09-14 2015-12-09 郑州悉知信息科技股份有限公司 关键词分类方法、装置及产品搜索方法、装置
CN106557505A (zh) * 2015-09-28 2017-04-05 北京国双科技有限公司 一种信息分类方法及装置
CN106557505B (zh) * 2015-09-28 2021-04-27 北京国双科技有限公司 一种信息分类方法及装置
CN105447719A (zh) * 2015-12-01 2016-03-30 苏州铭冠软件科技有限公司 一种适用于大数据分析的数据处理方法
CN106919619A (zh) * 2015-12-28 2017-07-04 阿里巴巴集团控股有限公司 一种商品聚类方法、装置及电子设备
CN108415948A (zh) * 2018-02-01 2018-08-17 谢春旺 一种信访信息自动化管理方法、电子设备及存储介质
CN110941715A (zh) * 2019-10-23 2020-03-31 北京精英系统科技有限公司 一种实体对象分类判断的方法

Also Published As

Publication number Publication date
CN102542061B (zh) 2014-03-26

Similar Documents

Publication Publication Date Title
CN102542061B (zh) 一种产品的智能分类方法
CN101593200B (zh) 基于关键词频度分析的中文网页分类方法
CN101794311B (zh) 基于模糊数据挖掘的中文网页自动分类方法
CN103544255B (zh) 基于文本语义相关的网络舆情信息分析方法
CN102279894B (zh) 基于语义的查找、集成和提供评论信息的方法及搜索系统
CN105404699A (zh) 一种搜索财经文章的方法、装置及服务器
CN104392006B (zh) 一种事件查询处理方法及装置
CN104951512A (zh) 一种基于互联网的舆情数据采集方法及系统
CN104504150A (zh) 新闻舆情监测系统
CN106250513A (zh) 一种基于事件建模的事件个性化分类方法及系统
CN101751458A (zh) 一种网络舆情监控系统及方法
CN102567494B (zh) 网站分类方法及装置
CN101604363A (zh) 基于文件指令频度的计算机恶意程序分类系统及分类方法
CN103577478A (zh) 网页推送方法及系统
CN103679012A (zh) 一种可移植可执行文件的聚类方法和装置
CN103294820B (zh) 基于语义扩展的web页面归类方法和系统
CN105468744A (zh) 一种实现税务舆情分析和全文检索的大数据平台
CN103838754A (zh) 信息搜索装置及方法
CN108197243A (zh) 一种基于用户身份的输入联想推荐方法及装置
CN104216979A (zh) 中文工艺专利自动分类系统及利用该系统进行专利分类的方法
CN112685564A (zh) 一种智能科技政策分类、推送方法、以及系统
CN110909542A (zh) 智能语义串并分析方法及系统
KR102107474B1 (ko) 크롤링을 통한 사회이슈 도출 시스템 및 그 도출 방법
CN106844588A (zh) 一种基于网络爬虫的用户行为数据的分析方法及系统
CN104933171A (zh) 兴趣点数据关联方法和装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
C56 Change in the name or address of the patentee
CP03 Change of name, title or address

Address after: 100085 Haidian District on the road to information on the ground floor, building A7F, No. 28, Beijing

Patentee after: BEIJING HUDONG BAIKE NETWORK TECHNOLOGY CO.,LTD.

Address before: 100029, miracle Fortune Plaza, 1 Li an yuan, Anding, Beijing, Chaoyang District

Patentee before: Hudong Online (Beijing) Technology Co.,Ltd.

CP01 Change in the name or title of a patent holder

Address after: 100085 Haidian District on the road to information on the ground floor, building A7F, No. 28, Beijing

Patentee after: Beijing Interactive Encyclopedia Network Technology Co.,Ltd.

Address before: 100085 Haidian District on the road to information on the ground floor, building A7F, No. 28, Beijing

Patentee before: BEIJING HUDONG BAIKE NETWORK TECHNOLOGY CO.,LTD.

CP01 Change in the name or title of a patent holder
TR01 Transfer of patent right

Effective date of registration: 20190924

Address after: 100041, room 2, building 3, building 30, Xing Xing street, Shijingshan District, Beijing,

Patentee after: BEIJING BYTEDANCE NETWORK TECHNOLOGY Co.,Ltd.

Address before: 100085 Haidian District on the road to information on the ground floor, building A7F, No. 28, Beijing

Patentee before: Beijing Interactive Encyclopedia Network Technology Co.,Ltd.

TR01 Transfer of patent right