CN104715049A - 基于本体词库的商品评论属性词抽取方法 - Google Patents

基于本体词库的商品评论属性词抽取方法 Download PDF

Info

Publication number
CN104715049A
CN104715049A CN201510138316.1A CN201510138316A CN104715049A CN 104715049 A CN104715049 A CN 104715049A CN 201510138316 A CN201510138316 A CN 201510138316A CN 104715049 A CN104715049 A CN 104715049A
Authority
CN
China
Prior art keywords
word
speech
attribute word
attribute
synonym
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510138316.1A
Other languages
English (en)
Other versions
CN104715049B (zh
Inventor
马睿
周晓锋
潘福成
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
WUXI ZHONGKE FANZAI INFORMATION TECHNOLOGY RESEARCH DEVELOPMENT CENTER Co Ltd
Original Assignee
WUXI ZHONGKE FANZAI INFORMATION TECHNOLOGY RESEARCH DEVELOPMENT CENTER Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by WUXI ZHONGKE FANZAI INFORMATION TECHNOLOGY RESEARCH DEVELOPMENT CENTER Co Ltd filed Critical WUXI ZHONGKE FANZAI INFORMATION TECHNOLOGY RESEARCH DEVELOPMENT CENTER Co Ltd
Priority to CN201510138316.1A priority Critical patent/CN104715049B/zh
Publication of CN104715049A publication Critical patent/CN104715049A/zh
Application granted granted Critical
Publication of CN104715049B publication Critical patent/CN104715049B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)

Abstract

本发明提供一种基于本体词库的商品评论属性词抽取方法,包括下述步骤:步骤1,对评论文本预处理:首先将每条评论文本分割为不同的子句;其次,对每条评论的各个子句,结合属性词本体词库,进行分词,然后进行词性标注,去停用词,接着在子句中搜索名词作为该条评论的属性词候选集;步骤2,对属性词候选集中的属性词进行归类:步骤3,在各个属性词候选集中,合并属性词的同义词类:步骤4,经过对属性词候选集中的合并操作之后,将每个同义词类的中心词认定为属性词候选集对应的子句的属性词。本发明相比于传统的文本处理提取属性词的方法效率更高。

Description

基于本体词库的商品评论属性词抽取方法
技术领域
本发明涉及互联网电子商务的商品评论,尤其是一种商品评论属性词抽取方法。
背景技术
2011年的全球互联网数据显示,截止到2011年12月,全球网站数量总数已达到5.55亿,全球网民的人数超过了20亿。互联网普及程度的提高带动了电子商务这一网络活动的发展,越来越多的网络留言遍布着我们的网络平台,而购物网站上的商品评论尤为明显。
2012年,“双十一”当日支付宝交易额实现飞速增长,达到191亿元,其中包括天猫商城132亿元,淘宝59亿元,订单数达到1.058亿笔;2013年,11月11日阿里巴巴平台总交易额350.19亿;2014年,11月11日阿里巴巴总成交额571.1亿,订单总量2.79亿。(以上数据来自阿里巴巴官方微博)京东官方微博宣布,2014年“双十一”期间三天(11月10日至12日)销售额25亿元,三天订单总量超过680万单,是2012年11月11日当天订单量的3倍多。
除此两家电商之外,国内还有很多大型的电商如当当网等。加上双十一之外的网上购物其他三百多天的电商运营数据,事实说明电子商务活动越来越频繁,而且由此产生海量的商品评论。
消费者的消费选择会受到消费者之间交换的信息的影响,在过去,人们常认为从亲戚或朋友那里听到的意见是最重要的消费前信息,现在,互联网的技术应用在过去十几年中的发展使得人们获取网络消费前信息的来源不再局限于自己的亲朋好友,而是扩大到了购物网站上的商品评论。实际上,这些评论成为了用户获取商品信息的重要来源。在传统的实体店铺中,顾客可以仔细检查商品的质量和品质,而网店中的商品,顾客看不到实物,必然会担心图片和实物的差距。因此对于网络购物而言,商品的相关评论就非常重要了,这些评论能够帮助顾客了解商品的服务和口碑,帮助他们作出正确的决策,选到自己满意的商品。
另外这些商品的生产者和销售者也能够从反馈的信息中有所收益,改进生产和服务,提高商品的质量和品牌的知名度,还能挖掘出潜在的消费者。
通过大量观察现行主流的电子商务网站,其中商品评论具有如下特点:
1.在商品评论中,大部分的子句都是针对一项属性进行评论的。例如有评论“手机到手用了一天,做工不错,软件和游戏运行都不错,手机是正品,赠送的小东西也都不错”,这句话中,由逗号分割的不同子句评论的对象各不相同。少数地,对一项属性的评论分布在不同的子句中,但是这些子句是相邻的。
2.商品评论文本中,对同一项属性的评论和对其他属性的评论是有明显界限的。我们将一条评论文本中,每个由标点或者空白字符分割的部分称作子句。多数子句包含的内容是一个评价对象(商品属性)加上一个评价词。如“做工不错”。也有部分子句没有评价对象,只有评价词,此种情况可以使用默认的评价对象,如评论子句“用了之后才发现真得很好”,可以理解为“质量很好”。
3.有些子句中包含多个评价属性,如“手机屏幕色彩饱满”。
4.有些子句不是针对商品本身的评论,如“真心建议你们公司不要跟圆通合作了,对这快递公司无语了”是对卖家和物流服务质量的评论。
5.对同一件商品,买家们评论的对象之间存在包含关系。例如对一款具体的手机,有些评论中属性词是“屏幕”,有些评论中属性词是“分辨率”。
逐日激增的商品评论这让人很难逐条阅读。情感标签由评价对象和评价词组成,包含了用户评论的详细信息,能够有效地体现出用户评论的核心内容,实现互联网电子商务网站的商品评价信息的归纳,尽可能地保留原先针对此商品的海量评论的有效内容,又方便了评论阅读者的快速掌握。
情感标签的抽取是近年来文本挖掘的热点问题,先前已经有过大量研究,但是鲜有针对现行电商商品评论的研究,使用先前的方法来对这些评论做处理,其效率不高,主要有两个原因:一是使用的词典内容过于宽泛,而且对目前商品评论的词汇包含完全度低,这就造成查询时效率和命中率低;二是在文本表示的时候,之前的研究大多考虑的是对大型文档进行处理,而目前中文商品评论文本都比较短,表达为向量空间模型时维度很大,很多元素是无效填充值,数据密度低,无论是存储还是查询效率低下。
情感标签由评价对象(属性词)和评价词组成,包含了用户评论的详细信息,能够有效地体现出用户评论的核心内容。如“质量很好”,“质量”是评价对象(属性词),“好”是评价词。属性词的提取是情感标签提取的重要步骤。
发明内容
本发明的目的在于针对目前主流电子商务网站商品评论的特点,提供一种基于本体词库的商品评论属性词抽取方法,相比于传统的文本处理提取属性词的方法效率更高。本发明采用的技术方案是:
一种基于本体词库的商品评论属性词抽取方法,包括下述步骤:
步骤1,对评论文本预处理:首先将每条评论文本分割为不同的子句;其次,对每条评论的各个子句,结合属性词本体词库,进行分词,然后进行词性标注,去停用词,接着在子句中搜索名词作为该条评论的属性词候选集;
步骤2,对属性词候选集中的属性词进行归类:对具体一种商品,遍历与这种商品相关的所有商品评论的属性词候选集,各自对每个属性词候选集中的属性词进行归类操作;归类后,对每个属性词候选集,会生成若干同义词类,每个同义词类是属性词本体词库中某个对应的同义词类的子集;
步骤3,在各个属性词候选集中,合并属性词的同义词类:
步骤4,经过对属性词候选集中的合并操作之后,将每个同义词类的中心词认定为属性词候选集对应的子句的属性词。
进一步地,步骤1中,具体采用正向最大匹配方法进行分词。
进一步地,步骤2中,对属性词候选集中的属性词进行归类操作的方法为:查找属性词本体词库,获取并返回词语w所在同义词类的中心词W;将中心词W代表的同义词类确定为词语w的同义词类。
进一步地,步骤3中,合并的方法为:属性词候选集中,
如果两个同义词类A和B的中心词是属性词本体词库中处于同一层次的词,且具有相同的上一层词语,且同义词类A和B内的词语数量都小于设定阈值,则将同义词类A和B合并,合并后新的同义词类的中心词是同义词类A和B的中心词在属性词本体词库中上一层的词语;
如果两个同义词类A和B的中心词在属性词本体词库的层次关系上是从属关系,且同义词类A和B内的词语数量都小于设定阈值,则将同义词类A和B合并,合并后新的同义词类的中心词是同义词类A和B的中心词在属性词本体词库的层次关系上位于从属关系上层的中心词。
如果使用目前已经存在的基于词典/词库的方法来对这些评论做属性词的提取效率不高,主要有两个原因:一是在使用的词典内容过于宽泛,而且对目前商品评论的词汇包含不够完整,这就造成查询时效率和命中率低;二是在文本表示的时候,之前的研究大多考虑的是对大型文档进行处理,如采用向量空间模型,而目前中文商品评论文本都比较短,表达为向量空间模型时维度很大,向量中很多元素会是无效填充值,造成数据密度低,无论是存储还是查询效率都不会高。本发明在查询效率、存储效率和命中率方面都能很好地满足工作需要。
附图说明
图1为属性词本体词库分层结构示意图。
图2为本发明的属性词的同义词类及中心词示例图。
图3为本发明的方法流程图。
具体实施方式
下面结合具体附图和实施例对本发明作进一步说明。
本发明用于基于现有已构建好的属性词本体词库,对于新的商品评论进行属性词的抽取。
商品评论文本中,将一条评论文本中,每个由标点或者空白字符分割的部分称作子句,如“手机屏幕很清晰,做工不错”包含用逗号分隔的两个子句。
此基于本体词库的商品评论属性词抽取方法,包括下述步骤:
步骤1,对评论文本预处理:首先将每条评论文本分割为不同的子句;其次,对每条评论的各个子句,结合属性词本体词库,使用正向最大匹配方法进行分词,然后进行词性标注,去停用词,接着在子句中搜索名词作为该条评论的属性词候选集;
词性标注可以区分分词后各词的词性,比如名词、动词、副词等。停用词对文档的含义没有任何意义,需要被过滤、屏蔽掉。一般来说,连词、冠词、介词都属于停用词,总结出的中文停用词有:的、他的、你的、我的、一、一下、不、不仅、不会、不但、不光、不只、不得、与、与其、且、个、个人、为、为了、乃、乃至、么、之、之一、之前、之后、之类、也、也是、也罢、于、于是、人们、人家、什么、从、从而、了、就、以、以上、以下、何、何况、何为、其、其一、其实、几、几乎、即、即使、即便、又、及、及其、可、可以、可是、各、各个、各位、各自、吧、呀、呢、呵、咋、和、哈、哦、哎、哪、哪个、哪儿……。
步骤1完成后,每个子句对应一个属性词候选集。
本发明所使用的属性词本体词库具有分层结构,可以预先建立或者采用第三方的本体词库。在概念的语义上,层次的上层节点是包含其下层子节点的,图1所示的是属性词本体词库概念分层的例子,“手机”的下层子节点可以是“外壳”“屏幕”“颜色”等;“屏幕”的下层子节点可以是“颜色”“分辨率”等。
属性词本体词库中的词语还具有同义词。一组同义词形成一个类别,每个类别具有一个中心词,中心词能代表此同义词类。包含于同一个同义词类的词语都在同一个层次。同义词类别中心词的确定原则:在商品评论中出现频率较高的属性词。图2所示的是一组同义词,“外观”“质感”“外壳”“设计”“款式”均为同义词,它们属于同一个同义词类别,其中“外观”是该同义词类别的中心词。
步骤2,对属性词候选集中的属性词进行归类:对具体一种商品,遍历与这种商品相关的所有商品评论的属性词候选集,各自对每个属性词候选集中的属性词进行归类操作;
属性词的归类是在属性词本体词库中查找该属性词所属的同义词类别。可定义子操作:
子操作 定义说明
C(w) 查找属性词本体词库,获取并返回词语w所在同义词类的中心词W
U(W,w) 将中心词W代表的同义词类确定为词语w的同义词类
则属性词的归类操作的算法描述为:U(C(w),w);
归类后,对每个属性词候选集,会生成若干同义词类,每个同义词类是属性词本体词库中某个对应的同义词类的子集,给后续合并操作提供了基础。
步骤3,在各个属性词候选集中,合并属性词的同义词类:
合并的目的是最终选择出高频属性词。
合并的过程如下:属性词候选集中,如果两个同义词类A和B的中心词是属性词本体词库中处于同一层次的词,且具有相同的上一层词语,且同义词类A和B内的词语数量都小于设定阈值,则将同义词类A和B合并,合并后新的同义词类的中心词是同义词类A和B的中心词在属性词本体词库中上一层的词语;
如果两个同义词类A和B的中心词在属性词本体词库的层次关系上是从属关系,且同义词类A和B内的词语数量都小于设定阈值,则将同义词类A和B合并,合并后新的同义词类的中心词是同义词类A和B的中心词在属性词本体词库的层次关系上位于从属关系上层的中心词;
合并到不满足合并的条件为止,比如同义词类的大小(即类内的词语数量)达到或超过设定阈值。这个预设阈值可以是3或4。
步骤4,经过对属性词候选集中的合并操作之后,将每个同义词类的中心词认定为属性词候选集对应的子句的属性词。

Claims (4)

1.一种基于本体词库的商品评论属性词抽取方法,其特征在于,包括下述步骤:
步骤1,对评论文本预处理:首先将每条评论文本分割为不同的子句;其次,对每条评论的各个子句,结合属性词本体词库,进行分词,然后进行词性标注,去停用词,接着在子句中搜索名词作为该条评论的属性词候选集;
步骤2,对属性词候选集中的属性词进行归类:对具体一种商品,遍历与这种商品相关的所有商品评论的属性词候选集,各自对每个属性词候选集中的属性词进行归类操作;归类后,对每个属性词候选集,会生成若干同义词类,每个同义词类是属性词本体词库中某个对应的同义词类的子集;
步骤3,在各个属性词候选集中,合并属性词的同义词类;
步骤4,经过对属性词候选集中的合并操作之后,将每个同义词类的中心词认定为属性词候选集对应的子句的属性词。
2.如权利要求1所述的基于本体词库的商品评论属性词抽取方法,其特征在于:
步骤1中,具体采用正向最大匹配方法进行分词。
3.如权利要求1所述的基于本体词库的商品评论属性词抽取方法,其特征在于:
步骤2中,对属性词候选集中的属性词进行归类操作的方法为:查找属性词本体词库,获取并返回词语w所在同义词类的中心词W;将中心词W代表的同义词类确定为词语w的同义词类。
4.如权利要求1所述的基于本体词库的商品评论属性词抽取方法,其特征在于:
步骤3中,合并的方法为:属性词候选集中,
如果两个同义词类A和B的中心词是属性词本体词库中处于同一层次的词,且具有相同的上一层词语,且同义词类A和B内的词语数量都小于设定阈值,则将同义词类A和B合并,合并后新的同义词类的中心词是同义词类A和B的中心词在属性词本体词库中上一层的词语;
如果两个同义词类A和B的中心词在属性词本体词库的层次关系上是从属关系,且同义词类A和B内的词语数量都小于设定阈值,则将同义词类A和B合并,合并后新的同义词类的中心词是同义词类A和B的中心词在属性词本体词库的层次关系上位于从属关系上层的中心词。
CN201510138316.1A 2015-03-26 2015-03-26 基于本体词库的商品评论属性词抽取方法 Expired - Fee Related CN104715049B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510138316.1A CN104715049B (zh) 2015-03-26 2015-03-26 基于本体词库的商品评论属性词抽取方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510138316.1A CN104715049B (zh) 2015-03-26 2015-03-26 基于本体词库的商品评论属性词抽取方法

Publications (2)

Publication Number Publication Date
CN104715049A true CN104715049A (zh) 2015-06-17
CN104715049B CN104715049B (zh) 2017-11-28

Family

ID=53414375

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510138316.1A Expired - Fee Related CN104715049B (zh) 2015-03-26 2015-03-26 基于本体词库的商品评论属性词抽取方法

Country Status (1)

Country Link
CN (1) CN104715049B (zh)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017071370A1 (zh) * 2015-10-30 2017-05-04 华为技术有限公司 一种标签处理方法及装置
CN106649260A (zh) * 2016-10-19 2017-05-10 中国计量大学 基于评论文本挖掘的产品特征结构树构建方法
CN108255808A (zh) * 2017-12-29 2018-07-06 东软集团股份有限公司 文本划分的方法、装置和存储介质以及电子设备
CN108304417A (zh) * 2017-01-13 2018-07-20 北京京东尚科信息技术有限公司 信息处理方法和信息处理装置
CN108491373A (zh) * 2018-02-01 2018-09-04 北京百度网讯科技有限公司 一种实体识别方法及系统
CN109189892A (zh) * 2018-09-17 2019-01-11 北京点网聚科技有限公司 一种基于文章评论的推荐方法及装置
CN109492214A (zh) * 2017-09-11 2019-03-19 苏州大学 属性词识别及其层次构建方法、装置、设备及存储介质
CN111507789A (zh) * 2019-01-31 2020-08-07 阿里巴巴集团控股有限公司 商品属性词的确定方法、装置及计算设备
CN111651984A (zh) * 2019-02-19 2020-09-11 北京京东尚科信息技术有限公司 物品描述文本的处理方法、装置和计算机可读存储介质
CN111767391A (zh) * 2020-03-27 2020-10-13 北京沃东天骏信息技术有限公司 目标文本生成方法、装置、计算机系统和介质
CN111881671A (zh) * 2020-09-27 2020-11-03 华南师范大学 一种属性词提取方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7100108B2 (en) * 2001-08-31 2006-08-29 International Business Machines Corporation Software program utility that isolates translatable english text from machine code and merges the text into one file for review purposes
CN101059805A (zh) * 2007-03-29 2007-10-24 复旦大学 基于网络流和分层知识库的动态文本聚类方法
US20100095198A1 (en) * 2008-10-15 2010-04-15 Apple Inc. Shared comments for online document collaboration
CN101968788A (zh) * 2009-07-27 2011-02-09 富士通株式会社 提取商品属性信息的方法和设备
CN103870973A (zh) * 2012-12-13 2014-06-18 阿里巴巴集团控股有限公司 基于电子信息的关键词提取的信息推送、搜索方法及装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7100108B2 (en) * 2001-08-31 2006-08-29 International Business Machines Corporation Software program utility that isolates translatable english text from machine code and merges the text into one file for review purposes
CN101059805A (zh) * 2007-03-29 2007-10-24 复旦大学 基于网络流和分层知识库的动态文本聚类方法
US20100095198A1 (en) * 2008-10-15 2010-04-15 Apple Inc. Shared comments for online document collaboration
CN101968788A (zh) * 2009-07-27 2011-02-09 富士通株式会社 提取商品属性信息的方法和设备
CN103870973A (zh) * 2012-12-13 2014-06-18 阿里巴巴集团控股有限公司 基于电子信息的关键词提取的信息推送、搜索方法及装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
QING ZHU: "Trust Service Discovery by Opinions Classification on Virtual Communities", 《NETWORKS SECURITY WIRELESS COMMUNICATIONS AND TRUSTED COMPUTING (NSWCTC)2010》 *
胡新明等: "在线评论中用户商品属性偏好识别方法研究", 《情报杂志》 *

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017071370A1 (zh) * 2015-10-30 2017-05-04 华为技术有限公司 一种标签处理方法及装置
CN106649260A (zh) * 2016-10-19 2017-05-10 中国计量大学 基于评论文本挖掘的产品特征结构树构建方法
CN106649260B (zh) * 2016-10-19 2022-01-25 中国计量大学 基于评论文本挖掘的产品特征结构树构建方法
CN108304417B (zh) * 2017-01-13 2021-09-17 北京京东尚科信息技术有限公司 信息处理方法和信息处理装置
CN108304417A (zh) * 2017-01-13 2018-07-20 北京京东尚科信息技术有限公司 信息处理方法和信息处理装置
CN109492214B (zh) * 2017-09-11 2023-09-19 苏州大学 属性词识别及其层次构建方法、装置、设备及存储介质
CN109492214A (zh) * 2017-09-11 2019-03-19 苏州大学 属性词识别及其层次构建方法、装置、设备及存储介质
CN108255808A (zh) * 2017-12-29 2018-07-06 东软集团股份有限公司 文本划分的方法、装置和存储介质以及电子设备
CN108255808B (zh) * 2017-12-29 2021-10-22 东软集团股份有限公司 文本划分的方法、装置和存储介质以及电子设备
CN108491373A (zh) * 2018-02-01 2018-09-04 北京百度网讯科技有限公司 一种实体识别方法及系统
CN108491373B (zh) * 2018-02-01 2022-05-27 北京百度网讯科技有限公司 一种实体识别方法及系统
CN109189892A (zh) * 2018-09-17 2019-01-11 北京点网聚科技有限公司 一种基于文章评论的推荐方法及装置
CN111507789A (zh) * 2019-01-31 2020-08-07 阿里巴巴集团控股有限公司 商品属性词的确定方法、装置及计算设备
CN111651984A (zh) * 2019-02-19 2020-09-11 北京京东尚科信息技术有限公司 物品描述文本的处理方法、装置和计算机可读存储介质
CN111767391A (zh) * 2020-03-27 2020-10-13 北京沃东天骏信息技术有限公司 目标文本生成方法、装置、计算机系统和介质
CN111767391B (zh) * 2020-03-27 2024-04-16 北京沃东天骏信息技术有限公司 目标文本生成方法、装置、计算机系统和介质
CN111881671A (zh) * 2020-09-27 2020-11-03 华南师范大学 一种属性词提取方法
CN111881671B (zh) * 2020-09-27 2020-12-29 华南师范大学 一种属性词提取方法

Also Published As

Publication number Publication date
CN104715049B (zh) 2017-11-28

Similar Documents

Publication Publication Date Title
CN104715049A (zh) 基于本体词库的商品评论属性词抽取方法
CN104731923A (zh) 互联网商品评论挖掘本体词库的构建方法
Bafna et al. Feature based summarization of customers’ reviews of online products
CN103049435B (zh) 文本细粒度情感分析方法及装置
CN103455487B (zh) 一种搜索词的提取方法及装置
CN108052593A (zh) 一种基于主题词向量和网络结构的主题关键词提取方法
US9798820B1 (en) Classification of keywords
CN108363725B (zh) 一种用户评论观点提取和观点标签生成的方法
CN103823893A (zh) 一种基于用户评论的产品检索方法及产品检索系统
CN110175325A (zh) 基于词向量和句法特征的评论分析方法及可视化交互界面
CN103853824A (zh) 一种基于深度语义挖掘的内文广告发布方法与系统
CN103838789A (zh) 一种文本相似度计算方法
CN102033880A (zh) 基于结构化数据集合的标注方法和装置
CN104268230B (zh) 一种基于异质图随机游走的中文微博客观点探测方法
CN105824898A (zh) 一种网络评论的标签提取方法和装置
CN107357793A (zh) 信息推荐方法和装置
Claster et al. Naïve Bayes and unsupervised artificial neural nets for Cancun tourism social media data analysis
CN108319734A (zh) 一种基于线性组合器的产品特征结构树自动构建方法
CN106033415A (zh) 文本内容推荐方法及装置
Garg et al. The structure of word co-occurrence network for microblogs
Ramalingam et al. Emotion detection from text
CN103150667A (zh) 一种基于本体结构的个性化推荐方法
CN105468649A (zh) 一种待展示对象匹配的判断方法及其装置
Chen et al. Personalized recommendation model: an online comment sentiment based analysis
Li et al. Improved new word detection method used in tourism field

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20171128

Termination date: 20210326