CN105824915A - 一种网购产品评论文摘生成方法及系统 - Google Patents

一种网购产品评论文摘生成方法及系统 Download PDF

Info

Publication number
CN105824915A
CN105824915A CN201610149461.4A CN201610149461A CN105824915A CN 105824915 A CN105824915 A CN 105824915A CN 201610149461 A CN201610149461 A CN 201610149461A CN 105824915 A CN105824915 A CN 105824915A
Authority
CN
China
Prior art keywords
comment
sentence
digest
similarity
comment sentence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610149461.4A
Other languages
English (en)
Inventor
袁文涛
董启文
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SHANGHAI TRUELAND INFORMATION TECHNOLOGY Co Ltd
Original Assignee
SHANGHAI TRUELAND INFORMATION TECHNOLOGY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SHANGHAI TRUELAND INFORMATION TECHNOLOGY Co Ltd filed Critical SHANGHAI TRUELAND INFORMATION TECHNOLOGY Co Ltd
Priority to CN201610149461.4A priority Critical patent/CN105824915A/zh
Publication of CN105824915A publication Critical patent/CN105824915A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/34Browsing; Visualisation therefor
    • G06F16/345Summarisation for human users

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请公开了一种网购产品评论文摘生成方法及系统,该方法包括:获取用户输入的搜索关键词;利用搜索关键词,对产品评论数据库进行检索,得到相应的评论句子集;按照句子重要度从大到小的顺序,对评论句子集中的评论句子进行依次选中,并且若当前选中的评论句子符合预设筛选原则,则将该评论句子添加到评论文摘,直到评论文摘中所有评论句子的总长度达到预设长度要求;其中,预设筛选原则为,若当前选中的评论句子与已添加到评论文摘的所有评论句子之间的相似度均未大于预设相似度阈值,则判定当前选中的评论句子符合预设筛选原则。本申请能够得到一份冗余度低、全面并且篇幅较短的评论文摘,由此确保了消费者可对产品信息进行快速全面地了解。

Description

一种网购产品评论文摘生成方法及系统
技术领域
本发明涉及电子商务技术领域,特别涉及一种网购产品评论文摘生成方法及系统。
背景技术
当前,随着电子商务的快速发展,人们越来越关注商品的优劣问题,网上用户评论这一功能应运而生,如亚马逊、淘宝、京东商城等都开放用户评论。接着,评论类的网站也相继问世,如大众点评网、口碑网、豆瓣网等。这些都是新型的电子商务服务类网站,贴合消费者的需求,为消费者提供了消息的参考和借鉴。
由此,互联网产生了大量的用户生成数据。对于流行的产品,评论数成千上万,人们不得不花费很多的精力从中寻找有用的信息。在这成千上万的对于同一产品的评价中,多数评价不仅含有重复的信息,而且含有不相关的无用信息。面对如此多的众说纷纭、信息繁杂的产品评论,人们阅读起来费时费力。
综上所述可以看出,如何确保消费者能够从众多产品评论中对产品信息进行快速全面地了解是目前亟待解决的问题。
发明内容
有鉴于此,本发明的目的在于提供一种网购产品评论文摘生成方法及系统,确保了消费者能够从众多产品评论中对产品信息进行快速全面地了解。其具体方案如下:
一种网购产品评论文摘生成方法,包括:
获取用户输入的搜索关键词;利用所述搜索关键词,对产品评论数据库进行检索,得到相应的评论句子集;
按照句子重要度从大到小的顺序,对所述评论句子集中的评论句子进行依次选中,并且若当前选中的评论句子符合预设筛选原则,则将该评论句子添加到评论文摘,直到评论文摘中所有评论句子的总长度达到预设长度要求;
其中,所述预设筛选原则为,若当前选中的评论句子与已添加到评论文摘的所有评论句子之间的相似度均未大于预设相似度阈值,则判定当前选中的评论句子符合所述预设筛选原则。
优选的,所述若当前选中的评论句子符合预设筛选原则,则将该评论句子添加到评论文摘的过程,包括:
基于最大边缘相关算法,计算当前选中的评论句子与当前已添加到评论文摘中的每一评论句子之间的相似度;
若计算得到的所有相似度均未大于所述预设相似度阈值,则将当前选中的评论句子添加到评论文摘。
优选的,所述基于最大边缘相关算法,计算当前选中的评论句子与当前已添加到评论文摘中的每一评论句子之间的相似度的过程,包括:
将基于翻译概率确定的相似度优化项添加到所述最大边缘相关算法,以对所述最大边缘相关算法进行优化,得到优化后的最大边缘相关算法;
利用所述优化后的最大边缘相关算法,计算当前选中的评论句子与当前已添加到评论文摘中的每一评论句子之间的相似度;
其中,基于翻译概率确定的相似度优化项用于计算任意两段评论句子之间的翻译概率,并且任意两段句子之间的翻译概率与该两段句子之间的相似度成正相关关系。
优选的,所述计算任意两段评论句子之间的翻译概率的过程,包括:
计算该两段评论句子中后一段评论句子的产品属性词与前一段评论句子的用户观点词之间的修饰程度,或者,计算后一段评论句子的用户观点词与前一段评论句子的产品属性词之间的修饰程度;
其中,修饰程度用于表征任意产品属性词与用户观点词之间存在修饰关系的可能性大小。
优选的,所述方法,还包括:
在对所述评论句子集中的评论句子进行选中之前,采用支持向量机回归模型和三组结构特征,对所述评论句子集中每一评论句子的重要度进行预测;其中,所述三组结构特征包括评论句子的长度特征、评论句子的词频-逆文档频率特征以及消费者对评论句子的认可度。
本发明还公开了一种网购产品评论文摘生成系统,包括:
关键词获取模块,用于获取用户输入的搜索关键词;
检索模块,用于利用所述搜索关键词,对产品评论数据库进行检索,得到相应的评论句子集;
文摘生成模块,用于按照句子重要度从大到小的顺序,对所述评论句子集中的评论句子进行依次选中,并且若当前选中的评论句子符合预设筛选原则,则将该评论句子添加到评论文摘,直到评论文摘中所有评论句子的总长度达到预设长度要求;
其中,所述预设筛选原则为,若当前选中的评论句子与已添加到评论文摘的所有评论句子之间的相似度均未大于预设相似度阈值,则判定当前选中的评论句子符合所述预设筛选原则。
优选的,所述文摘生成模块包括:
句子选取器,用于按照句子重要度从大到小的顺序,对所述评论句子集中的评论句子进行依次选中;
相似度计算器,用于基于最大边缘相关算法,计算当前选中的评论句子与当前已添加到评论文摘中的每一评论句子之间的相似度;
文摘生成器,用于当所述相似度计算器计算得到的所有相似度均未大于所述预设相似度阈值,则将当前选中的评论句子添加到评论文摘。
优选的,所述相似度计算器包括:
算法优化单元,用于将基于翻译概率确定的相似度优化项添加到所述最大边缘相关算法,以对所述最大边缘相关算法进行优化,得到优化后的最大边缘相关算法;
相似度计算单元,用于利用所述优化后的最大边缘相关算法,计算当前选中的评论句子与当前已添加到评论文摘中的每一评论句子之间的相似度;
其中,基于翻译概率确定的相似度优化项用于计算任意两段评论句子之间的翻译概率,并且任意两段句子之间的翻译概率与该两段句子之间的相似度成正相关关系。
优选的,所述系统,还包括:
重要度预测模块,用于在对所述评论句子集中的评论句子进行选中之前,采用支持向量机回归模型和三组结构特征,对所述评论句子集中每一评论句子的重要度进行预测;其中,所述三组结构特征包括评论句子的长度特征、评论句子的词频-逆文档频率特征以及消费者对评论句子的认可度。
本发明中,网购产品评论文摘生成方法,包括获取用户输入的搜索关键词;利用搜索关键词,对产品评论数据库进行检索,得到相应的评论句子集;按照句子重要度从大到小的顺序,对评论句子集中的评论句子进行依次选中,并且若当前选中的评论句子符合预设筛选原则,则将该评论句子添加到评论文摘,直到评论文摘中所有评论句子的总长度达到预设长度要求;其中,预设筛选原则为,若当前选中的评论句子与已添加到评论文摘的所有评论句子之间的相似度均未大于预设相似度阈值,则判定当前选中的评论句子符合预设筛选原则。可见,本发明先利用搜索关键词,从产品评论数据库中检索出相应的评论句子,然后基于重要度的大小顺序以及预设筛选原则,从检索到的所有评论句子中筛选出重要的并且冗余度较低的评论句子,接着将这些筛选出的评论句子添加到评论文摘,从而得到一份冗余度低、全面并且篇幅较短的评论文摘,由此确保了消费者能够利用这份评论文摘,在众多产品评论中对产品信息进行快速全面地了解。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本发明实施例公开的一种网购产品评论文摘生成方法流程图;
图2为本发明实施例公开的一种网购产品评论文摘生成系统结构示意图;
图3为本发明实施例公开的一种具体的网购产品评论文摘生成系统结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例公开了一种网购产品评论文摘生成方法,参见图1所示,该方法包括:
步骤S11:获取用户输入的搜索关键词。
可以理解的是,本发明实施例可以在网购产品的评论界面上设置搜索框,利用该搜索框获取用户输入的搜索关键词,也可以在评论界面上设置多个与该网购产品的特性相关的词语或短句,然后将用户选中的某些词语或短句作为搜索关键词。其中,上述搜索关键词可以是一个或多个独立的词,也可以是一小段的查询语句。
步骤S12:利用搜索关键词,对产品评论数据库进行检索,得到相应的评论句子集。
其中,上述产品评论数据库是指消费者针对同一种网购产品发布的产品评论。
步骤S13:按照句子重要度从大到小的顺序,对评论句子集中的评论句子进行依次选中,并且若当前选中的评论句子符合预设筛选原则,则将该评论句子添加到评论文摘,直到评论文摘中所有评论句子的总长度达到预设长度要求;
其中,预设筛选原则为,若当前选中的评论句子与已添加到评论文摘的所有评论句子之间的相似度均未大于预设相似度阈值,则判定当前选中的评论句子符合预设筛选原则。
另外,上述预设长度要求通常是指文摘字数的要求,在得到最终的评论文摘后,需对该评论文摘进行输出,以便用户查看。
需要说明的是,两个句子之间的相似度越高,说明这两个句子之间所表达的意思较为相近,为了减少评论文摘最终的冗余度,本发明实施例将两个较为相似的句子中重要度较高的一个句子添加到评论文摘,从而一方面确保了评论文摘的信息更加准确有效,另一方面确保了评论文摘更加精简。
本发明实施例中,在对评论句子集中的评论句子进行选中之前,采用支持向量机回归模型和三组结构特征,对评论句子集中每一评论句子的重要度进行预测;其中,三组结构特征包括评论句子的长度特征、评论句子的词频-逆文档频率特征以及消费者对评论句子的认可度。其中,优选的,可在用户输入搜索关键词之前,便利用系统空闲时间对评论数据库中已有的评论句子进行重要度预测。
可见,本发明实施例先利用搜索关键词,从产品评论数据库中检索出相应的评论句子,然后基于重要度的大小顺序以及预设筛选原则,从检索到的所有评论句子中筛选出重要的并且冗余度较低的评论句子,接着将这些筛选出的评论句子添加到评论文摘,从而得到一份冗余度低、全面并且篇幅较短的评论文摘,由此确保了消费者能够利用这份评论文摘,在众多产品评论中对产品信息进行快速全面地了解。
本发明实施例公开了一种具体的网购产品评论文摘生成方法,相对于上一实施例,本实施例对技术方案作了进一步的说明和优化。具体的:
在上一实施例步骤S13中,若当前选中的评论句子符合预设筛选原则,则将该评论句子添加到评论文摘的过程,包括:
步骤S131:基于最大边缘相关算法(即MaximalMarginalRelevance),计算当前选中的评论句子与当前已添加到评论文摘中的每一评论句子之间的相似度;
步骤S132:若计算得到的所有相似度均未大于预设相似度阈值,则将当前选中的评论句子添加到评论文摘。
在上述步骤S131中,基于最大边缘相关算法,计算当前选中的评论句子与当前已添加到评论文摘中的每一评论句子之间的相似度的过程,包括:
步骤S1311:将基于翻译概率确定的相似度优化项添加到最大边缘相关算法,以对最大边缘相关算法进行优化,得到优化后的最大边缘相关算法;
步骤S1312:利用优化后的最大边缘相关算法,计算当前选中的评论句子与当前已添加到评论文摘中的每一评论句子之间的相似度;
其中,基于翻译概率确定的相似度优化项用于计算任意两段评论句子之间的翻译概率,并且任意两段句子之间的翻译概率与该两段句子之间的相似度成正相关关系。
需要说明的是,上述所谓的翻译概率是指两个句子中的词语之间的修饰程度。
另外,计算任意两段评论句子之间的翻译概率的过程,具体包括:计算该两段评论句子中后一段评论句子的产品属性词与前一段评论句子的用户观点词之间的修饰程度,或者,计算后一段评论句子的用户观点词与前一段评论句子的产品属性词之间的修饰程度;
其中,修饰程度用于表征任意产品属性词与用户观点词之间存在修饰关系的可能性大小。例如,假设great和batterylife的翻译概率为0.00950836,当前选中的评论句子是“Thebatterylifeisimpressive”,已添加到评论文摘的评论句子为“Anothergreatthingwasthebatterylife”,由于前一句中的batterylife和后一句中的great存在0.00950836的翻译概率,即这两个词之间存在一定的修饰关系,就加大这两个句子的相似度。
本发明实施例还公开了一种网购产品评论文摘生成系统,参见图2所示,该系统包括:
关键词获取模块21,用于获取用户输入的搜索关键词;
检索模块22,用于利用搜索关键词,对产品评论数据库进行检索,得到相应的评论句子集;
文摘生成模块23,用于按照句子重要度从大到小的顺序,对评论句子集中的评论句子进行依次选中,并且若当前选中的评论句子符合预设筛选原则,则将该评论句子添加到评论文摘,直到评论文摘中所有评论句子的总长度达到预设长度要求;
其中,预设筛选原则为,若当前选中的评论句子与已添加到评论文摘的所有评论句子之间的相似度均未大于预设相似度阈值,则判定当前选中的评论句子符合预设筛选原则。
参见图3所示,上述文摘生成模块23具体包括句子选取器231、相似度计算器232和文摘生成器233;其中,
句子选取器231,用于按照句子重要度从大到小的顺序,对评论句子集中的评论句子进行依次选中;
相似度计算器232,用于基于最大边缘相关算法,计算当前选中的评论句子与当前已添加到评论文摘中的每一评论句子之间的相似度;
文摘生成器233,用于当相似度计算器232计算得到的所有相似度均未大于预设相似度阈值,则将当前选中的评论句子添加到评论文摘。
进一步的,上述相似度计算器232具体包括算法优化单元2321和相似度计算单元2322;其中,
算法优化单元2321,用于将基于翻译概率确定的相似度优化项添加到最大边缘相关算法,以对最大边缘相关算法进行优化,得到优化后的最大边缘相关算法;
相似度计算单元2322,用于利用优化后的最大边缘相关算法,计算当前选中的评论句子与当前已添加到评论文摘中的每一评论句子之间的相似度;
其中,基于翻译概率确定的相似度优化项用于计算任意两段评论句子之间的翻译概率,并且任意两段句子之间的翻译概率与该两段句子之间的相似度成正相关关系。
另外,上述计算任意两段评论句子之间的翻译概率的过程具体为:计算该两段评论句子中后一段评论句子的产品属性词与前一段评论句子的用户观点词之间的修饰程度,或者,计算后一段评论句子的用户观点词与前一段评论句子的产品属性词之间的修饰程度;其中,修饰程度用于表征任意产品属性词与用户观点词之间存在修饰关系的可能性大小。
本发明实施例中的系统,还可以进一步包括:
重要度预测模块,用于在对评论句子集中的评论句子进行选中之前,采用支持向量机回归模型和三组结构特征,对评论句子集中每一评论句子的重要度进行预测;其中,三组结构特征包括评论句子的长度特征、评论句子的词频-逆文档频率特征以及消费者对评论句子的认可度。
可见,本发明实施例先利用搜索关键词,从产品评论数据库中检索出相应的评论句子,然后基于重要度的大小顺序以及预设筛选原则,从检索到的所有评论句子中筛选出重要的并且冗余度较低的评论句子,接着将这些筛选出的评论句子添加到评论文摘,从而得到一份冗余度低、全面并且篇幅较短的评论文摘,由此确保了消费者能够利用这份评论文摘,在众多产品评论中对产品信息进行快速全面地了解。
最后,还需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上对本发明所提供的一种网购产品评论文摘生成方法及系统进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (9)

1.一种网购产品评论文摘生成方法,其特征在于,包括:
获取用户输入的搜索关键词;利用所述搜索关键词,对产品评论数据库进行检索,得到相应的评论句子集;
按照句子重要度从大到小的顺序,对所述评论句子集中的评论句子进行依次选中,并且若当前选中的评论句子符合预设筛选原则,则将该评论句子添加到评论文摘,直到评论文摘中所有评论句子的总长度达到预设长度要求;
其中,所述预设筛选原则为,若当前选中的评论句子与已添加到评论文摘的所有评论句子之间的相似度均未大于预设相似度阈值,则判定当前选中的评论句子符合所述预设筛选原则。
2.根据权利要求1所述的网购产品评论文摘生成方法,其特征在于,所述若当前选中的评论句子符合预设筛选原则,则将该评论句子添加到评论文摘的过程,包括:
基于最大边缘相关算法,计算当前选中的评论句子与当前已添加到评论文摘中的每一评论句子之间的相似度;
若计算得到的所有相似度均未大于所述预设相似度阈值,则将当前选中的评论句子添加到评论文摘。
3.根据权利要求2所述的网购产品评论文摘生成方法,其特征在于,所述基于最大边缘相关算法,计算当前选中的评论句子与当前已添加到评论文摘中的每一评论句子之间的相似度的过程,包括:
将基于翻译概率确定的相似度优化项添加到所述最大边缘相关算法,以对所述最大边缘相关算法进行优化,得到优化后的最大边缘相关算法;
利用所述优化后的最大边缘相关算法,计算当前选中的评论句子与当前已添加到评论文摘中的每一评论句子之间的相似度;
其中,基于翻译概率确定的相似度优化项用于计算任意两段评论句子之间的翻译概率,并且任意两段句子之间的翻译概率与该两段句子之间的相似度成正相关关系。
4.根据权利要求3所述的网购产品评论文摘生成方法,其特征在于,所述计算任意两段评论句子之间的翻译概率的过程,包括:
计算该两段评论句子中后一段评论句子的产品属性词与前一段评论句子的用户观点词之间的修饰程度,或者,计算后一段评论句子的用户观点词与前一段评论句子的产品属性词之间的修饰程度;
其中,修饰程度用于表征任意产品属性词与用户观点词之间存在修饰关系的可能性大小。
5.根据权利要求1至4任一项所述的网购产品评论文摘生成方法,其特征在于,还包括:
在对所述评论句子集中的评论句子进行选中之前,采用支持向量机回归模型和三组结构特征,对所述评论句子集中每一评论句子的重要度进行预测;其中,所述三组结构特征包括评论句子的长度特征、评论句子的词频-逆文档频率特征以及消费者对评论句子的认可度。
6.一种网购产品评论文摘生成系统,其特征在于,包括:
关键词获取模块,用于获取用户输入的搜索关键词;
检索模块,用于利用所述搜索关键词,对产品评论数据库进行检索,得到相应的评论句子集;
文摘生成模块,用于按照句子重要度从大到小的顺序,对所述评论句子集中的评论句子进行依次选中,并且若当前选中的评论句子符合预设筛选原则,则将该评论句子添加到评论文摘,直到评论文摘中所有评论句子的总长度达到预设长度要求;
其中,所述预设筛选原则为,若当前选中的评论句子与已添加到评论文摘的所有评论句子之间的相似度均未大于预设相似度阈值,则判定当前选中的评论句子符合所述预设筛选原则。
7.根据权利要求6所述的网购产品评论文摘生成系统,其特征在于,所述文摘生成模块包括:
句子选取器,用于按照句子重要度从大到小的顺序,对所述评论句子集中的评论句子进行依次选中;
相似度计算器,用于基于最大边缘相关算法,计算当前选中的评论句子与当前已添加到评论文摘中的每一评论句子之间的相似度;
文摘生成器,用于当所述相似度计算器计算得到的所有相似度均未大于所述预设相似度阈值,则将当前选中的评论句子添加到评论文摘。
8.根据权利要求7所述的网购产品评论文摘生成系统,其特征在于,所述相似度计算器包括:
算法优化单元,用于将基于翻译概率确定的相似度优化项添加到所述最大边缘相关算法,以对所述最大边缘相关算法进行优化,得到优化后的最大边缘相关算法;
相似度计算单元,用于利用所述优化后的最大边缘相关算法,计算当前选中的评论句子与当前已添加到评论文摘中的每一评论句子之间的相似度;
其中,基于翻译概率确定的相似度优化项用于计算任意两段评论句子之间的翻译概率,并且任意两段句子之间的翻译概率与该两段句子之间的相似度成正相关关系。
9.根据权利要求6至8任一项所述的网购产品评论文摘生成系统,其特征在于,还包括:
重要度预测模块,用于在对所述评论句子集中的评论句子进行选中之前,采用支持向量机回归模型和三组结构特征,对所述评论句子集中每一评论句子的重要度进行预测;其中,所述三组结构特征包括评论句子的长度特征、评论句子的词频-逆文档频率特征以及消费者对评论句子的认可度。
CN201610149461.4A 2016-03-16 2016-03-16 一种网购产品评论文摘生成方法及系统 Pending CN105824915A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610149461.4A CN105824915A (zh) 2016-03-16 2016-03-16 一种网购产品评论文摘生成方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610149461.4A CN105824915A (zh) 2016-03-16 2016-03-16 一种网购产品评论文摘生成方法及系统

Publications (1)

Publication Number Publication Date
CN105824915A true CN105824915A (zh) 2016-08-03

Family

ID=56988084

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610149461.4A Pending CN105824915A (zh) 2016-03-16 2016-03-16 一种网购产品评论文摘生成方法及系统

Country Status (1)

Country Link
CN (1) CN105824915A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110597978A (zh) * 2018-06-12 2019-12-20 北京京东尚科信息技术有限公司 物品摘要生成方法、系统、电子设备及可读存储介质
CN110704605A (zh) * 2018-06-25 2020-01-17 北京京东尚科信息技术有限公司 物品摘要自动生成方法、系统、设备及可读存储介质
CN110764726A (zh) * 2019-10-18 2020-02-07 网易(杭州)网络有限公司 目标对象的确定方法及装置、终端设备、存储介质
CN114330251A (zh) * 2022-03-04 2022-04-12 阿里巴巴达摩院(杭州)科技有限公司 文本生成方法、模型的训练方法、设备及存储介质
CN110704605B (zh) * 2018-06-25 2024-07-16 北京京东尚科信息技术有限公司 物品摘要自动生成方法、系统、设备及可读存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1185799A (ja) * 1997-09-05 1999-03-30 Nec Corp 特許抄本作成自動作成方式
CN101231634A (zh) * 2007-12-29 2008-07-30 中国科学院计算技术研究所 一种多文档自动文摘方法
CN102222119A (zh) * 2011-07-28 2011-10-19 成都希创掌中科技有限公司 数字图书系统中的个性化自动文摘方法
CN102411621A (zh) * 2011-11-22 2012-04-11 华中师范大学 一种基于云模型的中文面向查询的多文档自动文摘方法
CN102855263A (zh) * 2011-06-30 2013-01-02 富士通株式会社 一种对双语语料库进行句子对齐的方法及装置
CN104331449A (zh) * 2014-10-29 2015-02-04 百度在线网络技术(北京)有限公司 查询语句与网页相似度的确定方法、装置、终端及服务器

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1185799A (ja) * 1997-09-05 1999-03-30 Nec Corp 特許抄本作成自動作成方式
CN101231634A (zh) * 2007-12-29 2008-07-30 中国科学院计算技术研究所 一种多文档自动文摘方法
CN102855263A (zh) * 2011-06-30 2013-01-02 富士通株式会社 一种对双语语料库进行句子对齐的方法及装置
CN102222119A (zh) * 2011-07-28 2011-10-19 成都希创掌中科技有限公司 数字图书系统中的个性化自动文摘方法
CN102411621A (zh) * 2011-11-22 2012-04-11 华中师范大学 一种基于云模型的中文面向查询的多文档自动文摘方法
CN104331449A (zh) * 2014-10-29 2015-02-04 百度在线网络技术(北京)有限公司 查询语句与网页相似度的确定方法、装置、终端及服务器

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
安迪: "基于名实体的自动综述系统研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110597978A (zh) * 2018-06-12 2019-12-20 北京京东尚科信息技术有限公司 物品摘要生成方法、系统、电子设备及可读存储介质
CN110597978B (zh) * 2018-06-12 2023-12-08 北京京东尚科信息技术有限公司 物品摘要生成方法、系统、电子设备及可读存储介质
CN110704605A (zh) * 2018-06-25 2020-01-17 北京京东尚科信息技术有限公司 物品摘要自动生成方法、系统、设备及可读存储介质
CN110704605B (zh) * 2018-06-25 2024-07-16 北京京东尚科信息技术有限公司 物品摘要自动生成方法、系统、设备及可读存储介质
CN110764726A (zh) * 2019-10-18 2020-02-07 网易(杭州)网络有限公司 目标对象的确定方法及装置、终端设备、存储介质
CN110764726B (zh) * 2019-10-18 2023-08-22 网易(杭州)网络有限公司 目标对象的确定方法及装置、终端设备、存储介质
CN114330251A (zh) * 2022-03-04 2022-04-12 阿里巴巴达摩院(杭州)科技有限公司 文本生成方法、模型的训练方法、设备及存储介质
CN114330251B (zh) * 2022-03-04 2022-07-19 阿里巴巴达摩院(杭州)科技有限公司 文本生成方法、模型的训练方法、设备及存储介质

Similar Documents

Publication Publication Date Title
US20180189292A1 (en) Optimizing search result snippet selection
US8239387B2 (en) Structural clustering and template identification for electronic documents
US9798820B1 (en) Classification of keywords
Wang et al. Product weakness finder: an opinion-aware system through sentiment analysis
CN105243087B (zh) It资讯聚合阅读个性化推荐方法
US10002371B1 (en) System, method, and computer program product for searching summaries of online reviews of products
CN102200975B (zh) 一种利用语义分析的垂直搜索引擎系统
US20090271391A1 (en) Method and apparatus for rating user generated content in seach results
WO2013009613A1 (en) Systems and methods for natural language searching of structured data
CN103310343A (zh) 商品信息发布方法和装置
CN103870973A (zh) 基于电子信息的关键词提取的信息推送、搜索方法及装置
CN102033877A (zh) 检索方法和装置
CN108763321A (zh) 一种基于大规模相关实体网络的相关实体推荐方法
CN105243149B (zh) 一种基于语义的查询推荐方法和系统
CN103577490A (zh) 一种网页浏览历史展现方法及装置
US9569525B2 (en) Techniques for entity-level technology recommendation
CN105468790B (zh) 一种评论信息检索方法和装置
CN102722498A (zh) 搜索引擎及其实现方法
US11249993B2 (en) Answer facts from structured content
CN103177036A (zh) 一种标签自动提取方法和系统
CN104834736A (zh) 构建索引库的方法、装置及检索的方法、装置和系统
WO2015084757A1 (en) Systems and methods for processing data stored in a database
CN105824915A (zh) 一种网购产品评论文摘生成方法及系统
CN101561818B (zh) 分词处理方法及全文检索方法
Mahadevan et al. Review rating prediction using combined latent topics and associated sentiments: an empirical review

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20160803