CN110188339A

CN110188339A - 景点评价方法、装置、计算机设备和存储介质

Info

Publication number: CN110188339A
Application number: CN201810155433.2A
Authority: CN
Inventors: 范玉顺; 张峻旗; 梅晓文
Original assignee: Tsinghua University
Current assignee: Tsinghua University
Priority date: 2018-02-23
Filing date: 2018-02-23
Publication date: 2019-08-30
Anticipated expiration: 2038-02-23
Also published as: CN110188339B

Abstract

本申请涉及一种景点评价方法、装置、计算机设备和存储介质。所述方法包括：获取每个文本对应的情感评分集合；根据预先设置的景点列表获取每个文本对应的景点集合；根据所述情感评分集合以及所述景点集合，计算景点列表中各个景点对应的情感分数；统计各个景点对应的景点频次，并根据各个景点频次获得各个景点对应的景点热度信息，所述景点频次用于表征所述景点在所有文本中出现的次数；根据各个景点对应的景点热度信息以及所述情感分数得到各个景点的评价。采用本方法能够提升用户在海量文本数据中获取景点有意义评价的效率。

Description

景点评价方法、装置、计算机设备和存储介质

技术领域

本申请涉及计算机技术领域，特别是涉及一种景点评价方法、装置、计算机设备和存储介质。

背景技术

随着互联网技术的发展，越来越多的景点信息出现在网络上，而人们也乐于以游记的形式分享他们的旅行经历，因此，与旅游相关的数据，特别是与旅游相关的文本呈现出爆炸性的增长。

然而，因为数据太多，用户如果想在海量的文本数据中获得某个景点有意义的评价，效率十分低下。

发明内容

基于此，有必要针对目前在海量文本数据中对景点评价方法效率低问题，提供一种能够提高效率的景点评价方法、装置、计算机设备和存储介质。

一种景点评价方法，所述方法包括：

获取每个文本对应的情感评分集合；

根据预先设置的景点列表获取每个文本对应的景点集合；

根据所述情感评分集合以及所述景点集合，计算景点列表中各个景点对应的情感分数；

统计各个景点对应的景点频次，并根据各个景点频次获得各个景点对应的景点热度信息，所述景点频次用于表征所述景点在所有文本中出现的次数；

根据各个景点对应的景点热度信息以及所述情感分数得到各个景点的评价。

在其中一个实施例中，所述获取每个文本对应的情感评分集合的步骤包括：

根据预设的切分阈值和/或预设的切分符，切分所述文本，获得文本对应的多个片段；

对所述多个片段中的每一个片段进行情感分析，获得各个所述片段对应的情感值；

将各个所述片段对应的情感值，通过预先设置的第一映射关系，获得所述片段的情感评分；

根据文本中每个片段的情感评分，得到所述文本对应的情感评分集合。

在其中一个实施例中，所述根据预先设置的景点列表获取每个文本对应的景点集合的步骤包括：

根据预先设置的全局景点，构建初始景点集合；

依次获取所述景点列表中的景点名称，并将所述景点名称在所述文本中逐一进行匹配；

若匹配成功，则根据与所述文本匹配的景点名称更新初始景点集合，直至所述景点列表中所有的景点名称均完成匹配，则获得所述景点集合。

在其中一个实施例中，所述根据所述情感评分集合以及所述景点集合，计算各个景点对应的情感分数的步骤包括：

根据作者主题模型，将所述景点集合作为作者集合，将所述文本作为文档，以所述情感评分集合作为词袋，获得所述景点集合中各个景点的景点主题向量以及主题分数向量；

根据所述景点主题向量以及主题分数向量，获得景点分数概率分布；

根据景点分数概率分布，计算获得各个景点对应的情感分数。

在其中一个实施例中，所述根据所述景点主题向量以及主题分数向量，获得景点分数概率分布的步骤包括：

根据所述景点主题向量以及主题分数向量，通过全概率公式，计算获得景点分数概率分布。

在其中一个实施例中，所述统计所有文本中各个景点频次，并根据所述景点频次获得所述景点对应的景点热度信息的步骤包括：

根据预先设置的调节系数，设置对数压缩系数；

以所述调节系数与所述景点出现次数的和值为真数，以对数压缩系数为底数，通过对数函数获得所述景点对应的景点热度信息。

在其中一个实施例中，所述根据所述景点对应的景点热度信息以及所述情感分数对所述景点进行评价的步骤包括：

根据景点热度信息以及所述情感分数获得所述景点对应的综合分数；

根据景点对应的综合分数，通过预先设置的第二映射关系，获得所述景点的评分，所述景点的评分用于对所述景点进行评价。

一种景点评价装置，所述装置包括：

集合获取模块，用于获取每个文本对应的情感评分集合以及景点集合；

情感分数计算模块，用于根据所述情感评分集合以及所述景点集合，计算各个景点对应的情感分数；

热度信息获得模块，用于统计所有文本中各个景点频次，并根据所述景点频次获得所述景点对应的景点热度信息，所述景点频次用于表征所述景点在所有文本中出现的次数；

景点评价模块，用于根据各个景点对应的景点热度信息以及所述情感分数得到各个景点的评价。

一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现以下步骤：

获取每个文本对应的情感评分集合；

根据预先设置的景点列表获取每个文本对应的景点集合；

一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现以下步骤：

获取每个文本对应的情感评分集合；

根据预先设置的景点列表获取每个文本对应的景点集合；

上述景点评价方法、装置、计算机设备和存储介质，通过在游记文本中获得各个景点的情感分数以及景点热度信息，根据景点热度信息以及情感分数对景点进行评价，可以利用海量的文本，通过计算机无监督的对景点进行评价，能够提升基于文本数据对景点进行评价的效率。

附图说明

图1为一个实施例中景点评价方法的应用环境图；

图2为一个实施例中景点评价方法的流程示意图；

图3为图2所示实施例中S210步骤的流程示意图；

图4为一个实施例中情感分析API的应用示意图；

图5为一个实施例提供的第一映射关系示意图；

图6为图2所示实施例中S220步骤的流程示意图；

图7为图2所示实施例中S240步骤的流程示意图；

图8为一个实施例中基于作者主题模型的概率图模型示意图；

图9为图2所示实施例中S260步骤的流程示意图；

图10为图2所示实施例中S280步骤的流程示意图；

图11为一个实施例中景点评价装置的结构框图；

图12为另一个实施例中景点评价装置的结构框图；

图13为又一个实施例中景点评价装置的结构框图；

图14为一个实施例中计算机设备的内部结构图；

图15为另一个实施例中计算机设备的内部结构图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本申请进行进一步详细说明。应当理解，此处描述的具体实施例仅仅用以解释本申请，并不用于限定本申请。

本申请提供的景点评价方法，可以应用于终端设备中，也可以应用于由终端设备以及云端网络组成的系统中。可选的，可以应用于如图1所示的应用环境中。其中，终端102通过网络与服务器104通过网络进行通信。终端102在服务器104中获取大量的文本数据，并获得每个文本对应的情感评分集合以及景点集合，根据所有文本对应的情感评分集合以及景点集合，计算获得各个景点对应的情感分数，统计所有文本中的各个景点出现的次数获得景点热度信息，并最终根据景点对应的景点热度信息以及情感分数对该景点进行评价。其中，终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备，服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。可选的，该无线网络可以是2G网络、3G网络、4G网络或者5G网络、无线保真(WirelessFidelity，简称WIFI)网络等。需要说明的是，该景点评价方法所涉及的文本可以存储在终端102中，也可以存储在服务器104中，还可以一部分存储在终端102中另一部分存储在服务器104中，也就是说，本实施例对文本存储的具体位置并不做限定。

可以理解，本申请各个实施方式所涉及的方法，其执行主体可以是景点评价装置，该装置可以是通过软件、硬件或者软件硬件相结合的方式实现。该装置可以是终端的部分或全部，该装置也可以集成在云端服务器中，由终端设备在使用时进行调用。为了描述方便，下述方法实施例中的执行主体均以终端为例。

在一个实施例中，如图2所示，提供了一种景点评价方法，包括以下步骤：

步骤S210，获取每个文本对应的情感评分集合。

具体地，所述文本是指多个记载景点信息的文字信息，包括并不限于游客各种在线旅游平台中发布的游记，以及在微信、微博等信息平台中的文字信息。

情感分数用来表征对某段文字的情感倾向，情感倾向可以是指主体对客体主观存在的内心喜恶，通常包括积极、消极以及中性几种类别。也就是说，情感分数可以用来表征当作者通过某段文字描述事物时所表达的情感倾向。例如，“我爱天安门”这段文字所表达出的情感倾向是积极的。而“环境脏乱差”这段文字所表达出的情感倾向则是消极的。

情感分数可以是连续的浮点型数值，情感分数还可以是离散的整型数值。可以理解，对于一个文本来说，可以作为整个一段文字获得一个情感分数，也可以被切分为数段文字，其中每段文字都具有一个对应的情感分数。

步骤S220，根据预先设置的景点列表获取每个文本对应的景点集合；

具体的，基于百度百科词条、景点介绍、微博平台等先验知识，确定景点名称，假设共有J个不同的景点名称，则构建一个由1到J的整数集合，并建立起由J个不同的景点名称到整数集合的映射，使一个整数对应一个景点名称，从而获得景点列表SL。

进一步的，所述景点名称可以包括别名、简化名等，即相同景点无论使用别名、简化名还是正式名均为一个景点名称，映射一个整数。例如，将景点“首都博物馆”、“首博”均可以映射为整数1，而将将景点“故宫博物院”、“故宫”均可以映射为整数2。

根据景点列表SL，在文本中，获取其中涉及到的所有景点列表SL中的景点名称，组成景点集合。

步骤S230，根据所述情感评分集合以及所述景点集合，计算各个景点对应的情感分数。

具体的，根据情感评分集合以及景点集合，就可以获得景点集合中各个景点对应的情感分数。举例而言，如果一个文本只涉及一个景点，那么对于该文本的情感分数则可以直接作为该景点对应的情感分数。再如，如果一个文本涉及多个景点，而可以将该文本进行切分成为多个片段，每个片段对应一个景点，那么每个片段的情感评分可以作为该片段对应景点的情感分数。可选的，对于海量文本，还可以通过数据挖掘的方法，根据情感评分集合以及景点集合，获得各个景点对应的情感分数。

步骤S240，统计各个景点对应的景点频次，并根据各个景点频次获得各个景点对应的景点热度信息，所述景点频次用于表征所述景点在所有文本中出现的次数。

具体的，有的景点是热门旅游景点，在游记中出现的频次很高，而有的景点是冷门旅游景点，在文本中出现的频次较低。景点热度信息用来标记该景点在游记中热度的高低，可以通过统计各个景点在所有文本中出现的次数，并根据景点在所有文本中出现的次数来获得景点对应的景点热度信息。

可选的，可以采用将各个景点对应的景点频次除以所有景点频次中最大值的方式，获取景点热度信息。例如，对于景点A，景点B，景点C，经过统计，在所有文本中景点A对应的景点频次为1000次，景点B对应的景点频次为1500次，景点C对应的景点频次为2000次。则景点A的景点热度信息为:1000/2000＝0.5，景点B的景点热度信息为：1500/2000＝0.75，景点C的景点热度信息为:2000/2000＝0.1。

另外，可以采用将各个景点对应的景点频次除以所有景点频次总和的方式，获取景点热度信息，例如，在上述景点A，景点B以及景点C中，所有景点频次的综合为1000+1500+2000＝4500。则景点A的景点热度信息为1000/4500＝0.22，景点B的景点热度信息为:1500/4500＝0.33，景点C的景点热度信息为2000/4500＝0.44。

步骤S250，根据所述景点对应的景点热度信息以及所述情感分数对所述景点进行评价。

具体的，通过景点对应的景点热度信息以及该景点的情感分数，可以对景进行评价。举例而言，可以将景点热度信息和景点情感分数简单相乘，并根据计算结果对景点进行评价。

上述景点评价方法中，通过在游记文本中获得各个景点的情感分数以及景点热度信息，根据景点热度信息以及情感分数对景点进行评价，可以利用海量的文本，通过计算机无监督的对景点进行评价，能够提升基于文本数据对景点进行评价的效率。

请参阅图3，图3为一个实施例提供的步骤S210中获取每个文本对应的情感评分集合的流程示意图。该实施例涉及的是获取每个文本对应的情感评分集合的具体过程，可选的，在上述图2所示实施例的基础上，步骤S210中，获取每个文本对应的情感评分集合，具体包括：

步骤S211，根据预设的切分阈值以及预设的切分符，切分所述文本，获得文本对应的多个片段。

具体的，预设的切分符可以是标点符号，即逗号、句号、分号、顿号、感叹号、省略号的至少一种。预设的切分阈值可以是根据具体需求预先指定的表征字数的数值。例如，可以是50个字，也可以是130个字还可以使得每个片段在50字到130字之间。可以理解，切分阈值过大，每个片段包含的字数过多，那么片段中包括的景点个数可能也过多，从而导致对景点的评价准确率较低。相反，切分阈值越小，每个片段包含的字数过少，可能导致一个片段不包括一个完整的句子，也会导致对景点的评价准确率变低。因此，需要根据具体需求，折衷选择切分阈值。进一步的，将切分阈值设定为每个片段为50至130字。

可选的，在实际应用中，可以首先将所有的标点符号作为分隔符进行切分，得到多个短句。然后将短句按预设的顺序拼接起来组成一个片段，并同时统计该片段的字数，每当该片段的字数超过80字就开始拼接一个新的片段。当拼接到该文本的最后一个片段时，如果最后一个片段小于50字就合并入上一个片段，如果最后一个片段大于50字就作为新的一个片段。例如，假设一个文本按照标点符号可以被切分为10个短句，则先将前两个短句进行拼接作为一个片段，并同时统计该片段的字数，如果该片段的字数少于80字，则继续将第三个短句按照顺序拼接入该片段，直到该片段的字数超过80个字，则开始拼接一个新的片段。这样，可以使得大多数片段都在80字到90字之间，而最终一个片段的字数在50字至130字之间。

步骤S212，对所述多个片段中的每一个片段进行情感分析，获得各个所述片段对应的情感值。

具体的，将步骤S211获得的多个片段，作为输入，通过情感分析应用接口，就可以获得各个片段对应的情感值。情感分析应用接口，即情感分析API，可以采用现有的情感分析API，如波森中文语义平台提供的情感分析API或腾讯文智中文语义平台提供的情感分析API。一般的，通过情感分析应用接口获得的情感值是0-1之间的连续数值，数值越高表示情感越正面。

可选的，为了更方便的描述本实施例所述的情感分析应用接口。请一并参阅图4，图4示出了一个实施例提供的一个片段作为输入，通过情感API获得的情感值。如图所示，对于“我爱北京天安门”这段文字，所得到的情感值为0.9，对于“这真是惊艳世界的‘黑科技’”这段文字，所得到的情感值为0.65，对于“环境脏乱差，再也不去了”这段文字，所得到的情感值为0.01。需要说明的是，本实施例仅是示例性的给出了一种情感分析应用接口，而不同的情感分析应用接口对于输入文字，所得到的情感值可能是不同的。

步骤S213，将各个所述片段对应的情感值，通过预先设置的第一映射关系，获得所述片段的情感评分。

具体的，预先设置的第一映射关系可以是一个映射关系表，也可以是一个映射关系公式，还可以是通过其他将连续的情感值映射为情感分数的手段。

可选的，请一并参阅图5，图5为一个实施例提供的第一映射关系表，将步骤S222提供的情感值根据第一映射关系表即可获得相应的情感分数。例如，步骤S222中获得的情感值为0.7，则查表获得的情感分数为7，再如步骤S222中获得的情感值为0.35，则查表获得的情感分数为4。

步骤S214，根据文本中每个片段的情感评分，得到所述文本对应的情感评分集合。

具体的，获得了文本中每个片段的情感评分，即获得文本对应的情感评分集合。例如，在一个文本切分为3个片段，每个片段分布对应的情感分数为7，4，3。则文本对应的情感评分集合为{7，4，3}。

上述景点评价方法中，通过对文本进行切分，结合情感分析API获得文本对应的情感评分集合，能够进一步提升基于文本数据对景点进行评价的效率，并且提高了景点评价的准确率。

请参阅图6，图6为一个实施例提供的步骤S220中获取每个文本对应的景点集合的流程示意图。该实施例涉及的是获取每个文本对应的景点集合的具体过程，可选的，在上述图2所示实施例的基础上，步骤S220中，获取每个文本对应的景点集合，具体包括：

步骤S221，根据预先设置的全局景点，构建初始景点集合。

具体的，在一个文本中，特别是在游记中，会包括大量的背景词汇，所述背景词汇是指游记中常包含的时间、门票、电话等与景点的主题特征相关性不大的信息，背景词汇比较均匀地分布在大量的文本，特别是游记中，背景词汇不与特定的景点相关联，为了排除这些背景词汇的干扰，预先设置一个全局景点，将所述背景词汇添加至全局景点中。

步骤S222，依次获取景点列表中的景点名称，并将所述景点名称在所述文本中逐一进行匹配。

具体的，遍历所述文本，将景点列表SL中的景点名称在文本中逐一进行匹配，假设景点列表中有3个景点，分别为首都博物馆、颐和园、故宫，则首先将首都博物馆作为第一景点名称，将首都博物馆与在所述文本中进行匹配。所述匹配，是指采用关键词匹配的方法，如果在文本中出现了某个景点的名称，则认为此文本涉及到了该景点。

步骤S223，若匹配成功，则将与所述文本匹配的景点名称添加至与所述文本对应的景点集合，直至所述景点列表中所有的景点名称均完成匹配。

具体的，判断匹配是否成功，可以将文本中的相关词语与景点列表SL中的景点名称完全一致。也可以首先计算文本中相关词语与景点列表SL中的景点名称的相似度，并根据具体需求设置不同的相似度阈值判断是否匹配成功。

进一步的，如果所述景点列表SL中的景点名称中包括别名、简化名、正式名等，则分别将别名、简化名、正式名在所述文本中进行匹配，如果匹配成功，则将景点列表SL中的景点名称添加至所述文本对应的景点集合。

上述景点评价方法，通过添加全局景点获得的景点集合，可以有效的过滤背景词汇，从而提高景点评价方法的准确性。

请参阅图7，图7为一个实施例提供的步骤S230的流程示意图。本实施例涉及的是根据所述情感评分集合以及所述景点集合，计算各个景点对应的情感分数的具体方法，可选的，在图1至图6所示实施例的基础上，步骤S230具体包括：

S231，根据作者主题模型，将所述景点集合作为作者集合，将所述文本作为文档，以所述情感评分集合作为词袋，获得所述景点集合中各个景点的景点主题向量以及主题分数向量。

具体的，基于作者主题模型(Author-Topic Model，ATM)，将景点集合作为作者(Author)集合，将情感评分集合作为词袋，将文本作为文档，即可获得景点集合中各个景点的景点主题向量Θ＝θ_1：j以及主题分数向量所述作者主题模型是对LDA(隐含狄利克雷分布)模型的扩展，认为每个作者有一个主题概率分布，而文本的生成过程是首先随机选择一个作者，根据这个作者的主题概率分布，生成一个词，重复该过程直到生成整个文本，其中一个文本可以由多个作者完成，而每个词在属于一个主题的同时，也属于一个作者。在数据挖掘中，把一个文本看作多个主题的混合，并由多个作者完成。

可选的，对情感评分集合中各个分数进行吉布斯采样(Gibbs sampling)进行概率采样直至收敛，然后根据采样结果，获得景点主题向量以及主题分数向量。

请一并参阅图8，图8是一个实施例提供的基于作者主体模型的概率图模型示意图。其中，α是预先设置的超参数，用来描述景点主题分布；β是预先设置的超参数，用来描述主题分数分布；T代表主题个数；J用来代表景点个数，由于加入了全局景点gs，因此景点集合中元素的个数为J+1，可以理解，如果不加入全局景点gs，景点集合中元素的个数就是J；θ、均为可以通过计算获得的估计参数；S_i代表第i篇文章对应的景点集合；s是文本涉及的某个景点，z是该景点及景点主题分布所涉及的主题；I代表文本的个数，g是本次计算得到的情感分数。

S232，根据所述景点主题向量以及主题分数向量，获得景点分数概率分布。

具体的，根据步骤S231得到的景点主题向量Θ＝θ_1：J以及主题分数向量获得到景点分数概率分布。

可选的，利用全概率公式，根据景点主题向量Θ＝θ_1：J和主题分数向量即可获得景点分数概率分布，其矩阵表达式为：

Π＝ΨΘ，其中Θ为景点主题向量，Ψ为主题分数向量。

S233，根据景点分数概率分布，计算获得各个景点对应的情感分数。

具体的，根据景点分数概率分布和景点分数，就可以获得各个景点对应的情感分数。

可选的，根据景点分数概率分布Π＝π_1:J可以通过下述公式或其变形计算获得景点对应的情感分数：

其中，L_j为第j个景点的情感分数，n为情感分数的个数。

进一步的，在如图5所示的映射关系表中，有0分至10分总共有11个情感分数，则可以通过下述公式或其变形计算获得景点对应的情感分数：

请参阅图9，图9为一个实施例提供的步骤S240的流程示意图。本实施例涉及的是如何根据所述景点频次获得所述景点对应的景点热度信息，所述景点频次用于表征所述景点在所有文本中出现的次数。可选的，在图2至图6所示实施例的基础上，步骤S240具体包括：

步骤S241，根据预先设置的调节系数，设置对数压缩系数。

具体的，根据需求，灵活设置调节系数，并根据调节系数，设置对数压缩系数。假设调节系数为τ，则对数压缩系数σ可以在下述约束条件下进行设置：σ＞1,τ≤σ。

步骤S242，以所述调节系数与所述景点出现次数的和值为真数，以对数压缩系数为底数，计算对数函数，获得所述景点对应的景点热度信息。

具体的，对于景点j，设其在全部游记中出现的频次为λ_j，调节系数为τ，对数压缩系数为σ，则景点热度信息pop_j可以通过下述公式或其变形获得：

pop_j＝log_σ(τ+λ_j)

请参阅图10，图10为一个实施例提供的步骤S250的流程示意图。本实施例涉及的是如何根据所述景点频次获得所述景点对应的景点热度信息，所述景点频次用于表征所述景点在所有文本中出现的次数。可选的，在图1至图4所示实施例的基础上，步骤S250具体包括：

步骤S251，根据景点热度信息以及所述情感分数获得所述景点对应的综合分数。

具体的，根据景点热度信息与景点对应的情感分数，即获得景点对应的综合分数。

可选的，设景点j对应的景点热度信息为pop_j，景点j对应的情感分数为L_j，则景点j对应的综合分数可以由下述公式或其变形得到：

L′_j＝L_j*pop_j

步骤S252，根据景点对应的综合分数，通过预先设置的映射关系，获得所述景点的评分，所述景点的评分用于对所述景点进行评价。

具体的，根据景点对应的综合分数，通过预先设置的第二映射关系，可以获得景点的评分，可以理解，预先设置的第二映射关系可以是一个映射关系表，也可以是一个映射关系公式，还可以是通过其他将连续的景点的综合分数映射为景点的评分的手段。

可选的，预先设置的映射关系为映射关系公式，设景点j对应的综合分数为L′_j。假设景点列表中总共有J个景点，其中景点综合分数最高为max_jL_j′，景点综合分数最低为min_jL′_j，则景点j对应的评分可以由以下公式或其变形获得：

应该理解的是，虽然图2-10的流程图中的各个步骤按照箭头的指示依次显示，但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明，这些步骤的执行并没有严格的顺序限制，这些步骤可以以其它的顺序执行。而且，图2-10中的至少一部分步骤可以包括多个子步骤或者多个阶段，这些子步骤或者阶段并不必然是在同一时刻执行完成，而是可以在不同的时刻执行，这些子步骤或者阶段的执行顺序也不必然是依次进行，而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。

在一个实施例中，如图11所示，提供了一种景点评价装置，包括：集合获取模块、情感分数计算模块、热度信息获得模块以及景点评价模块，其中：

分数集合获取模块200，用于获取每个文本对应的情感评分集合；

景点集合获取模块300，用于根据预先设置的景点列表获取每个文本对应的景点集合；

情感分数计算模块400，用于根据所述情感评分集合以及所述景点集合，计算各个景点对应的情感分数；

热度信息获得模块500，用于统计所有文本中各个景点频次，并根据所述景点频次获得所述景点对应的景点热度信息，所述景点频次用于表征所述景点在所有文本中出现的次数；

景点评价模块600，用于根据各个景点对应的景点热度信息以及所述情感分数得到各个景点的评价。

关于景点评价装置的具体限定可以参见上文中对于景点评价方法的限定，在此不再赘述。

请参阅图12，图12为一个实施例提供的景点评价装置的结构示意图。在上述图11所示实施例的基础上，可选的，如图12所示，上述分数集合获取模块200可以包括，切分单元210，情感值获取单元220，第一映射单元230以及情感评分集合获取单元240。

切分单元210，用于根据预设的切分阈值和/或预设的切分符，切分所述文本，获得文本对应的多个片段；

情感值获取单元220，用于对所述多个片段中的每一个片段进行情感分析，获得各个所述片段对应的情感值；

第一映射单元230，用于将各个所述片段对应的情感值，通过预先设置的第一映射关系，获得所述片段的情感评分；

情感评分集合获取单元240，用于根据文本中每个片段的情感评分，得到所述文本对应的情感评分集合。

请参阅图13，图13为一个实施例提供的景点评价装置的结构示意图。在上述图11所示实施例的基础上，可选的，如图13所示，上述景点集合获取模块300可以包括：

初始景点集合构建单元310，用于根据预先设置的全局景点，构建初始景点集合；

景点匹配单元320，用于依次获取所述景点列表中的景点名称，并将所述景点名称在所述文本中逐一进行匹配；

景点集合更新单元330，用于若匹配成功，则根据与所述文本匹配的景点名称更新初始景点集合，直至所述景点列表中所有的景点名称均完成匹配，则获得所述景点集合；

在一个实施例中，在上述图11-13所示实施例的基础上，所述情感分数计算模块400包括：

向量获取单元，用于根据作者主题模型，将所述景点集合作为作者集合，将所述文本作为文档，以所述情感评分集合作为词袋，获得所述景点集合中各个景点的景点主题向量以及主题分数向量；

概率分布获取单元，用于根据所述景点主题向量以及主题分数向量，获得景点分数概率分布；

情感分数计算单元，用于根据景点分数概率分布，计算获得各个景点对应的情感分数。

在一个实施例中，在上述所示实施例的基础上，概率分布获取单元包括：

概率分布获取子单元，用于根据所述景点主题向量以及主题分数向量，通过全概率公式，计算获得景点分数概率分布。

在一个实施例中，在上述图11-图13所示实施例的基础上，所述热度信息获取模块500包括：

压缩系数设置单元，用于根据预先设置的调节系数，设置对数压缩系数；

热度信息计算单元，用于以所述调节系数与所述景点出现次数的和值为真数，以对数压缩系数为底数，通过对数函数获得所述景点对应的景点热度信息。

在一个实施例中，在上述图11-图13所示实施例的基础上，所述景点评价模块600包括：

综合分数获取单元，用于根据景点热度信息以及所述情感分数获得所述景点对应的综合分数；

景点评价单元，用于根据景点对应的综合分数，通过预先设置的第二映射关系，获得所述景点的评分，所述景点的评分用于对所述景点进行评价。上述景点评价装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中，也可以以软件形式存储于计算机设备中的存储器中，以便于处理器调用执行以上各个模块对应的操作。

本领域技术人员可以理解，图11-图13中示出的结构，仅仅是与本申请方案相关的部分结构的框图，并不构成对本申请方案所应用于其上的计算机设备的限定，具体的计算机设备可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。

在一个实施例中，提供了一种计算机设备，该计算机设备可以是服务器，其内部结构图可以如图14所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中，该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储文本数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种景点评价方法。

在一个实施例中，提供了一种计算机设备，该计算机设备可以是终端，其内部结构图可以如图15所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口、显示屏和输入装置。其中，该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种景点评价方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏，该计算机设备的输入装置可以是显示屏上覆盖的触摸层，也可以是计算机设备外壳上设置的按键、轨迹球或触控板，还可以是外接的键盘、触控板或鼠标等。

本领域技术人员可以理解，图14或图15中示出的结构，仅仅是与本申请方案相关的部分结构的框图，并不构成对本申请方案所应用于其上的计算机设备的限定，具体的计算机设备可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。

在一个实施例中，提供了一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，处理器执行计算机程序时实现以下步骤：

获取每个文本对应的情感评分集合；

根据预先设置的景点列表获取每个文本对应的景点集合；

在一个实施例中，处理器执行计算机程序时还实现以下步骤：

根据预先设置的全局景点，构建初始景点集合；

根据预先设置的调节系数，设置对数压缩系数；

根据景点对应的综合分数，通过预先设置的第二映射关系，获得所述景点的评分，所述景点的评分用于对所述景点进行评价。在一个实施例中，提供了一种计算机可读存储介质，其上存储有计算机程序，计算机程序被处理器执行时实现以下步骤：

获取每个文本对应的情感评分集合；

根据预先设置的景点列表获取每个文本对应的景点集合；

在一个实施例中，计算机程序被处理器执行时还实现以下步骤：

在一个实施例中，计算机程序被处理器执行时还实现以下步骤：根据预先设置的全局景点，构建初始景点集合；

根据预先设置的调节系数，设置对数压缩系数；

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的计算机程序可存储于一非易失性计算机可读取存储介质中，该计算机程序在执行时，可包括如上述各方法的实施例的流程。其中，本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用，均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限，RAM以多种形式可得，诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。

以上实施例的各技术特征可以进行任意的组合，为使描述简洁，未对上述实施例中的各个技术特征所有可能的组合都进行描述，然而，只要这些技术特征的组合不存在矛盾，都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本申请的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对发明专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本申请构思的前提下，还可以做出若干变形和改进，这些都属于本申请的保护范围。因此，本申请专利的保护范围应以所附权利要求为准。

Claims

1.一种景点评价方法，所述方法包括：

获取每个文本对应的情感评分集合；

根据预先设置的景点列表获取每个文本对应的景点集合；

统计各个景点对应的景点频次，并根据各个景点频次获得各个景点对应的景点热度信息，所述景点频次用于表征景点在所有文本中出现的次数；

2.根据权利要求1所述的方法，其特征在于，所述获取每个文本对应的情感评分集合的步骤包括：

3.根据权利要求1所述的方法，其特征在于，所述根据预先设置的景点列表获取每个文本对应的景点集合的步骤包括：

根据预先设置的全局景点，构建初始景点集合；

4.根据权利要求1-3中任意一项所述的方法，其特征在于，所述根据所述情感评分集合以及所述景点集合，计算景点列表中各个景点对应的情感分数的步骤包括：

5.根据权利要求4所述的方法，其特征在于，所述根据所述景点主题向量以及主题分数向量，获得景点分数概率分布的步骤包括：

6.根据权利要求1-3中任意一项所述的方法，其特征在于，所述统计各个景点对应的景点频次，并根据所述景点频次获得所述景点对应的景点热度信息的步骤包括：

根据预先设置的调节系数，设置对数压缩系数；

7.根据权利要求1-3中任意一项所述的方法，其特征在于，所述根据各个景点对应的景点热度信息以及所述情感分数得到各个景点的评价，包括：

8.一种景点评价装置，其特征在于，所述装置包括：

分数集合获取模块，用于获取每个文本对应的情感评分集合；

景点集合获取模块，用于根据预先设置的景点列表获取每个文本对应的景点集合；

情感分数计算模块，用于根据所述情感评分集合以及所述景点集合，计算景点列表中各个景点对应的情感分数；

热度信息获得模块，用于统计各个景点对应的景点频次，并根据各个景点频次获得各个景点对应的景点热度信息，所述景点频次用于表征所述景点在所有文本中出现的次数；

9.一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述方法的步骤。

10.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。