CN114331021A - 一种基于网络点评语义分析的寒地城市景区季节综合评价方法和装置 - Google Patents

一种基于网络点评语义分析的寒地城市景区季节综合评价方法和装置 Download PDF

Info

Publication number
CN114331021A
CN114331021A CN202111454298.XA CN202111454298A CN114331021A CN 114331021 A CN114331021 A CN 114331021A CN 202111454298 A CN202111454298 A CN 202111454298A CN 114331021 A CN114331021 A CN 114331021A
Authority
CN
China
Prior art keywords
evaluation
comment
data
semantic
semantic analysis
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111454298.XA
Other languages
English (en)
Inventor
梅洪元
孟雪
叶洋
安文
李书颀
单杰
周小璐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Building Design Research Institute Harbin Institute Of Technology
Original Assignee
Building Design Research Institute Harbin Institute Of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Building Design Research Institute Harbin Institute Of Technology filed Critical Building Design Research Institute Harbin Institute Of Technology
Priority to CN202111454298.XA priority Critical patent/CN114331021A/zh
Publication of CN114331021A publication Critical patent/CN114331021A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于网络点评语义分析的寒地城市景区季节综合评价方法和装置。步骤1:采集网络网站点评数据;步骤2:将步骤1的点评数据进行预处理;步骤3:基于步骤2预处理后的点评数据的词组确定评价指标;步骤4:基于步骤1预处理后的点评数据词组结合词组前后的分词进行语义分析;步骤5:基于步骤3的确定评价指标与步骤4的语义分析进行综合评价。本发明旨在通过大量数据更为高效、客观地获得评价结果。

Description

一种基于网络点评语义分析的寒地城市景区季节综合评价方 法和装置
技术领域
本发明属于的技术领域;具体涉及一种基于网络点评语义分析的寒地城市景区季节综合评价方法、装置、计算机设备及存储介质。
背景技术
随着旅游服务日渐发达,人们对景区品质的要求逐渐提高,越来越流行将景区体验的点评发布到点评网站上供他人参考。对寒地城市景区而言,在不同季节气候条件下,使用者空间的感知不同,评价体系的要素及其权重均有所不同,传统评价方式多依赖问卷访谈,且获得全季节数据调研周期持续时间长、成本高,应用网络点评可以较为快速地获得全季节数据,并获得人们对于寒地城市景区的关注点及其评价倾向,对寒地景区进行综合评分,进而加强景区建设,提高使用者满意度。
发明内容
本发明提供了一种基于网络点评语义分析的寒地城市景区季节综合评价方法,旨在通过大量数据更为高效、客观地获得评价结果。
本发明提供了一种基于网络点评语义分析的寒地城市景区季节综合评价装置,旨在通过大量数据更为高效、客观地获得评价结果。
本发明提供了一种计算机设备。
本发明提供了一种非临时性计算机可读存储介质。
本发明通过以下技术方案实现:
一种基于网络点评语义分析的寒地城市景区季节综合评价方法,所述综合评价方法包括以下步骤:
步骤1:采集网络网站点评数据;
步骤2:将步骤1的点评数据进行预处理;
步骤3:基于步骤2预处理后的点评数据的词组确定评价指标;
步骤4:基于步骤1预处理后的点评数据词组结合词组前后的分词进行语义分析;
步骤5:基于步骤3的确定评价指标与步骤4的语义分析进行综合评价。
进一步的,所述步骤1的网络网站点评数据先进行筛选,筛选出夏季的点评文本与冬季的点评文本。
进一步的,所述步骤2的预处理包括剔除无效文本、去除无效成分及替换标点符号。
进一步的,所述步骤3确定评价指标具体包括以下步骤:
步骤X3.1:基于处理后的夏季的点评数据进行词频统计;
步骤X3.2:基于步骤3.1统计的词频应用TF-IDF进行关键词提取;
步骤X3.3:基于步骤3.2提取的关键词针对不同研究区域筛选出使用者较为重视的关注要素并确定其权重;
步骤X3.4:基于步骤3.3的词组权重通过k-means聚类分析结合相关历史研究确定评价指标体系。
进一步的,所述步骤3确定评价指标具体包括以下步骤:
步骤D3.1:基于处理后的冬季的点评数据进行词频统计;
步骤D3.2:基于步骤3.1统计的词频应用TF-IDF进行关键词提取;
步骤D3.3:基于步骤3.2提取的关键词针对不同研究区域筛选出使用者较为重视的关注要素并确定其权重;
步骤D3.4:基于步骤3.3的词组权重通过k-means聚类分析结合相关历史研究确定评价指标体系。
进一步的,所述步骤4的综合评价具体包括以下步骤:
步骤4.1:将步骤1预处理后的点评数据提取词组,并判断该词组是否属于评价指标体系,如果不属于评价体系,则进行步骤4.2;如果属于评价体系,则进行步骤4.3;
步骤4.2:进行人工校正,人工判断是否属于评价体系,如果属于则进行步骤4.3,如果不属于则不做处理;
步骤4.3:进行关键词归类;
步骤4.4:基于步骤4.3的关键词归类,将关键词及其前后的分词均与情感词典匹配进行情感词典的匹配;
步骤4.5:将步骤4.4匹配后的关键词及其前后的分词根据词性类别与程度副词的修饰,再判断语义情感;
步骤4.6:将步骤4.5的语义情感进行打分,将分数与它修饰的关键词权重相乘;
步骤4.7:夏季数据与夏季评价指标体系相对应,冬季数据与冬季评价指标体系相对应,从而获得两个季节的语义打分。
通过人工智能识别为主,辅助人工判断归类的方式将预处理后的点评数据进行归类;
将关键词及其前后的分词均与情感词典匹配,根据词性类别与程度副词的修饰,在判断语义情感后,语义情感打分和它修饰的关键词权重相乘。夏季数据与夏季评价指标体系相对应,冬季数据与冬季评价指标体系相对应,从而获得两个季节的语义打分。
夏季与冬季的语义打分相加获得季节综合总分,其中,各类评价可根据权重与语义打分得出分类得分,从而指导运营方或设计方清晰得知不同季节中得分高及得分低的评价要素。
进一步的,所述步骤4.4中情感词典包括积极情感词表、消极情感词表、否定词表及程度副词表。
一种基于网络点评语义分析的寒地城市景区季节综合评价装置,所述综合评价装置包括
数据采集模块,用于采集网络网站点评数据;
数据预处理模块,用于将点评数据进行预处理;
语义分析分析模块,用于将点评数据词组结合词组前后的分词进行语义分析;
综合评价模块,用于将点评数据进行综合评价。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器质性所述计算机程序时实现权利要求1-7中任一项所述方法的步骤。
一种非临时性计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时,实现权利要求1-7中任一项所述方法的步骤。
本发明的有益效果是:
本发明相较传统问卷获取方式,节约人力且可获取大量数据,评价结果更为客观真实。
点评数据用来评估区域或空间的使用者反馈和满意程度是可以比传统问卷或问询的方法更加轻易获取几十倍或上百倍的线上数据的,大大提升了结论的可信度,也减少了研究者的工作量。线上数据的直接获取提供了公众主动评价的视角,较少的受到研究者主观思维的干扰,短小的评价文本更准确地反映出公众的直观感知与关注重点
本发明对寒地城市空间评价在综合不同季节评分过程中,线上评价时间连续性更强,时间成本更低。
传统调研观测方法只能在一定的时间内获得评价数据,很难长时间观测并获取,对于寒地城市中需获取不同季节条件的数据的城市空间而言,相较于线上点评数据的定时爬取,线下调研成本更高而准确性更弱。
本发明根据评价指标的权重与语义分析结合得出的评价结果更精确。
一是传统语义分析方法并不确定评价指标的权重,二是目前通过网络文本分析获取使用后评价的方法只用于确定评价体系并未进行语义分析的评分。两者相结合对景区进行评价体系建立并按分项权重评分更能反映景区现状。
附说明
附图1本发明的方法流程图。
具体实施方式
下面将结合本发明实施例中的附图对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
一种基于网络点评语义分析的寒地城市景区季节综合评价方法,所述综合评价方法包括以下步骤:
步骤1:采集网络网站点评数据;
步骤2:将步骤1的点评数据进行预处理;
步骤3:基于步骤2预处理后的点评数据的词组确定评价指标;
步骤4:基于步骤1预处理后的点评数据词组结合词组前后的分词进行语义分析;
步骤5:基于步骤3的确定评价指标与步骤4的语义分析进行综合评价。
夏季与冬季的语义打分相加获得季节综合总分,其中,各类评价可根据权重与语义打分得出分类得分,从而指导运营方或设计方清晰得知不同季节中得分高及得分低的评价要素。
进一步的,所述步骤1的网络网站点评数据先进行筛选,筛选出夏季的点评文本与冬季的点评文本。
进一步的,所述步骤2的预处理包括剔除无效文本、去除无效成分及替换标点符号。
进一步的,所述步骤3确定评价指标具体包括以下步骤:
步骤X3.1:基于处理后的夏季的点评数据进行词频统计;应用分词工具如jieba分词、thulac、SnowNLP等,与停用词词库清洗有效关键词并分析频次;
步骤X3.2:基于步骤3.1统计的词频应用TF-IDF进行关键词提取;其中TF词频(Term Frequency),IDF逆向文件频率(Inverse Document Frequency),简单来说,此方法是指,如果词w在一篇文档d中出现的频率高,并且在其他文档中很少出现,则认为词w具有很好的区分能力,适合用来把文章d和其他文章区分开来;
步骤X3.3:基于步骤3.2提取的关键词针对不同研究区域筛选出使用者较为重视的关注要素并确定其权重;
步骤X3.4:基于步骤3.3的词组权重通过k-means聚类分析结合相关历史研究(指代的是既往有关景区评价体系的科学研究)确定评价指标体系。k均值聚类算法(k-meansclustering algorithm)是一个将数据集中在某些方面相似的数据成员进行分类组织的过程,k均值聚类是最著名的划分聚类算法,可以将筛选出的关注要素归为大类,便于评价指标体系的确定。
进一步的,所述步骤3确定评价指标具体包括以下步骤:
步骤D3.1:基于处理后的冬季的点评数据进行词频统计;应用分词工具如jieba分词、thulac、SnowNLP等,与停用词词库清洗有效关键词并分析频次;
步骤D3.2:基于步骤3.1统计的词频应用TF-IDF进行关键词提取;其中TF词频(Term Frequency),IDF逆向文件频率(Inverse Document Frequency),简单来说,此方法是指,如果词w在一篇文档d中出现的频率高,并且在其他文档中很少出现,则认为词w具有很好的区分能力,适合用来把文章d和其他文章区分开来;
步骤D3.3:基于步骤3.2提取的关键词针对不同研究区域筛选出使用者较为重视的关注要素并确定其权重;
步骤D3.4:基于步骤3.3的词组权重通过k-means聚类分析结合相关历史研究(指代的是既往有关景区评价体系的科学研究)确定评价指标体系。k均值聚类算法(k-meansclustering algorithm)是一个将数据集中在某些方面相似的数据成员进行分类组织的过程,k均值聚类是最著名的划分聚类算法,可以将筛选出的关注要素归为大类,便于评价指标体系的确定。
进一步的,所述步骤4的综合评价具体包括以下步骤:
步骤4.1:将步骤1预处理后的点评数据提取词组,并判断该词组是否属于评价指标体系,如果不属于评价体系,则进行步骤4.2;如果属于评价体系,则进行步骤4.3;
步骤4.2:进行人工校正,人工判断是否属于评价体系,如果属于则进行步骤4.3,如果不属于则不做处理;
步骤4.3:进行关键词归类;
步骤4.4:基于步骤4.3的关键词归类,将关键词及其前后的分词均与情感词典匹配进行情感词典的匹配;
步骤4.5:将步骤4.4匹配后的关键词及其前后的分词根据词性类别与程度副词的修饰,再判断语义情感;
步骤4.6:将步骤4.5的语义情感进行打分,将分数与它修饰的关键词权重相乘;
步骤4.7:夏季数据与夏季评价指标体系相对应,冬季数据与冬季评价指标体系相对应,从而获得两个季节的语义打分。
通过人工智能识别为主,辅助人工判断归类的方式将预处理后的点评数据进行归类;
将关键词及其前后的分词均与情感词典匹配,根据词性类别与程度副词的修饰,在判断语义情感后,语义情感打分和它修饰的关键词权重相乘。夏季数据与夏季评价指标体系相对应,冬季数据与冬季评价指标体系相对应,从而获得两个季节的语义打分。
夏季与冬季的语义打分相加获得季节综合总分,其中,各类评价可根据权重与语义打分得出分类得分,从而指导运营方或设计方清晰得知不同季节中得分高及得分低的评价要素。
进一步的,所述步骤4.4中情感词典包括积极情感词表、消极情感词表、否定词表及程度副词表。
一种基于网络点评语义分析的寒地城市景区季节综合评价装置,所述综合评价装置包括
数据采集模块,用于采集网络网站点评数据;
数据预处理模块,用于将点评数据进行预处理;
语义分析分析模块,用于将点评数据词组结合词组前后的分词进行语义分析;
综合评价模块,用于将点评数据进行综合评价。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器质性所述计算机程序时实现权利要求1-7中任一项所述方法的步骤。
一种非临时性计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时,实现权利要求1-7中任一项所述方法的步骤。

Claims (10)

1.一种基于网络点评语义分析的寒地城市景区季节综合评价方法,其特征在于,所述综合评价方法包括以下步骤:
步骤1:采集网络网站点评数据;
步骤2:将步骤1的点评数据进行预处理;
步骤3:基于步骤2预处理后的点评数据的词组确定评价指标;
步骤4:基于步骤1预处理后的点评数据词组结合词组前后的分词进行语义分析;
步骤5:基于步骤3的确定评价指标与步骤4的语义分析进行综合评价。
2.根据权利要求1所述一种基于网络点评语义分析的寒地城市景区季节综合评价方法,其特征在于,所述步骤1的网络网站点评数据先进行筛选,筛选出夏季的点评文本与冬季的点评文本。
3.根据权利要求1所述一种基于网络点评语义分析的寒地城市景区季节综合评价方法,其特征在于,所述步骤2的预处理包括剔除无效文本、去除无效成分及替换标点符号。
4.根据权利要求1所述一种基于网络点评语义分析的寒地城市景区季节综合评价方法,其特征在于,所述步骤3确定评价指标具体包括以下步骤:
步骤X3.1:基于处理后的夏季的点评数据进行词频统计;
步骤X3.2:基于步骤3.1统计的词频应用TF-IDF进行关键词提取;
步骤X3.3:基于步骤3.2提取的关键词针对不同研究区域筛选出使用者较为重视的关注要素并确定其权重;
步骤X3.4:基于步骤3.3的词组权重通过k-means聚类分析结合相关历史研究确定评价指标体系。
5.根据权利要求1所述一种基于网络点评语义分析的寒地城市景区季节综合评价方法,其特征在于,所述步骤3确定评价指标具体包括以下步骤:
步骤D3.1:基于处理后的冬季的点评数据进行词频统计;
步骤D3.2:基于步骤3.1统计的词频应用TF-IDF进行关键词提取;
步骤D3.3:基于步骤3.2提取的关键词针对不同研究区域筛选出使用者较为重视的关注要素并确定其权重;
步骤D3.4:基于步骤3.3的词组权重通过k-means聚类分析结合相关历史研究确定评价指标体系。
6.根据权利要求4或5所述一种基于网络点评语义分析的寒地城市景区季节综合评价方法,其特征在于,所述步骤4的综合评价具体包括以下步骤:
步骤4.1:将步骤1预处理后的点评数据提取词组,并判断该词组是否属于评价指标体系,如果不属于评价体系,则进行步骤4.2;如果属于评价体系,则进行步骤4.3;
步骤4.2:进行人工校正,人工判断是否属于评价体系,如果属于则进行步骤4.3,如果不属于则不做处理;
步骤4.3:进行关键词归类;
步骤4.4:基于步骤4.3的关键词归类,将关键词及其前后的分词均与情感词典匹配进行情感词典的匹配;
步骤4.5:将步骤4.4匹配后的关键词及其前后的分词根据词性类别与程度副词的修饰,再判断语义情感;
步骤4.6:将步骤4.5的语义情感进行打分,将分数与它修饰的关键词权重相乘;
步骤4.7:夏季数据与夏季评价指标体系相对应,冬季数据与冬季评价指标体系相对应,从而获得两个季节的语义打分。
通过人工智能识别为主,辅助人工判断归类的方式将预处理后的点评数据进行归类;
将关键词及其前后的分词均与情感词典匹配,根据词性类别与程度副词的修饰,在判断语义情感后,语义情感打分和它修饰的关键词权重相乘。夏季数据与夏季评价指标体系相对应,冬季数据与冬季评价指标体系相对应,从而获得两个季节的语义打分。
夏季与冬季的语义打分相加获得季节综合总分,其中,各类评价可根据权重与语义打分得出分类得分,从而指导运营方或设计方清晰得知不同季节中得分高及得分低的评价要素。
7.根据权利要求6所述一种基于网络点评语义分析的寒地城市景区季节综合评价方法,其特征在于,所述步骤4.4中情感词典包括积极情感词表、消极情感词表、否定词表及程度副词表。
8.一种基于网络点评语义分析的寒地城市景区季节综合评价装置,其特征在于,所述综合评价装置包括
数据采集模块,用于采集网络网站点评数据;
数据预处理模块,用于将点评数据进行预处理;
语义分析分析模块,用于将点评数据词组结合词组前后的分词进行语义分析;
综合评价模块,用于将点评数据进行综合评价。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器质性所述计算机程序时实现权利要求1-7中任一项所述方法的步骤。
10.一种非临时性计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时,实现权利要求1-7中任一项所述方法的步骤。
CN202111454298.XA 2021-12-01 2021-12-01 一种基于网络点评语义分析的寒地城市景区季节综合评价方法和装置 Pending CN114331021A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111454298.XA CN114331021A (zh) 2021-12-01 2021-12-01 一种基于网络点评语义分析的寒地城市景区季节综合评价方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111454298.XA CN114331021A (zh) 2021-12-01 2021-12-01 一种基于网络点评语义分析的寒地城市景区季节综合评价方法和装置

Publications (1)

Publication Number Publication Date
CN114331021A true CN114331021A (zh) 2022-04-12

Family

ID=81048157

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111454298.XA Pending CN114331021A (zh) 2021-12-01 2021-12-01 一种基于网络点评语义分析的寒地城市景区季节综合评价方法和装置

Country Status (1)

Country Link
CN (1) CN114331021A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116307792A (zh) * 2022-10-12 2023-06-23 广州市阿尔法软件信息技术有限公司 一种面向城市体检主题场景的评估方法及装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116307792A (zh) * 2022-10-12 2023-06-23 广州市阿尔法软件信息技术有限公司 一种面向城市体检主题场景的评估方法及装置
CN116307792B (zh) * 2022-10-12 2024-03-12 广州市阿尔法软件信息技术有限公司 一种面向城市体检主题场景的评估方法及装置

Similar Documents

Publication Publication Date Title
CN109189901B (zh) 一种智能客服系统中自动发现新分类以及对应语料的方法
CN109829166B (zh) 基于字符级卷积神经网络的民宿顾客意见挖掘方法
CN108364199B (zh) 一种基于互联网用户评论的数据分析方法及系统
US10387805B2 (en) System and method for ranking news feeds
CN112015721A (zh) 一种基于大数据的电商平台存储数据库的优化方法
CN112581006A (zh) 筛选舆情信息及监测企业主体风险等级的舆情引擎及方法
CN112765974B (zh) 一种业务辅助方法、电子设备及可读存储介质
CN112069312B (zh) 一种基于实体识别的文本分类方法及电子装置
CN104347071B (zh) 生成口语考试参考答案的方法及系统
CN107992550A (zh) 一种网络评论分析方法及系统
CN108363699A (zh) 一种基于百度贴吧的网民学业情绪分析方法
TWI477987B (zh) 新聞文本情緒傾向分析方法
CN114331021A (zh) 一种基于网络点评语义分析的寒地城市景区季节综合评价方法和装置
CN113032550B (zh) 一种基于预训练语言模型的观点摘要评价系统
CN106709824B (zh) 一种基于网络文本语义分析的建筑评价方法
CN108509588A (zh) 一种基于大数据的律师评估方法及推荐方法
CN111221915B (zh) 基于CWK-means的在线学习资源质量分析方法
CN110413985B (zh) 一种相关文本片段搜索方法及装置
CN111507528A (zh) 一种基于cnn-lstm的股票长期趋势预测方法
CN113254632B (zh) 基于事件检测技术的时间线摘要自动生成方法
CN115640439A (zh) 一种网络舆情监控的方法、系统及存储介质
CN111209375B (zh) 一种通用的条款与文档匹配方法
CN114443930A (zh) 一种新闻舆情智能监测分析方法、系统及计算机存储介质
CN111444434A (zh) 一种互联网反馈评论的生成方法及系统
CN110852090A (zh) 一种用于舆情爬取的机构特征词汇扩展系统和方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination