CN117217801A - 基于游客真实评价的景区优化方案智能生成方法及系统 - Google Patents
基于游客真实评价的景区优化方案智能生成方法及系统 Download PDFInfo
- Publication number
- CN117217801A CN117217801A CN202311234371.1A CN202311234371A CN117217801A CN 117217801 A CN117217801 A CN 117217801A CN 202311234371 A CN202311234371 A CN 202311234371A CN 117217801 A CN117217801 A CN 117217801A
- Authority
- CN
- China
- Prior art keywords
- scenic spot
- emotion
- comment
- data
- evaluation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000011156 evaluation Methods 0.000 title claims abstract description 135
- 238000005457 optimization Methods 0.000 title claims abstract description 88
- 238000000034 method Methods 0.000 title claims abstract description 68
- 230000008451 emotion Effects 0.000 claims abstract description 165
- 238000007781 pre-processing Methods 0.000 claims abstract description 20
- 230000011218 segmentation Effects 0.000 claims description 45
- 230000007935 neutral effect Effects 0.000 claims description 12
- 230000036651 mood Effects 0.000 claims description 11
- 238000012545 processing Methods 0.000 claims description 10
- 238000004422 calculation algorithm Methods 0.000 claims description 7
- 238000004364 calculation method Methods 0.000 claims description 6
- 238000010276 construction Methods 0.000 claims description 4
- 238000005516 engineering process Methods 0.000 claims description 4
- 230000000694 effects Effects 0.000 description 14
- 238000004458 analytical method Methods 0.000 description 11
- 230000008569 process Effects 0.000 description 9
- 230000002411 adverse Effects 0.000 description 8
- 238000004590 computer program Methods 0.000 description 8
- 238000012986 modification Methods 0.000 description 6
- 230000004048 modification Effects 0.000 description 6
- 238000004891 communication Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 239000003086 colorant Substances 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 4
- 238000012217 deletion Methods 0.000 description 3
- 230000037430 deletion Effects 0.000 description 3
- 238000012549 training Methods 0.000 description 3
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 238000003058 natural language processing Methods 0.000 description 2
- 238000003062 neural network model Methods 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 101100444584 Mus musculus Efnb2 gene Proteins 0.000 description 1
- 230000004308 accommodation Effects 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000003796 beauty Effects 0.000 description 1
- 230000010485 coping Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000000802 evaporation-induced self-assembly Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了基于游客真实评价的景区优化方案智能生成方法及系统,其中,方法包括:获取游客评论数据;对游客评论数据进行预处理,提取游客评论中的主题词及情感关键词;构建景区评价评分数据表,景区评价评分数据表包含多个评论主题,评论主题内列举出每种评价主题中经常出现的评语及评语所对应的评分;根据主题词及情感关键词与景区评价评分数据表进行匹配,获得游客评论数据的评分;根据评分获得与游客评论数据对应的情绪评价;判断情绪评价是否为负面情绪;若是,则在预先构建的景区优化方案库,对主题词及主题词所对应的情感关键词进行匹配,获得第一景区优化方案。有效地解决难以快速有效的整合游客评价数据的问题。
Description
技术领域
本申请涉及人工智能技术领域,具体涉及基于游客真实评价的景区优化方案智能生成方法及系统。
背景技术
近年来,随着旅游业和社交软件的发展,微信公众号、微博等平台逐渐成为游客对旅游和景区表达情感的平台,积累了大量的游客对景区评论的文本。但对于这些评论所给予的评价,目前现有技术往往是通过人工的方式阅读评论后再根据评价的内容做出处理,此种方法不仅费事费力,而且由于评论数据量巨大且分散在各个OTA平台、微信公众号或服务平台上,难以快速有效的整合评价数据,无法有效的对其进行分析治理,使得全市各文旅资源无法及时有效的对评价进行掌握、无法第一时间响应舆情,进而影响游客的游玩体验及对景区造成不良的影响。
现有技术存在难以快速有效的整合评价数据,无法有效的对其进行分析治理,使得全市各文旅资源无法及时有效的对评价进行掌握、无法第一时间响应舆情,进而影响游客的游玩体验及对景区造成不良的影响的技术问题。
发明内容
本申请通过提供了基于游客真实评价的景区优化方案智能生成方法及系统,解决了难以快速有效的整合评价数据,无法有效的对其进行分析治理,使得全市各文旅资源无法及时有效的对评价进行掌握、无法第一时间响应舆情,进而影响游客的游玩体验及对景区造成不良的影响的技术问题。达到了基于游客评论数据,及时做出景区优化方案,在第一时间响应舆情,提高游客的游玩体验的技术效果。
鉴于上述问题,本申请提供了基于游客真实评价的景区优化方案智能生成方法及系统。
第一方面,本申请提供了一种基于游客真实评价的景区优化方案智能生成方法,其中,所述方法包括:获取游客评论数据;对所述游客评论数据进行预处理,提取所述游客评论中的主题词及所述主题词所对应的情感关键词;构建景区评价评分数据表,所述景区评价评分数据表包含多个评论主题,所述评论主题内列举出每种所述评价主题中经常出现的评语及所述评语所对应的评分;根据所述主题词及所述主题词所对应的情感关键词与所述景区评价评分数据表进行匹配,获得所述游客评论数据的评分;根据所述评分获得与所述游客评论数据对应的情绪评价,所述情绪评价包括正面情绪、中性情绪、负面情绪;判断所述情绪评价是否为负面情绪;若是,则在预先构建的景区优化方案库,对所述主题词及所述主题词所对应的情感关键词进行匹配,获得第一景区优化方案。
第二方面,本申请提供了基于游客真实评价的景区优化方案智能生成系统,其中,所述系统包括:游客评论数据获得单元,用于获取游客评论数据;预处理单元,用于对所述游客评论数据进行预处理,提取所述游客评论中的主题词及所述主题词所对应的情感关键词;景区评价评分数据表构建单元,用于构建景区评价评分数据表,所述景区评价评分数据表包含多个评论主题,所述评论主题内列举出每种所述评价主题中经常出现的评语及所述评语所对应的评分;游客评论数据评分获得单元,用于根据所述主题词及所述主题词所对应的情感关键词与所述景区评价评分数据表进行匹配,获得所述游客评论数据的评分;情绪评价获得单元,用于根据所述评分获得与所述游客评论数据对应的情绪评价,所述情绪评价包括正面情绪、中性情绪、负面情绪;情绪评价判断单元,用于判断所述情绪评价是否为负面情绪;第一景区优化方案获得单元,用于若是,则在预先构建的景区优化方案库,对所述主题词及所述主题词所对应的情感关键词进行匹配,获得第一景区优化方案。
第三方面,本申请提供了基于游客真实评价的景区优化方案智能生成装置,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现第一方面任一项所述方法的步骤。
第四方面,本申请提供了一种计算机程序产品,包括计算机程序和/或指令,其特征在于,该计算机程序和/或指令被处理器执行时实现第一方面任一项所述方法的步骤。
本申请中提供的一个或多个技术方案,至少具有如下技术效果或优点:
由于采用了获取游客评论数据;对所述游客评论数据进行预处理,提取所述游客评论中的主题词及所述主题词所对应的情感关键词;构建景区评价评分数据表,所述景区评价评分数据表包含多个评论主题,所述评论主题内列举出每种所述评价主题中经常出现的评语及所述评语所对应的评分;根据所述主题词及所述主题词所对应的情感关键词与所述景区评价评分数据表进行匹配,获得所述游客评论数据的评分;根据所述评分获得与所述游客评论数据对应的情绪评价,所述情绪评价包括正面情绪、中性情绪、负面情绪;判断所述情绪评价是否为负面情绪;若是,则在预先构建的景区优化方案库,对所述主题词及所述主题词所对应的情感关键词进行匹配,获得第一景区优化方案。解决了难以快速有效的整合评价数据,无法有效的对其进行分析治理,使得全市各文旅资源无法及时有效的对评价进行掌握、无法第一时间响应舆情,进而影响游客的游玩体验及对景区造成不良的影响的技术问题。达到了基于游客评论数据,及时做出景区优化方案,在第一时间响应舆情,提高游客的游玩体验的技术效果。
上述说明仅是本申请技术方案的概述,为了能够更清楚了解本申请的技术手段,而可依照说明书的内容予以实施,并且为了让本申请的上述和其它目的、特征和优点能够更明显易懂,以下特举本申请的具体实施方式。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请一种基于游客真实评价的景区优化方案智能生成方法的流程示意图;
图2为本申请一种基于游客真实评价的景区优化方案智能生成方法的获得所述游客评论数据的评分的流程示意图;
图3为本申请一种基于游客真实评价的景区优化方案智能生成方法的提取主题词及所述主题词所对应的情感关键词的流程示意图;
图4为本申请一种基于游客真实评价的景区优化方案智能生成方法的预先构建的景区优化方案库的流程示意图;
图5为本申请一种基于游客真实评价的景区优化方案智能生成方法的获得第二景区优化方案的流程示意图;
图6为本申请一种基于游客真实评价的景区优化方案智能生成系统的结构示意图;
图7为本申请示例性电子设备的结构示意图。
附图标记说明:游客评论数据获得单元11,预处理单元12,景区评价评分数据表构建单元13,游客评论数据评分获得单元14,情绪评价获得单元15,情绪评价判断单元16,第一景区优化方案获得单元17,电子设备300,存储器301,处理器302,通信接口303,总线架构304。
具体实施方式
本申请通过提供了基于游客真实评价的景区优化方案智能生成方法及系统,解决了难以快速有效的整合评价数据,无法有效的对其进行分析治理,使得全市各文旅资源无法及时有效的对评价进行掌握、无法第一时间响应舆情,进而影响游客的游玩体验及对景区造成不良的影响的技术问题。达到了基于游客评论数据,及时做出景区优化方案,在第一时间响应舆情,提高游客的游玩体验的技术效果。
申请概述
近年来,随着旅游业和社交软件的发展,微信公众号、微博等平台逐渐成为游客对旅游和景区表达情感的平台,积累了大量的游客对景区评论的文本。但对于这些评论所给予的评价,目前现有技术往往是通过人工的方式阅读评论后再根据评价的内容做出处理,此种方法不仅费事费力,而且由于评论数据量巨大且分散在各个OTA平台、微信公众号或服务平台上,难以快速有效的整合评价数据,无法有效的对其进行分析治理,使得全市各文旅资源无法及时有效的对评价进行掌握、无法第一时间响应舆情,进而影响游客的游玩体验及对景区造成不良的影响。
现有技术存在难以快速有效的整合评价数据,无法有效的对其进行分析治理,使得全市各文旅资源无法及时有效的对评价进行掌握、无法第一时间响应舆情,进而影响游客的游玩体验及对景区造成不良的影响的技术问题。
针对上述技术问题,本申请提供的技术方案总体思路如下:
本申请提供了一种基于游客真实评价的景区优化方案智能生成方法,其中,所述方法包括:获取游客评论数据;对所述游客评论数据进行预处理,提取所述游客评论中的主题词及所述主题词所对应的情感关键词;构建景区评价评分数据表,所述景区评价评分数据表包含多个评论主题,所述评论主题内列举出每种所述评价主题中经常出现的评语及所述评语所对应的评分;根据所述主题词及所述主题词所对应的情感关键词与所述景区评价评分数据表进行匹配,获得所述游客评论数据的评分;根据所述评分获得与所述游客评论数据对应的情绪评价,所述情绪评价包括正面情绪、中性情绪、负面情绪;判断所述情绪评价是否为负面情绪;若是,则在预先构建的景区优化方案库,对所述主题词及所述主题词所对应的情感关键词进行匹配,获得第一景区优化方案。
在介绍了本申请基本原理后,下面将结合说明书附图来具体介绍本申请的各种非限制性的实施方式。
实施例一
如图1所示,本申请提供了一种基于游客真实评价的景区优化方案智能生成方法,其中,所述方法包括:
S100:获取游客评论数据;
具体而言,获取游客评论数据的方式可以为多种,如可以从各OTA平台、微信公众号、微博等平台获取游客评论数据,获取数据的方式为利用网络爬虫,当然需要说明的是,当然的,获取游客评论数据还可以采取其他方式,此处是为进行步骤理解进行的细化,不对所述获取游客评论数据的方式进行具体限定。
S200:对所述游客评论数据进行预处理,提取所述游客评论中的主题词及所述主题词所对应的情感关键词;
具体而言,发明实施例在获取所述游客评论数据后,可以对游客评论数据文本进行预处理,进而得到所述游客评论中的主题词及所述主题词所对应的情感关键词,该预处理可以是对待提取景区评论文本进行分词、以及对分词的过滤等操作,同时,此处的主题词为可以代表景区特征的表示,例如交通、景点、住宿、服务等,可根据实际需求进行设置,在此不作限定,同时需要说明的是,游客评论数据往往包含了多个主题,此时就会提取多个主题词及与每个主题词对应的情感关键词,如“景区景点很好看,但就是工作人员的服务态度不好”,此时提取的主题关键词就有“景点”和“服务”两个,而“景点”所对应的情感关键词为“很好看”,“服务”的情感关键词为“态度不好”
S300:构建景区评价评分数据表,所述景区评价评分数据表包含多个评论主题,所述评论主题内列举出每种所述评价主题中经常出现的评语及所述评语所对应的评分;
具体而言,评论主题包含有多个,如服务、安全、景色、交通、体验、配套、卫生、消费等,可根据实际需求,进行具体设置,在此不作限定,同时,各个评论主题内列举出每种所述评价主题中经常出现的评语及所述评语所对应的评分可根据多种方式获得,即可根据了解的情况自行设定评语和评分,也可根据通过对以往大数据分析,以获得对应的评语和评分。
S400:根据所述主题词及所述主题词所对应的情感关键词与所述景区评价评分数据表进行匹配,获得所述游客评论数据的评分;
具体而言,根据所述主题词与所述景区评价评分数据表中的所述评价主题进行匹配,确定所述主题词在所述景区评价评分数据表中的评价主体,再根据确定好的评价主体,将对应的所述情感关键词与所述评价主体内的经常出现的评语进行匹配,确定最接近的评语,获得与所述评语相对应的评分,需说明的是,以所述主题词和所述情感关键词与所述景区评价评分表数据集为训练数据,将所述主题词和所述情感关键词与所述景区评价评分表的所述评论主题和每种所述评价主题中经常出现的评语及所述评语所对应的评分输入神经网络模型,所述景区评价评分表是基于大数据采集的信息,采用自然语言处理算法将所述景区评价评分表进行标准处理,使得计算机可以对景区评价评分表中的信息进行定量化的具体运算,常见的,可以采用归一化对所述景区评价评分表中的信息进行处理,具体的,结合所述主题词和所述情感关键词的数据特征,采用映射的方式将所述主题词和所述情感关键词映射到0~1范围之内,使得所述主题词和所述情感关键词能够参与运算,以获得匹配度,当然的,实际的运算过程应结合所述用户所述主题词和所述情感关键词的数据特征进行具体确定。
S500:根据所述评分获得与所述游客评论数据对应的情绪评价,所述情绪评价包括正面情绪、中性情绪、负面情绪;
具体而言,评分的设置以实际耳朵,以评分(0~10分)为例,若经过匹配,最终评分在5分以下,则得到的情绪评价为负面情绪,若评分为5分,则得到的情绪评价为中性情绪,若评分大于5分,则为正面情绪。
S600:判断所述情绪评价是否为负面情绪;
S700:若是,则在预先构建的景区优化方案库,对所述主题词及所述主题词所对应的情感关键词进行匹配,获得第一景区优化方案。
具体而言,所述预先构建的景区优化方案库将景区优化方案根据方案的主题特征和情绪关键特征设置两级标签,首先根据主题特征设置为第一标签,然后再在所述第一标签下根据情绪关键特征设置第二标签,此时对所述主题词及所述主题词所对应的情感关键词进行匹配,根据所述主题词确定第一标签,再根据所述情感关键词确定第二标签,第二标签所对应的景区优化方案为第一景区优化方案。同时,若为否,则表示游客情绪为中性或正面情绪,无需给出优化方案。
具体而言,本方法首先可通过网络爬虫技术从各OTA平台、微信公众号、微博获取游客评论数据,再根据文旅行业自身的特点,制作行业评价评分表。该评分表提供了包含服务、安全、景色、交通、体验、配套、卫生、消费八大类型的评价,并列举出每种评价类型中经常出现的评语,以及对应的评分(0~10分),再通过Jieba中文分词工具,对游客评论进行“全模式”的分词,将评论中所有可能的词语都扫描出来,从不同的角度切分成不同的词语,将各种不同的组合都挖掘出来。将分词的结果与评价评分表中的评语进行匹配,得出游客评论中不同类型评价的评分,评分计算规则为同一评论类型的多个评论词语进行平均分的计算,再根据评分对游客评论进行正面情绪、中性情绪、负面情绪的评价分析。若为负面情绪,同时根据词性保留有价值的词语(如:名词、地名、动词、动名词、形容词、区别词、习惯用语、成语等),对选定时间段内的所有评论的分词结果进行计数统计,并按计数降序排列,选择前20个词作为情绪关键词,最后根据文旅行业的自身特点,制作包含服务、安全、景色、交通、体验、配套、卫生、消费八大类型的景区优化方案的文案,方案中包含应对各种情绪关键词的解决措施,通过AI生成式大语言模型对优化方案进行向量化,并进行本地化存储,将分词的结果与评价评分表中的评语进行匹配,得出游客评论中不同主题特征评价的低分情绪关键词。通过AI生成式大语言模型对情绪关键词进行向量化,并进行本地化存储,运用余弦相似度算法,对情绪关键词向量与优化方案向量进行相似度比对,选出相似度评分高的N组方案,将负面关键词与选出的N组方案一起传递给AI生成式大语言模型,由大语言模型最终生成景区优化方案。
进一步的,所述评论主题包括:服务、安全、景色、交通、体验、配套、卫生、消费八个主题。
具体而言,此处对评论主题进行进一步的细化,使得景区主题特征进一步细化,有助于后续优化方案的提出,使得方案更具针对性,提升了方法的可行性。
进一步的,所述方法中对所述游客评论数据进行预处理时规则包括:去除重复数据,去除缺失无效数据,短句删除,英文、数字、字符的删除,去除停用词及中文分词。
本实施例进行预处理时,包括以下步骤:
第一步是去除重复数据,因评论集数量较多,内容难免存在重复,比如很多用户在旅游后一般会忘记对景区进行评论,评论期限一过,系统就会自动默认为默认好评,这类数据并不能代表用户的本身情感态度,应当予以去除。主要包括内容重复数据,以及系统默认评论数据。
第二步是去除缺失无效数据,去除无效数据主要包括去除内容缺失数据,数据集中多次出现空白评论,删除这些空值数据,以及去除HTML超文本标签数据,例如超文本标签“<htkl></html>、<ul/>、<ul/>”等无效数据。
第三步是短句删除,对于一些评论内容较短的数据,比如“可以”,“好”,“一般”,这种词汇量较短的评论文本虽然表达了用户对景区的情感态度,但是并没有详细说明情感态度的具体对象,即评价主题;
第四步是英文、数字、字符的删除。对于文本数据中出现的英文,数字“1”,“2”,“3”以及特殊字符串“@”,“#”等并不具备分析价值,因此需要在数据预处理阶段删除。
第五步是去除停用词,文章中很多数据是无用的,以免影响后续情感处理的准确性,需要剔除这部分无用数据。这部分数据主要表现为大量存在且没有实际用处,例如文本中出现的“我们”,“的”,“大家”,“这样”等经常使用的词,以及“呢”,“呀”等大量出现无实际用处的词就是停用词,为了使文本分析结果更加精准,最好的方式就是剔除这些停用词。
第六步是中文分词,因计算机不能直接处理非结构化数据,比如汉字,为了便于分析游客评论数据,需要将数据切分处理转变成结构化数据。
本实施例进行本实施例进行游客评论数据时,以游客评论数据中“风景真的很美,各色风景让人目不暇接,温度很舒服,没有失望,很值得一游”为例,阐述具体的整句,情感值计算步骤,过程如下:
句子切分,将“风景真的很美,各色风景让人目不暇接,温度很舒服,没有失望,很值得一游”输入软件中,利用标点符号对文本进行初步切分,形成五个小分句,后续每个分句中的情感倾向态度,切分好的子句如下所示:
子句1:“风景真的很美”
子句2:“各色风景让人目不暇接”
子句3:“温度很舒服”
子句4:“没有失望”。
中文分词及去停用词,利用jieba分词对每个子句进行中文分词以及去除停用词,先对子句进行分词且分处理,具体结果如下所示:
分词后1:“风景”,“真的”,“很”,“美”
分词后2:“各色”,“风景”,“让”,“人”,“目不暇接”
分词后3:“温度”,“很”,“舒服”
分词后4:“没有”,“失望”
分词后5:“很”,“值得”,“一游”
子句分词处理后进行停用词处理,将分词文本与本文构造的停用词词典进行匹配,删除匹配成功的停用词,未匹配成功的则保留下来,具体结果如下:
去停用词后1:“风景”,“很”,“美”
去停用词后2:“各色”,“风景”,“目不暇接”
去停用词后3:“温度”,“很”,“舒服”
去停用词后4:“没有”,“失望”
去停用词后5:“很”,“值得”,“一游”
进一步地,所述重复数据包括容重复数据和系统默认评论数据;
所述无效数据包括内容缺失数据,数据集中多次出现空白评论,空值数据以及HTML超文本标签数据;
所述短句删除是删除与评论内容较短的数据;
所述中文分词是将数据切分处理转变成结构化数据。
如图2所示,S400的步骤,包括:
S401:将所述主题词与所述景区评论评分表进行匹配,确定所述游客评论数据的所述评论主题;
具体而言,以所述主题词与所述景区评价评分表的评论主题数据集为训练数据,将所述主题词与所述景区评价评分表的所述评论主题数据集输入神经网络模型,所述评论主题是基于大数据采集的信息,采用自然语言处理算法将所述评论主题进行标准处理,使得计算机可以对评论主题进行定量化的具体运算,常见的,可以采用归一化对评论主题进行处理,具体的,结合所述主题词的数据特征,采用映射的方式将所述主题词映射到0~1范围之内,使得所述主题词能够参与运算,以获得匹配度,当然的,实际的运算过程应结合所述用户所述主题词的数据特征进行具体确定。
S402:将所述情感关键词与所述景区评论评分表内所述评论主题对应的所述评语进行匹配;
S403:若同一所述主题词下存在多个所述情感关键词,则评分计算规则为进行平均分的计算。
具体而言,如一个主题词下存在多个情感关键词,则将每个情感关键词所对应的评分除以情感关键词的数量作为最终的评分结果;
进一步的,所述S100的步骤,包括:通过网络爬虫技术从各OTA平台、微信公众号、微博获取游客评论数据。
进一步的,如图3所示,所述S200的步骤,包括:
S201:对游客评论进行“全模式”的分词;
S202:将评论中所有可能的词语都扫描出来,从不同的角度切分成不同的词语,将各种不同的组合都挖掘出来,同时根据词性保留有价值的词语并从中提取所述主题词;
S203:对选定时间段内所有评论中提取的所述主题词所对应的分词结果进行计数统计,并按计数降序排列,选择前若干个词作为情感关键词。
具体而言,在本市实例中,首先通过Jieba中文分词工具,对游客评论进行“全模式”的分词,将评论中所有可能的词语都扫描出来,从不同的角度切分成不同的词语,将各种不同的组合都挖掘出来,同时根据词性保留有价值的词语(如:名词、地名、动词、动名词、形容词、区别词、习惯用语、成语等)。对选定时间段内的所有评论的分词结果进行计数统计,并按计数降序排列,选择前20个词作为情绪关键词,需说明的是,情绪关键词的设置可根据实际情况进行设置,在此不作限定。
进一步的,如图4所示,所述预先构建的景区优化方案库的步骤,包括:
S704:获取与优化方案相关的多源信息;
S705:对所述多源信息进行预处理,确定预处理的多源信息;
S706:对所述预处理的多源信息进行主题特征和情绪关键词特征提取,建立所述景区优化方案库。
具体而言,本方法可通过网络爬虫技术从各OTA平台、微信公众号、微博等平台获取与优化方案相关的多源信息,再在获取所述游客评论数据后,可以对游客评论数据文本进行预处理,进而得到所述游客评论中的主题词及所述主题词所对应的情感关键词,该预处理可以是对待提取景区评论文本进行分词、以及对分词的过滤等操作。
进一步的,如图5所示,所述S700的步骤,包括:
S701:将所述情绪关键词进行向量化,并进行本地化存储。
S702:运用余弦相似度算法,对所述情绪关键词向量与景区优化方案向量进行相似度比对,选出相似度评分高的N组方案。
S703:将所述情绪关键词与选出的N组方案一起传递给AI生成式大语言模型,由AI生成式大语言模型最终生成第二景区优化方案。
具体而言,首先根据文旅行业的自身特点,制作包含服务、安全、景色、交通、体验、配套、卫生、消费八大类型的景区优化方案的文案,方案中包含应对各种情绪关键词的解决措施,通过AI生成式大语言模型对优化方案进行向量化,并进行本地化存储,将分词的结果与评价评分表中的评语进行匹配,得出游客评论中不同主题特征评价的低分情绪关键词。通过AI生成式大语言模型对情绪关键词进行向量化,并进行本地化存储,运用余弦相似度算法,对情绪关键词向量与优化方案向量进行相似度比对,选出相似度评分高的N组方案,将负面关键词与选出的N组方案一起传递给AI生成式大语言模型,由大语言模型最终生成景区优化方案。
综上所述,本申请所提供的一种基于游客真实评价的景区优化方案智能生成方法具有如下技术效果:
1.由于采用了获取游客评论数据;对所述游客评论数据进行预处理,提取所述游客评论中的主题词及所述主题词所对应的情感关键词;构建景区评价评分数据表,所述景区评价评分数据表包含多个评论主题,所述评论主题内列举出每种所述评价主题中经常出现的评语及所述评语所对应的评分;根据所述主题词及所述主题词所对应的情感关键词与所述景区评价评分数据表进行匹配,获得所述游客评论数据的评分;根据所述评分获得与所述游客评论数据对应的情绪评价,所述情绪评价包括正面情绪、中性情绪、负面情绪;判断所述情绪评价是否为负面情绪;若是,则在预先构建的景区优化方案库,对所述主题词及所述主题词所对应的情感关键词进行匹配,获得第一景区优化方案。解决了难以快速有效的整合评价数据,无法有效的对其进行分析治理,使得全市各文旅资源无法及时有效的对评价进行掌握、无法第一时间响应舆情,进而影响游客的游玩体验及对景区造成不良的影响的技术问题。达到了基于游客评论数据,及时做出景区优化方案,在第一时间响应舆情,提高游客的游玩体验的技术效果。
2.由于采用了去除重复数据,去除缺失无效数据,短句删除,英文、数字、字符的删除,去除停用词及中文分词。有效地去除了无效数据,保证了方法的有效性与可实施性。
3.由于采用了所述重复数据包括容重复数据和系统默认评论数据;所述无效数据包括内容缺失数据,数据集中多次出现空白评论,空值数据以及HTML超文本标签数据;所述短句删除是删除与评论内容较短的数据;所述中文分词是将数据切分处理转变成结构化数据。进一步提升方法的有效性与可实施性。
4.由于采用了将所述主题词与所述景区评论评分表进行匹配,确定所述游客评论数据的所述评论主题;将所述情感关键词与所述景区评论评分表内所述评论主题对应的所述评语进行匹配;若同一所述主题词下存在多个所述情感关键词,则评分计算规则为进行平均分的计算。进一步对评分的方式进行优化,保证了获得评分的有效性与可实施性。
5.由于采用了对游客评论进行“全模式”的分词将评论中所有可能的词语都扫描出来,从不同的角度切分成不同的词语,将各种不同的组合都挖掘出来,同时根据词性保留有价值的词语并从中提取所述主题词;对选定时间段内所有评论中提取的所述主题词所对应的分词结果进行计数统计,并按计数降序排列,选择前若干个词作为情感关键词。。词性的保留,确保了情感关键词的有效性,保证了方法的可实施性。
实施例二
基于与前述实施例中一种基于游客真实评价的景区优化方案智能生成方法相同的发明构思,如图6所示,本申请提供了一种基于游客真实评价的景区优化方案智能生成系统,其中,所述系统包括:
游客评论数据获得单元11,用于获取游客评论数据;
预处理单元12,用于对所述游客评论数据进行预处理,提取所述游客评论中的主题词及所述主题词所对应的情感关键词;
景区评价评分数据表构建单元13,用于构建景区评价评分数据表,所述景区评价评分数据表包含多个评论主题,所述评论主题内列举出每种所述评价主题中经常出现的评语及所述评语所对应的评分;
游客评论数据评分获得单元14,用于根据所述主题词及所述主题词所对应的情感关键词与所述景区评价评分数据表进行匹配,获得所述游客评论数据的评分;
情绪评价获得单元15,用于根据所述评分获得与所述游客评论数据对应的情绪评价,所述情绪评价包括正面情绪、中性情绪、负面情绪;
情绪评价判断单元16,用于判断所述情绪评价是否为负面情绪;
第一景区优化方案获得单元17,用于若是,则在预先构建的景区优化方案库,对所述主题词及所述主题词所对应的情感关键词进行匹配,获得第一景区优化方案。
示例性电子设备
下面参考图7来描述本申请的电子设备,基于与前述实施例中一种基于游客真实评价的景区优化方案智能生成方法相同的发明构思,本申请还提供了一种基于游客真实评价的景区优化方案智能生成系统,包括:处理器,所述处理器与存储器耦合,所述存储器用于存储程序,当所述程序被所述处理器执行时,使得系统以执行第一方面任一项所述的方法。该电子设备300包括:处理器302、通信接口303、存储器301。
可选的,电子设备300还可以包括总线架构304。其中,通信接口303、处理器302以及存储器301可以通过总线架构304相互连接;总线架构304可以是外设部件互连标(peripheral component interconnect,简称PCI)总线或扩展工业标准结构(extendedindustry Standard architecture,简称EISA)总线等。所述总线架构304可以分为地址总线、数据总线、控制总线等。为便于表示,图7中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。处理器302可以是一个CPU,微处理器,ASIC,或一个或多个用于控制本申请方案程序执行的集成电路。通信接口303,使用任何收发器一类的装置,用于与其他设备或通信网络通信,如以太网,无线接入网(radio access network,RAN),无线局域网(wireless local area networks,WLAN),有线接入网等。存储器301可以是ROM或可存储静态信息和指令的其他类型的静态存储设备,RAM或者可存储信息和指令的其他类型的动态存储设备,也可以是电可擦可编程只读存储器(electrically erasable Programmableread-only memory,EEPROM)、只读光盘(compact discread-only memory,CD-ROM)或其他光盘存储、光碟存储(包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等)、磁盘存储介质或者其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。存储器可以是独立存在,通过总线架构304与处理器相连接。存储器也可以和处理器集成在一起。
其中,存储器301用于存储执行本申请方案的计算机执行指令,并由处理器302来控制执行。处理器302用于执行存储器301中存储的计算机执行指令,从而实现本申请上述实施例提供的一种基于游客真实评价的景区优化方案智能生成方法。
可选的,本申请中的计算机执行指令也可以称之为应用程序代码,本申请对此不作具体限定。
本领域普通技术人员可以理解:本申请中涉及的第一、第二等各种数字编号仅为描述方便进行的区分,并不用来限制本申请的范围,也不表示先后顺序。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。“至少一个”是指一个或者多个。至少两个是指两个或者多个。“至少一个”、“任意一个”或其类似表达,是指的这些项中的任意组合,包括单项(个)或复数项(个)的任意组合。例如a,b,或c中的至少一项(个、种),可以表示:a,b,c,a-b,a-c,b-c,或a-b-c,其中a,b,c可以是单个,也可以是多个。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本申请所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包括一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如软盘、硬盘、磁带)、光介质(例如DVD)、或者半导体介质(例如固态硬盘(SolidState Disk,SSD))等。
本申请中所描述的各种说明性的逻辑单元和电路可以通过通用处理器,数字信号处理器,专用集成电路(ASIC),现场可编程门阵列(FPGA)或其它可编程逻辑装置,离散门或晶体管逻辑,离散硬件部件,或上述任何组合的设计来实现或操作所描述的功能。通用处理器可以为微处理器,可选地,该通用处理器也可以为任何传统的处理器、控制器、微控制器或状态机。处理器也可以通过计算装置的组合来实现,例如数字信号处理器和微处理器,多个微处理器,一个或多个微处理器联合一个数字信号处理器核,或任何其它类似的配置来实现。
本申请中所描述的方法或算法的步骤可以直接嵌入硬件、处理器执行的软件单元、或者这两者的结合。软件单元可以存储于RAM存储器、闪存、ROM存储器、EPROM存储器、EEPROM存储器、寄存器、硬盘、可移动磁盘、CD-ROM或本领域中其它任意形式的存储媒介中。
示例性地,存储媒介可以与处理器连接,以使得处理器可以从存储媒介中读取信息,并可以向存储媒介存写信息。可选地,存储媒介还可以集成到处理器中。处理器和存储媒介可以设置于ASIC中,ASIC可以设置于终端中。可选地,处理器和存储媒介也可以设置于终端中的不同的部件中。这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
尽管结合具体特征及其实施例对本申请进行了描述,显而易见的,在不脱离本申请的精神和范围的情况下,可对其进行各种修改和组合。相应地,本说明书和附图仅仅是所附权利要求所界定的本申请的示例性说明,且视为已覆盖本申请范围内的任意和所有修改、变化、组合或等同物。显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请意图包括这些改动和变型在内。
Claims (10)
1.一种基于游客真实评价的景区优化方案智能生成方法,其特征在于,包括:
获取游客评论数据;
对所述游客评论数据进行预处理,提取所述游客评论中的主题词及所述主题词所对应的情感关键词;
构建景区评价评分数据表,所述景区评价评分数据表包含多个评论主题,所述评论主题内列举出每种所述评价主题中经常出现的评语及所述评语所对应的评分;
根据所述主题词及所述主题词所对应的情感关键词与所述景区评价评分数据表进行匹配,获得所述游客评论数据的评分;
根据所述评分获得与所述游客评论数据对应的情绪评价,所述情绪评价包括正面情绪、中性情绪、负面情绪;
判断所述情绪评价是否为负面情绪;
若是,则在预先构建的景区优化方案库,对所述主题词及所述主题词所对应的情感关键词进行匹配,获得第一景区优化方案。
2.根据权利要求1所述的基于游客真实评价的景区优化方案智能生成方法,其特征在于,所述评论主题包括:服务、安全、景色、交通、体验、配套、卫生、消费八个主题。
3.根据权利要求1所述的基于游客真实评价的景区优化方案智能生成方法,其特征在于,所述方法中对所述游客评论数据进行预处理时规则包括:去除重复数据,去除缺失无效数据,短句删除,英文、数字、字符的删除,去除停用词及中文分词。
4.根据权利要求3所述的基于游客真实评价的景区优化方案智能生成方法,其特征在于,所述重复数据包括容重复数据和系统默认评论数据;
所述无效数据包括内容缺失数据,数据集中多次出现空白评论,空值数据以及HTML超文本标签数据;
所述短句删除是删除与评论内容较短的数据;
所述中文分词是将数据切分处理转变成结构化数据。
5.根据权利要求1所述的基于游客真实评价的景区优化方案智能生成方法,其特征在于,所述根据所述主题词及所述主题词所对应的情感关键词与所述景区评价评分数据表进行匹配,获得所述游客评论数据的评分的步骤,包括:
将所述主题词与所述景区评论评分表进行匹配,确定所述游客评论数据的所述评论主题;
将所述情感关键词与所述景区评论评分表内所述评论主题对应的所述评语进行匹配;
若同一所述主题词下存在多个所述情感关键词,则评分计算规则为进行平均分的计算。
6.根据权利要求1所述的基于游客真实评价的景区优化方案智能生成方法,其特征在于,所述获取游客评论数据的步骤,包括:通过网络爬虫技术从各OTA平台、微信公众号、微博获取游客评论数据。
7.根据权利要求1所述的基于游客真实评价的景区优化方案智能生成方法,其特征在于,所述方法中提取所述游客评论中的主题词及所述主题词所对应的情感关键词的步骤,包括:
对游客评论进行“全模式”的分词;
将评论中所有可能的词语都扫描出来,从不同的角度切分成不同的词语,将各种不同的组合都挖掘出来,同时根据词性保留有价值的词语并从中提取所述主题词;
对选定时间段内所有评论中提取的所述主题词所对应的分词结果进行计数统计,并按计数降序排列,选择前若干个词作为情感关键词。
8.根据权利要求1所述的基于游客真实评价的景区优化方案智能生成方法,其特征在于,所述预先构建的景区优化方案库的步骤,包括:
获取与优化方案相关的多源信息;
对所述多源信息进行预处理,确定预处理的多源信息;
对所述预处理的多源信息进行主题特征和情绪关键词特征提取,建立所述景区优化方案库。
9.根据权利要求1所述的基于游客真实评价的景区优化方案智能生成方法,其特征在于,所述在预先构建的景区优化方案库,对所述主题词及所述主题词所对应的情感关键词进行匹配,获得第一景区优化方案的步骤,包括:
将所述情绪关键词进行向量化,并进行本地化存储。
运用余弦相似度算法,对所述情绪关键词向量与景区优化方案向量进行相似度比对,选出相似度评分高的N组方案。
将所述情绪关键词与选出的N组方案一起传递给AI生成式大语言模型,由AI生成式大语言模型最终生成第二景区优化方案。
10.一种基于游客真实评价的景区优化方案智能生成系统,其特征在于,所述系统包括:
游客评论数据获得单元,用于获取游客评论数据;
预处理单元,用于对所述游客评论数据进行预处理,提取所述游客评论中的主题词及所述主题词所对应的情感关键词;
景区评价评分数据表构建单元,用于构建景区评价评分数据表,所述景区评价评分数据表包含多个评论主题,所述评论主题内列举出每种所述评价主题中经常出现的评语及所述评语所对应的评分;
游客评论数据评分获得单元,用于根据所述主题词及所述主题词所对应的情感关键词与所述景区评价评分数据表进行匹配,获得所述游客评论数据的评分;
情绪评价获得单元,用于根据所述评分获得与所述游客评论数据对应的情绪评价,所述情绪评价包括正面情绪、中性情绪、负面情绪;
情绪评价判断单元,用于判断所述情绪评价是否为负面情绪;
第一景区优化方案获得单元,用于若是,则在预先构建的景区优化方案库,对所述主题词及所述主题词所对应的情感关键词进行匹配,获得第一景区优化方案。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311234371.1A CN117217801A (zh) | 2023-09-24 | 2023-09-24 | 基于游客真实评价的景区优化方案智能生成方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311234371.1A CN117217801A (zh) | 2023-09-24 | 2023-09-24 | 基于游客真实评价的景区优化方案智能生成方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117217801A true CN117217801A (zh) | 2023-12-12 |
Family
ID=89050798
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311234371.1A Pending CN117217801A (zh) | 2023-09-24 | 2023-09-24 | 基于游客真实评价的景区优化方案智能生成方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117217801A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117973946A (zh) * | 2024-03-29 | 2024-05-03 | 云南与同加科技有限公司 | 一种面向教学的数据处理方法及系统 |
-
2023
- 2023-09-24 CN CN202311234371.1A patent/CN117217801A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117973946A (zh) * | 2024-03-29 | 2024-05-03 | 云南与同加科技有限公司 | 一种面向教学的数据处理方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108874878B (zh) | 一种知识图谱的构建系统及方法 | |
CN109829166B (zh) | 基于字符级卷积神经网络的民宿顾客意见挖掘方法 | |
CN105893582B (zh) | 一种社交网络用户情绪判别方法 | |
CN105786991B (zh) | 结合用户情感表达方式的中文情感新词识别方法和系统 | |
KR102032091B1 (ko) | 인공지능 기반의 댓글 감성 분석 방법 및 그 시스템 | |
CN110297893B (zh) | 自然语言问答方法、装置、计算机装置及存储介质 | |
CN106202053B (zh) | 一种社交关系驱动的微博主题情感分析方法 | |
CN110472203B (zh) | 一种文章的查重检测方法、装置、设备及存储介质 | |
CN107577782B (zh) | 一种基于异质数据的人物相似度刻画方法 | |
CN107688630B (zh) | 一种基于语义的弱监督微博多情感词典扩充方法 | |
CN116561538A (zh) | 问答评分方法、问答评分装置、电子设备及存储介质 | |
WO2023124837A1 (zh) | 问诊处理方法、装置、设备及存储介质 | |
CN117217801A (zh) | 基于游客真实评价的景区优化方案智能生成方法及系统 | |
CN110399603A (zh) | 一种基于意群划分的文本处理技术方法和系统 | |
CN116306661A (zh) | 一种基于社交媒体数据的生态系统文化服务评估方法 | |
CN111898038A (zh) | 一种基于人机协作的社交媒体假新闻检测方法 | |
CN108763355A (zh) | 一种基于用户的智能机器人交互数据处理系统及方法 | |
CN115186080A (zh) | 一种智能问答数据处理方法、系统、计算机设备及介质 | |
CN114416929A (zh) | 实体召回模型的样本生成方法、装置、设备及存储介质 | |
CN113782123A (zh) | 一种基于网络数据的在线医疗患者满意度测量方法 | |
CN114116965A (zh) | 评论文本的观点提取方法以及电子设备 | |
CN108241609B (zh) | 排比句识别方法及系统 | |
CN113254609A (zh) | 一种基于负样本多样性的问答模型集成方法 | |
CN115630357B (zh) | 一种应用程序越界收集个人信息行为的判定方法 | |
CN111782789A (zh) | 智能问答方法与系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |