CN116501873A

CN116501873A - 一种基于ChatGpt及其他深度模型建立文本分析框架的方法

Info

Publication number: CN116501873A
Application number: CN202310464791.2A
Authority: CN
Inventors: 程新泉; 周彦希
Original assignee: Individual
Current assignee: Individual
Priority date: 2023-04-26
Filing date: 2023-04-26
Publication date: 2023-07-28

Abstract

本发明公开了一种基于ChatGpt及其他深度模型建立文本分析框架的方法，包括以下步骤：S1、采集登山旅游的评价文本数据；S2、运用ChatGpt4.0api做文本预处理；S3、利用BERT、ChatGpt、CNN分别进行文本情感分类；S4、对比步骤S4中三大模型在获取文本中情感分析的性能，选择最优模型；S5、导出不同极性的文本，通过主题分析模型来计算获取用户需求；S6、通过词频分析架构IPA商业模型。本发明采用上述的一种基于ChatGpt及其他深度模型建立文本分析框架的方法，具有广泛的商业应用价值，使用ChatGPT4.0api分析在线登山旅游评论，替代了传统机器学习的方法，使用提示工程进而获得情感分数，进而评估模型在准确度、精确度、召回率和F1分数方面的性能。

Description

一种基于ChatGpt及其他深度模型建立文本分析框架的方法

技术领域

本发明涉及登山旅游数据挖掘技术领域，尤其是涉及一种基于ChatGpt及其他深度模型建立文本分析框架的方法。

背景技术

随着旅游电子商务的兴起和发展，越来越多的游客通过互联网购买旅游服务，并在接受旅游服务后进行评论，发表对于旅游服务品质的看法，表达对于旅游服务的情感或感受，这些评论对于其他游客评估和选择旅游服务、区域旅游服务的质量评价、改进旅游服务的质量具有很重要的参考意义。但是，面对海量的旅游评论数据，通过人工或简单的统计分析方法，既费时费力又很难深层次的发挥旅游评论的价值，如何有效分析旅游评论的情感倾向，并在此基础上评价旅游服务的质量，为游客选择旅游目的地、旅游过程中的“吃住行游购娱”等各类服务提供决策依据，为旅游主管部门提供区域旅游质量评价、改进旅游服务提供工具和依据。

目前，对评论文本进行情感分析的技术主要分为两大类：一是基于情感字典或者语意知识的方法，二是基于机器学习方法。目前，上述两种方法在文本情感分析中均有运用，但是，使用机器学习的方法进行文本情感分析的优势更为明显，弹性和准确率更高。基于现有技术出发，公开号为CN106156287A“基于旅游需求模板的景区评价数据分析舆情满意度方法”的发明专利公开了一种基于关键词模板库来分析旅游景区满意度的方法，可以认为是使用情感词典的情感分析方法，其严重依赖于用户对情感词进行赋分，不能对新的词语进行处理，对一条评论整体所表达的情感倾向分析准确性较差。

因此，如何在评估各类机器学习算法模型有缺的基础上，选择性能和准确性相互平衡，且适合旅游行业特征的分类算法模型，对提高旅游评论分析的效率和有效性，具有很高的研究价值。

发明内容

本发明的目的是提供一种基于ChatGpt及其他深度模型建立文本分析框架的方法，具有广泛的商业应用价值，使用ChatGPT4.0 api分析在线登山旅游评论，替代了传统机器学习的方法，使用提示工程进而获得情感分数，进而评估模型在准确度、精确度、召回率和F1分数方面的性能。

为实现上述目的，本发明提供了一种基于ChatGpt及其他深度模型建立文本分析框架的方法，包括以下步骤：

S1、采集登山旅游的评价文本数据；

S2、运用ChatGpt4.0 api做文本预处理；

S3、利用BERT、ChatGpt、CNN分别进行文本情感分类；

S4、对比步骤S4中三大模型在获取文本中情感分析的性能，选择最优模型；

S5、导出不同极性的文本，通过主题分析模型来计算获取用户需求；

S6、通过词频分析架构IPA商业模型。

优选的，在所述步骤S1中，所述登山旅游的评价文本数据通过网络抓取或实地获得。

优选的，在所述步骤S2中，对评价文本数据进行预处理，具体如下：

通过程序语言对文本评价数据进行去重处理；

删除文本评价数据中不相关的信息，并标准化文本评价数据格式。

优选的，在所述步骤S3中，BERT(Bidirectional Encoder Representations fromTransformers)为一种预训练语言模型，采用fine-tune的方式构建模型；ChatGpt(ChatGenerative Pre-trainedTransformer)为一种基于深度学习技术的自然语言处理模型；CNN(Convolutional NeuralNetwork)为一种卷积神经网络；所述BERT、所述ChatGpt、所述CNN的实施方式均包括读取数据、调取模型、将情感分类文本存储在对应文件中、得到准确性、精确度、召回率及F1分数。

优选的，在所述步骤S5中，所述主题分析模型具体包括如下：将不同极性的文本组合成文本集，对所述文本集进行相关性筛选，删除低于预设相关性阈值的文本。

优选的，在所述步骤S6中，所述词频分析具体包括如下：

将得到的评价文本数据输入至词频分析器，利用LDA算法，结合预设的关键字，对待分析的文本数据进行分析和统计；

将分析和统计的结果输出架构IPA商业模型。

因此，本发明采用上述一种基于ChatGpt及其他深度模型建立文本分析框架的方法，具有广泛的商业应用价值，使用ChatGPT4.0 api分析在线登山旅游评论，替代了传统机器学习的方法，使用提示工程进而获得情感分数，进而评估模型在准确度、精确度、召回率和F1分数方面的性能。

下面通过附图和实施例，对本发明的技术方案做进一步的详细描述。

附图说明

图1是本发明一种基于ChatGpt及其他深度模型建立文本分析框架的方法的实施方法流程图；

图2是本发明一种基于ChatGpt及其他深度模型建立文本分析框架的方法实施例一IPA商业模型气泡图。

具体实施方式

以下通过附图和实施例对本发明的技术方案作进一步说明。

除非另外定义，本发明使用的技术术语或者科学术语应当为本发明所属领域内具有一般技能的人士所理解的通常意义。

如图1所示，本发明一种基于ChatGpt及其他深度模型建立文本分析框架的方法，包括以下步骤：

S1、采集登山旅游的评价文本数据；

S2、运用ChatGpt4.0 api做文本预处理；

S3、利用BERT、ChatGpt、CNN分别进行文本情感分类；

S6、通过词频分析架构IPA商业模型。

具体的，在步骤S1中，登山旅游的评价文本数据通过网络抓取或实地获得。

具体的，在步骤S2中，对评价文本数据进行预处理，具体如下：

通过程序语言对文本评价数据进行去重处理；

具体的，在步骤S3中，BERT(Bidirectional Encoder Representations fromTransformers)为一种预训练语言模型，采用fine-tune的方式构建模型；ChatGpt(ChatGenerative Pre-trainedTransformer)为一种基于深度学习技术的自然语言处理模型；CNN(Convolutional Neural Network)为一种卷积神经网络；BERT、ChatGpt、CNN的实施方式均包括读取数据、调取模型、将情感分类文本存储在对应文件中、得到准确性、精确度、召回率及F1分数。

具体的，在步骤S5中，主题分析模型具体包括如下：将不同极性的文本组合成文本集，对文本集进行相关性筛选，删除低于预设相关性阈值的文本。

具体的，在步骤S6中，词频分析具体包括如下：

将分析和统计的结果输出架构IPA商业模型。

下面将通过使用ChatGpt对本发明作进一步的解释。

实施例一

在本实施例中，ChatGpt作为一种新的情感分析方法，使用ChatGptAPI分析在线旅游评论，作为传统机器学习的替代方法。该方法涉及使用提示工程来获得情感分数，然后使用这些分数来评估模型在准确度、精确度、召回度和F1分数方面的性能。

为了实现上述的目标，ChatGptAPI被集成到分析管道中，使模型能够处理从各种在线平台收集的大量登山旅游评论。随后对登山旅游评论数据进行预处理，以此删除任何不相关的信息并标准化登山旅游评论文本数据的格式。然后采用即时工程技术来构建情绪分析任务，并查询API以获得每条评论的情绪分数。在此基础上，登录旅游评论数据集被分为训练集和测试集，确保正面、负面和中性情绪评论的适当平衡。

基于ChatGPT API的方法的结果展示了良好的性能，准确度为0.84，精确度为0.63，召回率为0.61，F1分数为0.61。这些指标表明该模型能够正确地对旅游评论的情绪进行分类，并特别强调真阳性率和真阴性率。在情感分析中使用ChatGPT API展示了大规模语言模型提供准确可靠结果的潜力，同时还降低了其他机器学习及深度学习方法中与特征提取和模型训练相关的复杂性。

如图2所示，在本实施例中，通过ChatGPT API的方法，将得到的结果进行词频分析，进而架构出IPA(Importance-Performance Analysis)商业模型，具体指的是“重要性-绩效”模型，进一步的解释说明本发明具有广泛的商业应用价值。

最后应说明的是：以上实施例仅用以说明本发明的技术方案而非对其进行限制，尽管参照较佳实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对本发明的技术方案进行修改或者等同替换，而这些修改或者等同替换亦不能使修改后的技术方案脱离本发明技术方案的精神和范围。

Claims

1.一种基于ChatGpt及其他深度模型建立文本分析框架的方法，其特征在于：包括以下步骤：

S1、采集登山旅游的评价文本数据；

S2、运用ChatGpt4.0api做文本预处理；

S3、利用BERT、ChatGpt、CNN分别进行文本情感分类；

S6、通过词频分析架构IPA商业模型。

2.根据权利要求1所述的一种基于ChatGpt及其他深度模型建立文本分析框架的方法，其特征在于：在所述步骤S1中，所述登山旅游的评价文本数据通过网络抓取或实地获得。

3.根据权利要求1所述的一种基于ChatGpt及其他深度模型建立文本分析框架的方法，其特征在于：在所述步骤S2中，对评价文本数据进行预处理，具体如下：

通过程序语言对文本评价数据进行去重处理；

4.根据权利要求1所述的一种基于ChatGpt及其他深度模型建立文本分析框架的方法，其特征在于：在所述步骤S3中，BERT(BidirectionalEncoderRepresentationsfromTransformers)为一种预训练语言模型，采用fine-tune的方式构建模型；ChatGpt(ChatGenerativePre-trainedTransformer)为一种基于深度学习技术的自然语言处理模型；CNN(ConvolutionalNeuralNetwork)为一种卷积神经网络；所述BERT、所述ChatGpt、所述CNN的实施方式均包括读取数据、调取模型、将情感分类文本存储在对应文件中、得到准确性、精确度、召回率及F1分数。

5.根据权利要求1所述的一种基于ChatGpt及其他深度模型建立文本分析框架的方法，其特征在于：在所述步骤S5中，所述主题分析模型具体包括如下：将不同极性的文本组合成文本集，对所述文本集进行相关性筛选，删除低于预设相关性阈值的文本。

6.根据权利要求1所述的一种基于ChatGpt及其他深度模型建立文本分析框架的方法，其特征在于：在所述步骤S6中，所述词频分析具体包括如下：

将分析和统计的结果输出架构IPA商业模型。