CN115392199B

CN115392199B - 评价分析和报告生成的方法、装置、电子设备及存储介质

Info

Publication number: CN115392199B
Application number: CN202211004819.6A
Authority: CN
Inventors: 陈振华; 李晓捷; 朱辰昊; 王海兵
Original assignee: Zaihui Shanghai Network Technology Co ltd
Current assignee: Zaihui Shanghai Network Technology Co ltd
Priority date: 2022-08-22
Filing date: 2022-08-22
Publication date: 2023-08-04
Anticipated expiration: 2042-08-22
Also published as: CN115392199A

Abstract

本发明涉及一种评价分析和报告生成的方法、装置、电子设备及存储介质。评价分析和报告生成的方法，包括步骤：S1、菜品和差评关键词库进行配置；S2、数据准备和预处理，形成基础的评价内容数据表；S3、数据导入；S4、基础数据统计；S5、菜品统计和分析，请求通用NLP平台，将根据返回结果的情绪正向或负向分析；S6、差评关键词分析，根据关键词库内容自动匹配评价内容并进行计数和内容索引定位，生成差评反馈的问题；S7、NLP评论分析；S8、手动标记；S9、合并整理，对于前面步骤的所有标记结果进行相似的分析结果进行合并；S10、生成和输出分析报告。本发明通过基于关键词库和自然语言对评价进行处理、分析和生成报告，其耗时短、效率高。

Description

评价分析和报告生成的方法、装置、电子设备及存储介质

技术领域

本发明涉及数据处理技术领域，具体而言，涉及一种评价分析和报告生成的方法、装置、电子设备及存储介质。

背景技术

本地生活领域，普通消费者到店消费后往往会在互联网平台如点评APP(Application，应用软件)上，对商户的菜品、价格、服务和环境等方面进行全面评价，第三方平台会依据评价内容计算商户的星级和排名，而商户通过收集这些评价内容并进行追条整理，能够精准挖掘出店铺经营过程中遇到关键问题，并进行针对性改进。

通常情况一家店铺每周的评价数量非常有限，但对于热度较高的商户或者连锁商户，一周内能产生评论量能达到百条甚至更多，那么人工分析和整理的时长也会大大增加，实测单次处理百条评论可能耗时在4小时以上，所消耗时间长。因此，亟需利用AI(人工智能)技术对评价进行自动分析和整理。

发明内容

本发明要解决的技术问题是评价分析耗时过长问题。

为解决上述技术问题，根据本发明的一个方面，提供一种评价分析和报告生成的方法，方法基于第三方平台的APP或者管理后台上对于目标商户的评价而进行的智能评价分析和报告生成，方法包括如下步骤：S1、菜品和差评关键词库进行配置，录入菜品名称和差评关键词；S2、数据准备和预处理，通过第三平台的APP或者管理后台下载所需评价内容的列表，进行内容清洗去除无效内容，无效内容包括表情的特殊字符，形成基础的评价内容数据表；S3、数据导入，导入标准格式评价数据，其中，数据导入过程中自动过滤掉没有评论内容的评价，减少无效数据干扰；S4、基础数据统计，统计基础数据包括总评论数、好评数、中差评数；S5、菜品统计和分析，根据步骤S1菜品名称词库，进行统计菜品出现次数，截取菜品所在位置的文本句子，根据词库的菜品名称搜索过滤掉未提及菜品名称的评论内容，并根据常用标点切分成语句形成菜品语句库；请求通用NLP(Natural Language Processing，自然语言处理)平台，将根据返回结果的情绪正向或负向分析，分别统计为菜品的正向次数、负向次数，其中，对菜品语句进行情绪分析，输入为具体语句数据，输出为语句的分词情绪值或切词后的分词情绪值列表，对于其中只要出现一例负向情绪值即记录为负面提及，逐句处理后汇总每个菜品提及的次数以及正负向提及次数；S6、差评关键词分析，根据关键词库内容自动匹配评价内容并进行计数和内容索引定位，生成差评反馈的问题；S7、NLP评论分析，将评论的内容发往自然语言分析平台，对于评论内容较长的，需要根据段落切分后再分别请求处理；将第三方平台反馈的问题分类，所分类的类型包括菜品、价格、服务、环境和其他；S8、人工分析、手动标记，对前面步骤处理过程可能会出现遗漏，进行人为补充额外的差评问题，或者隐藏不需的反馈内容；S9、合并整理，对于前面步骤的所有标记结果进行合并整理，将相似的分析结果进行合并；如前面步骤处理过程存在概率不准确时，进行人工修正负面关键词和分类；S10、生成分析报告，根据以上步骤生成分析报告内容，输出报告。

根据本发明的实施例，步骤S2中，可从第三方平台APP后台下载的数据，确保其中至少包含一条中差评内容。

进一步地，步骤S2中，可对评价内容进行结构化处理，确保格式按照标准格式录入，格式包括评论内容、星级、评论时间、用户名的字段。

根据本发明的实施例，步骤S5中，NLP平台可包括BERT模型(BidirectionalEncoder Representation from Transformers，预训练的语言表征模型)和神经网络模型。

根据本发明的实施例，步骤S5中，NLP平台可具有利用第三方云平台的NLP接口，NLP接口包括阿里云或腾讯云平台。

根据本发明的实施例，步骤S6还可包括：S61、将基础评论的评价数据，根据常用标点切分成语句后构成基础的语句库；S62、确定负面语句库，利用NLP技术处理基础语句库，其中，负面语句为出现负面情绪词数量>0。

进一步地，步骤S7中，可根据TextCNN(TextCNN是指将卷积神经网络CNN应用到文本分类任务，利用多个不同size的kernel来提取句子中的关键信息，从而能够更好地捕捉局部相关性)算法对负面语句进行分类，分别划分到不同的负面问题分类中。

根据本发明的第二个方面，提供一种评价分析和报告生成的装置，包括：

数据预处理模块，数据预处理模块通过第三平台的APP或者管理后台下载所需评价内容的列表，进行内容清洗去除无效内容，无效内容包括表情的特殊字符，形成基础的评价内容数据表。菜品正负向统计模块，菜品正负向统计模块用于对评价数据进行情绪分析，请求通用NLP平台，将根据返回结果的情绪正向或负向分析，分别统计为菜品的正向次数、负向次数，其中，对菜品语句进行情绪分析，输入为具体语句数据，输出为语句的分词情绪值或切词后的分词情绪值列表，对于其中只要出现一例负向情绪值即记录为负面提及，逐句处理后汇总每个菜品提及的次数以及正负向提及次数，其中，NLP平台包括BERT模型和神经网络模型，或者具有利用包括阿里云或腾讯云平台的第三方云平台的NLP接口。差评分类统计模块，用于将基础评论的评价数据根据常用标点切分成语句后构成基础的语句库，确定负面语句库，其中，负面语句为出现负面情绪词数量>0；能够利用NLP技术处理基础语句库，根据TextCNN算法对负面语句进行分类，分别划分到不同的负面问题分类中，分类类型包括菜品、价格、服务、环境和其他。

根据本发明的第三个方面，提供一种电子设备，包括：存储器、处理器及存储在存储器上并可在处理器上运行的评价分析和报告生成程序，评价分析和报告生成程序被处理器执行时实现上述的评价分析和报告生成方法的步骤。

根据本发明的第四个方面，提供一种计算机存储介质，其中，计算机存储介质上存储有评价分析和报告生成程序，评价分析和报告生成程序被处理器执行时实现上述的评价分析和报告生成方法的步骤。

与现有技术相比，本发明的实施例所提供的技术方案至少可实现如下有益效果：

本发明通过基于关键词库和自然语言处理，进行自然语言处理、文本情绪分析和数据挖掘，利用AI技术对评价进行自动分析和整理的处理，从而完成评价分析和报告生成，其耗时短、效率高。

本发明内容结合自然语言处理技术和自定义的差评关键词库，构建一套标准评价反馈处理流程，包括对评价内容进行语义分析、关键问题提取分类以及菜品正负向提及计数等，使评价分析更为全面和准确。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对实施例的附图作简单地介绍，显而易见地，下面描述中的附图仅仅涉及本发明的一些实施例，而非对本发明的限制。

图1是示出依据本发明实施例的评价分析和报告生成的方法的流程图；

图2是示出依据本发明实施例的评价数据；

图3a是示出依据本发明实施例的每个菜品提及的次数；

图3b是示出依据本发明实施例的评价分类。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例的附图，对本发明实施例的技术方案进行清楚、完整地描述。显然，所描述的实施例是本发明的一部分实施例，而不是全部的实施例。基于所描述的本发明的实施例，本领域普通技术人员在无需创造性劳动的前提下所获得的所有其它实施例，都属于本发明保护的范围。

除非另作定义，此处使用的技术术语或者科学术语应当为本发明所属领域内具有一般技能的人士所理解的通常意义。本发明专利申请说明书以及权利要求书中使用的“第一”、“第二”以及类似的词语并不表示任何顺序、数量或者重要性，而只是用来区分不同的组成部分。同样，“一个”或者“一”等类似词语也不表示数量限制，而是表示存在至少一个。

评价分析和报告生成的方法基于第三方平台的APP或者管理后台上对于目标商户的评价而进行的智能评价分析和报告生成。如图1至图3b所示，评价分析和报告生成的方法包括如下步骤：

S1、菜品和差评关键词库进行配置，录入菜品名称和差评关键词。

S2、数据准备和预处理，通过第三平台的APP或者管理后台下载所需评价内容的列表，进行内容清洗去除无效内容，无效内容包括表情的特殊字符，形成基础的评价内容数据表。

S3、数据导入，导入标准格式评价数据，其中，数据导入过程中自动过滤掉没有评论内容的评价，减少无效数据干扰。

S4、基础数据统计，统计基础数据包括总评论数、好评数、中差评数。

S5、菜品统计和分析，根据步骤S1菜品名称词库，进行统计菜品出现次数，截取菜品所在位置的文本句子，根据词库的菜品名称搜索过滤掉未提及菜品名称的评论内容，并根据常用标点切分成语句形成菜品语句库；请求通用NLP平台，将根据返回结果的情绪正向或负向分析，分别统计为菜品的正向次数、负向次数，其中，对菜品语句进行情绪分析，输入为具体语句数据，输出为语句的分词情绪值或切词后的分词情绪值列表，对于其中只要出现一例负向情绪值即记录为负面提及，逐句处理后汇总每个菜品提及的次数以及正负向提及次数。

S6、差评关键词分析，根据关键词库内容自动匹配评价内容并进行计数和内容索引定位，生成差评反馈的问题。

S7、NLP评论分析，将评论的内容发往自然语言分析平台，对于评论内容较长的，需要根据段落切分后再分别请求处理；将第三方平台反馈的问题分类，所分类的类型包括菜品、价格、服务、环境和其他。

S8、人工分析、手动标记，对前面步骤处理过程可能会出现遗漏，进行人为补充额外的差评问题，或者隐藏不需的反馈内容。

S9、合并整理，对于前面步骤的所有标记结果进行合并整理，将相似的分析结果进行合并。

如前面步骤处理过程存在概率不准确时，进行人工修正负面关键词和分类。

S10、生成分析报告，根据以上步骤生成分析报告内容，输出报告。

根据本发明的一个或一些实施例，步骤S2中，从第三方平台APP后台下载的数据，确保其中至少包含一条中差评内容。

进一步地，步骤S2中，对评价内容进行结构化处理，确保格式按照标准格式录入，格式包括评论内容、星级、评论时间、用户名的字段。

根据本发明的一个或一些实施例，步骤S5中，NLP平台包括BERT模型和神经网络模型。

根据本发明的一个或一些实施例，步骤S5中，NLP平台具有利用第三方云平台的NLP接口，NLP接口包括阿里云或腾讯云平台。

根据本发明的一个或一些实施例，步骤S6还包括：S61、将基础评论的评价数据，根据常用标点切分成语句后构成基础的语句库；S62、确定负面语句库，利用NLP技术处理基础语句库，其中，负面语句为出现负面情绪词数量>0。

进一步地，步骤S7中，根据TextCNN算法对负面语句进行分类，分别划分到不同的负面问题分类中。

根据本发明的第二个方面，提供一种评价分析和报告生成的装置，包括：数据预处理模块、菜品正负向统计模块和差评分类统计模块。

数据预处理模块通过第三平台的APP或者管理后台下载所需评价内容的列表，进行内容清洗去除无效内容，无效内容包括表情的特殊字符，形成基础的评价内容数据表。

菜品正负向统计模块用于对评价数据进行情绪分析，请求通用NLP平台，将根据返回结果的情绪正向或负向分析，分别统计为菜品的正向次数、负向次数。其中，对菜品语句进行情绪分析，输入为具体语句数据，输出为语句的分词情绪值或切词后的分词情绪值列表，对于其中只要出现一例负向情绪值即记录为负面提及，逐句处理后汇总每个菜品提及的次数以及正负向提及次数。其中，NLP平台包括BERT模型和神经网络模型，或者具有利用包括阿里云或腾讯云平台的第三方云平台的NLP接口。

差评分类统计模块用于将基础评论的评价数据根据常用标点切分成语句后构成基础的语句库，确定负面语句库，其中，负面语句为出现负面情绪词数量>0。差评分类统计模块能够利用NLP技术处理基础语句库，根据TextCNN算法对负面语句进行分类，分别划分到不同的负面问题分类中，分类类型包括菜品、价格、服务、环境和其他。

根据本发明的又一方面，提供一种评价分析和报告生成的设备，包括：存储器、处理器及存储在存储器上并可在处理器上运行的评价分析和报告生成程序，评价分析和报告生成程序被处理器执行时实现上述的评价分析和报告生成方法的步骤。

根据本发明还提供一种计算机存储介质。

计算机存储介质上存储有评价分析和报告生成程序，评价分析和报告生成程序被处理器执行时实现上述的评价分析和报告生成方法的步骤。

其中，在所述处理器上运行的评价分析和报告生成程序被执行时所实现的方法可参照本发明评价分析和报告生成方法各个实施例，此处不再赘述。

本发明还提供一种计算机程序产品。

本发明计算机程序产品包括评价分析和报告生成程序，所述评价分析和报告生成程序被处理器执行时实现如上所述的评价分析和报告生成方法的步骤。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端设备(可以是手机，计算机，服务器，空调器，或者网络设备等)执行本发明各个实施例所述的方法。

以上所述仅是本发明的示范性实施方式，而非用于限制本发明的保护范围，本发明的保护范围由所附的权利要求确定。

Claims

1.一种评价分析和报告生成的方法，所述方法基于第三方平台的APP或者管理后台上对于目标商户的评价而进行的智能评价分析和报告生成，所述方法包括如下步骤：

S1、菜品名称词库和差评关键词词库进行配置，分别录入菜品名称和差评关键词；

S2、数据准备和预处理，通过第三平台的APP或者管理后台下载所需评价内容的列表，进行内容清洗去除无效内容，所述无效内容包括表情的特殊字符，形成基础的评价内容数据表；

S3、数据导入，导入标准格式评价内容数据，其中，数据导入过程中自动过滤掉没有评价内容的评价数据，减少无效数据干扰；

S4、基础数据统计，统计评价内容数据的基础数据包括总评论数、好评数、中差评数；

S5、菜品统计和分析，根据步骤S1菜品名称词库，进行统计菜品提及的次数，截取菜品所在位置的文本句子，根据菜品名称词库的菜品名称搜索过滤掉未提及菜品名称的评价内容，并根据常用标点切分成语句形成菜品语句库；请求通用NLP平台，将根据返回结果的情绪正向或负向分析，分别统计为菜品的正向提及次数、负向提及次数，其中，对菜品语句进行情绪分析，输入为具体语句数据，输出为语句的分词情绪值或切词后的分词情绪值列表，对于其中只要出现一例负向情绪值即记录为负向提及，逐句处理后汇总每个菜品提及的次数以及正负向提及次数；

S6、差评关键词分析，根据差评关键词库内容自动匹配评价内容并进行计数和内容索引定位，生成差评反馈的问题；

S7、NLP评论分析，将评价内容发往通用NLP平台，对于评价内容较长的，需要根据段落切分后再分别请求处理；将第三方平台反馈的问题分类，所分类的类型包括菜品、价格、服务、环境和其他；

S8、人工分析、手动标记，对前面步骤处理过程可能会出现遗漏，进行人为补充额外的差评问题，或者隐藏不需的反馈内容；

S9、合并整理，对于前面步骤的所有标记结果进行合并整理，将相似的分析结果进行合并；如前面步骤处理过程存在概率不准确时，进行人工修正差评关键词和分类；

S10、生成分析报告，根据以上步骤生成分析报告内容，输出报告，

其中，步骤S6还包括：

S61、将基础的评价内容数据，根据常用标点切分成语句后构成基础的语句库；

S62、确定负面语句库，利用NLP技术处理基础语句库，其中，负面语句为出现负面情绪词数量>0，

其中，步骤S7中，根据TextCNN算法对负面语句进行分类，分别划分到不同的负面问题分类中。

2.如权利要求1所述的方法，其中，步骤S2中，从第三方平台的APP或者管理后台下载的数据，确保其中至少包含一条中差评内容。

3.如权利要求2所述的方法，其中，步骤S2中，对评价内容进行结构化处理，确保格式按照标准格式录入，所述格式包括评论内容、星级、评论时间、用户名的字段。

4.如权利要求1所述的方法，其中，步骤S5中，所述NLP平台包括BERT模型和神经网络模型。

5.如权利要求1所述的方法，其中，步骤S5中，所述NLP平台具有利用第三方云平台的NLP接口，所述NLP接口包括阿里云或腾讯云平台。

6.一种评价分析和报告生成的装置，包括：

数据预处理模块，菜品名称词库和差评关键词词库进行配置，分别录入菜品名称和差评关键词；所述数据预处理模块通过第三平台的APP或者管理后台下载所需评价内容的列表，进行内容清洗去除无效内容，所述无效内容包括表情的特殊字符，形成基础的评价内容数据表；

菜品正负向统计模块，所述菜品正负向统计模块用于对评价内容数据进行情绪分析，所述菜品正负向统计模块根据菜品名称词库，进行统计菜品提及的次数，截取菜品所在位置的文本句子，根据菜品名称词库的菜品名称搜索过滤掉未提及菜品名称的评价内容，并根据常用标点切分成语句形成菜品语句库；所述菜品正负向统计模块请求通用NLP平台，将根据返回结果的情绪正向或负向分析，分别统计为菜品的正向提及次数、负向提及次数，其中，对菜品语句进行情绪分析，输入为具体语句数据，输出为语句的分词情绪值或切词后的分词情绪值列表，对于其中只要出现一例负向情绪值即记录为负向提及，逐句处理后汇总每个菜品提及的次数以及正负向提及次数，其中，所述NLP平台包括BERT模型和神经网络模型，或者具有利用包括阿里云或腾讯云平台的第三方云平台的NLP接口；

差评分类统计模块，用于将基础的评价内容数据根据常用标点切分成语句后构成基础的语句库，确定负面语句库，其中，负面语句为出现负面情绪词数量>0；能够利用NLP技术处理基础语句库，根据TextCNN算法对负面语句进行分类，分别划分到不同的负面问题分类中，所述分类类型包括菜品、价格、服务、环境和其他，

其中，所述评价分析和报告生成的装置执行如下步骤：

S2、数据准备和预处理，所述数据预处理模块通过第三平台的APP或者管理后台下载所需评价内容的列表，进行内容清洗去除无效内容，所述无效内容包括表情的特殊字符，形成基础的评价内容数据表；

S5、菜品统计和分析，所述菜品正负向统计模块根据步骤S1菜品名称词库，进行统计菜品提及的次数，截取菜品所在位置的文本句子，根据菜品名称词库的菜品名称搜索过滤掉未提及菜品名称的评价内容，并根据常用标点切分成语句形成菜品语句库；所述菜品正负向统计模块请求通用NLP平台，将根据返回结果的情绪正向或负向分析，分别统计为菜品的正向提及次数、负向提及次数，其中，对菜品语句进行情绪分析，输入为具体语句数据，输出为语句的分词情绪值或切词后的分词情绪值列表，对于其中只要出现一例负向情绪值即记录为负向提及，逐句处理后汇总每个菜品提及的次数以及正负向提及次数；

S7、NLP评论分析，将评价内容发往通用NLP平台，对于评价内容较长的，需要根据段落切分后再分别请求处理；将第三方平台反馈的问题分类，所分类的类型包括菜品、价格、服务、环境和其他；其中，根据TextCNN算法对负面语句进行分类，分别划分到不同的负面问题分类中；

7.一种电子设备，包括：存储器、处理器及存储在所述存储器上并可在所述处理器上运行的评价分析和报告生成程序，所述评价分析和报告生成程序被所述处理器执行时实现如权利要求1至5中任一项所述的评价分析和报告生成方法的步骤。

8.一种计算机存储介质，其中，所述计算机存储介质上存储有评价分析和报告生成程序，所述评价分析和报告生成程序被处理器执行时实现如权利要求1至5中任一项所述的评价分析和报告生成方法的步骤。