CN113158069A - 基于大数据的互动话题场景分析方法、服务器及介质 - Google Patents

基于大数据的互动话题场景分析方法、服务器及介质 Download PDF

Info

Publication number
CN113158069A
CN113158069A CN202110584705.2A CN202110584705A CN113158069A CN 113158069 A CN113158069 A CN 113158069A CN 202110584705 A CN202110584705 A CN 202110584705A CN 113158069 A CN113158069 A CN 113158069A
Authority
CN
China
Prior art keywords
public opinion
knowledge base
topic
public
polarity information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN202110584705.2A
Other languages
English (en)
Inventor
付立才
张磊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Lijin Technology Co ltd
Original Assignee
Guangzhou Lijin Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Lijin Technology Co ltd filed Critical Guangzhou Lijin Technology Co ltd
Priority to CN202110584705.2A priority Critical patent/CN113158069A/zh
Publication of CN113158069A publication Critical patent/CN113158069A/zh
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请涉及基于大数据的互动话题场景分析方法、服务器及介质,通过获取与话题互动客户端对应的舆情评论文本,并按照对话题互动客户端的设定分类方式,将属于相同分类的话题互动客户端所对应的舆情评论文本归类至相同文本集,从而可以通过获取分类的第一情绪极性信息,以及与分类对应的文本集中每一舆情评论文本的第二情绪极性信息,将获取的第一情绪极性信息和第二情绪极性信息进行关联分析,能够基于分类下的话题互动客户端实现对主题检测场景的舆情风向检测,通过关联分类下的话题互动客户端改善单一话题互动客户端容易受到误操作、评论干扰、话题群主引导等因素影响的问题,进而能够提高舆情风向检测的精准度和舆情风向情况的时效性。

Description

基于大数据的互动话题场景分析方法、服务器及介质
技术领域
本申请实施例涉及舆情分析和大数据技术领域,具体涉及一种基于大数据的互动话题场景分析方法、服务器及介质。
背景技术
互联网的快速进步促进了很多新媒体的发展,不论是流量明星还是普通用户,都可以通过智能电子设备在微博、朋友圈或者互动点评平台上发表各类话题并分享所见所想。相应的,无论是热点新闻还是娱乐八卦,传播速度远超想象。比如,一些热门的、关注度较高的互动话题可以在极短时间内(比如几分钟内),累计几十万次转发或者几百万的阅读量。
鉴于上述内容,如此海量的信息可以得到爆炸式的传播,如何能够实时的把握互动话题舆情并作出对应的应对措施对很多互联网企业来说是至关重要的。因此,需要对相关的互动话题场景进行用户评论舆情分析。然而相关的舆情分析技术存在精准度低下且时效性差的问题。
发明内容
有鉴于此,本申请实施例提供了一种基于大数据的互动话题场景分析方法、服务器及介质。
本申请实施例提供了一种基于大数据的互动话题场景分析方法,应用于互动话题场景分析服务器,包括:
获取与话题互动客户端对应的舆情评论文本,其中,所述舆情评论文本是对所述话题互动客户端收集的主题检测结果进行舆情分析而得到的;
按照对所述话题互动客户端的设定分类方式,将属于相同分类的所述话题互动客户端所对应的舆情评论文本归类至相同文本集;
获取所述分类的第一情绪极性信息,以及与所述分类对应的所述文本集中每一所述舆情评论文本的第二情绪极性信息;
将所述获取的第一情绪极性信息和第二情绪极性信息进行关联分析,以获取所述分类下的所述话题互动客户端对应的主题检测场景的舆情风向情况。
在一种可选的实施方案中,所述将所述获取的第一情绪极性信息和第二情绪极性信息进行关联分析,以获取所述分类下的所述话题互动客户端对应的主题检测场景的舆情风向情况包括:
从与所述分类对应的所述文本集中挑选所述第二情绪极性信息符合设定挑选条件的所述舆情评论文本,并归类至待分析文本集;
基于所述分类的第一情绪极性信息和所述待分析文本集中的所述舆情评论文本的第二情绪极性信息,确定所述主题检测场景是否存在舆情;
若存在舆情,则将所述待分析文本集中的所述舆情评论文本的第二情绪极性信息进行信息融合,获取所述主题检测场景内的舆情风向情况。
在一种可选的实施方案中,所述第一情绪极性信息包括所述分类的舆情观点类别分布,所述第二情绪极性信息包括所述舆情评论文本的舆情观点类别,所述设定挑选条件包括:所述舆情评论文本的所述舆情观点类别包含于所述分类的所述舆情观点类别分布内。
在一种可选的实施方案中,所述第一情绪极性信息包括所述分类下的所述话题互动客户端之间的社交状态关系;所述基于所述分类的第一情绪极性信息和所述待分析文本集中的所述舆情评论文本的第二情绪极性信息,确定所述主题检测场景是否存在舆情包括:
判断所述分类的第一情绪极性信息和所述待分析文本集中的所述舆情评论文本的第二情绪极性信息是否符合以下条件:所述分类下所述话题互动客户端之间的社交状态关系为语义融合和/或社交成员群融合,且所述待分析文本集中所有所述舆情评论文本对应的话题互动客户端相同;若不符合,则确定所述主题检测场景内存在舆情;若符合,则确定所述主题检测场景内不存在舆情;
相应的,所述第一情绪极性信息还包括所述分类的信息融合标签,所述信息融合标签用于表示是否需要进行信息融合;所述将所述待分析文本集中的所述舆情评论文本的第二情绪极性信息进行信息融合,获取所述主题检测场景内的舆情风向情况之前,所述方法还包括:
判断所述分类下的所述话题互动客户端之间的社交状态关系和所述信息融合标签是否符合以下条件:所述分类下的所述话题互动客户端之间的社交状态关系为间接融合,且所述信息融合标签表示需要进行信息融合;若符合,则执行所述将所述待分析文本集中的所述舆情评论文本的第二情绪极性信息进行信息融合,获取所述主题检测场景内的舆情风向情况的步骤。
在一种可选的实施方案中,所述第二情绪极性信息包括舆情观点中的舆情事件的自然语言特征;所述将所述待分析文本集中的所述舆情评论文本的第二情绪极性信息进行信息融合,获取所述主题检测场景内的舆情风向情况包括:
基于所述舆情评论文本的自然语言特征,确定所述待分析文本集中的所述舆情评论文本所属的舆情事件;
分别通过属于相同所述舆情事件的所述舆情评论文本的第二情绪极性信息进行信息融合,获取不同所述舆情事件的舆情倾向变化信息;
相应的,所述基于所述舆情评论文本的自然语言特征,确定所述待分析文本集中的所述舆情评论文本所属的舆情事件包括:
统计所述待分析文本集中所有所述舆情评论文本之间的所述自然语言特征的特征相关性;
若所述舆情评论文本之间的所述特征相关性大于一设定相关性阈值,则确定所述舆情评论文本属于相同所述舆情事件;
相应的,所述第二情绪极性信息还包括所述舆情事件的若干热点描述的特征内容,以及所述自然语言特征的可信系数;所述分别通过属于相同所述舆情事件的所述舆情评论文本的第二情绪极性信息进行信息融合,获取不同所述舆情事件的舆情倾向变化信息包括:
分别从不同所述舆情事件中选取一个作为当前舆情事件,并对所述当前舆情事件执行以下步骤:
分别将所述若干热点描述中的一个热点描述作为当前热点描述;
基于属于所述当前舆情事件的所述舆情评论文本的所述自然语言特征的可信系数和所述当前热点描述的特征内容,确定所述当前舆情事件的当前热点描述的特征内容。
在一种可选的实施方案中,所述第二情绪极性信息还包括所述舆情事件在所述主题检测结果中的状态信息;所述方法还包括:
在属于所述当前舆情事件的所述舆情评论文本中挑选所述特征内容最多的舆情评论文本;
通过挑选得到的舆情评论文本中的所述状态信息,获取所述当前舆情事件的目标结果。
在一种可选的实施方案中,所述将所述获取的第一情绪极性信息和第二情绪极性信息进行关联分析,以获取所述分类下的所述话题互动客户端对应的主题检测场景的舆情风向情况之前,所述方法还包括:过滤不符合设定文本核验条件的舆情评论文本;
相应的,所述设定文本核验条件至少包括:所述舆情评论文本所对应的主题检测结果的收集时刻与当前时刻之间的时段差异值小于一设定差异值。
在一种可选的实施方案中,所述方法还包括:
根据所述分类下的所述话题互动客户端对应的主题检测场景的舆情风向情况输出会话倾向性知识库的搭建服务,所述会话倾向性知识库的搭建服务包括知识库描述和特征线程分布,所述知识库描述包括多个会话倾向性生成内容对应的创建状态,所述特征线程分布包括所述会话倾向性生成内容的至少一个知识库特征线程;
当检测到话题业务端针对所述知识库特征线程的调用行为,且调用行为的目标时段位于所述知识库特征线程对应的创建状态的状态时段内时,在所述创建状态的目标时段输出所述知识库特征线程对应的知识库特征;
根据所述会话倾向性生成内容对应的创建状态的状态时段内的知识库特征,生成目标会话倾向性知识库;
相应的,所述知识库描述包括整体倾向性描述;
当检测到话题业务端针对所述知识库特征线程的调用行为,且调用行为的目标时段位于所述知识库特征线程对应的创建状态的状态时段内时,在所述创建状态的目标时段输出所述知识库特征线程对应的知识库特征,包括:
当检测到话题业务端针对所述特征线程分布中知识库特征线程的调用行为,且调用行为的目标时段位于所述知识库特征线程对应的创建状态的状态时段内时,在所述创建状态的目标时段输出所述知识库特征线程对应的知识库特征;
根据所述会话倾向性生成内容对应的创建状态的状态时段内的知识库特征,生成目标会话倾向性知识库,包括:
根据所述会话倾向性生成内容对应的创建状态的状态时段内的知识库特征,生成目标会话倾向性知识库的整体倾向性描述;
相应的,所述知识库描述还包括所述会话生成内容的关键内容描述;
当检测到话题业务端针对所述特征线程分布中的知识库特征线程的调用行为,且调用行为的目标时段位于所述知识库特征线程对应的创建状态的状态时段内时,在所述创建状态的目标时段输出所述知识库特征线程对应的知识库特征,还包括:
根据所述整体倾向性描述,基于所述关键内容描述输出所述整体倾向性描述中所述会话倾向性生成内容对应的知识库特征,所述关键内容描述包括至少一个会话倾向性局部内容对应的局部创建状态;
当检测到话题业务端针对所述关键内容描述中知识库特征的调用行为,且调用行为的目标时段位于所述知识库特征线程对应的局部创建状态的状态时段内时,在所述局部创建状态中的目标时段输出所述知识库特征线程对应的知识库特征;
根据所述会话倾向性生成内容对应的创建状态的状态时段内的知识库特征,生成目标会话倾向性知识库,还包括:
根据所述会话倾向性局部内容对应的局部创建状态的状态时段内的知识库特征,生成目标会话倾向性知识库的关键内容描述。
本申请实施例还提供了一种互动话题场景分析服务器,包括处理器、通信总线和存储器;所述处理器和所述存储器通过所述通信总线通信,所述处理器从所述存储器中读取计算机程序并运行,以执行上述的方法。
本申请实施例还提供了一种计算机存储介质,所述计算机存储介质存储有计算机程序,所述计算机程序在运行时实现上述的方法。
相较于现有技术,本申请实施例提供的基于大数据的互动话题场景分析方法、服务器及介质具有以下技术效果:通过获取与话题互动客户端对应的舆情评论文本,且舆情评论文本是对话题互动客户端收集的主题检测结果进行舆情分析而得到的,并按照对话题互动客户端的设定分类方式,将属于相同分类的话题互动客户端所对应的舆情评论文本归类至相同文本集,从而可以通过获取分类的第一情绪极性信息,以及与分类对应的文本集中每一舆情评论文本的第二情绪极性信息,将获取的第一情绪极性信息和第二情绪极性信息进行关联分析,以获取分类下的话题互动客户端对应的主题检测场景的舆情风向情况,进而能够基于分类下的话题互动客户端实现对主题检测场景的舆情风向检测,通过关联分类下的话题互动客户端,能够改善单一话题互动客户端容易受到误操作、评论干扰、话题群主引导等因素影响的问题,进而能够提高舆情风向检测的精准度和舆情风向情况的时效性。
在后面的描述中,将部分地陈述其他的特征。在检查后面内容和附图时,本领域的技术人员将部分地发现这些特征,或者可以通过生产或运用了解到这些特征。通过实践或使用后面所述详细示例中列出的方法、工具和组合的各个方面,当前申请中的特征可以被实现和获得。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本申请实施例所提供的一种互动话题场景分析服务器的方框示意图。
图2为本申请实施例所提供的一种基于大数据的互动话题场景分析方法的流程图。
图3为本申请实施例所提供的一种基于大数据的互动话题场景分析装置的框图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例只是本申请的一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。
因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
图1示出了本申请实施例所提供的一种互动话题场景分析服务器10的方框示意图。本申请实施例中的互动话题场景分析服务器10可以为具有数据存储、传输、处理功能的服务端,如图1所示,互动话题场景分析服务器10包括:存储器11、处理器12、通信总线13和基于大数据的互动话题场景分析装置20。
存储器11、处理器12和通信总线13之间直接或间接地电性连接,以实现数据的传输或交互。例如,这些元件互相之间可以通过一条或多条通讯总线或信号线实现电性连接。存储器11中存储有基于大数据的互动话题场景分析装置20,所述基于大数据的互动话题场景分析装置20包括至少一个可以软件或固件(firmware)的形式储存于所述存储器11中的软件功能模块,所述处理器12通过运行存储在存储器11内的软件程序以及模块,例如本申请实施例中的基于大数据的互动话题场景分析装置20,从而执行各种功能应用以及数据处理,即实现本申请实施例中的基于大数据的互动话题场景分析方法。
其中,所述存储器11可以是,但不限于,随机存取存储器(Random Access Memory,RAM),只读存储器(Read Only Memory,ROM),可编程只读存储器(Programmable Read-OnlyMemory,PROM),可擦除只读存储器(Erasable Programmable Read-Only Memory,EPROM),电可擦除只读存储器(Electric Erasable Programmable Read-Only Memory,EEPROM)等。其中,存储器11用于存储程序,所述处理器12在接收到执行指令后,执行所述程序。
所述处理器12可能是一种集成电路芯片,具有数据的处理能力。上述的处理器12可以是通用处理器,包括中央处理器 (Central Processing Unit,CPU)、网络处理器(Network Processor,NP)等。可以实现或者执行本申请实施例中公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
通信总线13用于通过网络建立互动话题场景分析服务器10与其他通信终端设备之间的通信连接,实现网络信号及数据的收发操作。上述网络信号可包括无线信号或者有线信号。
可以理解,图1所示的结构仅为示意,互动话题场景分析服务器10还可包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。图1中所示的各组件可以采用硬件、软件或其组合实现。
本申请实施例还提供了一种计算机存储介质,所述计算机存储介质存储有计算机程序,所述计算机程序在运行时实现上述的方法。
图2示出了本申请实施例所提供的一种基于大数据的互动话题场景分析的流程图。所述方法有关的流程所定义的方法步骤应用于互动话题场景分析服务器10,可以由所述处理器12实现,所述方法包括以下步骤100-步骤400。
步骤100、互动话题场景分析服务器获取与话题互动客户端对应的舆情评论文本。
在本申请实施例中,所述舆情评论文本是对所述话题互动客户端收集的主题检测结果进行舆情分析而得到的。
举例而言,互动话题场景分析服务器可以与话题互动客户端通信连接,互动话题场景分析服务器在获得话题互动客户端的授权的前提下进行主题检测结果的舆情分析,比如进行评论文本的识别和提取。
步骤200、互动话题场景分析服务器按照对所述话题互动客户端的设定分类方式,将属于相同分类的所述话题互动客户端所对应的舆情评论文本归类至相同文本集。
例如,设定分类方式可以理解为预先配置的划分策略,相同分类包括体育、影视、食品、房地产等类别。可以理解的是,通过进行舆情评论文本归类,能够便于后续进行评论文本的全局化和关联化分析,以确保舆情风向情况的准确性,减少舆情分析的偏差。
步骤300、互动话题场景分析服务器获取所述分类的第一情绪极性信息,以及与所述分类对应的所述文本集中每一所述舆情评论文本的第二情绪极性信息。
在一些可能的实施例中,第一情绪极性信息可以理解为文本集对应的全局性情绪极性情况,第二情绪极性信息对应于舆情评论文本。可以理解,第一情绪极性信息为整体层面的情绪极性,第二情绪极性信息为局部层面的情绪极性。
此外,情绪极性可以是二分类极性比如消极和积极,也可以是三分类极性比如消极、积极和中立。在一些情况下,还可以按照实际需求进行不同极性等级的划分,在此不作限定。
步骤400、互动话题场景分析服务器将所述获取的第一情绪极性信息和第二情绪极性信息进行关联分析,以获取所述分类下的所述话题互动客户端对应的主题检测场景的舆情风向情况。
在本申请实施例中,舆情风向情况可以是主题检测场景下的话题互动客户端的倾向情况或者意图变化情况。进一步地,话题互动客户端的倾向情况或者意图变化情况可以用于进行服务反馈分析。
在相关实施例中,步骤400所描述的将所述获取的第一情绪极性信息和第二情绪极性信息进行关联分析,以获取所述分类下的所述话题互动客户端对应的主题检测场景的舆情风向情况,可以包括以下步骤410-步骤430。
步骤410、从与所述分类对应的所述文本集中挑选所述第二情绪极性信息符合设定挑选条件的所述舆情评论文本,并归类至待分析文本集。
例如,所述第一情绪极性信息包括所述分类的舆情观点类别分布,所述第二情绪极性信息包括所述舆情评论文本的舆情观点类别。进一步地,所述设定挑选条件可以包括:所述舆情评论文本的所述舆情观点类别包含于所述分类的所述舆情观点类别分布内。可以理解的是,舆情观点类别分布可以是舆情观点类别列表。
步骤420、基于所述分类的第一情绪极性信息和所述待分析文本集中的所述舆情评论文本的第二情绪极性信息,确定所述主题检测场景是否存在舆情。
在一些示例中,所述第一情绪极性信息包括所述分类下的所述话题互动客户端之间的社交状态关系。基于此,步骤420所描述的基于所述分类的第一情绪极性信息和所述待分析文本集中的所述舆情评论文本的第二情绪极性信息,确定所述主题检测场景是否存在舆情,可以包括以下内容:判断所述分类的第一情绪极性信息和所述待分析文本集中的所述舆情评论文本的第二情绪极性信息是否符合以下条件:所述分类下所述话题互动客户端之间的社交状态关系为语义融合和/或社交成员群融合,且所述待分析文本集中所有所述舆情评论文本对应的话题互动客户端相同;若不符合,则确定所述主题检测场景内存在舆情;若符合,则确定所述主题检测场景内不存在舆情。
可以理解的是,存在舆情可以理解为存在较大的网络影响或者网络反应。通过上述内容,能够准确判断主题检测场景是否存在舆情。
步骤430、若存在舆情,则将所述待分析文本集中的所述舆情评论文本的第二情绪极性信息进行信息融合,获取所述主题检测场景内的舆情风向情况。
例如,将所述待分析文本集中的所述舆情评论文本的第二情绪极性信息进行信息融合可以理解为将所述待分析文本集中的所述舆情评论文本的第二情绪极性信息进行信息互补,这样一来,能够改善单一话题互动客户端容易受到误操作、评论干扰、话题群主引导等因素影响的问题,将不同情绪极性信息的时序情况考虑在内,进而能够提高舆情风向检测的精准度和舆情风向情况的时效性。
在一些可能的实施例中,所述第一情绪极性信息还包括所述分类的信息融合标签,所述信息融合标签用于表示是否需要进行信息融合。基于此,在步骤430所描述的将所述待分析文本集中的所述舆情评论文本的第二情绪极性信息进行信息融合,获取所述主题检测场景内的舆情风向情况的步骤之前,该方法还可以包括以下内容:判断所述分类下的所述话题互动客户端之间的社交状态关系和所述信息融合标签是否符合以下条件:所述分类下的所述话题互动客户端之间的社交状态关系为间接融合,且所述信息融合标签表示需要进行信息融合;若符合,则执行所述将所述待分析文本集中的所述舆情评论文本的第二情绪极性信息进行信息融合,获取所述主题检测场景内的舆情风向情况的步骤。
在一些可选的实施例中,所述第二情绪极性信息包括舆情观点中的舆情事件的自然语言特征。基于此,上述步骤430所描述的将所述待分析文本集中的所述舆情评论文本的第二情绪极性信息进行信息融合,获取所述主题检测场景内的舆情风向情况,可以包括以下步骤431和步骤432所描述的内容。
步骤431、基于所述舆情评论文本的自然语言特征,确定所述待分析文本集中的所述舆情评论文本所属的舆情事件。
可以理解,自然语言特征可以基于自然语言分析得到。
在一些可能的实施例中,步骤431所描述的基于所述舆情评论文本的自然语言特征,确定所述待分析文本集中的所述舆情评论文本所属的舆情事件,可以包括以下内容:统计所述待分析文本集中所有所述舆情评论文本之间的所述自然语言特征的特征相关性;若所述舆情评论文本之间的所述特征相关性大于一设定相关性阈值,则确定所述舆情评论文本属于相同所述舆情事件。例如,特征相关性可以是特征相似度。
步骤432、分别通过属于相同所述舆情事件的所述舆情评论文本的第二情绪极性信息进行信息融合,获取不同所述舆情事件的舆情倾向变化信息。
例如,舆情倾向变化信息可以理解为相关用户的评论观点的倾向变化情况。
在一些可能的实施例中,所述第二情绪极性信息还包括所述舆情事件的若干热点描述的特征内容,以及所述自然语言特征的可信系数(置信度)。基于此,步骤432所描述的分别通过属于相同所述舆情事件的所述舆情评论文本的第二情绪极性信息进行信息融合,获取不同所述舆情事件的舆情倾向变化信息,可以包括以下内容:分别从不同所述舆情事件中选取一个作为当前舆情事件,并对所述当前舆情事件执行以下步骤:分别将所述若干热点描述中的一个热点描述作为当前热点描述;基于属于所述当前舆情事件的所述舆情评论文本的所述自然语言特征的可信系数和所述当前热点描述的特征内容,确定所述当前舆情事件的当前热点描述的特征内容。
在另外的一些实施例中,所述第二情绪极性信息还包括所述舆情事件在所述主题检测结果中的状态信息(事件分布情况或者文本分布情况),基于此,该方法还可以包括以下内容:在属于所述当前舆情事件的所述舆情评论文本中挑选所述特征内容最多的舆情评论文本;通过挑选得到的舆情评论文本中的所述状态信息,获取所述当前舆情事件的目标结果。
在一些可选的实施例中,在步骤400所描述的将所述获取的第一情绪极性信息和第二情绪极性信息进行关联分析,以获取所述分类下的所述话题互动客户端对应的主题检测场景的舆情风向情况的步骤之前,所述方法还包括:过滤不符合设定文本核验条件的舆情评论文本。在一些示例中,所述设定文本核验条件至少包括:所述舆情评论文本所对应的主题检测结果的收集时刻与当前时刻之间的时段差异值小于一设定差异值。
对于一些可独立实施的实施例而言,在步骤400所描述的内容之后,该方法还可以包括以下内容:根据所述分类下的所述话题互动客户端对应的主题检测场景的舆情风向情况输出会话倾向性知识库的搭建服务,所述会话倾向性知识库的搭建服务包括知识库描述和特征线程分布,所述知识库描述包括多个会话倾向性生成内容对应的创建状态,所述特征线程分布包括所述会话倾向性生成内容的至少一个知识库特征线程;当检测到话题业务端针对所述知识库特征线程的调用行为,且调用行为的目标时段位于所述知识库特征线程对应的创建状态的状态时段内时,在所述创建状态的目标时段输出所述知识库特征线程对应的知识库特征;根据所述会话倾向性生成内容对应的创建状态的状态时段内的知识库特征,生成目标会话倾向性知识库。
对于一些可独立实施的实施例而言,上述步骤所描述的输出会话倾向性知识库的搭建服务,所述会话倾向性知识库的搭建服务包括知识库描述和特征线程分布,所述知识库描述包括多个会话倾向性生成内容对应的创建状态,所述特征线程分布包括所述会话倾向性生成内容的至少一个知识库特征线程;当检测到话题业务端针对所述知识库特征线程的调用行为,且调用行为的目标时段位于所述知识库特征线程对应的创建状态的状态时段内时,在所述创建状态的目标时段输出所述知识库特征线程对应的知识库特征;根据所述会话倾向性生成内容对应的创建状态的状态时段内的知识库特征,生成目标会话倾向性知识库,可以包括以下技术方案。
S21:互动话题场景分析服务器输出会话倾向性知识库的搭建服务。
在本申请实施例中,所述会话倾向性知识库的搭建服务包括知识库描述和特征线程分布,所述知识库描述包括多个会话倾向性生成内容对应的创建状态,所述特征线程分布包括所述会话倾向性生成内容的至少一个知识库特征线程。
可以理解的是,会话倾向性知识库可以是基于话题用户的会话倾向性或者话题倾向性所形成的可视化知识图谱,可用于后续的的用户倾向或者用户意图分析。相应的,搭建服务可以是供用户进行可视化拖拽操作的界面或者页面。创建状态可以是相关的会话倾向性生成内容的使用状态或者约束条件。知识库特征线程用于表征知识库特征组合功能或者组合方式,不同的的知识库特征线程的知识库特征组合功能或者组合方式存在差异。
例如,互动话题场景分析服务器可以根据舆情风向情况针对性地输出会话倾向性知识库的搭建服务。比如可以根据舆情风向情况中的倾向性变化情况输出会话倾向性知识库的搭建服务。
对于一些可选的实施例b而言,所述知识库描述包括关键内容描述,所述会话倾向性生成内容包括至少一个会话倾向性局部内容。基于此,S21所描述的输出会话倾向性知识库的搭建服务,所述会话倾向性知识库的搭建服务包括知识库描述和特征线程分布,所述知识库描述包括多个会话倾向性生成内容对应的创建状态,所述特征线程分布包括所述会话倾向性生成内容的至少一个知识库特征线程,可以包括以下技术方案:输出会话倾向性知识库的搭建服务,所述会话倾向性知识库的搭建服务包括关键内容描述和特征线程分布,所述关键内容描述包括至少一个会话倾向性局部内容对应的局部创建状态,所述特征线程分布包括所述会话倾向性局部内容的至少一个知识库特征线程。
对于一些可选的实施例c而言,所述知识库描述包括舆情解析描述,基于此,上述S21所描述的输出会话倾向性知识库的搭建服务,所述会话倾向性知识库的搭建服务包括知识库描述和特征线程分布,所述知识库描述包括多个会话倾向性生成内容对应的创建状态,所述特征线程分布包括所述会话倾向性生成内容的至少一个知识库特征线程,可以包括以下技术方案:输出会话倾向性知识库的搭建服务,所述会话倾向性知识库的搭建服务包括舆情解析描述和特征线程分布,所述舆情解析描述包括多个会话倾向性相关舆情元素对应的创建状态,所述特征线程分布包括所述相关舆情元素的至少一个知识库特征线程。
S22:互动话题场景分析服务器当检测到话题业务端针对所述知识库特征线程的调用行为,且调用行为的目标时段位于所述知识库特征线程对应的创建状态的状态时段内时,在所述创建状态的目标时段输出所述知识库特征线程对应的知识库特征。
对于本申请实施例而言,互动话题场景分析服务器可以与话题业务端通信连接,调用行为可以理解为话题业务端对相应的知识库特征线程的拖拽操作或者点击操作等。调用行为的目标时段可以理解为激活时段或者触发时段。创建状态的状态时段可以理解为相关线程的可使用终端,这样一来,能够在相关线程的空闲时段进行知识库特征的输出/显示,确保知识库特征的完整性,并尽可能满足话题业务端的实际搭建需求。
在可选的实施例a中,所述知识库描述包括整体倾向性描述,基于此,S22所描述的当检测到话题业务端针对所述知识库特征线程的调用行为,且调用行为的目标时段位于所述知识库特征线程对应的创建状态的状态时段内时,在所述创建状态的目标时段输出所述知识库特征线程对应的知识库特征,可以包括以下技术方案:当检测到话题业务端针对所述特征线程分布中知识库特征线程的调用行为,且调用行为的目标时段位于所述知识库特征线程对应的创建状态的状态时段内时,在所述创建状态的目标时段输出所述知识库特征线程对应的知识库特征。
在实施例a的基础上,还包括实施例a1所描述技术方案,在实施例a1中,所述知识库描述还包括所述会话生成内容的关键内容描述,基于此,上述步骤所描述的当检测到话题业务端针对所述特征线程分布中的知识库特征线程的调用行为,且调用行为的目标时段位于所述知识库特征线程对应的创建状态的状态时段内时,在所述创建状态的目标时段输出所述知识库特征线程对应的知识库特征,还可以包括以下技术方案:根据所述整体倾向性描述,基于所述关键内容描述输出所述整体倾向性描述中所述会话倾向性生成内容对应的知识库特征,所述关键内容描述包括至少一个会话倾向性局部内容对应的局部创建状态;当检测到话题业务端针对所述关键内容描述中知识库特征的调用行为,且调用行为的目标时段位于所述知识库特征线程对应的局部创建状态的状态时段内时,在所述局部创建状态中的目标时段输出所述知识库特征线程对应的知识库特征。如此设计,能够将局部情况考虑在内,从而利用分治思想精准地输出相关的知识库特征。
在实施例b的基础上,S22所描述的当检测到话题业务端针对所述知识库特征线程的调用行为,且调用行为的目标时段位于所述知识库特征线程对应的创建状态的状态时段内时,在所述创建状态的目标时段输出所述知识库特征线程对应的知识库特征,可以包括以下内容:当检测到话题业务端针对所述特征线程分布中知识库特征线程的调用行为,且调用行为的目标时段位于所述知识库特征线程对应的局部创建状态的状态时段内时,在所述局部创建状态的目标时段输出所述知识库特征线程对应的知识库特征。
在实施例b的基础上,还可以包括实施例b1对应的技术方案。在实施例b1中,所述知识库描述还包括整体倾向性描述,所述整体倾向性描述包括多个会话倾向性生成内容对应的创建状态,基于此,上述S22所描述的当检测到话题业务端针对所述知识库特征线程的调用行为,且调用行为的目标时段位于所述知识库特征线程对应的创建状态的状态时段内时,在所述创建状态的目标时段输出所述知识库特征线程对应的知识库特征,还可以包括以下技术方案:根据所述关键内容描述所展现的会话倾向性生成内容,在所述整体倾向性描述中的所述会话倾向性生成内容对应的创建状态的状态时段内输出所述关键内容描述中的知识库特征;当检测到话题业务端针对所述特征线程分布中知识库特征线程的调用行为,且调用行为的目标时段位于所述知识库特征线程对应的创建状态的状态时段内时,在所述整体倾向性描述的目标时段输出所述知识库特征线程对应的知识库特征。
在实施例c 的基础上,上述S22所描述的当检测到话题业务端针对所述知识库特征线程的调用行为,且调用行为的目标时段位于所述知识库特征线程对应的创建状态的状态时段内时,在所述创建状态的目标时段输出所述知识库特征线程对应的知识库特征,可以包括以下技术方案:当检测到话题业务端针对所述知识库特征线程的调用行为,且调用行为的目标时段位于所述知识库特征线程对应的创建状态的状态时段内时,在所述相关舆情元素对应创建状态中的目标时段输出所述知识库特征线程对应的知识库特征。如此设计,能够从舆情层面出发进行知识库特征的输出,从而考虑话题用户端的舆情分析需求。
S23:互动话题场景分析服务器根据所述会话倾向性生成内容对应的创建状态的状态时段内的知识库特征,生成目标会话倾向性知识库。
在本申请实施例中,目标会话倾向性知识库可以理解为与话题业务端的调用行为相适配的知识图谱,目标会话倾向性知识库可以包括不同的会话倾向性特征节点以及不同会话倾向性特征节点之间的关联关系或者传递关系。目标会话倾向性知识库可以用于后续进行相关的用户倾向性挖掘和研究,从而为话题倾向性分析提供较为完整的信息基础。
可以理解的是,在实施例a的基础上,S23所描述根据所述会话倾向性生成内容对应的创建状态的状态时段内的知识库特征,生成目标会话倾向性知识库,可以包括以下内容:根据所述会话倾向性生成内容对应的创建状态的状态时段内的知识库特征,生成目标会话倾向性知识库的整体倾向性描述。如此设计,可以从全局层面对目标会话倾向性知识库进行搭建。
可以理解的是,在实施例a1的基础上,S23所描述的根据所述会话倾向性生成内容对应的创建状态的状态时段内的知识库特征,生成目标会话倾向性知识库,还可以包括:根据所述会话倾向性局部内容对应的局部创建状态的状态时段内的知识库特征,生成目标会话倾向性知识库的关键内容描述。
在实施例b的基础上,S23所描述的根据所述会话倾向性生成内容对应的创建状态的状态时段内的知识库特征,生成目标会话倾向性知识库,包括:根据所述会话倾向性局部内容对应的局部创建状态的状态时段内的知识库特征,生成目标会话倾向性知识库的关键内容描述。
在实施例b1的基础上,S23所描述的根据所述会话倾向性生成内容对应的创建状态的状态时段内的知识库特征,生成目标会话倾向性知识库,还可以包括以下内容:根据所述会话倾向性生成内容对应的创建状态的状态时段内的知识库特征,生成目标会话倾向性知识库的整体倾向性描述。
在实施例c的基础上,上述S23所描述的根据所述会话倾向性生成内容对应的创建状态的状态时段内的知识库特征,生成目标会话倾向性知识库,可以包括以下技术方案:根据所述相关舆情元素对应的创建状态的状态时段内的知识库特征,生成目标会话倾向性知识库的舆情解析描述。
在一些可能的实施例中,所述会话倾向性知识库的搭建服务还包括描述挑选单元,基于此,该方法还可以包括以下技术方案:当检测到话题业务端针对所述描述挑选单元的知识库描述挑选行为,在所述会话倾向性搭建服务中输出话题业务端挑选的知识库描述和特征线程分布,所述特征线程分布包括所述知识库描述对应的多个知识库特征线程。
在另外的一些示例d中,所述特征线程分布还包括动态特征线程,基于此,在上述S22所描述的在当检测到话题业务端针对所述知识库特征线程的调用行为,且调用行为的目标时段位于所述知识库特征线程对应的创建状态的状态时段内时,在所述创建状态的目标时段输出所述知识库特征线程对应的知识库特征的步骤之前,该方法还可以包括以下内容:基于话题业务端针对所述动态特征线程的配置行为,在所述特征线程分布中更新输出话题业务端配置后的动态特征线程。如此,可以实现对动态特征线程的实时更新和优化,从而确保动态特征线程的时效性。
在实施例d 的基础上,在上述S22所描述的当检测到话题业务端针对所述知识库特征线程的调用行为,且调用行为的目标时段位于所述知识库特征线程对应的创建状态的状态时段内时,在所述创建状态的目标时段输出所述知识库特征线程对应的知识库特征,可以包括以下技术方案:当检测到话题业务端针对所述动态特征线程的调用行为,且调用行为的目标时段位于所述知识库描述的创建状态的状态时段内时,在所述创建状态的目标时段输出所述知识库特征线程对应的动态特征。
在上述实施例d 的基础上,所述配置单元还包括融合单元。基于此,上述步骤所描述的基于话题业务端针对所述配置单元的挑选行为,对所述知识库特征进行配置,可以包括以下内容:基于话题业务端针对所述融合单元的挑选行为,输出融合标签分布,所述融合标签分布包括多个不同融合层面的融合标签单元;基于话题业务端针对所述融合标签单元的融合层面挑选行为,将所述知识库特征调整为可标定状态;基于话题业务端针对所述可标签的知识库特征的挑选行为,按照话题业务端挑选的融合层面依次融合所述话题业务端挑选的知识库特征。如此,能够根据话题业务端的实际需求进行知识库特征的融合,从而尽可能满足话题业务端的知识库搭建需求。
在实施例d的基础上,所述知识库样本服务还包括共享单元,基于此,在上述S23所描述的根据所述会话倾向性生成内容对应的创建状态的状态时段内的知识库特征,生成目标会话倾向性知识库的步骤之后,该方法还可以包括以下S241-S243。
S241:基于话题业务端对所述共享单元的激活行为,获取所述目标会话倾向性知识库。
S242:基于所述目标会话倾向性知识库,输出共享调整服务,所述共享调整服务包括验证单元。
例如,验证单元可以理解为验证控件或者具有验证功能的模块,可以用于进行知识库共享的安全性校验。
S243:基于话题业务端对所述验证单元的激活行为,对所述目标会话倾向性知识库进行共享。
例如,激活行为可以是选择操作或者其他形式的触发操作。
如此设计,通过S241-S243,能够实现对搭建完成的知识库的共享,从而进一步减少重新搭建知识库所耗费的资源,提高知识库的利用率。
在另外的一些实施例中,在S21所描述的输出会话倾向性知识库的搭建服务,所述会话倾向性知识库的搭建服务包括知识库描述和特征线程分布,所述知识库描述包括多个会话倾向性生成内容对应的创建状态,所述特征线程分布包括所述会话倾向性生成内容的至少一个知识库特征线程的步骤之前,该方法还可以包括以下内容:输出知识库样本服务,所述知识库样本服务包括多个知识库样本;基于话题业务端对所述知识库样本的挑选行为,获取话题业务端挑选的目标知识库样本;基于所述目标知识库样本,输出所述会话倾向性搭建服务,所述会话倾向性搭建服务包括根据所述目标知识库样本生成的知识库描述。基于此,在S23所描述的根据所述会话倾向性生成内容对应的创建状态的状态时段内的知识库特征,生成目标会话倾向性知识库的步骤之前,该方法还可以包括以下内容:基于话题业务端在所述知识库描述中的配置激活行为,输出配置分布(比如相关的编辑列表),所述配置分布包括多个配置单元(比如编辑控件等);基于话题业务端针对所述配置单元的挑选行为,对所述知识库特征进行配置。如此设计,能够实现对相关知识库特征的灵活调整和编辑。
对于可独立实施的实施例而言,可以输出会话倾向性知识库的搭建服务,所述会话倾向性知识库的搭建服务包括知识库描述和特征线程分布,所述知识库描述包括多个会话倾向性生成内容对应的创建状态,所述特征线程分布包括所述会话倾向性生成内容的至少一个知识库特征线程;当检测到话题业务端针对所述知识库特征线程的调用行为,且调用行为的目标时段位于所述知识库特征线程对应的创建状态的状态时段内时,在所述创建状态的目标时段输出所述知识库特征线程对应的知识库特征;根据所述会话倾向性生成内容对应的创建状态的状态时段内的知识库特征,生成目标会话倾向性知识库。本实施例通过利用与会话倾向性生成内容对应的知识库特征线程,基于事先进行了创建状态分类的知识库描述进行相关知识库的搭建,可以有效提高会话倾向性知识库搭建的效率,减少互动话题场景分析服务器在搭建会话倾向性知识库时的资源开销,还能够满足不同话题业务端针对会话倾向性知识库的个性化搭建需求,提高会话倾向性知识库搭建的灵活性。
可以理解的是,通过上述技术方案,通过获取与话题互动客户端对应的舆情评论文本,且舆情评论文本是对话题互动客户端收集的主题检测结果进行舆情分析而得到的,并按照对话题互动客户端的设定分类方式,将属于相同分类的话题互动客户端所对应的舆情评论文本归类至相同文本集,从而可以通过获取分类的第一情绪极性信息,以及与分类对应的文本集中每一舆情评论文本的第二情绪极性信息,将获取的第一情绪极性信息和第二情绪极性信息进行关联分析,以获取分类下的话题互动客户端对应的主题检测场景的舆情风向情况,进而能够基于分类下的话题互动客户端实现对主题检测场景的舆情风向检测,通过关联分类下的话题互动客户端,能够改善单一话题互动客户端容易受到误操作、评论干扰、话题群主引导等因素影响的问题,进而能够提高舆情风向检测的精准度和舆情风向情况的时效性。
基于上述同样的发明构思,还提供了一种基于大数据的互动话题场景分析装置20,应用于互动话题场景分析服务器10,所述装置包括:
文本获取模块21,用于获取与话题互动客户端对应的舆情评论文本,其中,所述舆情评论文本是对所述话题互动客户端收集的主题检测结果进行舆情分析而得到的;
文本分类模块22,用于按照对所述话题互动客户端的设定分类方式,将属于相同分类的所述话题互动客户端所对应的舆情评论文本归类至相同文本集;
信息获取模块23,用于获取所述分类的第一情绪极性信息,以及与所述分类对应的所述文本集中每一所述舆情评论文本的第二情绪极性信息;
舆情分析模块24,用于将所述获取的第一情绪极性信息和第二情绪极性信息进行关联分析,以获取所述分类下的所述话题互动客户端对应的主题检测场景的舆情风向情况。
可以理解的是,关于上述模块的描述可以参阅对图2所示的方法的说明,在此不再赘述。
在本申请实施例所提供的几个实施例中,应该理解到,所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置和方法实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本申请的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
另外,在本申请各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,互动话题场景分析服务器10,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上所述仅为本申请的优选实施例而已,并不用于限制本申请,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (10)

1.一种基于大数据的互动话题场景分析方法,其特征在于,应用于互动话题场景分析服务器,所述方法包括:
获取与话题互动客户端对应的舆情评论文本,其中,所述舆情评论文本是对所述话题互动客户端收集的主题检测结果进行舆情分析而得到的;
按照对所述话题互动客户端的设定分类方式,将属于相同分类的所述话题互动客户端所对应的舆情评论文本归类至相同文本集;
获取所述分类的第一情绪极性信息,以及与所述分类对应的所述文本集中每一所述舆情评论文本的第二情绪极性信息;
将所述获取的第一情绪极性信息和第二情绪极性信息进行关联分析,以获取所述分类下的所述话题互动客户端对应的主题检测场景的舆情风向情况。
2.根据权利要求1所述的基于大数据的互动话题场景分析方法,其特征在于,所述将所述获取的第一情绪极性信息和第二情绪极性信息进行关联分析,以获取所述分类下的所述话题互动客户端对应的主题检测场景的舆情风向情况包括:
从与所述分类对应的所述文本集中挑选所述第二情绪极性信息符合设定挑选条件的所述舆情评论文本,并归类至待分析文本集;
基于所述分类的第一情绪极性信息和所述待分析文本集中的所述舆情评论文本的第二情绪极性信息,确定所述主题检测场景是否存在舆情;
若存在舆情,则将所述待分析文本集中的所述舆情评论文本的第二情绪极性信息进行信息融合,获取所述主题检测场景内的舆情风向情况。
3.根据权利要求2所述的基于大数据的互动话题场景分析方法,其特征在于,所述第一情绪极性信息包括所述分类的舆情观点类别分布,所述第二情绪极性信息包括所述舆情评论文本的舆情观点类别,所述设定挑选条件包括:所述舆情评论文本的所述舆情观点类别包含于所述分类的所述舆情观点类别分布内。
4.根据权利要求2所述的基于大数据的互动话题场景分析方法,其特征在于,所述第一情绪极性信息包括所述分类下的所述话题互动客户端之间的社交状态关系;所述基于所述分类的第一情绪极性信息和所述待分析文本集中的所述舆情评论文本的第二情绪极性信息,确定所述主题检测场景是否存在舆情包括:
判断所述分类的第一情绪极性信息和所述待分析文本集中的所述舆情评论文本的第二情绪极性信息是否符合以下条件:所述分类下所述话题互动客户端之间的社交状态关系为语义融合和/或社交成员群融合,且所述待分析文本集中所有所述舆情评论文本对应的话题互动客户端相同;若不符合,则确定所述主题检测场景内存在舆情;若符合,则确定所述主题检测场景内不存在舆情;
相应的,所述第一情绪极性信息还包括所述分类的信息融合标签,所述信息融合标签用于表示是否需要进行信息融合;所述将所述待分析文本集中的所述舆情评论文本的第二情绪极性信息进行信息融合,获取所述主题检测场景内的舆情风向情况之前,所述方法还包括:
判断所述分类下的所述话题互动客户端之间的社交状态关系和所述信息融合标签是否符合以下条件:所述分类下的所述话题互动客户端之间的社交状态关系为间接融合,且所述信息融合标签表示需要进行信息融合;若符合,则执行所述将所述待分析文本集中的所述舆情评论文本的第二情绪极性信息进行信息融合,获取所述主题检测场景内的舆情风向情况的步骤。
5.根据权利要求2所述的基于大数据的互动话题场景分析方法,其特征在于,所述第二情绪极性信息包括舆情观点中的舆情事件的自然语言特征;所述将所述待分析文本集中的所述舆情评论文本的第二情绪极性信息进行信息融合,获取所述主题检测场景内的舆情风向情况包括:
基于所述舆情评论文本的自然语言特征,确定所述待分析文本集中的所述舆情评论文本所属的舆情事件;
分别通过属于相同所述舆情事件的所述舆情评论文本的第二情绪极性信息进行信息融合,获取不同所述舆情事件的舆情倾向变化信息;
相应的,所述基于所述舆情评论文本的自然语言特征,确定所述待分析文本集中的所述舆情评论文本所属的舆情事件包括:
统计所述待分析文本集中所有所述舆情评论文本之间的所述自然语言特征的特征相关性;
若所述舆情评论文本之间的所述特征相关性大于一设定相关性阈值,则确定所述舆情评论文本属于相同所述舆情事件;
相应的,所述第二情绪极性信息还包括所述舆情事件的若干热点描述的特征内容,以及所述自然语言特征的可信系数;所述分别通过属于相同所述舆情事件的所述舆情评论文本的第二情绪极性信息进行信息融合,获取不同所述舆情事件的舆情倾向变化信息包括:
分别从不同所述舆情事件中选取一个作为当前舆情事件,并对所述当前舆情事件执行以下步骤:
分别将所述若干热点描述中的一个热点描述作为当前热点描述;
基于属于所述当前舆情事件的所述舆情评论文本的所述自然语言特征的可信系数和所述当前热点描述的特征内容,确定所述当前舆情事件的当前热点描述的特征内容。
6.根据权利要求5所述的基于大数据的互动话题场景分析方法,其特征在于,所述第二情绪极性信息还包括所述舆情事件在所述主题检测结果中的状态信息;所述方法还包括:
在属于所述当前舆情事件的所述舆情评论文本中挑选所述特征内容最多的舆情评论文本;
通过挑选得到的舆情评论文本中的所述状态信息,获取所述当前舆情事件的目标结果。
7.根据权利要求1所述的基于大数据的互动话题场景分析方法,其特征在于,所述将所述获取的第一情绪极性信息和第二情绪极性信息进行关联分析,以获取所述分类下的所述话题互动客户端对应的主题检测场景的舆情风向情况之前,所述方法还包括:过滤不符合设定文本核验条件的舆情评论文本;
相应的,所述设定文本核验条件至少包括:所述舆情评论文本所对应的主题检测结果的收集时刻与当前时刻之间的时段差异值小于一设定差异值。
8.根据权利要求1所述的基于大数据的互动话题场景分析方法,其特征在于,所述方法还包括:
根据所述分类下的所述话题互动客户端对应的主题检测场景的舆情风向情况输出会话倾向性知识库的搭建服务,所述会话倾向性知识库的搭建服务包括知识库描述和特征线程分布,所述知识库描述包括多个会话倾向性生成内容对应的创建状态,所述特征线程分布包括所述会话倾向性生成内容的至少一个知识库特征线程;
当检测到话题业务端针对所述知识库特征线程的调用行为,且调用行为的目标时段位于所述知识库特征线程对应的创建状态的状态时段内时,在所述创建状态的目标时段输出所述知识库特征线程对应的知识库特征;
根据所述会话倾向性生成内容对应的创建状态的状态时段内的知识库特征,生成目标会话倾向性知识库;
相应的,所述知识库描述包括整体倾向性描述;
当检测到话题业务端针对所述知识库特征线程的调用行为,且调用行为的目标时段位于所述知识库特征线程对应的创建状态的状态时段内时,在所述创建状态的目标时段输出所述知识库特征线程对应的知识库特征,包括:
当检测到话题业务端针对所述特征线程分布中知识库特征线程的调用行为,且调用行为的目标时段位于所述知识库特征线程对应的创建状态的状态时段内时,在所述创建状态的目标时段输出所述知识库特征线程对应的知识库特征;
根据所述会话倾向性生成内容对应的创建状态的状态时段内的知识库特征,生成目标会话倾向性知识库,包括:
根据所述会话倾向性生成内容对应的创建状态的状态时段内的知识库特征,生成目标会话倾向性知识库的整体倾向性描述;
相应的,所述知识库描述还包括所述会话生成内容的关键内容描述;
当检测到话题业务端针对所述特征线程分布中的知识库特征线程的调用行为,且调用行为的目标时段位于所述知识库特征线程对应的创建状态的状态时段内时,在所述创建状态的目标时段输出所述知识库特征线程对应的知识库特征,还包括:
根据所述整体倾向性描述,基于所述关键内容描述输出所述整体倾向性描述中所述会话倾向性生成内容对应的知识库特征,所述关键内容描述包括至少一个会话倾向性局部内容对应的局部创建状态;
当检测到话题业务端针对所述关键内容描述中知识库特征的调用行为,且调用行为的目标时段位于所述知识库特征线程对应的局部创建状态的状态时段内时,在所述局部创建状态中的目标时段输出所述知识库特征线程对应的知识库特征;
根据所述会话倾向性生成内容对应的创建状态的状态时段内的知识库特征,生成目标会话倾向性知识库,还包括:
根据所述会话倾向性局部内容对应的局部创建状态的状态时段内的知识库特征,生成目标会话倾向性知识库的关键内容描述。
9.一种互动话题场景分析服务器,其特征在于,包括:
处理器,
通信总线,以及
存储器;
其中,所述处理器和所述存储器通过所述通信总线通信,所述处理器从所述存储器中读取计算机程序并运行,以执行权利要求1-8任一项所述的方法。
10.一种计算机存储介质,其特征在于,所述计算机存储介质存储有计算机程序,所述计算机程序在运行时实现权利要求1-8任一项所述的方法。
CN202110584705.2A 2021-05-27 2021-05-27 基于大数据的互动话题场景分析方法、服务器及介质 Withdrawn CN113158069A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110584705.2A CN113158069A (zh) 2021-05-27 2021-05-27 基于大数据的互动话题场景分析方法、服务器及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110584705.2A CN113158069A (zh) 2021-05-27 2021-05-27 基于大数据的互动话题场景分析方法、服务器及介质

Publications (1)

Publication Number Publication Date
CN113158069A true CN113158069A (zh) 2021-07-23

Family

ID=76877760

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110584705.2A Withdrawn CN113158069A (zh) 2021-05-27 2021-05-27 基于大数据的互动话题场景分析方法、服务器及介质

Country Status (1)

Country Link
CN (1) CN113158069A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114139209A (zh) * 2021-12-15 2022-03-04 智谷互联网科技(廊坊)有限公司 一种应用于业务用户大数据的信息防窃取方法及系统
CN116662503A (zh) * 2023-05-22 2023-08-29 深圳市新美网络科技有限公司 私域用户场景话术推荐方法及其系统

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114139209A (zh) * 2021-12-15 2022-03-04 智谷互联网科技(廊坊)有限公司 一种应用于业务用户大数据的信息防窃取方法及系统
CN114139209B (zh) * 2021-12-15 2022-10-11 苏州泰克赛威网络科技有限公司 一种应用于业务用户大数据的信息防窃取方法及系统
CN116662503A (zh) * 2023-05-22 2023-08-29 深圳市新美网络科技有限公司 私域用户场景话术推荐方法及其系统
CN116662503B (zh) * 2023-05-22 2023-12-29 深圳市新美网络科技有限公司 私域用户场景话术推荐方法及其系统

Similar Documents

Publication Publication Date Title
Adewole et al. SMSAD: a framework for spam message and spam account detection
JP6253984B2 (ja) 消費者発信メディアの評判管理のシステムおよび方法
US20150120583A1 (en) Process and mechanism for identifying large scale misuse of social media networks
US10013480B2 (en) Method and system for decomposing social relationships into domains of interactions
CN114143216A (zh) 用于基于网络的广告数据业务时延减小的系统和方法
CN106202155B (zh) 一种信息处理方法及装置
CN113158069A (zh) 基于大数据的互动话题场景分析方法、服务器及介质
US10594817B2 (en) Cognitive device-to-device interaction and human-device interaction based on social networks
Murugan et al. Detecting spams in social networks using ML algorithms-a review
US9058376B2 (en) Scoring of interrelated message elements
US11269928B2 (en) Identification and analysis of cohesive and topic-focused groups of user accounts from user-generated content on electronic communication platforms
Liang et al. Information propagation formalized representation of micro-blog network based on petri nets
Gentile et al. Extracting semantic user networks from informal communication exchanges
JP2010286868A (ja) コミュニティ形成システム、そのコミュニティ形成装置、そのデータ処理方法およびコンピュータプログラム
KR20130091391A (ko) 콘텐츠 추천 서버 및 방법, 그리고 그 방법을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 기록매체
CN114661998A (zh) 基于互联网热点话题的大数据处理方法及系统
CN114186272A (zh) 一种基于数字办公的大数据威胁防护方法及系统
Chen et al. Survey on Astroturfing Detection and Analysis from an Information Technology Perspective
Gadek et al. AI techniques to analyse a social network on text, user and group level: application on Galaxy2
CN114219427B (zh) 一种应对大数据办公的信息安全处理方法及存储介质
Chao et al. A Social Network system oriented hybrid recommendation model
US9729484B2 (en) Method of processing connection data of platform of an internet site
CN115174633B (zh) 工业互联网业务数据处理方法、系统及云平台
CN115062223B (zh) 社交大数据平台垃圾广告用户精准识别方法
Mezghani et al. Online social network phenomena: buzz, rumor and spam

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication

Application publication date: 20210723

WW01 Invention patent application withdrawn after publication