CN114461807A - 一种基于量化计算的舆论场趋势预测分析方法 - Google Patents
一种基于量化计算的舆论场趋势预测分析方法 Download PDFInfo
- Publication number
- CN114461807A CN114461807A CN202210314718.2A CN202210314718A CN114461807A CN 114461807 A CN114461807 A CN 114461807A CN 202210314718 A CN202210314718 A CN 202210314718A CN 114461807 A CN114461807 A CN 114461807A
- Authority
- CN
- China
- Prior art keywords
- trend
- score
- public opinion
- comment
- content
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
- G06F16/353—Clustering; Classification into predefined classes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2413—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
- G06F18/24133—Distances to prototypes
- G06F18/24137—Distances to cluster centroïds
- G06F18/2414—Smoothing the distance, e.g. radial basis function networks [RBFN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Databases & Information Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种基于量化计算的舆论场趋势预测分析方法,属于舆情分析技术领域,包括步骤:S1,获取基础数据;S2,基于获取的基础数据,进行立场检测及基于发言时机因素的立场趋势分析,构建舆论趋势走向判断规则生成样本集;S3,构建基于发言账号和发言内容的舆论趋势走向预测神经网络模型TFNN;S4,利用步骤S2的构建趋势走向判断规则生成样本集得到的样本数据,训练步骤S3的TFNN模型,得出舆论趋势走向预测结果。本发明能够对新时期网络社会的科学治理和媒体平台舆论走向判断提供科学,有效的决策建议。
Description
技术领域
本发明涉及舆情分析技术领域,更为具体的,涉及一种基于量化计算的舆论场趋势预测分析方法。
背景技术
由于网络传播途径复杂,舆论趋势走向影响因素纷繁,如果对舆论环境走向趋势判断不准确,会导致微小舆情事件迅速发酵成为社会热点,形成重大舆论危机,从而危害社会稳定和国家安全。
现有技术存在如下技术问题:1)舆论趋势走向判断考虑不够全面;2)如何对特定主题实现量化分析舆论趋势走向。
发明内容
本发明的目的在于克服现有技术的不足,提供一种基于量化计算的舆论场趋势预测分析方法,能够对新时期网络社会的科学治理和媒体平台舆论趋势走向判断提供科学,有效的决策建议等。
本发明的目的是通过以下方案实现的:
一种基于量化计算的舆论场趋势预测分析方法,包括步骤:
S1,获取基础数据;
S2,基于获取的基础数据,进行立场检测及考虑时机因素的立场趋势分析,构建舆论趋势走向判断规则生成样本集;
S3,构建舆论趋势走向预测神经网络模型TFNN,所述舆论趋势走向预测神经网络模型TFNN包括输入层、表示层和输出层,在表示层设有一层第一全连接层和第一激活层,在输出层设有一层第二全连接层和第二激活层;
S4,利用步骤S2的构建舆论趋势走向判断规则生成样本集得到的样本数据,训练步骤S3中的所述舆论趋势走向预测神经网络模型TFNN,实现舆论趋势走向预测。
进一步地,在步骤S1中,根据指定的主题从社交网络平台采集主贴以及评论内容数据,作为基础数据。
进一步地,在步骤S2中,所述进行立场检测及考虑时机因素的立场趋势分析,包括子步骤:
S21,评论文本立场检测:根据评论内容对主贴
内容、主题所持立场分析出评论文本内容对目标主题的立场倾向是“支持”、“反对”还是“中立”,实现评论内容立场检测;
S22,立场趋势分析:在步骤S21中取得评论文本内容的立场之后,进行相应主题下所有评论的立场趋势分析,生成“支持”、“反对”、“中立”三个立场集合;
S23,使用LSTM模型对步骤S22中立场的变化趋势进行预测,选择立场变化中的最佳拐点作为舆论影响时机作为判断趋势走向因素之一。
进一步地,在步骤S2中,所述构建舆论趋势走向判断规则生成样本集,包括子步骤:
SS21,趋势平滑:建立各立场人数占比随总发帖量的趋势变化的趋势图曲线并进行平滑处理,然后使用最小二乘法将数据的一个小窗口回归到多项式上,然后使用多项式来估计窗口中心的点,最后窗口向前移动一个数据点,使用最小二乘法将数据窗口回归到多项式,使用多项式来估计窗口中心点,直到每个点相对于邻居都进行了最佳调整;
SS22,趋势图曲线拐点检测:采用滑动窗口算法并将其扩展以找到多个变化点,将两个相邻的窗口沿着信号滑动,计算第一窗口和第二窗口之间的差异;当这两个窗口包含不相似的片段时,如果计算得到的差异值大于设定值,则检测得到一个拐点;并通过在离线设置中,计算得到完整的差异曲线并执行峰值搜索过程以找到拐点索引,最后对平滑后的趋势曲线进行拐点检测标注;
SS23,趋势段选取:基于步骤SS22中在趋势曲线标注的拐点,计算趋势曲线中上升幅度最大的一段作为样本提取出来,将与趋势曲线同立场的评论标注为正样本,其他立场的评论标注为负样本,遵循此规则给各评论打标签,所述标签作为趋势影响力得分的考量;
SS24,样本趋势走向判断规则制定:样本的趋势走向判断机制由评论社交账户基本信息得分与本次评论社交账户对立场趋势影响力得分的和构成;
Score_User = w_property * Score(property) + w_behavior * Score(behavior)(1)
式(1)中,Score_User代表人物画像总得分,Score(property)代表人物账户属性得分,w_property代表基本属性权重比例,Score(behavior)代表行为属性得分,w_behavior代表行为属性权重比例;
Score_Final = Score_User * W_User + Score_label* W_label(2)
式(2)中,Score_label为评论社交账户对立场趋势的影响力得分,且得分规则如下:评论成功影响了一位其他立场人员的评论,则该评论得第一设定数值分数;评论成功增加了本立场人数,该评论得第二设定数值分数;评论未能增加本立场人数,该评论得第三设定数值分数;评论使本立场人数降低,该评论得第四设定数值分数;W_label代表趋势影响力得分权重比例;W_User代表人物账户属性权重比例;Score_Final代表样本趋势走向最终得分;
SS25,构建样本特征,所述样本特征包括人物账户属性特征、评论内容语义特征和主题立场语义特征;然后通过所述样本特征计算得出Score_Final,利用该Score_Final的结果作为预测有效影响舆论走势的结论。
进一步地,在步骤S3中,包括子步骤:将人物账户属性特征、评论内容语义特征和主题立场语义特征作为神经网络模型TFNN模型的输入特征。
进一步地,在步骤S4中,影响舆论趋势走向预测的因素包括发言时机、发言内容、发言账号。
进一步地,在步骤SS21中,所述平滑处理采用Savitzky-Golay filter平滑处理。
进一步地,在步骤SS25中,所述评论语义内容特征根据sentence_bert模型输出得到。
进一步地,在步骤SS25中,通过将评论内容、主题内容、选定的评论文本内容对目标主题的立场倾向输入sentence_bert模型,输出语义向量,能够表征评论内容的语义、主题以及立场,得到所述主题立场语义特征。
本发明的有益效果是:
本发明通过综合考虑评论内容、主题、评论账户属性等多种因素,制定了样本舆论趋势判断规则,同时提出了一种新的引导舆论趋势走向预测神经网络模型,实现了舆论趋势走向预测,能够对新时期网络社会的科学治理和媒体平台舆论趋势走向判断提供科学,有效的决策建议。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例中舆论引导策略生成流程示意图;
图2为本发明实施例中各立场人数占比随总发帖量的趋势变化图;
图3为本发明实施例中特定主题立场变化趋势预测示意图;
图4为本发明实施例中趋势图曲线平滑示意图;
图5为本发明实施例中平滑曲线拐点检测示意图;
图6为本发明实施例中趋势段选取示意图;
图7为本发明实施例中提出的TFNN模型结构示意图。
具体实施方式
本说明书中所有实施例公开的所有特征,或隐含公开的所有方法或过程中的步骤,除了互相排斥的特征和/或步骤以外,均可以以任何方式组合和/或扩展、替换。
下面根据附图1~图7,对本发明的技术构思、工作原理、功效和工作过程作进一步详细说明。
本发明在解决背景技术中的问题时,又发现了如下新的技术问题:
传统舆论引导的方法通常是构建社交网络影响力传播模型,通过用户间关注、评论、回复、点赞等交互行为关系,找出用户间关系扩散特征,推断造成该特征的用户关系和互动行为,找到影响力高的账号,从而实现信息引导,该方法并未综合考虑信息内容、主题匹配度等因素对舆论引导的影响,因此对舆论引导策略考虑不够全面。
在具体实施过程中,本发明的技术方案详细说明如下:
为了解决如何对特定主题实现有效舆论走向判断的问题,本发明的技术构思是:通过分析该特定主题立场趋势变化,预测趋势拐点,提供影响趋势时机判断;综合利用社交账户人物画像、个体言论内容、主题内容等特征,量化分析以上因素对舆论走向的影响度,构建了舆论趋势走向预测模型,最终能够提供发言账号、发帖内容等引导策略,实现舆论走向的有效预测。本发明技术方案的总体流程,如图1所示。在具体实施过程中,包括如下步骤:
(1)数据获取
根据指定主题,从社交网络平台采集主贴以及评论内容,包括发表言论的社交账户基本信息、行为信息、内容信息等,作为进行引导策略分析的基础数据。
(2)立场检测及立场趋势分析
步骤一,评论文本立场检测:根据评论内容对主贴内容、主题所持立场进行分析,实现评论内容立场检测。立场检测任务通过自然语言处理技术,分析出当前评论文本内容对目标主题的立场倾向是“支持”、“反对”还是“中立”。
步骤二,立场趋势分析:取得评论文本内容的立场之后,进行该主题下所有评论的立场趋势分析,生成“支持”、“反对”、“中立”三个立场集合,各立场人数占比随总发帖量的趋势变化如图2所示。
步骤三,本发明使用LSTM模型对话题立场变化趋势进行预测,选择立场变化中的最佳拐点作为影响时机作为判断趋势走向因素之一。
LSTM的特点就是在RNN结构以外添加了各层的阀门节点。阀门有3类:遗忘阀门(forget gate),输入阀门(input gate)和输出阀门(output gate)。模型的记忆功能就是由这些阀门节点实现的。通过调节阀门的开关就可以实现早期序列对最终结果的影响。LSTM在时间序列预测中表现非常优异。根据预测变化趋势,选择趋势反转的拐点位置作为引导时机。
(3)构建趋势走向判断规则生成趋势走向判断规则生成样本集
步骤一,趋势平滑:对各立场人数占比随总发帖量的趋势变化的趋势图曲线进行Savitzky-Golay filter平滑。使用最小二乘法将数据的一个小窗口回归到多项式上,然后使用多项式来估计窗口中心的点。最后窗口向前移动一个数据点,重复这个过程。这样继续下去,直到每个点相对于邻居都进行了最佳调整,如图4所示。
步骤二,趋势图曲线拐点检测:采用基于滑动窗口算法(一种快速近似的 OptimalDetection的替代算法),该方法依赖于单个变化点检测程序并将其扩展以找到多个变化点。算法实施时,两个相邻的窗口沿着信号滑动,计算第一窗口和第二窗口之间的差异。当这两个窗口包含不相似的片段时,计算得的差异值将会很大,检测得到一个拐点。在离线设置中,计算完整的差异曲线并执行峰值搜索过程以找到拐点索引。对平滑后的趋势曲线进行拐点检测标注,如图5所示。
步骤三,趋势段选取:基于图5的趋势曲线标注的拐点,计算曲线中上升幅度最大的一段作为样本提取出来,与该趋势曲线同立场的评论标注为正样本,其他立场的评论标注为负样本,遵循此规则给各评论打标签。此标签作为趋势影响力得分的考量,如图6所示。
步骤四,样本趋势走向判断规则制定:样本的趋势走向判断机制由某个评论社交账户基本信息得分与本次评论社交账户对立场趋势影响力得分的和构成。
Score_User = w_property * Score(property) + w_behavior * Score(behavior)(1)
式(1)中,Score_User代表人物画像总得分,Score(property)代表人物账户属性得分,包含粉丝量,发帖量等,w_property代表基本属性权重比例,Score(behavior)代表行为属性得分,w_behavior代表行为属性权重比例。
Score_Final = Score_User * W_User + Score_label* W_label(2)
式(2)中,Score_label为本次评论社交账户对立场趋势的影响力得分。得分规则如下:本次评论成功影响了一位其他立场人员的评论,该评论得4分;本次评论成功增加了本立场人数,该发言得3分;本次评论未能增加本立场人数,该评论得2分;本次评论使本立场人数降低,该评论得1分。W_label代表趋势影响力得分权重比例。W_User代表人物账户属性权重比例,将两部分得分加起来作为代表样本趋势走向最终得分Score_Final。
步骤五,构建样本特征:由人物账户属性特征和评论内容特征构成。评论内容特征是根据sentence_bert模型输出。将评论内容、主题内容、当前评论文本内容对目标主题的立场倾向输入sentence_bert模型,输出语义向量,表征评论内容的语义、topic以及立场。
最后的样本特征构成为:人物账户属性特征和评论内容语义特征和主题立场语义特征,通过样本特征计算得出该Score_Final,利用该分析结果,可以作为判断有效影响舆论走势的因素,作为训练样本,构建舆论趋势走向预测模型。
(4)模型构建
模型需要输入特征有三部分内容:人物账户属性特征和评论内容语义特征和主题立场语义特征,三部分特征维度不尽相同,目前能够处理多领域信息的有推荐系统中的DSSM双塔模型,通过参考该模型架构,根据三部分输入的内容维度进行神经网络模型结构构造,提出了一种舆论趋势走向预测舆论趋势走向预测神经网络模型TFNN(Trendforcastneural network),经过2层全连接层和激活层后,将三部分进行concat,再经过全连接层和激活层,其原理结构如图7所示。
(5)舆论趋势走向预测
至此,利用(3)构建趋势走向判断规则生成趋势走向判断规则生成样本集得到的样本数据,训练TFNN模型,可以通过输入人物账户属性特征和评论内容语义特征和主题立场语义特征,得到舆论影响因素,包括发言时机、发言内容、发言账号。
由于社交网络本身异构性、跨平台传播复杂性、舆情发酵多变性等影响网络信息传播的因素众多,本发明的技术方案通过厘清网络信息传播规律,判定网络舆情发酵趋势、识别舆情引导关键节点、智能推荐舆论引导策略等,能够对新时期网络社会的科学治理和媒体平台舆论走势判断提供科学,有效的决策建议。
实施例1:一种基于量化计算的舆论场趋势预测分析方法,包括步骤:
S1,获取基础数据;
S2,基于获取的基础数据,进行立场检测及考虑时机因素的立场趋势分析,构建舆论趋势走向判断规则生成样本集;
S3,构建舆论趋势走向预测神经网络模型TFNN,所述舆论趋势走向预测神经网络模型TFNN包括输入层、表示层和输出层,在表示层设有一层第一全连接层和第一激活层,在输出层设有一层第二全连接层和第二激活层;
S4,利用步骤S2的构建趋势走向判断规则生成样本集得到的样本数据,训练步骤S3的所述TFNN模型,生成舆论引导策略。
实施例2:在实施例1的基础上,在步骤S1中,根据指定的主题从社交网络平台采集主贴以及评论内容数据,作为进行舆论走势判断分析的基础数据。
实施例3:在实施例1的基础上,在步骤S2中,所述进行立场检测及考虑时机因素的立场趋势分析,包括子步骤:
S21,评论文本立场检测:根据评论内容对主贴内容、主题所持立场分析出当前评论文本内容对目标主题的立场倾向是“支持”、“反对”还是“中立”,实现评论内容立场检测;
S22,立场趋势分析:取得评论文本内容的立场之后,进行该主题下所有评论的立场趋势分析,生成“支持”、“反对”、“中立”三个立场集合;
S23,使用LSTM模型对话题立场变化趋势进行预测,选择立场变化中的最佳拐点作为影响时机作为判断趋势走向因素之一。
实施例4:在实施例1的基础上,在步骤S2中,所述构建舆论趋势走向判断规则生成样本集,包括子步骤:
SS21,趋势平滑:对各立场人数占比随总发帖量的趋势变化的趋势图曲线进行平滑处理,使用最小二乘法将数据的一个小窗口回归到多项式上,然后使用多项式来估计窗口中心的点,最后窗口向前移动一个数据点,重复这个过程;这样继续下去,直到每个点相对于邻居都进行了最佳调整;
SS22,趋势图曲线拐点检测:采用滑动窗口算法并将其扩展以找到多个变化点,将两个相邻的窗口沿着信号滑动,计算第一窗口和第二窗口之间的差异;当这两个窗口包含不相似的片段时,计算得的差异值大于设定值,检测得到一个拐点;并在离线设置中,计算完整的差异曲线并执行峰值搜索过程以找到拐点索引,对平滑后的趋势曲线进行拐点检测标注;
SS23,趋势段选取:基于步骤SS22中趋势曲线标注的拐点,计算曲线中上升幅度最大的一段作为样本提取出来,与该趋势曲线同立场的评论标注为正样本,其他立场的评论标注为负样本,遵循此规则给各评论打标签;此标签作为趋势影响力得分的考量;
SS24,样本趋势走向判断规则制定:样本的趋势走向判断机制由某个评论社交账户基本信息得分与本次评论社交账户对立场趋势影响力得分的和构成;
Score_User = w_property * Score(property) + w_behavior * Score(behavior)(1)
式(1)中,Score_User代表人物画像总得分,Score(property)代表人物账户属性得分,w_property代表基本属性权重比例,Score(behavior)代表行为属性得分,w_behavior代表行为属性权重比例;
Score_Final = Score_User * W_User + Score_label* W_label(2)
式(2)中,Score_label为本次评论社交账户对立场趋势的影响力得分;得分规则如下:本次评论成功影响了一位其他立场人员的评论,该评论得第一设定数值分数;本次评论成功增加了本立场人数,该发言得第二设定数值分数;本次评论未能增加本立场人数,该评论得第三设定数值分数;本次评论使本立场人数降低,该评论得第四设定数值分数;W_label代表趋势影响力得分权重比例;W_User代表人物账户属性权重比例,将两部分得分加起来作为代表样本趋势走向最终得分Score_Final;
SS25,构建样本特征,所述样本特征包括人物账户属性特征、评论内容语义特征和主题立场语义特征;通过所述样本特征计算得出该Score_Final,利用该分析结果,作为判断有效影响舆论走势的因素,作为训练样本,构建舆论趋势走向预测模型。
实施例5:在实施例1的基础上,在步骤S3中,包括子步骤:将人物账户属性特征、评论内容语义特征和主题立场语义特征作为神经网络模型TFNN模型的输入特征。
实施例6:在实施例3的基础上,在步骤S4中,影响舆论趋势走向预测的因素包括发言时机、发言内容、发言账号。
实施例7:在实施例1的基础上,在步骤SS21中,所述平滑处理采用Savitzky-Golayfilter平滑处理。
实施例8:在实施例3的基础上,在步骤SS25中,所述评论内容语义特征根据sentence_bert模型输出。
实施例9:在实施例1的基础上,在步骤S25中,通过将评论内容、主题内容、当前评论文本内容对目标主题的立场倾向输入sentence_bert模型,输出语义向量,表征评论内容的语义、topic以及立场,得到所述主题立场语义特征。
本发明功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,在一台计算机设备(可以是个人计算机,服务器,或者网络设备等)以及相应的软件中执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、或者光盘等各种可以存储程序代码的介质,进行测试的数据在程序实现中存在于只读存储器(Random Access Memory,RAM)、随机存取存储器(Random Access Memory,RAM)等。
Claims (9)
1.一种基于量化计算的舆论场趋势预测分析方法,其特征在于,包括步骤:
S1,获取基础数据;
S2,基于获取的基础数据进行立场检测及考虑时机因素的立场趋势分析,构建舆论趋势走向判断规则生成样本集;
S3,构建舆论趋势走向预测神经网络模型TFNN,所述舆论趋势走向预测神经网络模型TFNN包括输入层、表示层和输出层,在表示层设有一层第一全连接层和第一激活层,在输出层设有一层第二全连接层和第二激活层;
S4,利用步骤S2的构建舆论趋势走向判断规则生成样本集得到的样本数据,训练步骤S3中的所述舆论趋势走向预测神经网络模型TFNN,实现舆论趋势走向预测。
2.根据权利要求1所述的基于量化计算的舆论场趋势预测分析方法,其特征在于,在步骤S1中,根据指定的主题从社交网络平台采集主贴以及评论内容数据,作为基础数据。
3.根据权利要求2所述的基于量化计算的舆论场趋势预测分析方法,其特征在于,在步骤S2中,所述进行立场检测及考虑时机因素的立场趋势分析,包括子步骤:
S21,评论文本立场检测:根据评论内容对主贴
内容、主题所持立场分析出评论文本内容对目标主题的立场倾向是“支持”、“反对”还是“中立”,实现评论内容立场检测;
S22,立场趋势分析:在步骤S21中取得评论文本内容的立场之后,进行相应主题下所有评论的立场趋势分析,生成“支持”、“反对”、“中立”三个立场集合;
S23,使用LSTM模型对步骤S22中立场的变化趋势进行预测,选择立场变化中的最佳拐点作为舆论影响时机作为判断趋势走向因素之一。
4.根据权利要求1所述的基于量化计算的舆论场趋势预测分析方法,其特征在于,在步骤S2中,所述构建舆论趋势走向判断规则生成样本集,包括子步骤:
SS21,趋势平滑:建立各立场人数占比随总发帖量的趋势变化的趋势图曲线并进行平滑处理,然后使用最小二乘法将数据的一个小窗口回归到多项式上,然后使用多项式来估计窗口中心的点,最后窗口向前移动一个数据点,使用最小二乘法将数据窗口回归到多项式,使用多项式来估计窗口中心点,直到每个点相对于邻居都进行了最佳调整;
SS22,趋势图曲线拐点检测:采用滑动窗口算法并将其扩展以找到多个变化点,将两个相邻的窗口沿着信号滑动,计算第一窗口和第二窗口之间的差异;当这两个窗口包含不相似的片段时,如果计算得到的差异值大于设定值,则检测得到一个拐点;并通过在离线设置中,计算得到完整的差异曲线并执行峰值搜索过程以找到拐点索引,最后对平滑后的趋势曲线进行拐点检测标注;
SS23,趋势段选取:基于步骤SS22中在趋势曲线标注的拐点,计算趋势曲线中上升幅度最大的一段作为样本提取出来,将与趋势曲线同立场的评论标注为正样本,其他立场的评论标注为负样本,遵循此规则给各评论打标签,所述标签作为趋势影响力得分的考量;
SS24,样本趋势走向判断规则制定:样本的趋势走向判断机制由评论社交账户基本信息得分与本次评论社交账户对立场趋势影响力得分的和构成;
Score_User = w_property * Score(property) + w_behavior * Score(behavior)(1)
式(1)中,Score_User代表人物画像总得分,Score(property)代表人物账户属性得分,w_property代表基本属性权重比例,Score(behavior)代表行为属性得分,w_behavior代表行为属性权重比例;
Score_Final = Score_User * W_User + Score_label* W_label(2)
式(2)中,Score_label为评论社交账户对立场趋势的影响力得分,且得分规则如下:评论成功影响了一位其他立场人员的评论,则该评论得第一设定数值分数;评论成功增加了本立场人数,该评论得第二设定数值分数;评论未能增加本立场人数,该评论得第三设定数值分数;评论使本立场人数降低,该评论得第四设定数值分数;W_label代表趋势影响力得分权重比例;W_User代表人物账户属性权重比例;Score_Final代表样本趋势走向最终得分;
SS25,构建样本特征,所述样本特征包括人物账户属性特征、评论内容语义特征和主题立场语义特征;然后通过所述样本特征计算得出Score_Final,利用该Score_Final的结果作为预测有效影响舆论走势的结论。
5.根据权利要求4所述的基于量化计算的舆论场趋势预测分析方法,其特征在于,在步骤S3中,包括子步骤:将人物账户属性特征、评论内容语义特征和主题立场语义特征作为神经网络模型TFNN模型的输入特征。
6.根据权利要求1所述的基于量化计算的舆论场趋势预测分析方法,其特征在于,在步骤S4中,影响舆论趋势走向预测的因素包括发言时机、发言内容、发言账号。
7.根据权利要求4所述的基于量化计算的舆论场趋势预测分析方法,其特征在于,在步骤SS21中,所述平滑处理采用Savitzky-Golay filter平滑处理。
8.根据权利要求4所述的基于量化计算的舆论场趋势预测分析方法,其特征在于,在步骤SS25中,所述评论内容语义特征根据sentence_bert模型输出得到。
9.根据权利要求4所述的基于量化计算的舆论场趋势预测分析方法,其特征在于,在步骤SS25中,通过将评论内容、主题内容、选定的评论文本内容对目标主题的立场倾向输入sentence_bert模型,输出语义向量,能够表征评论内容的语义、主题以及立场,得到所述主题立场语义特征。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN202210314718.2A CN114461807A (zh) | 2022-03-29 | 2022-03-29 | 一种基于量化计算的舆论场趋势预测分析方法 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN202210314718.2A CN114461807A (zh) | 2022-03-29 | 2022-03-29 | 一种基于量化计算的舆论场趋势预测分析方法 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| CN114461807A true CN114461807A (zh) | 2022-05-10 |
Family
ID=81416734
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| CN202210314718.2A Pending CN114461807A (zh) | 2022-03-29 | 2022-03-29 | 一种基于量化计算的舆论场趋势预测分析方法 |
Country Status (1)
| Country | Link |
|---|---|
| CN (1) | CN114461807A (zh) |
-
2022
- 2022-03-29 CN CN202210314718.2A patent/CN114461807A/zh active Pending
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| Shou et al. | Conversational emotion recognition studies based on graph convolutional neural networks and a dependent syntactic analysis | |
| CN110096567B (zh) | 基于qa知识库推理的多轮对话回复选择方法、系统 | |
| Gweon et al. | Measuring prevalence of other-oriented transactive contributions using an automated measure of speech style accommodation | |
| Lee et al. | Promising ideas for collective advancement of communal knowledge using temporal analytics and cluster analysis | |
| Pugh et al. | Say What? Automatic Modeling of Collaborative Problem Solving Skills from Student Speech in the Wild. | |
| Preiser et al. | Qualitative content analysis | |
| Qianjing et al. | An artificial intelligence based construction and application of english multimodal online reading mode | |
| Yin et al. | A deep learning based chatbot for campus psychological therapy | |
| Zhang et al. | A Contrastive learning-based Task Adaptation model for few-shot intent recognition | |
| CN112749558A (zh) | 一种目标内容获取方法、装置、计算机设备和存储介质 | |
| Wang et al. | Predicting self-reported proactive personality classification with Weibo text and short answer text | |
| CN117094291B (zh) | 基于智能写作的自动新闻生成系统 | |
| CN114461807A (zh) | 一种基于量化计算的舆论场趋势预测分析方法 | |
| Ali et al. | Using text comprehension model for learning concepts, context, and topic of web content | |
| Sileo et al. | Discourse-based evaluation of language understanding | |
| Kim et al. | Detecting multiclass emotions from labeled movie scripts | |
| Jayanthi M et al. | Quest_SA: Preprocessing Method for Closed‐Ended Questionnaires Using Sentiment Analysis through Polarity | |
| Alsheri et al. | MOOCSent: a sentiment predictor for massive open online courses | |
| Sajinika et al. | Twitter Sentiment Analysis and Topic Modeling for Online Learning | |
| Chamorro-Atalaya et al. | Supervised learning using support vector machine applied to sentiment analysis of teacher performance satisfaction | |
| Mayfield et al. | Recognizing rare social phenomena in conversation: Empowerment detection in support group chatrooms | |
| Sun | The application of improving machine learning algorithm and voice technology in the teaching evaluation of ideological and political education | |
| Yang et al. | Detecting senior executives’ personalities for predicting corporate behaviors: an attention-based deep learning approach | |
| Singh et al. | Mining tourists’ opinions on popular Indian tourism hotspots using sentiment analysis and topic modeling | |
| Cheng et al. | Automatic Scoring of Spoken Language Based on Basic Deep Learning |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| PB01 | Publication | ||
| PB01 | Publication | ||
| SE01 | Entry into force of request for substantive examination | ||
| SE01 | Entry into force of request for substantive examination |