CN110096652A - 舆情风向标指数计算方法及装置、可读存储介质 - Google Patents

舆情风向标指数计算方法及装置、可读存储介质 Download PDF

Info

Publication number
CN110096652A
CN110096652A CN201910371823.8A CN201910371823A CN110096652A CN 110096652 A CN110096652 A CN 110096652A CN 201910371823 A CN201910371823 A CN 201910371823A CN 110096652 A CN110096652 A CN 110096652A
Authority
CN
China
Prior art keywords
index
text
mood
market value
public sentiment
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910371823.8A
Other languages
English (en)
Inventor
孙弋涵
刘峰
陈秋蕾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SAIC Motor Corp Ltd
Original Assignee
SAIC Motor Corp Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SAIC Motor Corp Ltd filed Critical SAIC Motor Corp Ltd
Priority to CN201910371823.8A priority Critical patent/CN110096652A/zh
Publication of CN110096652A publication Critical patent/CN110096652A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9536Search customisation based on social or collaborative filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

一种舆情风向标指数计算方法及装置、可读存储介质,所述舆情风向标指数计算方法包括获取目标主体对应的文本数据;分别计算所述文本数据的热度指数以及情绪指数;根据所述热度指数和所述情绪指数,得到所述目标主体的情绪市值;根据预设的滑动时间窗口内加权的历史情绪市值和当期新增的情绪市值,计算所述当期新增的情绪市值对舆情风向的影响,得到舆情风向标指数。上述方案可以使舆情风向标指数全面、精确地反映舆论情况。

Description

舆情风向标指数计算方法及装置、可读存储介质
技术领域
本发明属于互联网技术领域,特别涉及一种舆情风向标指数计算方法及装置、可读存储介质。
背景技术
舆情是“舆论情况”的简称,是指在一定的社会空间内,围绕中介性社会事件的发生、发展和变化,作为主体的民众对作为客体的社会管理者、企业、个人及其他各类组织及其政治、社会、道德等方面的取向产生和持有的社会态度。舆情是较多群众关于社会中各种现象、问题所表达的信念、态度、意见和情绪等等表现的总和。
由于舆情分析的复杂性,现有的舆情指数计算方法大多不能全面、精确地反映舆论情况。
发明内容
本发明实施例解决的是如何使舆情风向标指数全面、精确地反映舆论情况。
为解决上述技术问题,本发明实施例提供一种舆情风向标指数计算方法,包括:获取目标主体对应的文本数据;分别计算所述文本数据的热度指数以及情绪指数;根据所述热度指数和所述情绪指数,得到所述目标主体的情绪市值;根据预设的滑动时间窗口内加权的历史情绪市值和当期新增的情绪市值,计算所述当期新增的情绪市值对舆情风向的影响,得到舆情风向标指数。
可选的,所述分别计算所述文本数据的热度指数以及情绪指数,包括:获取所述文本数据的数量和类型;根据所述文本数据的数量、所述文本数据的类型以及预设的类型权重,计算所述热度指数。
可选的,采用如下公式计算所述热度指数:其中,H为所述热度指数,N为所述文本数据的数量,t为时间,i为所述文本数据的类型,I为所述文本数据的类型数量,wi为所述预设的类型权重。
可选的,所述分别计算所述文本数据的热度指数以及情绪指数,包括:当在预设的时间内没有获取到所述目标主体对应的文本数据时,采用衰减函数计算所述文本数据的热度指数。
可选的,采用如下衰减函数公式计算所述热度指数:Ht=f(Ht-1);其中,H为所述热度指数,t为时间。
可选的,所述分别计算所述文本数据的热度指数以及情绪指数,包括:采用预设的情感分析机器学习模型对所述文本数据进行情感分析,得到正面文本、负面文本以及中性文本;根据预设的文本类型权重、正面文本、负面文本以及中性文本,计算所述文本数据的正面指数、负面指数以及中性指数;根据预设的正面文本权重、预设的负面文本权重、预设的中性文本权重、正面指数、负面指数以及中性指数,计算所述文本数据的情绪指数。
可选的,采用如下公式计算所述文本数据的情绪指数:其中,E为所述情绪指数,t为时间,P为所述正面指数,N为所述负面指数,NE为所述中性指数, i为所述文本数据的类型,wi为所述预设的类型权重,PT为所述正面文本,NT为所述负面文本,NET为所述中性文本,j、k、l为文本编号,J为所述正面文本的数量,K为所述负面文本的数量,L为所述中性文本的数量,wP为所述预设的正面文本权重,wN为所述预设的负面文本权重,wNE为所述预设的中性文本权重。
可选的,采用如下公式计算所述目标主体的情绪市值:Ot=Ht*Et;其中,O为所述情绪市值,H为所述热度指数,E为所述情绪指数,t为时间。
可选的,采用如下公式计算所述舆情风向标指数:其中,O'为所述舆情风向标指数,Ot为所述当期新增的情绪市值,t、d为时间,D为所述预设的滑动时间窗口大小,为所述预设的滑动时间窗口内加权的历史情绪市值,wd为所述历史情绪市值对应的权重。
可选的,所述根据所述热度指数和所述情绪指数,得到所述目标主体的情绪市值,包括:根据至少一个数据源中目标主体对应的文本数据所对应的热度指数和情绪指数,得到每个数据源中所述目标主体的情绪市值;根据预设的数据源权重和所述每个数据源中所述目标主体的情绪市值,得到所述目标主体的整体情绪市值。
可选的,采用如下公式计算所述目标主体的整体情绪市值:其中,PO为所述整体情绪市值,O为所述每个数据源中所述目标主体的情绪市值Om,t=Hm,t*Em,t,t为时间,H为所述热度指数,E为所述情绪指数,m为数据源编号,M为数据源数量,wm为所述预设的数据源权重。
可选的,所述预设的数据源权重由每个数据源的PageRank值构成。
可选的,在得到所述目标主体的整体情绪市值之后,还包括:根据所述预设的滑动时间窗口内加权的历史整体情绪市值和当期新增的整体情绪市值,计算所述当期新增的整体情绪市值对舆情风向的影响,得到整体舆情风向标指数。
可选的,采用如下公式计算所述整体舆情风向标指数:其中,PO'为所述整体舆情风向标指数,POt为所述当期新增的整体情绪市值,t、d为时间,D为所述预设的滑动时间窗口大小,为所述预设的滑动时间窗口内加权的历史整体情绪市值,wd为所述历史整体情绪市值对应的权重。
可选的,所述计算所述当期新增的整体情绪市值对舆情风向的影响,包括:判断中途加入的数据源加入的时间是否超过所述预设的滑动时间窗口大小;当所述数据源加入的时间超过所述预设的滑动时间窗口大小时,根据预设的滑动时间窗口和加入所述数据源后的整体情绪市值,再对整体舆情风向标指数进行修正,得到修正后的整体舆情风向标指数。
为解决上述技术问题,本发明实施例还公开了一种舆情风向标指数计算装置,包括:获取单元,用于获取目标主体对应的文本数据;第一计算单元,用于分别计算所述文本数据的热度指数以及情绪指数;第二计算单元,用于根据所述热度指数和所述情绪指数,得到所述目标主体的情绪市值;第三计算单元,用于根据预设的滑动时间窗口内加权的历史情绪市值和当期新增的情绪市值,计算所述当期新增的情绪市值对舆情风向的影响,得到舆情风向标指数。
可选的,所述第一计算单元,用于:获取所述文本数据的数量和类型;根据所述文本数据的数量、所述文本数据的类型以及预设的类型权重,计算所述热度指数。
可选的,所述第一计算单元,用于根据所述文本数据的数量、所述文本数据的类型以及预设的类型权重,计算所述热度指数,采用如下公式计算所述热度指数:其中,H为所述热度指数,N为所述文本数据的数量,t为时间,i为所述文本数据的类型,I为所述文本数据的类型数量,wi为所述预设的类型权重。
可选的,所述第一计算单元,用于:当在预设的时间内没有获取到所述目标主体对应的文本数据时,采用衰减函数计算所述文本数据的热度指数。
可选的,所述第一计算单元,用于当在预设的时间内没有获取到所述目标主体对应的文本数据时,采用衰减函数计算所述文本数据的热度指数,采用如下衰减函数公式计算所述热度指数:Ht=f(Ht-1);其中,H为所述热度指数,t为时间。
可选的,所述第一计算单元,用于:采用预设的情感分析机器学习模型对所述文本数据进行情感分析,得到正面文本、负面文本以及中性文本;根据预设的文本类型权重、正面文本、负面文本以及中性文本,计算所述文本数据的正面指数、负面指数以及中性指数;根据预设的正面文本权重、预设的负面文本权重、预设的中性文本权重、正面指数、负面指数以及中性指数,计算所述文本数据的情绪指数。
可选的,所述第一计算单元,用于根据预设的正面文本权重、预设的负面文本权重、预设的中性文本权重、正面指数、负面指数以及中性指数,计算所述文本数据的情绪指数,采用如下公式计算所述文本数据的情绪指数:其中,E为所述情绪指数,t为时间,P为所述正面指数,N为所述负面指数,NE为所述中性指数, i为所述文本数据的类型,wi为所述预设的类型权重,PT为所述正面文本,NT为所述负面文本,NET为所述中性文本,j、k、l为文本编号,J为所述正面文本的数量,K为所述负面文本的数量,L为所述中性文本的数量,wP为所述预设的正面文本权重,wN为所述预设的负面文本权重,wNE为所述预设的中性文本权重。
可选的,所述第二计算单元,用于根据所述热度指数和所述情绪指数,得到所述目标主体的情绪市值,采用如下公式计算所述目标主体的情绪市值:Ot=Ht*Et;其中,O为所述情绪市值,H为所述热度指数,E为所述情绪指数,t为时间。
可选的,所述第三计算单元,用于根据预设的滑动时间窗口内加权的历史情绪市值和当期新增的情绪市值,计算所述当期新增的情绪市值对舆情风向的影响,得到舆情风向标指数,采用如下公式计算所述舆情风向标指数:其中,O'为所述舆情风向标指数,Ot为所述当期新增的情绪市值,t、d为时间,D为所述预设的滑动时间窗口大小,为所述预设的滑动时间窗口内加权的历史情绪市值,wd为所述历史情绪市值对应的权重。
可选的,所述第二计算单元,用于:根据至少一个数据源中目标主体对应的文本数据所对应的热度指数和情绪指数,得到每个数据源中所述目标主体的情绪市值;根据预设的数据源权重和所述每个数据源中所述目标主体的情绪市值,得到所述目标主体的整体情绪市值。
可选的,所述第二计算单元,用于根据预设的数据源权重和所述每个数据源中所述目标主体的情绪市值,得到所述目标主体的整体情绪市值,采用如下公式计算所述目标主体的整体情绪市值:其中,PO为所述整体情绪市值,O为所述每个数据源中所述目标主体的情绪市值,Om,t=Hm,t*Em,t,t为时间,H为所述热度指数,E为所述情绪指数,m为数据源编号,M为数据源数量,wm为所述预设的数据源权重。
可选的,所述预设的数据源权重由每个数据源的PageRank值构成。
可选的,所述第三计算单元,还用于:根据所述预设的滑动时间窗口内加权的历史整体情绪市值和当期新增的整体情绪市值,计算所述当期新增的整体情绪市值对舆情风向的影响,得到整体舆情风向标指数。
可选的,所述第三计算单元,还用于根据所述预设的滑动时间窗口内加权的历史整体情绪市值和当期新增的整体情绪市值,计算所述当期新增的整体情绪市值对舆情风向的影响,得到整体舆情风向标指数,采用如下公式计算所述整体舆情风向标指数:其中,PO'为整体舆情风向标指数,POt为所述当期新增的整体情绪市值,t、d为时间,D为所述预设的滑动时间窗口大小,为所述预设的滑动时间窗口内加权的历史整体情绪市值,wd为所述历史整体情绪市值对应的权重。
可选的,所述第三计算单元,用于:判断中途加入的数据源加入的时间是否超过所述预设的滑动时间窗口大小;当所述数据源加入的时间超过所述预设的滑动时间窗口大小时,根据预设的滑动时间窗口和加入所述数据源后的整体情绪市值,再对整体舆情风向标指数进行修正,得到修正后的整体舆情风向标指数。
本发明实施例还公开了一种计算机可读存储介质,其上存储有计算机指令,所述计算机指令运行时执行上述任一种所述的舆情风向标指数计算方法的步骤。
本发明实施例还提供了一种舆情风向标指数计算装置,包括存储器和处理器,所述存储器上存储有可在所述处理器上运行的计算机指令,所述处理器运行所述计算机指令时执行上述任一种所述的舆情风向标指数计算方法的步骤。
与现有技术相比,本发明实施例的技术方案具有以下有益效果:
根据目标主体对应的文本数据的热度指数和情绪指数,得到目标主体的情绪市值;根据预设的滑动时间窗口内加权的历史情绪市值和当期新增的情绪市值,计算所述当期新增的情绪市值对舆情风向的影响,得到舆情风向标指数。构建了综合性的舆情风向标指数,可以全面、精确地反映舆论情况,并动态地描述舆情的变化情况。
进一步,根据预设的数据源权重和所述每个数据源中所述目标主体的情绪市值,得到所述目标主体的整体情绪市值,可以对多数据源的文本数据进行整体舆情风向标指数计算,更加全面、精确地反映舆论情况。
进一步,当所述数据源加入的时间超过所述预设的滑动时间窗口大小时,根据预设的滑动时间窗口和加入所述数据源后的整体情绪市值,再对整体舆情风向标指数进行修正,得到修正后的整体舆情风向标指数。可以应对多数据源情况下数据源增加、减少之后的整体舆情风向标指数变化,以动态地描述整体舆论情况的变化情况。
附图说明
图1是本发明实施例中的一种舆情风向标指数计算方法的流程图;
图2是本发明实施例中的一种舆情风向标指数计算装置的结构示意图。
具体实施方式
现有技术中,由于舆情分析的复杂性,现有的舆情指数计算方法大多不能全面、精确地反映舆论情况。
本发明实施例中,根据目标主体对应的文本数据的热度指数和情绪指数,得到目标主体的情绪市值;根据预设的滑动时间窗口内加权的历史情绪市值和当期新增的情绪市值,计算所述当期新增的情绪市值对舆情风向的影响,得到舆情风向标指数。构建了综合性的舆情风向标指数,可以全面、精确地反映舆论情况,并动态地描述舆情的变化情况。
为使本发明的上述目的、特征和有益效果能够更为明显易懂,下面结合附图对本发明的具体实施例做详细的说明。
本发明实施例提供了一种舆情风向标指数计算方法,参照图1,以下通过具体步骤进行详细说明。
步骤S101,获取目标主体对应的文本数据。
在实际应用中,可以在一个或多个数据源中,根据目标主体的关键词检索目标主体对应的文本数据;用户也可以根据自身的不同需求,设置不同范围、不同类型的目标主体的关键词,来检索目标主体对应的文本数据,以在不同的程度上分析目标主体的舆论情况。
在获取到目标主体对应的文本数据之后,还可以对文本数据进行整理和清洗,以提高文本数据与目标主体的相关性。
步骤S102,分别计算所述文本数据的热度指数以及情绪指数。
在具体实施中,可以获取文本数据的数量和类型,再根据文本数据的数量、文本数据的类型以及预设的类型权重,计算文本数据的热度指数。
在实际应用中,文本数据可以包含多种类型,因此可以针对文本数据的类型分别赋予不同的权重。例如,目标主体的文本数据是在数据源的文章标题中获得的,则对该文本数据类型赋予较大的权重;又如,目标主体的文本数据是在数据源的文章评论中获得的,则对该文本数据类型赋予与文章标题类型的文本数据不同的权重。可以理解的是,根据用户的不同需求,可以对标题型文本数据、正文型文本数据、引用型文本数据等不同类型的数据类型分别赋予不同的权重,本发明在此不作赘述。
在实际应用中,包含目标主体的文本数据可以对应多个数据源,因此可以分别计算不同数据源中目标主体的文本数据对应的热度指数以及情绪指数。可以理解的是,用户根据自身的需求,也可以统一计算所有数据源中的文本数据的热度指数以及情绪指数,本发明在此不作限定。
在具体实施中,可以采用如下公式(1)计算某数据源某时间的热度指数:
其中,H为热度指数,N为文本数据的数量,t为时间,i为文本数据的类型,I为文本数据的类型数量,wi为预设的类型权重。
在具体实施中,当在预设的时间内没有获取到所述目标主体对应的文本数据时,可以采用衰减函数计算所述文本数据的热度指数。
在实际应用中,用户可以设置在单位时间内没有新增目标主体的文本数据时(即预设的时间为单位时间),定义热度衰减函数进行缺失值填补。用户也可以设置在预设的时间内没有获取到所述目标主体对应的文本数据时(即预设的时间为不包括单位时间的其他时间),采用衰减函数计算所述文本数据的热度指数。另外,用户还可以动态调整预设的时间以及定义不同衰减程度的衰减函数,本发明在此不作赘述。
在具体实施中,可以采用如下衰减函数公式(2)计算热度指数:
Ht=f(Ht-1); (2)
其中,H为热度指数,t为时间。
在具体实施中,可以采用预设的情感分析机器学习模型对所述文本数据进行情感分析,得到正面文本、负面文本以及中性文本;再根据预设的文本类型权重、正面文本、负面文本以及中性文本,计算所述文本数据的正面指数、负面指数以及中性指数;最后根据预设的正面文本权重、预设的负面文本权重、预设的中性文本权重、正面指数、负面指数以及中性指数,计算所述文本数据的情绪指数。由于采用了情感分析机器学习模型来对每条文本进行情感评分,进而构建文本数据的情绪指数,可以反映舆情中情绪表达的部分,以全面、精确地反映舆论情况。
本发明一实施例中,首先人工对训练数据中的文本数据进行标注,将文本数据标注为正面、负面和中性文本。接着将文本数据进行向量化处理,通过词典的形式将文本数据转化为由0和1组成的向量。然后将向量化后的文本数据输入预设的情感分析机器学习模型,模型会自动学习向量各个维度与文本标注的关系,不断调整后得到最优的情感分类模型。最后,在进行模型测试时,输入用同一方法向量化的测试文本数据,模型则会输出对于该文本数据的正面、负面或中性结果的判断。
在具体实施中,可以采用如下公式(3)计算所述文本数据的情绪指数:
其中,E为情绪指数,t为时间,P为正面指数,N为负面指数,NE为中性指数,i为文本数据的类型,wi为预设的类型权重,PT为正面文本,NT为负面文本,NET为中性文本,j、k、l为文本编号,J为正面文本的数量,K为负面文本的数量,L为中性文本的数量,wP为预设的正面文本权重,wN为预设的负面文本权重,wNE为预设的中性文本权重。
步骤S103,根据所述热度指数和所述情绪指数,得到所述目标主体的情绪市值。
在实际应用中,通过构建热度指数和情绪指数,并将两者交互性地结合,合理量化了目标主体的情绪市值。
在具体实施中,可以采用如下公式(4)计算所述目标主体的情绪市值:
Ot=Ht*Et; (4)
其中,O为情绪市值,H为热度指数,E为情绪指数,t为时间。
在实际应用中,可以以天为单位时间,某天的情绪市值可以以当天的日期为时间t,用户也可以根据自身的不同需求,设置不同的单位时间来计算相应的情绪市值,也可以动态调整单位时间,因此时间t可以反映用户所设置的单位时间内的目标主体的情绪市值。上述单位时间的设置方法和定义,可以应用于步骤S101至步骤S103所述的舆情风向标指数计算方法的步骤,本发明在后续步骤中不再赘述。
在实际应用中,一般会存在多个数据源包含目标主体的文本数据。步骤S102中可以得到多个数据源中的目标主体的文本数据所对应的热度指数和情绪指数,进而进行多数据源情况下的舆情风向标指数计算。当目标主体的文本数据只存在于一个数据源中,或者用户因自身需求不需要分别计算多个数据源中的目标主体的文本数据所对应的热度指数和情绪指数时,也可以直接采用单个热度指数和单个情绪指数进行舆情风向标指数计算,本发明在此不作限定。
在具体实施中,可以根据至少一个数据源中目标主体对应的文本数据所对应的热度指数和情绪指数,得到每个数据源中所述目标主体的情绪市值;再根据预设的数据源权重和所述每个数据源中所述目标主体的情绪市值,得到所述目标主体的整体情绪市值。因此,可以对多数据源的文本数据进行整体情绪市值计算,更加全面、精确地反映舆论情况。
在具体实施中,可以采用如下公式(5)计算所述目标主体的整体情绪市值:
其中,PO为整体情绪市值,O为所述每个数据源中所述目标主体的情绪市值,Om,t=Hm,t*Em,t,t为时间,H为热度指数,E为情绪指数,m为数据源编号,M为数据源数量,wm为预设的数据源权重。
在具体实施中,预设的数据源权重可以由每个数据源的网页排名,又称网页级别(PageRank值)构成。可以理解的是,根据用户的不同需求,也可以设置贴合用户需求的其他数据源权重,本发明在此不作赘述。
步骤S104,根据预设的滑动时间窗口内加权的历史情绪市值和当期新增的情绪市值,计算所述当期新增的情绪市值对舆情风向的影响,得到舆情风向标指数。
在具体实施中,根据预设的滑动时间窗口内加权的历史情绪市值和当期新增的情绪市值,计算所述当期新增的情绪市值对舆情风向的影响,以充分反映舆情的实效性,进而动态地描述舆情的变化情况。
在实际应用中,情绪市值或整体情绪市值反映了目标主体随时间变化的舆论情况。滑动时间窗口内的情绪市值或整体情绪市值是已知的历史情绪市值或已知的历史整体情绪市值,当期新增的情绪市值是滑动时间窗口以外的新得到的情绪市值或整体情绪市值。可以理解的是,用户可以根据自身的不同需求,设置不同长度的滑动时间窗口,也可以动态调整滑动时间窗口的大小,本发明在此不作赘述。
在具体实施中,可以采用如下公式(6)计算舆情风向标指数:
其中,O'为舆情风向标指数,Ot为所述当期新增的情绪市值,t、d为时间,D为所述预设的滑动时间窗口大小,为所述预设的滑动时间窗口内加权的历史情绪市值,wd为所述历史情绪市值对应的权重。
在具体实施中,存在多个数据源包含目标主体的文本数据时,在得到所述目标主体的整体情绪市值之后,还可以根据所述预设的滑动时间窗口内加权的历史整体情绪市值和当期新增的整体情绪市值,计算所述当期新增的整体情绪市值对舆情风向的影响,得到整体舆情风向标指数,精确地评估整体舆情风向标指数在多个数据源情况下的变化情况。
在具体实施中,可以先判断中途加入的数据源加入的时间是否超过所述预设的滑动时间窗口大小;当所述数据源加入的时间超过所述预设的滑动时间窗口大小时,根据预设的滑动时间窗口和加入所述数据源后的整体情绪市值,再对整体舆情风向标指数进行修正,得到修正后的整体舆情风向标指数。可以应对多数据源情况下数据源增加、减少之后的整体舆情风向标指数变化,对整体舆情风向标指数进行修正,提高整体舆情风向标指数的精确度和稳定性,以动态地描述整体舆论情况的变化情况。
在具体实施中,可以采用如下公式(7)计算整体舆情风向标指数:
其中,PO'为整体舆情风向标指数,POt为所述当期新增的整体情绪市值,t、d为时间,D为所述预设的滑动时间窗口大小,为所述预设的滑动时间窗口内加权的历史整体情绪市值,wd为所述历史整体情绪市值对应的权重。
综上所述,根据目标主体对应的文本数据的热度指数和情绪指数,得到目标主体的情绪市值;根据预设的滑动时间窗口内加权的历史情绪市值和当期新增的情绪市值,计算所述当期新增的情绪市值对舆情风向的影响,得到舆情风向标指数。构建了综合性的舆情风向标指数,可以全面、精确地反映舆论情况,并动态地描述舆情的变化情况。
参照图2,本发明实施例还提供了一种舆情风向标指数计算装置20,包括:获取单元201、第一计算单元202、第二计算单元203以及第三计算单元204;
其中,所述获取单元201,用于获取目标主体对应的文本数据;
所述第一计算单元202,用于分别计算所述文本数据的热度指数以及情绪指数;
所述第二计算单元203,用于根据所述热度指数和所述情绪指数,得到所述目标主体的情绪市值;
所述第三计算单元204,用于根据预设的滑动时间窗口内加权的历史情绪市值和当期新增的情绪市值,计算所述当期新增的情绪市值对舆情风向的影响,得到舆情风向标指数。
在具体实施中,第一计算单元202,可以用于:获取所述文本数据的数量和类型;根据所述文本数据的数量、所述文本数据的类型以及预设的类型权重,计算所述热度指数。
在具体实施中,第一计算单元202,可以用于根据所述文本数据的数量、所述文本数据的类型以及预设的类型权重,计算所述热度指数,采用如下公式计算所述热度指数:其中,H为热度指数,N为文本数据的数量,t为时间,i为文本数据的类型,I为文本数据的类型数量,wi为预设的类型权重。
在具体实施中,第一计算单元202,可以用于:当在预设的时间内没有获取到所述目标主体对应的文本数据时,采用衰减函数计算所述文本数据的热度指数。
在具体实施中,第一计算单元202,可以用于当在预设的时间内没有获取到所述目标主体对应的文本数据时,采用衰减函数计算所述文本数据的热度指数,采用如下衰减函数公式计算所述热度指数:Ht=f(Ht-1);其中,H为热度指数,t为时间。
在具体实施中,第一计算单元202,可以用于:采用预设的情感分析机器学习模型对所述文本数据进行情感分析,得到正面文本、负面文本以及中性文本;根据预设的文本类型权重、正面文本、负面文本以及中性文本,计算所述文本数据的正面指数、负面指数以及中性指数;根据预设的正面文本权重、预设的负面文本权重、预设的中性文本权重、正面指数、负面指数以及中性指数,计算所述文本数据的情绪指数。
在具体实施中,第一计算单元202,可以用于根据预设的正面文本权重、预设的负面文本权重、预设的中性文本权重、正面指数、负面指数以及中性指数,计算所述文本数据的情绪指数,采用如下公式计算所述文本数据的情绪指数:其中,E为情绪指数,t为时间,P为正面指数,N为负面指数,NE为中性指数, i为文本数据的类型,wi为预设的类型权重,PT为正面文本,NT为负面文本,NET为中性文本,j、k、l为文本编号,J为正面文本的数量,K为负面文本的数量,L为中性文本的数量,wP为预设的正面文本权重,wN为预设的负面文本权重,wNE为预设的中性文本权重。
在具体实施中,第二计算单元203,可以用于根据所述热度指数和所述情绪指数,得到所述目标主体的情绪市值,采用如下公式计算所述目标主体的情绪市值:Ot=Ht*Et;其中,O为所述情绪市值,H为所述热度指数,E为所述情绪指数,t为时间。
在具体实施中,第三计算单元204,可以用于根据预设的滑动时间窗口内加权的历史情绪市值和当期新增的情绪市值,计算所述当期新增的情绪市值对舆情风向的影响,得到舆情风向标指数,采用如下公式计算所述舆情风向标指数:其中,O'为所述舆情风向标指数,Ot为所述当期新增的情绪市值,t、d为时间,D为所述预设的滑动时间窗口大小,为所述预设的滑动时间窗口内加权的历史情绪市值,wd为所述历史情绪市值对应的权重。
在具体实施中,第二计算单元203,可以用于:根据至少一个数据源中目标主体对应的文本数据所对应的热度指数和情绪指数,得到每个数据源中所述目标主体的情绪市值;根据预设的数据源权重和所述每个数据源中所述目标主体的情绪市值,得到所述目标主体的整体情绪市值。
在具体实施中,第二计算单元203,可以用于根据预设的数据源权重和所述每个数据源中所述目标主体的情绪市值,得到所述目标主体的整体情绪市值,采用如下公式计算所述目标主体的整体情绪市值:其中,PO为所述整体情绪市值,O为所述每个数据源中所述目标主体的情绪市值,Om,t=Hm,t*Em,t,t为时间,H为所述热度指数,E为所述情绪指数,m为数据源编号,M为数据源数量,wm为所述预设的数据源权重。
在具体实施中,预设的数据源权重可以由每个数据源的PageRank值构成。
在具体实施中,第三计算单元204还可以用于:根据所述预设的滑动时间窗口内加权的历史整体情绪市值和当期新增的整体情绪市值,计算所述当期新增的整体情绪市值对舆情风向的影响,得到整体舆情风向标指数。
在具体实施中,第三计算单元204,还可以用于根据所述预设的滑动时间窗口内加权的历史整体情绪市值和当期新增的整体情绪市值,计算所述当期新增的整体情绪市值对舆情风向的影响,得到整体舆情风向标指数,采用如下公式计算所述整体舆情风向标指数:其中,PO'为整体舆情风向标指数,POt为所述当期新增的整体情绪市值,t、d为时间,D为所述预设的滑动时间窗口大小,为所述预设的滑动时间窗口内加权的历史整体情绪市值,wd为所述历史整体情绪市值对应的权重。
在具体实施中,第三计算单元204可以用于:判断中途加入的数据源加入的时间是否超过所述预设的滑动时间窗口大小;当所述数据源加入的时间超过所述预设的滑动时间窗口大小时,根据预设的滑动时间窗口和加入所述数据源后的整体情绪市值,再对整体舆情风向标指数进行修正,得到修正后的整体舆情风向标指数。
本发明实施例还提供了一种计算机可读存储介质,计算机可读存储介质为非易失性存储介质或非瞬态存储介质,其上存储有计算机指令,所述计算机指令运行时执行本发明上述实施例中提供的任一种所述的舆情风向标指数计算方法的步骤。
本发明实施例还提供了一种舆情风向标指数计算装置,包括存储器和处理器,所述存储器上存储有可在所述处理器上运行的计算机指令,所述处理器运行所示计算机指令时,执行本发明上述实施例中提供的任一种所述的舆情风向标指数计算方法的步骤。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于任一计算机可读存储介质中,存储介质可以包括:ROM、RAM、磁盘或光盘等。
虽然本发明披露如上,但本发明并非限定于此。任何本领域技术人员,在不脱离本发明的精神和范围内,均可作各种更动与修改,因此本发明的保护范围应当以权利要求所限定的范围为准。

Claims (32)

1.一种舆情风向标指数计算方法,其特征在于,包括:
获取目标主体对应的文本数据;
分别计算所述文本数据的热度指数以及情绪指数;
根据所述热度指数和所述情绪指数,得到所述目标主体的情绪市值;
根据预设的滑动时间窗口内加权的历史情绪市值和当期新增的情绪市值,计算所述当期新增的情绪市值对舆情风向的影响,得到舆情风向标指数。
2.如权利要求1所述的舆情风向标指数计算方法,其特征在于,所述分别计算所述文本数据的热度指数以及情绪指数,包括:
获取所述文本数据的数量和类型;
根据所述文本数据的数量、所述文本数据的类型以及预设的类型权重,计算所述热度指数。
3.如权利要求2所述的舆情风向标指数计算方法,其特征在于,采用如下公式计算所述热度指数:
其中,H为所述热度指数,N为所述文本数据的数量,t为时间,i为所述文本数据的类型,I为所述文本数据的类型数量,wi为所述预设的类型权重。
4.如权利要求1所述的舆情风向标指数计算方法,其特征在于,所述分别计算所述文本数据的热度指数以及情绪指数,包括:当在预设的时间内没有获取到所述目标主体对应的文本数据时,采用衰减函数计算所述文本数据的热度指数。
5.如权利要求4所述的舆情风向标指数计算方法,其特征在于,采用如下衰减函数公式计算所述热度指数:
Ht=f(Ht-1);
其中,H为所述热度指数,t为时间。
6.如权利要求1所述的舆情风向标指数计算方法,其特征在于,所述分别计算所述文本数据的热度指数以及情绪指数,包括:
采用预设的情感分析机器学习模型对所述文本数据进行情感分析,得到正面文本、负面文本以及中性文本;
根据预设的文本类型权重、正面文本、负面文本以及中性文本,计算所述文本数据的正面指数、负面指数以及中性指数;
根据预设的正面文本权重、预设的负面文本权重、预设的中性文本权重、正面指数、负面指数以及中性指数,计算所述文本数据的情绪指数。
7.如权利要求6所述的舆情风向标指数计算方法,其特征在于,采用如下公式计算所述文本数据的情绪指数:
其中,E为所述情绪指数,t为时间,P为所述正面指数,N为所述负面指数,NE为所述中性指数,i为所述文本数据的类型,wi为所述预设的类型权重,PT为所述正面文本,NT为所述负面文本,NET为所述中性文本,j、k、l为文本编号,J为所述正面文本的数量,K为所述负面文本的数量,L为所述中性文本的数量,wP为所述预设的正面文本权重,wN为所述预设的负面文本权重,wNE为所述预设的中性文本权重。
8.如权利要求1所述的舆情风向标指数计算方法,其特征在于,采用如下公式计算所述目标主体的情绪市值:
Ot=Ht*Et
其中,O为所述情绪市值,H为所述热度指数,E为所述情绪指数,t为时间。
9.如权利要求1所述的舆情风向标指数计算方法,其特征在于,采用如下公式计算所述舆情风向标指数:
其中,O'为所述舆情风向标指数,Ot为所述当期新增的情绪市值,t、d为时间,D为所述预设的滑动时间窗口大小,为所述预设的滑动时间窗口内加权的历史情绪市值,wd为所述历史情绪市值对应的权重。
10.如权利要求1所述的舆情风向标指数计算方法,其特征在于,所述根据所述热度指数和所述情绪指数,得到所述目标主体的情绪市值,包括:
根据至少一个数据源中目标主体对应的文本数据所对应的热度指数和情绪指数,得到每个数据源中所述目标主体的情绪市值;
根据预设的数据源权重和所述每个数据源中所述目标主体的情绪市值,得到所述目标主体的整体情绪市值。
11.如权利要求10所述的舆情风向标指数计算方法,其特征在于,采用如下公式计算所述目标主体的整体情绪市值:
其中,PO为所述整体情绪市值,O为所述每个数据源中所述目标主体的情绪市值,Om,t=Hm,t*Em,t,t为时间,H为所述热度指数,E为所述情绪指数,m为数据源编号,M为数据源数量,wm为所述预设的数据源权重。
12.如权利要求10所述的舆情风向标指数计算方法,其特征在于,所述预设的数据源权重由每个数据源的PageRank值构成。
13.如权利要求10所述的舆情风向标指数计算方法,其特征在于,在得到所述目标主体的整体情绪市值之后,还包括:根据所述预设的滑动时间窗口内加权的历史整体情绪市值和当期新增的整体情绪市值,计算所述当期新增的整体情绪市值对舆情风向的影响,得到整体舆情风向标指数。
14.如权利要求13所述的舆情风向标指数计算方法,其特征在于,采用如下公式计算所述整体舆情风向标指数:
其中,PO'为所述整体舆情风向标指数,POt为所述当期新增的整体情绪市值,t、d为时间,D为所述预设的滑动时间窗口大小,为所述预设的滑动时间窗口内加权的历史整体情绪市值,wd为所述历史整体情绪市值对应的权重。
15.如权利要求13所述的舆情风向标指数计算方法,其特征在于,所述计算所述当期新增的整体情绪市值对舆情风向的影响,包括:
判断中途加入的数据源加入的时间是否超过所述预设的滑动时间窗口大小;当所述数据源加入的时间超过所述预设的滑动时间窗口大小时,根据预设的滑动时间窗口和加入所述数据源后的整体情绪市值,再对整体舆情风向标指数进行修正,得到修正后的整体舆情风向标指数。
16.一种舆情风向标指数计算装置,其特征在于,包括:
获取单元,用于获取目标主体对应的文本数据;
第一计算单元,用于分别计算所述文本数据的热度指数以及情绪指数;
第二计算单元,用于根据所述热度指数和所述情绪指数,得到所述目标主体的情绪市值;
第三计算单元,用于根据预设的滑动时间窗口内加权的历史情绪市值和当期新增的情绪市值,计算所述当期新增的情绪市值对舆情风向的影响,得到舆情风向标指数。
17.如权利要求16所述的舆情风向标指数计算装置,其特征在于,所述第一计算单元,用于:获取所述文本数据的数量和类型;根据所述文本数据的数量、所述文本数据的类型以及预设的类型权重,计算所述热度指数。
18.如权利要求17所述的舆情风向标指数计算装置,其特征在于,所述第一计算单元,用于根据所述文本数据的数量、所述文本数据的类型以及预设的类型权重,计算所述热度指数,采用如下公式计算所述热度指数:
其中,H为所述热度指数,N为所述文本数据的数量,t为时间,i为所述文本数据的类型,I为所述文本数据的类型数量,wi为所述预设的类型权重。
19.如权利要求16所述的舆情风向标指数计算装置,其特征在于,所述第一计算单元,用于:当在预设的时间内没有获取到所述目标主体对应的文本数据时,采用衰减函数计算所述文本数据的热度指数。
20.如权利要求19所述的舆情风向标指数计算装置,其特征在于,所述第一计算单元,用于当在预设的时间内没有获取到所述目标主体对应的文本数据时,采用衰减函数计算所述文本数据的热度指数,采用如下衰减函数公式计算所述热度指数:
Ht=f(Ht-1);
其中,H为所述热度指数,t为时间。
21.如权利要求16所述的舆情风向标指数计算装置,其特征在于,所述第一计算单元,用于:采用预设的情感分析机器学习模型对所述文本数据进行情感分析,得到正面文本、负面文本以及中性文本;根据预设的文本类型权重、正面文本、负面文本以及中性文本,计算所述文本数据的正面指数、负面指数以及中性指数;根据预设的正面文本权重、预设的负面文本权重、预设的中性文本权重、正面指数、负面指数以及中性指数,计算所述文本数据的情绪指数。
22.权利要求21所述的舆情风向标指数计算装置,其特征在于,所述第一计算单元,用于根据预设的正面文本权重、预设的负面文本权重、预设的中性文本权重、正面指数、负面指数以及中性指数,计算所述文本数据的情绪指数,采用如下公式计算所述文本数据的情绪指数:
其中,E为所述情绪指数,t为时间,P为所述正面指数,N为所述负面指数,NE为所述中性指数,i为所述文本数据的类型,wi为所述预设的类型权重,PT为所述正面文本,NT为所述负面文本,NET为所述中性文本,j、k、l为文本编号,J为所述正面文本的数量,K为所述负面文本的数量,L为所述中性文本的数量,wP为所述预设的正面文本权重,wN为所述预设的负面文本权重,wNE为所述预设的中性文本权重。
23.如权利要求16所述的舆情风向标指数计算装置,其特征在于,所述第二计算单元,用于根据所述热度指数和所述情绪指数,得到所述目标主体的情绪市值,采用如下公式计算所述目标主体的情绪市值:
Ot=Ht*Et
其中,O为所述情绪市值,H为所述热度指数,E为所述情绪指数,t为时间。
24.如权利要求16所述的舆情风向标指数计算装置,其特征在于,所述第三计算单元,用于根据预设的滑动时间窗口内加权的历史情绪市值和当期新增的情绪市值,计算所述当期新增的情绪市值对舆情风向的影响,得到舆情风向标指数,采用如下公式计算所述舆情风向标指数:
其中,O'为所述舆情风向标指数,Ot为所述当期新增的情绪市值,t、d为时间,D为所述预设的滑动时间窗口大小,为所述预设的滑动时间窗口内加权的历史情绪市值,wd为所述历史情绪市值对应的权重。
25.如权利要求16所述的舆情风向标指数计算装置,其特征在于,所述第二计算单元,用于:根据至少一个数据源中目标主体对应的文本数据所对应的热度指数和情绪指数,得到每个数据源中所述目标主体的情绪市值;根据预设的数据源权重和所述每个数据源中所述目标主体的情绪市值,得到所述目标主体的整体情绪市值。
26.如权利要求25所述的舆情风向标指数计算装置,其特征在于,所述第二计算单元,用于根据预设的数据源权重和所述每个数据源中所述目标主体的情绪市值,得到所述目标主体的整体情绪市值,采用如下公式计算所述目标主体的整体情绪市值:
其中,PO为所述整体情绪市值,O为所述每个数据源中所述目标主体的情绪市值,Om,t=Hm,t*Em,t,t为时间,H为所述热度指数,E为所述情绪指数,m为数据源编号,M为数据源数量,wm为所述预设的数据源权重。
27.如权利要求25所述的舆情风向标指数计算装置,其特征在于,所述预设的数据源权重由每个数据源的PageRank值构成。
28.如权利要求25所述的舆情风向标指数计算装置,其特征在于,所述第三计算单元,还用于:根据所述预设的滑动时间窗口内加权的历史整体情绪市值和当期新增的整体情绪市值,计算所述当期新增的整体情绪市值对舆情风向的影响,得到整体舆情风向标指数。
29.如权利要求28所述的舆情风向标指数计算装置,其特征在于,所述第三计算单元,还用于根据所述预设的滑动时间窗口内加权的历史整体情绪市值和当期新增的整体情绪市值,计算所述当期新增的整体情绪市值对舆情风向的影响,得到整体舆情风向标指数,采用如下公式计算所述整体舆情风向标指数:
其中,PO'为所述整体舆情风向标指数,POt为所述当期新增的整体情绪市值,t、d为时间,D为所述预设的滑动时间窗口大小,为所述预设的滑动时间窗口内加权的历史整体情绪市值,wd为所述历史整体情绪市值对应的权重。
30.如权利要求28所述的舆情风向标指数计算装置,其特征在于,所述第三计算单元,用于:判断中途加入的数据源加入的时间是否超过所述预设的滑动时间窗口大小;当所述数据源加入的时间超过所述预设的滑动时间窗口大小时,根据预设的滑动时间窗口和加入所述数据源后的整体情绪市值,再对整体舆情风向标指数进行修正,得到修正后的整体舆情风向标指数。
31.一种计算机可读存储介质,计算机可读存储介质为非易失性存储介质或非瞬态存储介质,其上存储有计算机指令,其特征在于,所述计算机指令运行时执行权利要求1至15中任一项所述的舆情风向标指数计算方法的步骤。
32.一种舆情风向标指数计算装置,包括存储器和处理器,所述存储器上存储有可在所述处理器上运行的计算机指令,其特征在于,所述处理器运行所述计算机指令时执行权利要求1至15任一项所述的舆情风向标指数计算方法的步骤。
CN201910371823.8A 2019-05-06 2019-05-06 舆情风向标指数计算方法及装置、可读存储介质 Pending CN110096652A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910371823.8A CN110096652A (zh) 2019-05-06 2019-05-06 舆情风向标指数计算方法及装置、可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910371823.8A CN110096652A (zh) 2019-05-06 2019-05-06 舆情风向标指数计算方法及装置、可读存储介质

Publications (1)

Publication Number Publication Date
CN110096652A true CN110096652A (zh) 2019-08-06

Family

ID=67447037

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910371823.8A Pending CN110096652A (zh) 2019-05-06 2019-05-06 舆情风向标指数计算方法及装置、可读存储介质

Country Status (1)

Country Link
CN (1) CN110096652A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111026868A (zh) * 2019-12-05 2020-04-17 厦门市美亚柏科信息股份有限公司 一种多维度舆情危机预测方法、终端设备及存储介质
CN111461542A (zh) * 2020-03-31 2020-07-28 支付宝(杭州)信息技术有限公司 一种事件统计方法及装置
CN112612895A (zh) * 2020-12-29 2021-04-06 中科院计算技术研究所大数据研究院 一种主体话题态度指数的计算方法
CN113128217A (zh) * 2021-03-26 2021-07-16 航天科工智能运筹与信息安全研究院(武汉)有限公司 一种基于网络孪生空间的舆情处置决策方法
CN113342972A (zh) * 2021-05-24 2021-09-03 支付宝(杭州)信息技术有限公司 舆情识别模型训练方法、系统以及舆情风险监测方法和系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102194001A (zh) * 2011-05-17 2011-09-21 杭州电子科技大学 网络舆情危机预警方法
CN108959383A (zh) * 2018-05-31 2018-12-07 平安科技(深圳)有限公司 网络舆情的分析方法、装置及计算机可读存储介质
CN109284432A (zh) * 2018-08-22 2019-01-29 华东计算技术研究所(中国电子科技集团公司第三十二研究所) 基于大数据平台的网络舆情分析系统
CN109472018A (zh) * 2018-09-26 2019-03-15 深圳壹账通智能科技有限公司 企业舆情监测方法、装置、计算机设备和存储介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102194001A (zh) * 2011-05-17 2011-09-21 杭州电子科技大学 网络舆情危机预警方法
CN108959383A (zh) * 2018-05-31 2018-12-07 平安科技(深圳)有限公司 网络舆情的分析方法、装置及计算机可读存储介质
CN109284432A (zh) * 2018-08-22 2019-01-29 华东计算技术研究所(中国电子科技集团公司第三十二研究所) 基于大数据平台的网络舆情分析系统
CN109472018A (zh) * 2018-09-26 2019-03-15 深圳壹账通智能科技有限公司 企业舆情监测方法、装置、计算机设备和存储介质

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111026868A (zh) * 2019-12-05 2020-04-17 厦门市美亚柏科信息股份有限公司 一种多维度舆情危机预测方法、终端设备及存储介质
CN111026868B (zh) * 2019-12-05 2022-07-15 厦门市美亚柏科信息股份有限公司 一种多维度舆情危机预测方法、终端设备及存储介质
CN111461542A (zh) * 2020-03-31 2020-07-28 支付宝(杭州)信息技术有限公司 一种事件统计方法及装置
CN112612895A (zh) * 2020-12-29 2021-04-06 中科院计算技术研究所大数据研究院 一种主体话题态度指数的计算方法
CN113128217A (zh) * 2021-03-26 2021-07-16 航天科工智能运筹与信息安全研究院(武汉)有限公司 一种基于网络孪生空间的舆情处置决策方法
CN113128217B (zh) * 2021-03-26 2024-04-02 航天科工智能运筹与信息安全研究院(武汉)有限公司 一种基于网络孪生空间的舆情处置决策方法
CN113342972A (zh) * 2021-05-24 2021-09-03 支付宝(杭州)信息技术有限公司 舆情识别模型训练方法、系统以及舆情风险监测方法和系统
CN113342972B (zh) * 2021-05-24 2023-02-28 支付宝(杭州)信息技术有限公司 舆情识别模型训练方法、系统以及舆情风险监测方法和系统

Similar Documents

Publication Publication Date Title
CN110096652A (zh) 舆情风向标指数计算方法及装置、可读存储介质
CN103164463B (zh) 推荐标签的方法和装置
JP6843882B2 (ja) 履歴ログからの学習と、etlツール内のデータアセットに関するデータベースオペレーションの推奨
CN103116582B (zh) 一种信息检索方法及相关系统和装置
US8798969B2 (en) Machine learning for a memory-based database
US20160306888A1 (en) Identifying influencers for topics in social media
CN105005589A (zh) 一种文本分类的方法和装置
US20180285969A1 (en) Predictive model training and selection for consumer evaluation
JP2021166109A (ja) 融合順序付けモデルの訓練方法と装置、検索の順序付け方法と装置、電子デバイス、記憶媒体、及びプログラム
CN113939829A (zh) 用于模型探索的数据采样
Westland et al. Partial least squares path analysis
US11210673B2 (en) Transaction feature generation
WO2017160872A1 (en) Machine learning applications for dynamic, quantitative assessment of human resources
US20150170304A1 (en) Methods and systems for projecting earnings and creating earnings tools within an online career network
CN107133836A (zh) 一种自适应权重组合推荐算法
CN103617146B (zh) 一种基于硬件资源消耗的机器学习方法及装置
Tang et al. Forecasting annual foreign tourist arrivals to China by incorporating firefly algorithm into fractional non-homogenous discrete Grey model
Wang et al. Marked temporal dynamics modeling based on recurrent neural network
CN110019563B (zh) 一种基于多维数据的肖像建模方法和装置
CN110009128A (zh) 行业舆情指数预测方法、装置、计算机设备及存储介质
CN110363283A (zh) 基于深度学习的用户属性预测方法及相关装置
CN113902260A (zh) 信息预测方法、装置、电子设备和介质
CN106997360A (zh) 用户行为数据的处理方法和装置
CN107766537A (zh) 一种职位搜索排序方法及计算设备
Fritsche et al. Deciphering professional forecasters' stories: Analyzing a corpus of textual predictions for the German economy

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination