CN116522917B - 舆情信息热度评分方法、装置、计算机设备和存储介质 - Google Patents
舆情信息热度评分方法、装置、计算机设备和存储介质 Download PDFInfo
- Publication number
- CN116522917B CN116522917B CN202310202520.XA CN202310202520A CN116522917B CN 116522917 B CN116522917 B CN 116522917B CN 202310202520 A CN202310202520 A CN 202310202520A CN 116522917 B CN116522917 B CN 116522917B
- Authority
- CN
- China
- Prior art keywords
- word segmentation
- public opinion
- opinion information
- popularity
- comprehensive score
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000013077 scoring method Methods 0.000 title claims abstract description 16
- 230000011218 segmentation Effects 0.000 claims abstract description 165
- 238000000034 method Methods 0.000 claims abstract description 12
- 238000004364 calculation method Methods 0.000 claims description 53
- 238000004590 computer program Methods 0.000 claims description 13
- 230000002776 aggregation Effects 0.000 claims description 8
- 238000004220 aggregation Methods 0.000 claims description 8
- 230000008451 emotion Effects 0.000 claims description 8
- 238000004422 calculation algorithm Methods 0.000 claims description 3
- 238000012163 sequencing technique Methods 0.000 abstract description 4
- 238000004891 communication Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 238000009825 accumulation Methods 0.000 description 2
- 230000006399 behavior Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000003754 machining Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/211—Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种舆情信息热度评分方法、装置、计算机设备和存储介质。其中方法包括:对舆情信息进行全量分词和去重,得到多个分词因子,每个分词因子包括多个系数;计算每个分词因子的综合评分,得到分词因子综合评分集合;选取综合评分排名在前的若干个分词因子;计算综合评分排名在前的若干个分词因子命中的每个舆情信息的热度评分,得到具有热度评分的命中舆情信息集合;对具有热度评分的命中舆情信息集合按照时间进行排序,通过预设评分公式,对每个命中舆情信息计算最终热度评分。能够得到用户精加工舆情信息中每个舆情的最终热度评分,为根据用户关注的指定背景、行业的舆情信息生成信息热榜提供排序依据,实现用户个性化热榜推荐的需求。
Description
技术领域
本申请涉及计算机技术领域,特别是涉及一种舆情信息热度评分方法、装置、计算机设备和存储介质。
背景技术
随着网络的普及,用户能够获取到更多的网络信息,不同的用户可能会根据自身习惯关注一些特定的网络信息,为了能够使得用户得知当前网络信息被关注的排行,则产生了信息热度的概念,信息热度主要是指该信息被用户关注的程度,一般来说,用户关注程度越高的信息,其热度越高。
以网络社区为例,在网络社区中,帖子作为网络信息的特例,某一用户发表了一个帖子之后,该帖子的浏览量与回复量是衡量该帖子热度的依据,浏览量和回复量越高的帖子,其热度越高。为了能够向社区会员展示目前最受关注的帖子,网络社区将选取热度排行靠前的帖子作为“热贴”,置于显眼处供会员浏览,所以必须对每个帖子的热度进行实时地更新。
当前面向互联网的信息热榜,基本都是根据搜索引擎指数、资讯指数、播放量及用户的阅读、评论、转发、点赞等行为的数量加权求和、指数化处理后得出的。但是,当前这种互联网上的热度计算方式,是基于各个行业、各种背景下的用户行为来进行计算的,对于指定背景、指定行业下的客户专注的热榜起不到计算热度的作用,也就是无法满足用户个性化热榜推荐需求。
发明内容
基于此,针对上述技术问题,提供舆情信息热度评分方法、装置、计算机设备和存储介质,以解决现有面向互联网的热度计算方式无法满足用户个性化热榜推荐需求的技术问题。
为了实现上述目的,本申请提供如下技术方案:
第一方面,一种舆情信息热度评分方法,包括:
按时间对精加工舆情信息进行全量分词,并对重复分词因子进行相似聚合,得到去重后的多个分词因子,每个分词因子包括多个系数;
通过预设分词因子综合评分计算公式,计算每个分词因子的综合评分EW,得到分词因子综合评分集合;
对所述分词因子综合评分集合进行综合评分排序,选取综合评分排名在前的若干个分词因子;
通过预设舆情信息热度计算公式,计算所述综合评分排名在前的若干个分词因子命中的每个舆情信息的热度评分HM,得到具有热度评分的命中舆情信息集合;
对所述具有热度评分的命中舆情信息集合按照时间进行排序,通过预设评分公式,对每个命中舆情信息计算最终热度评分HV。
可选地,所述对精加工舆情信息进行全量分词具体是采用N-最短路径分词算法。
可选地,所述多个系数包括舆情信息情感系数KIV、收藏系数FAV、选取系数SEL、推送系数PUS和分词量系数CW。
进一步可选地,所述预设分词因子综合评分计算公式为:
其中,EW为分词因子综合评分,λ为舆情信息情感系数KIV在分词因子综合评分计算中的占比;θ为收藏系数FAV在分词因子综合评分计算中的占比;ω为选取系数SEL在分词因子综合评分计算中的占比;μ为推送系数PUS在分词因子综合评分计算中的占比;为分词量系数CW在分词因子综合评分计算中的占比;α为分词因子元素最大下标;β为调整常量值。
可选地,所述预设舆情信息热度计算公式为:
其中,HM为命中舆情信息的热度评分;Data为舆情信息命中的分词因子的综合评分,SIM为与该舆情信息命中的分词因子相同的分词因子的综合评分。
可选地,所述预设评分公式为:
其中,HV表示命中舆情信息的最终热度评分;λ表示时间:0表示今天,1表示昨天,2表示前天……;Q1、Q2、Q3……表示不同时间的影响值。
可选地,所述选取综合评分排名在前的若干个分词因子,具体是选取综合评分排名前十的分词因子。
第二方面,一种舆情信息热度评分装置,包括:
全量分词模块,用于按时间对精加工舆情信息进行全量分词,并对重复分词因子进行相似聚合,得到去重后的多个分词因子,每个分词因子包括多个系数;
分词因子综合评分计算模块,用于通过预设分词因子综合评分计算公式,计算每个分词因子的综合评分EW,得到分词因子综合评分集合;
综合评分排序模块,用于对所述分词因子综合评分集合进行综合评分排序,选取综合评分排名在前的若干个分词因子;
命中舆情信息热度评分计算模块,用于通过预设舆情信息热度计算公式,计算所述综合评分排名在前的若干个分词因子命中的每个舆情信息的热度评分HM,得到具有热度评分的命中舆情信息集合;
最终热度评分计算模块,用于对所述具有热度评分的命中舆情信息集合按照时间进行排序,通过预设评分公式,对每个命中舆情信息计算最终热度评分HV。
第三方面,一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现第一方面中任一项所述的方法的步骤。
第四方面,一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现第一方面中任一项所述的方法的步骤。
本发明至少具有以下有益效果:
本发明实施例提供了一种舆情信息热度评分方法,采用对用户精加工舆情信息进行全量分词和去重,得到多个分词因子,每个分词因子包括多个系数,计算每个分词因子的综合评分EW,得到分词因子综合评分集合,选取综合评分排名在前的若干个分词因子,计算综合评分排名在前的若干个分词因子命中的每个舆情信息的热度评分HM,得到具有热度评分的命中舆情信息集合,对具有热度评分的命中舆情信息集合按照时间进行排序,通过预设评分公式,对每个命中舆情信息计算最终热度评分HV;能够得到用户精加工舆情信息中每个舆情的最终热度评分,进而能够为根据用户关注的指定背景、指定行业的舆情信息生成信息热榜提供排序依据,实现用户个性化热榜推荐的需求。
附图说明
图1为本发明一个实施例提供的一种舆情信息热度评分方法的流程示意图;
图2为本发明一个实施例提供的一种舆情信息热度评分方法的另一种流程示意图;
图3为本发明一个实施例提供的一种舆情信息热度评分装置的模块架构框图;
图4为本发明一个实施例提供的一种计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
在一个实施例中,如图1所示,提供了一种舆情信息热度评分方法,包括以下步骤:
S1,按时间对精加工舆情信息进行全量分词,并对重复分词因子进行相似聚合,得到去重后的多个分词因子,每个分词因子包括多个系数。
其中,用户精加工舆情信息指的是用户关注范围内的舆情数据,也就是用户关注的某个背景、某个领域、某个行业的的舆情数据;精加工舆情信息可以是用户通过舆情平台选定范围后的数据,或者标签化的数据。
换句话说,按时间对精加工舆情信息的title+content文本采用N-最短路径分词算法进行全量分词,得到分词因子1,分词因子2……。每个分词因子本身包含:舆情信息情感系数KIV、收藏系数FAV、选取系数SEL、推送系数PUS和分词量系数CW。
另外,对重复分词因子进行相似聚合也可以过滤掉一些通用分词的意义,比如"的"、"是"。
S2,通过预设分词因子综合评分计算公式,计算每个分词因子的综合评分EW,得到分词因子综合评分集合。
通过预设分词因子综合评分公式对每个分词因子进行综合评分计算;分词因子综合评分公式如下:
其中,输出EW为分词因子综合评分,λ为舆情信息情感系数KIV在分词因子综合评分计算中的占比;θ为收藏系数FAV在分词因子综合评分计算中的占比;ω为选取系数SEL在分词因子综合评分计算中的占比;μ为推送系数PUS在分词因子综合评分计算中的占比;为分词量系数CW在分词因子综合评分计算中的占比;α为分词因子元素最大下标;β为调整常量值。
最终得到EW1,EW2,EW3……分词因子综合分数集合。
S3,对分词因子综合评分集合进行综合评分排序,选取综合评分排名在前的若干个分词因子。
其中,选取综合评分排名在前的若干个分词因子,具体是选取综合评分排名前十的分词因子。
换句话说,通过对分词综合评分集合排序,得到分词因子TOP10。
S4,通过预设舆情信息热度计算公式,计算综合评分排名在前的若干个分词因子命中的每个舆情信息的热度评分HM,得到具有热度评分的命中舆情信息集合。
根据综合评分排名TOP10的分词命中舆情信息,开始对舆情信息集合的舆情信息热度进行评分;该舆情信息集合也就是由综合评分排名TOP10的分词所命中舆情信息组成的集合。
每个命中的舆情信息的热度评分:命中多个分词因子的综合评分累计+相同分词因子的累计。
预设舆情信息热度计算公式为:
其中,HM为命中舆情信息的热度评分;Data为舆情信息命中的分词因子的综合评分,SIM为与该舆情信息命中的分词因子相同的分词因子的综合评分。也就是说,计算每个命中舆情信息热度时也会算上当时进行重复分词因子相似聚合时去掉的相同分词因子。
最终得到HM1,HM2,HM3……具有热度评分的舆情信息集合SM。
S5,对具有热度评分的命中舆情信息集合按照时间进行排序,通过预设评分公式,对每个命中舆情信息计算最终热度评分HV。
对舆情信息SM进行排序评分,按照时间倒序递减得出最终得分;
预设时间排序评分公式:
其中,HV表示命中舆情信息的最终热度评分;λ表示时间:0表示今天,1表示昨天,2表示前天……;Q1、Q2、Q3……表示不同时间的影响值。通过对SM集合最后的评分得到最终的热度评分SM。
该舆情信息热度评分方法的另一流程示意图可参考图2。
本发明实施例提供了一种基于某种数据平台用户精加工信息后的信息热度评分机制,填充了热榜计算的空白,市场上的热榜都是基于各个不同背景、行业的用户行为的热度计算,而本发明是基于用户专注的方向、领域、行业做的二次热榜计算,来弥补目前市场上“大而全”的热榜计算。
上述一种舆情信息热度评分方法中,采用对用户精加工舆情信息进行全量分词和去重,得到多个分词因子,每个分词因子包括多个系数,计算每个分词因子的综合评分EW,得到分词因子综合评分集合,选取综合评分排名在前的若干个分词因子,计算综合评分排名在前的若干个分词因子命中的每个舆情信息的热度评分HM,得到具有热度评分的命中舆情信息集合,对具有热度评分的命中舆情信息集合按照时间进行排序,通过预设评分公式,对每个命中舆情信息计算最终热度评分HV;能够得到用户精加工舆情信息中每个舆情的最终热度评分,进而能够为根据用户关注的指定背景、指定行业的舆情信息生成信息热榜提供排序依据,实现用户个性化热榜推荐的需求。
应该理解的是,虽然图1-2的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图1-2中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图3所示,提供了一种舆情信息热度评分装置,包括以下程序模块:
全量分词模块301,用于按时间对精加工舆情信息进行全量分词,并对重复分词因子进行相似聚合,得到去重后的多个分词因子,每个分词因子包括多个系数;
分词因子综合评分计算模块302,用于通过预设分词因子综合评分计算公式,计算每个分词因子的综合评分EW,得到分词因子综合评分集合;
综合评分排序模块303,用于对分词因子综合评分集合进行综合评分排序,选取综合评分排名在前的若干个分词因子;
命中舆情信息热度评分计算模块304,用于通过预设舆情信息热度计算公式,计算综合评分排名在前的若干个分词因子命中的每个舆情信息的热度评分HM,得到具有热度评分的命中舆情信息集合;
最终热度评分计算模块305,用于对具有热度评分的命中舆情信息集合按照时间进行排序,通过预设评分公式,对每个命中舆情信息计算最终热度评分HV。
关于一种舆情信息热度评分装置的具体限定可以参见上文中对于一种舆情信息热度评分方法的限定,在此不再赘述。上述一种舆情信息热度评分装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是终端,其内部结构图可以如图4所示。该计算机设备包括通过系统总线连接的处理器、存储器、通信接口、显示屏和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的通信接口用于与外部的终端进行有线或无线方式的通信,无线方式可通过WIFI、运营商网络、NFC(近场通信)或其他技术实现。该计算机程序被处理器执行时以实现一种舆情信息热度评分方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
本领域技术人员可以理解,图4中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,涉及上述实施例方法中的全部或部分流程。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,涉及上述实施例方法中的全部或部分流程。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-OnlyMemory,ROM)、磁带、软盘、闪存或光存储器等。易失性存储器可包括随机存取存储器(Random AccessMemory,RAM)或外部高速缓冲存储器。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(StaticRandomAccessMemory,SRAM)或动态随机存取存储器(DynamicRandomAccessMemory,DRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。
Claims (6)
1.一种舆情信息热度评分方法,其特征在于,包括:
按时间对精加工舆情信息进行全量分词,并对重复分词因子进行相似聚合,得到去重后的多个分词因子,每个分词因子包括多个系数;
通过预设分词因子综合评分计算公式,计算每个分词因子的综合评分EW,得到分词因子综合评分集合;
对所述分词因子综合评分集合进行综合评分排序,选取综合评分排名在前的若干个分词因子;
通过预设舆情信息热度计算公式,计算所述综合评分排名在前的若干个分词因子命中的每个舆情信息的热度评分HM,得到具有热度评分的命中舆情信息集合;
对所述具有热度评分的命中舆情信息集合按照时间进行排序,通过预设评分公式,对每个命中舆情信息计算最终热度评分HV;
所述多个系数包括舆情信息情感系数KIV、收藏系数FAV、选取系数SEL、推送系数PUS和分词量系数CW;
所述预设分词因子综合评分计算公式为:
其中,EW为分词因子综合评分,λ为舆情信息情感系数KIV在分词因子综合评分计算中的占比;θ为收藏系数FAV在分词因子综合评分计算中的占比;ω为选取系数SEL在分词因子综合评分计算中的占比;μ为推送系数PUS在分词因子综合评分计算中的占比;为分词量系数CW在分词因子综合评分计算中的占比;α为分词因子元素最大下标;β为调整常量值;
所述预设舆情信息热度计算公式为:
其中,HM为命中舆情信息的热度评分;Data为舆情信息命中的分词因子的综合评分,SIM为与该舆情信息命中的分词因子相同的分词因子的综合评分;
所述预设评分公式为:
其中,HV表示命中舆情信息的最终热度评分;λ表示时间:0表示今天,1表示昨天,2表示前天……;Q1、Q2、Q3……表示不同时间的影响值。
2.根据权利要求1所述的舆情信息热度评分方法,其特征在于,所述对精加工舆情信息进行全量分词具体是采用N-最短路径分词算法。
3.根据权利要求1所述的舆情信息热度评分方法,其特征在于,所述选取综合评分排名在前的若干个分词因子,具体是选取综合评分排名前十的分词因子。
4.一种舆情信息热度评分装置,其特征在于,包括:
全量分词模块,用于按时间对精加工舆情信息进行全量分词,并对重复分词因子进行相似聚合,得到去重后的多个分词因子,每个分词因子包括多个系数;
分词因子综合评分计算模块,用于通过预设分词因子综合评分计算公式,计算每个分词因子的综合评分EW,得到分词因子综合评分集合;
综合评分排序模块,用于对所述分词因子综合评分集合进行综合评分排序,选取综合评分排名在前的若干个分词因子;
命中舆情信息热度评分计算模块,用于通过预设舆情信息热度计算公式,计算所述综合评分排名在前的若干个分词因子命中的每个舆情信息的热度评分HM,得到具有热度评分的命中舆情信息集合;
最终热度评分计算模块,用于对所述具有热度评分的命中舆情信息集合按照时间进行排序,通过预设评分公式,对每个命中舆情信息计算最终热度评分HV;
所述多个系数包括舆情信息情感系数KIV、收藏系数FAV、选取系数SEL、推送系数PUS和分词量系数CW;
所述预设分词因子综合评分计算公式为:
其中,EW为分词因子综合评分,λ为舆情信息情感系数KIV在分词因子综合评分计算中的占比;θ为收藏系数FAV在分词因子综合评分计算中的占比;ω为选取系数SEL在分词因子综合评分计算中的占比;μ为推送系数PUS在分词因子综合评分计算中的占比;为分词量系数CW在分词因子综合评分计算中的占比;α为分词因子元素最大下标;β为调整常量值;
所述预设舆情信息热度计算公式为:
其中,HM为命中舆情信息的热度评分;Data为舆情信息命中的分词因子的综合评分,SIM为与该舆情信息命中的分词因子相同的分词因子的综合评分;
所述预设评分公式为:
其中,HV表示命中舆情信息的最终热度评分;λ表示时间:0表示今天,1表示昨天,2表示前天……;Q1、Q2、Q3……表示不同时间的影响值。
5.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至3中任一项所述的方法的步骤。
6.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至3中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310202520.XA CN116522917B (zh) | 2023-03-06 | 2023-03-06 | 舆情信息热度评分方法、装置、计算机设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310202520.XA CN116522917B (zh) | 2023-03-06 | 2023-03-06 | 舆情信息热度评分方法、装置、计算机设备和存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116522917A CN116522917A (zh) | 2023-08-01 |
CN116522917B true CN116522917B (zh) | 2024-01-26 |
Family
ID=87405398
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310202520.XA Active CN116522917B (zh) | 2023-03-06 | 2023-03-06 | 舆情信息热度评分方法、装置、计算机设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116522917B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118474427B (zh) * | 2024-07-09 | 2024-09-24 | 中译文娱科技(青岛)有限公司 | 一种网络舆情检测方法及系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108710994A (zh) * | 2018-04-26 | 2018-10-26 | 平安科技(深圳)有限公司 | 基于舆情因子的投资选股方法、装置及存储介质 |
CN109145215A (zh) * | 2018-08-29 | 2019-01-04 | 中国平安保险(集团)股份有限公司 | 网络舆情分析方法、装置及存储介质 |
CN112380859A (zh) * | 2020-11-12 | 2021-02-19 | 平安科技(深圳)有限公司 | 舆情信息的推荐方法、装置、电子设备及计算机存储介质 |
CN112860902A (zh) * | 2021-04-02 | 2021-05-28 | 中国工商银行股份有限公司 | 舆情情感热度计算方法及装置 |
CN113780832A (zh) * | 2021-09-14 | 2021-12-10 | 平安科技(深圳)有限公司 | 舆情文本评分方法、装置、计算机设备和存储介质 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8965845B2 (en) * | 2012-12-07 | 2015-02-24 | International Business Machines Corporation | Proactive data object replication in named data networks |
-
2023
- 2023-03-06 CN CN202310202520.XA patent/CN116522917B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108710994A (zh) * | 2018-04-26 | 2018-10-26 | 平安科技(深圳)有限公司 | 基于舆情因子的投资选股方法、装置及存储介质 |
CN109145215A (zh) * | 2018-08-29 | 2019-01-04 | 中国平安保险(集团)股份有限公司 | 网络舆情分析方法、装置及存储介质 |
CN112380859A (zh) * | 2020-11-12 | 2021-02-19 | 平安科技(深圳)有限公司 | 舆情信息的推荐方法、装置、电子设备及计算机存储介质 |
CN112860902A (zh) * | 2021-04-02 | 2021-05-28 | 中国工商银行股份有限公司 | 舆情情感热度计算方法及装置 |
CN113780832A (zh) * | 2021-09-14 | 2021-12-10 | 平安科技(深圳)有限公司 | 舆情文本评分方法、装置、计算机设备和存储介质 |
Non-Patent Citations (1)
Title |
---|
多源数据融合的热点舆情事件分析技术研究与实现;朴炳旭;《中国优秀硕士学位论文全文数据库 (社会科学Ⅱ辑)》(第05期);H123-17 * |
Also Published As
Publication number | Publication date |
---|---|
CN116522917A (zh) | 2023-08-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112000819B (zh) | 多媒体资源推荐方法、装置、电子设备及存储介质 | |
Rae et al. | Improving tag recommendation using social networks | |
US8825639B2 (en) | Endorsing search results | |
CN110223186B (zh) | 用户相似度确定方法以及信息推荐方法 | |
CN106651544B (zh) | 最少用户交互的会话式推荐系统 | |
CN108491540B (zh) | 文本信息推送方法、装置及智能终端 | |
CN106131601A (zh) | 视频推荐方法及装置 | |
CN111553754A (zh) | 行为预测系统的更新方法及装置 | |
Zhao et al. | Service quality evaluation by exploring social users’ contextual information | |
CN109766492B (zh) | 学习推荐方法、装置、设备和可读介质 | |
US11232522B2 (en) | Methods, systems and techniques for blending online content from multiple disparate content sources including a personal content source or a semi-personal content source | |
US11558324B2 (en) | Method and system for dynamically generating a card | |
De Choudhury et al. | Why do we converse on social media? An analysis of intrinsic and extrinsic network factors | |
CN116522917B (zh) | 舆情信息热度评分方法、装置、计算机设备和存储介质 | |
US9767400B2 (en) | Method and system for generating a card based on intent | |
US11113347B2 (en) | Method and system for providing organized content | |
CN106649647A (zh) | 基于人工智能的搜索结果排序方法和装置 | |
JP5481295B2 (ja) | オブジェクト推薦装置、オブジェクト推薦方法、オブジェクト推薦プログラムおよびオブジェクト推薦システム | |
CN106503059A (zh) | 展示页面推送方法及装置 | |
CN112559895A (zh) | 一种数据处理方法、装置、电子设备及存储介质 | |
WO2023160413A1 (zh) | 书籍推荐方法、装置、电子设备及存储介质 | |
CN112182414A (zh) | 文章推荐方法、装置及电子设备 | |
CN106777201B (zh) | 搜索结果页上的推荐数据的排序方法及装置 | |
CN105095258B (zh) | 一种媒体信息排序方法、装置和媒体信息推荐系统 | |
US8949327B2 (en) | Method and device to provide trusted recommendations of websites |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |