CN115795175B - 基于数据分析的多维度热点提取方法 - Google Patents

基于数据分析的多维度热点提取方法 Download PDF

Info

Publication number
CN115795175B
CN115795175B CN202310113229.5A CN202310113229A CN115795175B CN 115795175 B CN115795175 B CN 115795175B CN 202310113229 A CN202310113229 A CN 202310113229A CN 115795175 B CN115795175 B CN 115795175B
Authority
CN
China
Prior art keywords
dimension
data
line
evaluation
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202310113229.5A
Other languages
English (en)
Other versions
CN115795175A (zh
Inventor
孟超越
常智山
程建文
周志扬
李俊丽
油严凯
赵冲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mingtai Beijing Technology Co ltd
Original Assignee
Mingtai Beijing Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mingtai Beijing Technology Co ltd filed Critical Mingtai Beijing Technology Co ltd
Priority to CN202310113229.5A priority Critical patent/CN115795175B/zh
Publication of CN115795175A publication Critical patent/CN115795175A/zh
Application granted granted Critical
Publication of CN115795175B publication Critical patent/CN115795175B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及多维度热点提取技术领域,具体为基于数据分析的多维度热点提取方法,该方法包括下述步骤:步骤一:通过维度提选单元从各个不同的维度进行维热信息的提取,本发明通过对不同维度的热点信息进行数据的采集,并将采集的数据进行依次往下的划分,从而将数据的类别种类划分清楚,并与对数据的提取以及处理,依据划分的数据进行不同种类的数据处理,从而得到对应种类数据的分析系数以及评价系数,将数据进行数值转化,增加数据的直观性,依据转化后的不同系数进行综合处理,依据处理结果对不同维度的热点信息进行判定选取,从而选取出不同维度的热点,选取出不重复的热点数据,并生成提取传输提示,依据提示进行提取传输。

Description

基于数据分析的多维度热点提取方法
技术领域
本发明涉及多维度热点提取技术领域,具体为基于数据分析的多维度热点提取方法。
背景技术
热点指的是比较受广大群众关注,或者欢迎的新闻或者信息,或指某时期引人注目的地方或问题,对于热点的提取是现在的网络平台进行的数据处理,选取出各类信息中浏览量最多,人们感兴趣的信息进行提取。
目前,对于不同维度的热点提取方法是通过不同维度的热点的浏览量以及点击量进行一个数据的排行,依据排行的结果进行热点选取,该方法对热点的选取不够准确,无法依据信息的不同浏览、阅读、评价等数据自动判定热点的真实性,从而降低选取热点的准确性,无法结合多方数据,进行实时的自动分析。
为此,我们提出基于数据分析的多维度热点提取方法。
发明内容
本发明的目的在于提供基于数据分析的多维度热点提取方法,通过对不同维度的热点信息进行数据的采集,并将采集的数据进行依次往下的划分,从而将数据的类别种类划分清楚,并与对数据的提取以及处理,依据划分的数据进行不同种类的数据处理,从而得到对应种类数据的分析系数以及评价系数,将数据进行数值转化,增加数据的直观性,便于对数据有一个直观的了解,依据转化后的不同系数进行综合处理,依据处理结果对不同维度的热点信息进行判定选取,从而选取出不同维度的热点,并将其进行整合提出,选取出不重复的热点数据,并生成提取传输提示,依据提示进行提取传输。
本发明的目的可以通过以下技术方案实现:基于数据分析的多维度热点提取方法,该方法具体包括下述步骤:
步骤一:通过维度提选单元从各个不同的维度进行维热信息的提取,并对维热信息进行划分操作,划分得到提维数据组,提维数据组包括提维数据、维分数据、维名数据、维点数据、维览数据、维评数据、维间数据以及维线数据;
步骤二:通过维热点分处理单元对提维数据组内不同维度的数据进行维热状况处理操作,得到信号数据组,信号数据组包括阅读信号、浏览信号、线优信号、线劣信号、共存一信号、共存二信号、不合格维线数据、合格维线数据、好评间隔值、差评间隔值以及正评间隔值;
步骤三:通过维热计算整合单元对信号数据组内的数据进行不同系数的计算整合操作,得到分析评价系数组,分析评价系数组包括上线评价系数和阅览分析系数;
步骤四:通过维热判定预警单元对分析评价系数组进行维度热点数据的判定预警操作,得到操作数组以及提取传输信号,依据提取传输信号对操作数组进行提取传输。
进一步的,提取划分操作的具体操作过程为:
将维热信息划分为提维数据、维分数据、维名数据、维点数据、维览数据、维评数据、维间数据以及维线数据;
提维数据表示为维热信息内不同的维度对应的分类编号,维分数据表示为维热信息内提维数据对应的分类,维名数据表示为维热信息内维分数据对应的数据名称,维点数据表示为维热信息内维名数据对应的用户点击量,维览数据表示为维热信息内维名数据对应的用户浏览的时间长度,维评数据表示为维热信息内维名数据对应的评价内容,维间数据表示为维热信息内维名数据对应的评价时间点,维线数据表示为维热信息内维名数据对应的上线时长;
依据提维数据提取对应的维分数据、维名数据、维点数据、维览数据、维评数据、维间数据以及维线数据并将其标定为提维数据组,将提维数据组传输至维热点分处理单元。
进一步的,维热状况处理操作的具体操作过程为:
依据提维数据选取对应的维分数据,并将维分数据对应的维名数据、维点数据、维览数据、维评数据、维间数据和维线数据进行选取标记;
将选取标记的维名数据,并将维名数据对应的维点数据以及维览数据进行点览处理,具体为:
依据维名数据选取对应的维览数据,设定一个维览阈值,将维览数据与维览阈值进行差值计算,计算出维览阈差值,将维览阈差值与维览阈差值对应的阈值进行比对,当维览阈差值大于等于维览阈差值对应的阈值时,则生成阅读信号,当维览阈差值小于维览阈差值对应的阈值时,则生成浏览信号;
依据维名数据选取对应的维评数据、维间数据以及维线数据进行评间处理,得到线优信号、线劣信号、共存一信号、共存二信号、不合格维线数据、合格维线数据、好评间隔值、差评间隔值以及正评间隔值。
进一步的,评间处理的具体过程为:
提取维名数据对应的维线数据,将若干个为维名数据对应的维线数据进行时间排序,得到维线排序数据,设定一个上线阈值,将上线阈值与维线排序数据中的维线数据进行匹配,当匹配出维线排序数据中的维线数据均大于上线阈值时,则生成线优信号,当匹配出维线排序数据中的维线数据均小于上线阈值时,则生成线劣信号;
当上线阈值与维线排序数据中的维线数据的匹配结果一致时,则生成共存一信号,将该维线数据标定为维线分界数据,将维线排序数据中该维线分界数据以及排序在维线分界数据后的维线数据标定为不合格维线数据,将维线排序数据中排序在维线分界数据后的维线数据标定为合格维线数据,当上线阈值在维线排序数据中的两个维线数据之间时,则生成共存二信号,将维线排序数据中两个维线数据中的后一个数据及后续排序对应的维线数据标定为不合格维线数据,将维线排序数据中两个维线数据中的前一个数据及之前的排序对应的维线数据标定为合格维线数据;
提取维评数据,设定一个好评数词组以及差评数词组,将维评数据与好评数词组以及差评数词组进行匹配,当维评数据与好评数词组或差评数词组的匹配结果一致时,则生成好评信号或差评信号,当维评数据与好评数词组以及差评数词组的匹配结果均不一致时,则生成正评信号;
提取若干个对应好评信号、差评信号以及正评信号,依据维间数据识别出每两次好评信号出现的时间差值,将其标定为好评间隔值,依据维间数据识别出每两次差评信号出现的时间差值,将其标定为差评间隔值,依据维间数据识别出每两次正评信号出现的时间差,将其标定为正评间隔值。
进一步的,计算整合操作的具体操作过程为:
提取阅读信号以及浏览信号,识别出阅读信号以及浏览信号出现的次数,并将阅读信号以及浏览信号出现的次数分别标定为阅读次数值以及浏览信号次数值;
将阅读次数值以及浏览信号次数值分别与维名数据对应的维点数据进行占比计算,计算出阅读次数占比值Yci以及浏览信号次数占比值Lci;
依据公式:
Figure SMS_1
,计算出阅览分析系数
Figure SMS_2
,u1表示为阅读次数占比值的预设比例系数,u2表示为浏览信号次数占比值的预设比例系数,M1表示为阅览分析系数的预设偏差纠正系数,且u1>u2;
对线优信号、线劣信号、共存一信号以及共存二信号进行识别标记,当识别到线优信号或线劣信号时,则将线优信号或线劣信号赋值标定为信号赋值,并将信号赋值标记为Ac,c=1,2,当识别到共存一信号或共存二信号时,则将对应的不合格维线数据以及合格维线数据标定为维线评价数值Bv,v=1,2,将信号赋值与维线评价数值标定为识别数值Kabn,n=1,2;
依据公式:
Figure SMS_3
,计算出上线评价系数
Figure SMS_4
,r1表示为识别数值预设转换因子,Hj表示为好评间隔值,Zj表示为正评间隔值,Cj表示为差评间隔值,r2表示为好评间隔值、差评间隔值以及正评间隔值的预设转换因子,β表示为上线评价系数的偏差纠正预设值。
进一步的,判定预警操作的具体操作过程为:
提取维名数据对应的上线评价系数
Figure SMS_5
和阅览分析系数
Figure SMS_6
,依据公式:
Figure SMS_7
,计算出判定值
Figure SMS_8
,glc表示为判定值计算的偏差调节因子;
提取维名数据对应的判定值
Figure SMS_9
,依据判定值
Figure SMS_10
对维名数据进行从大到小的排序,得到维名排序数据,将维名排序数据进行热度提取划分,具体为:设定一个热度提取划分阈值,将热度提取划分阈值与维名排序数据进行匹配,将维名排序数据中排序在热度提取划分阈值之前的维名数据标定为热度提取数据;
依据提维数据选取对应的维分数据,依据维分数据选取对应的热度提取数据,将热度提取数据进行整合,整合得到热度提取数组,并对热度提取数组内的维名数据进行识别,当出现重复的维名数据时,则自动进行随机剔除,只保留其中一个维名数据,同时,将随机剔除后的热度提取数组标定为操作数组,生成提取传输信号,依据提取传输信号对操作数组进行提取传输。
本发明的有益效果:
本发明通过对不同维度的热点信息进行数据的采集,并将采集的数据进行依次往下的划分,从而将数据的类别种类划分清楚,并与对数据的提取以及处理,依据划分的数据进行不同种类的数据处理,从而得到对应种类数据的分析系数以及评价系数,将数据进行数值转化,增加数据的直观性,便于对数据有一个直观的了解,依据转化后的不同系数进行综合处理,依据处理结果对不同维度的热点信息进行判定选取,从而选取出不同维度的热点,并将其进行整合提出,选取出不重复的热点数据,并生成提取传输提示,依据提示进行提取传输。
附图说明
下面结合附图对本发明作进一步的说明。
图1是本发明的热点提取流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
请参阅图1所示,本发明为基于数据分析的多维度热点提取方法,该方法具体包括下述步骤:
通过维度提选单元从各个不同的维度进行维热信息的提取,依据从不同维度提取的维热信息进行提取划分操作,提取划分操作的具体操作过程为:
将维热信息内不同的维度对应的分类编号标定为提维数据,提维数据的含义表示为若干个维度其中之一的维度,即可以理解为A维度,将维热信息内提维数据对应的分类标定为维分数据,将维热信息内维分数据对应的数据名称标定为维名数据,将维热信息内维名数据对应的用户点击量标定为维点数据,将维热信息内维名数据对应的用户浏览的时间长度标定为维览数据,将维热信息内维名数据对应的评价内容标定为维评数据,将维热信息内维名数据对应的评价时间点标定为维间数据,将维热信息内维名数据对应的上线时长标定为维线数据,此处的上线时长指代该信息出现的时间直至当前时刻的时间长度;
提取提维数据、维分数据、维名数据、维点数据、维览数据、维评数据、维间数据以及维线数据,并对其进行对应划分,具体为:依据提维数据提取对应的维分数据,依据维分数据提取对应的维名数据,依据维名数据提取对应的维点数据、维览数据、维评数据、维间数据以及维线数据,即依据提维数据提取对应的维分数据、维名数据、维点数据、维览数据、维评数据、维间数据以及维线数据,便于对数据进行整合划分,从而便于后续数据的提取,节省数据提取的时间,提高工作效率;
将提维数据、维分数据、维名数据、维点数据、维览数据、维评数据、维间数据以及维线数据传输至维热点分处理单元;
通过维热点分处理单元对提维数据以及对应的维分数据、维名数据、维点数据、维览数据、维评数据、维间数据和维线数据进行维热状况处理操作,维热状况处理操作的具体操作过程为:
依据提维数据选取对应的维分数据,并将维分数据对应的维名数据、维点数据、维览数据、维评数据、维间数据和维线数据进行选取标记;
将选取标记的维名数据,并将维名数据对应的维点数据以及维览数据进行点览处理,具体为:
依据维名数据选取对应的维览数据,设定一个维览阈值,将维览数据与维览阈值进行差值计算,计算出维览阈差值,将维览阈差值与维览阈差值对应的阈值进行比对,当维览阈差值大于等于维览阈差值对应的阈值时,则判定对应维名数据被用户阅读,生成阅读信号,当维览阈差值小于维览阈差值对应的阈值时,则判定对应维名数据未被用户阅读,生成浏览信号;
依据维名数据选取对应的维评数据、维间数据以及维线数据进行评间处理,评间处理的具体过程为:
提取维名数据对应的维线数据,将若干个为维名数据对应的维线数据进行时间排序,得到维线排序数据,设定一个上线阈值,将上线阈值与维线排序数据中的维线数据进行匹配,具体为:当匹配出维线排序数据中的维线数据均大于上线阈值时,则判定所有维名数据的上线时长均大于设定的时间,生成线优信号,当匹配出维线排序数据中的维线数据均小于上线阈值时,则判定所有维名数据的上线时长均小于设定的时间,生成线劣信号;
当上线阈值与维线排序数据中的维线数据的匹配结果一致时,则判定维线排序数据内优劣共存,生成共存一信号,将该维线数据标定为维线分界数据,将维线排序数据中该维线分界数据以及排序在维线分界数据后的维线数据标定为不合格维线数据,将维线排序数据中排序在维线分界数据后的维线数据标定为合格维线数据,当上线阈值在维线排序数据中的两个维线数据之间时,则判定维线排序数据内优劣共存,生成共存二信号,将维线排序数据中两个维线数据中的后一个数据及后续排序对应的维线数据标定为不合格维线数据,将维线排序数据中两个维线数据中的前一个数据及之前的排序对应的维线数据标定为合格维线数据;
提取维评数据,设定一个好评数词组以及差评数词组,将维评数据与好评数词组以及差评数词组进行匹配,当维评数据与好评数词组的匹配结果一致时,则判定该维评数据为好评数据,生成好评信号,当维评数据与差评数词组的匹配结果一致时,则判定该维评数据为好评数据,生成差评信号,当维评数据与好评数词组以及差评数词组的匹配结果均不一致时,则判定该维评数据为正评数据,生成正评信号;
提取若干个对应好评信号、差评信号以及正评信号,依据维间数据识别出每两次好评信号出现的时间差值,将其标定为好评间隔值,依据维间数据识别出每两次差评信号出现的时间差值,将其标定为差评间隔值,依据维间数据识别出每两次正评信号出现的时间差,将其标定为正评间隔值;
通过维热计算整合单元对阅读信号、浏览信号、线优信号、线劣信号、共存一信号、共存二信号、不合格维线数据、合格维线数据、好评间隔值、差评间隔值以及正评间隔值进行计算整合操作,计算整合操作的具体操作过程为:
提取阅读信号以及浏览信号,识别出阅读信号以及浏览信号出现的次数,并将阅读信号以及浏览信号出现的次数分别标定为阅读次数值以及浏览信号次数值;
将阅读次数值以及浏览信号次数值分别与维名数据对应的维点数据进行占比计算,计算出阅读次数占比值以及浏览信号次数占比值,具体计算式为:阅读次数占比值=阅读次数值/维点数据;浏览信号次数占比值=浏览信号次数值/维点数据;
将阅读次数占比值以及浏览信号次数占比值代入到计算式:
Figure SMS_11
,其中,
Figure SMS_12
表示为阅览分析系数,Yci表示为阅读次数占比值,u1表示为阅读次数占比值的预设比例系数,Lci表示为浏览信号次数占比值,u2表示为浏览信号次数占比值的预设比例系数,M1表示为阅览分析系数的预设偏差纠正系数,且u1>u2;
提取线优信号、线劣信号、共存一信号以及共存二信号并进行识别,当识别到线优信号时,则将线优信号赋值为A1影响值,当识别到线劣信号时,则将线劣信号赋值为A2影响值,将线优信号以及线劣信号的赋值标定为信号赋值,并将信号赋值标记为Ac,c=1,2,当识别到共存一信号或共存二信号时,则提取对应的不合格维线数据以及合格维线数据并依次标记为B1、B2,将B1、B2标定为维线评价数值Bv,v=1,2,将信号赋值与维线评价数值标定为识别数值Kabn,n=1,2,当n=1时,则识别数值表示为Ac,当n=2时,则识别数值表示为Bv
将识别数值与好评间隔值、差评间隔值以及正评间隔值一同代入计算式:
Figure SMS_13
计算出上线评价系数
Figure SMS_14
,其中,Kabn表示为识别数值,r1表示为识别数值预设转换因子,Hj表示为好评间隔值,Zj表示为正评间隔值,Cj表示为差评间隔值,r2表示为好评间隔值、差评间隔值以及正评间隔值的预设转换因子,β表示为上线评价系数的偏差纠正预设值;
通过维热判定预警单元对维名数据以及对应的上线评价系数
Figure SMS_15
和阅览分析系数
Figure SMS_16
一同进行判定预警操作,判定预警操作的具体操作过程为:
提取维名数据对应的上线评价系数
Figure SMS_17
和阅览分析系数
Figure SMS_18
,依据公式:
Figure SMS_19
,计算出判定值
Figure SMS_20
,glc表示为判定值计算的偏差调节因子;
提取维名数据对应的判定值
Figure SMS_21
,依据判定值
Figure SMS_22
对维名数据进行从大到小的排序,得到维名排序数据,将维名排序数据进行热度提取划分,具体为:设定一个热度提取划分阈值,将热度提取划分阈值与维名排序数据进行匹配,将维名排序数据中排序在热度提取划分阈值之前的维名数据标定为热度提取数据;
依据提维数据选取对应的维分数据,依据维分数据选取对应的热度提取数据,将热度提取数据进行整合,整合得到热度提取数组,并对热度提取数组内的维名数据进行识别,当出现重复的维名数据时,则自动进行随机剔除,只保留其中一个维名数据,同时,将随机剔除后的热度提取数组标定为操作数组,生成提取传输信号,依据提取传输信号对操作数组进行提取传输。
以上内容仅仅是对本发明结构所作的举例和说明,所属本技术领域的技术人员对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代,只要不偏离发明的结构或者超越本权利要求书所定义的范围,均应属于本发明的保护范围。

Claims (1)

1.基于数据分析的多维度热点提取方法,其特征在于,该方法具体包括下述步骤:
步骤一:通过维度提选单元从各个不同的维度进行维热信息的提取,并对维热信息进行划分操作,提取划分操作的具体操作过程为:
将维热信息划分为提维数据、维分数据、维名数据、维点数据、维览数据、维评数据、维间数据以及维线数据;
提维数据表示为维热信息内不同的维度对应的分类编号,维分数据表示为维热信息内提维数据对应的分类,维名数据表示为维热信息内维分数据对应的数据名称,维点数据表示为维热信息内维名数据对应的用户点击量,维览数据表示为维热信息内维名数据对应的用户浏览的时间长度,维评数据表示为维热信息内维名数据对应的评价内容,维间数据表示为维热信息内维名数据对应的评价时间点,维线数据表示为维热信息内维名数据对应的上线时长;
依据提维数据提取对应的维分数据、维名数据、维点数据、维览数据、维评数据、维间数据以及维线数据并将其标定为提维数据组,将提维数据组传输至维热点分处理单元;
步骤二:通过维热点分处理单元对提维数据组内不同维度的数据进行维热状况处理操作,维热状况处理操作的具体操作过程为:
依据提维数据选取对应的维分数据,并将维分数据对应的维名数据、维点数据、维览数据、维评数据、维间数据和维线数据进行选取标记;
将选取标记的维名数据,并将维名数据对应的维点数据以及维览数据进行点览处理,具体为:
依据维名数据选取对应的维览数据,设定一个维览阈值,将维览数据与维览阈值进行差值计算,计算出维览阈差值,将维览阈差值与维览阈差值对应的阈值进行比对,当维览阈差值大于等于维览阈差值对应的阈值时,则生成阅读信号,当维览阈差值小于维览阈差值对应的阈值时,则生成浏览信号;
依据维名数据选取对应的维评数据、维间数据以及维线数据进行评间处理,评间处理的具体过程为:
提取维名数据对应的维线数据,将若干个为维名数据对应的维线数据进行时间排序,得到维线排序数据,设定一个上线阈值,将上线阈值与维线排序数据中的维线数据进行匹配,当匹配出维线排序数据中的维线数据均大于上线阈值时,则生成线优信号,当匹配出维线排序数据中的维线数据均小于上线阈值时,则生成线劣信号;
当上线阈值与维线排序数据中的维线数据的匹配结果一致时,则生成共存一信号,将该维线数据标定为维线分界数据,将维线排序数据中该维线分界数据以及排序在维线分界数据后的维线数据标定为不合格维线数据,将维线排序数据中排序在维线分界数据后的维线数据标定为合格维线数据,当上线阈值在维线排序数据中的两个维线数据之间时,则生成共存二信号,将维线排序数据中两个维线数据中的后一个数据及后续排序对应的维线数据标定为不合格维线数据,将维线排序数据中两个维线数据中的前一个数据及之前的排序对应的维线数据标定为合格维线数据;
提取维评数据,设定一个好评数词组以及差评数词组,将维评数据与好评数词组以及差评数词组进行匹配,当维评数据与好评数词组或差评数词组的匹配结果一致时,则生成好评信号或差评信号,当维评数据与好评数词组以及差评数词组的匹配结果均不一致时,则生成正评信号;
提取若干个对应好评信号、差评信号以及正评信号,依据维间数据识别出每两次好评信号出现的时间差值,将其标定为好评间隔值,依据维间数据识别出每两次差评信号出现的时间差值,将其标定为差评间隔值,依据维间数据识别出每两次正评信号出现的时间差,将其标定为正评间隔值;
将阅读信号、浏览信号、线优信号、线劣信号、共存一信号、共存二信号、不合格维线数据、合格维线数据、好评间隔值、差评间隔值以及正评间隔值标记为信号数据组;
步骤三:通过维热计算整合单元对信号数据组内的数据进行不同系数的计算整合操作,计算整合操作的具体操作过程为:
提取阅读信号以及浏览信号,识别出阅读信号以及浏览信号出现的次数,并将阅读信号以及浏览信号出现的次数分别标定为阅读次数值以及浏览信号次数值;
将阅读次数值以及浏览信号次数值分别与维名数据对应的维点数据进行占比计算,计算出阅读次数占比值Yci以及浏览信号次数占比值Lci;
依据公式:
Figure QLYQS_1
,计算出阅览分析系数
Figure QLYQS_2
,u1表示为阅读次数占比值的预设比例系数,u2表示为浏览信号次数占比值的预设比例系数,M1表示为阅览分析系数的预设偏差纠正系数,且u1>u2;
对线优信号、线劣信号、共存一信号以及共存二信号进行识别标记,当识别到线优信号或线劣信号时,则将线优信号或线劣信号赋值标定为信号赋值,并将信号赋值标记为Ac,c=1,2,当识别到共存一信号或共存二信号时,则将对应的不合格维线数据以及合格维线数据标定为维线评价数值Bv,v=1,2,将信号赋值与维线评价数值标定为识别数值Kabn,n=1,2;
依据公式:
Figure QLYQS_3
,计算出上线评价系数
Figure QLYQS_4
,r1表示为识别数值预设转换因子,Hj表示为好评间隔值,Zj表示为正评间隔值,Cj表示为差评间隔值,r2表示为好评间隔值、差评间隔值以及正评间隔值的预设转换因子,β表示为上线评价系数的偏差纠正预设值;
将上线评价系数和阅览分析系数标定为分析评价系数组;
步骤四:通过维热判定预警单元对分析评价系数组进行维度热点数据的判定预警操作,判定预警操作的具体操作过程为:
提取维名数据对应的上线评价系数
Figure QLYQS_5
和阅览分析系数
Figure QLYQS_6
,依据公式:
Figure QLYQS_7
,计算出判定值
Figure QLYQS_8
,glc表示为判定值计算的偏差调节因子;
提取维名数据对应的判定值
Figure QLYQS_9
,依据判定值
Figure QLYQS_10
对维名数据进行从大到小的排序,得到维名排序数据,将维名排序数据进行热度提取划分,具体为:设定一个热度提取划分阈值,将热度提取划分阈值与维名排序数据进行匹配,将维名排序数据中排序在热度提取划分阈值之前的维名数据标定为热度提取数据;
依据提维数据选取对应的维分数据,依据维分数据选取对应的热度提取数据,将热度提取数据进行整合,整合得到热度提取数组,并对热度提取数组内的维名数据进行识别,当出现重复的维名数据时,则自动进行随机剔除,只保留其中一个维名数据,同时,将随机剔除后的热度提取数组标定为操作数组,生成提取传输信号,依据提取传输信号对操作数组进行提取传输。
CN202310113229.5A 2023-02-15 2023-02-15 基于数据分析的多维度热点提取方法 Active CN115795175B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310113229.5A CN115795175B (zh) 2023-02-15 2023-02-15 基于数据分析的多维度热点提取方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310113229.5A CN115795175B (zh) 2023-02-15 2023-02-15 基于数据分析的多维度热点提取方法

Publications (2)

Publication Number Publication Date
CN115795175A CN115795175A (zh) 2023-03-14
CN115795175B true CN115795175B (zh) 2023-04-25

Family

ID=85430991

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310113229.5A Active CN115795175B (zh) 2023-02-15 2023-02-15 基于数据分析的多维度热点提取方法

Country Status (1)

Country Link
CN (1) CN115795175B (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102270240A (zh) * 2011-08-15 2011-12-07 哈尔滨工业大学 网络论坛中热点发现及其演化态势分析方法
CN103593358A (zh) * 2012-08-16 2014-02-19 江苏金鸽网络科技有限公司 一种基于聚类分析的互联网信息热点控制方法
CN109740059A (zh) * 2018-12-31 2019-05-10 杭州翼兔网络科技有限公司 一种热门话题舆情分析方法
CN111198946A (zh) * 2019-12-25 2020-05-26 北京邮电大学 一种网络新闻热点挖掘方法及装置
CN112597280A (zh) * 2020-12-28 2021-04-02 上海朝阳永续信息技术股份有限公司 一种自动发现热点关键词和热点新闻的方法
WO2022005272A1 (en) * 2020-06-30 2022-01-06 Mimos Berhad System and method for hot topics aggregation using relationship graph

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4489994B2 (ja) * 2001-05-11 2010-06-23 富士通株式会社 話題抽出装置、方法、プログラム及びそのプログラムを記録する記録媒体

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102270240A (zh) * 2011-08-15 2011-12-07 哈尔滨工业大学 网络论坛中热点发现及其演化态势分析方法
CN103593358A (zh) * 2012-08-16 2014-02-19 江苏金鸽网络科技有限公司 一种基于聚类分析的互联网信息热点控制方法
CN109740059A (zh) * 2018-12-31 2019-05-10 杭州翼兔网络科技有限公司 一种热门话题舆情分析方法
CN111198946A (zh) * 2019-12-25 2020-05-26 北京邮电大学 一种网络新闻热点挖掘方法及装置
WO2022005272A1 (en) * 2020-06-30 2022-01-06 Mimos Berhad System and method for hot topics aggregation using relationship graph
CN112597280A (zh) * 2020-12-28 2021-04-02 上海朝阳永续信息技术股份有限公司 一种自动发现热点关键词和热点新闻的方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
刘培玉 ; 侯秀艳 ; 朱振方 ; 刘芳 ; 蔡肖红 ; .基于热度联合排序的微博热点话题发现.计算机科学与探索.2015,(第04期),全文. *

Also Published As

Publication number Publication date
CN115795175A (zh) 2023-03-14

Similar Documents

Publication Publication Date Title
CN101859425B (zh) 一种提供应用列表的方法及装置
CN108932945B (zh) 一种语音指令的处理方法及装置
CN106708990B (zh) 一种音乐片段提取方法和设备
CN110335625A (zh) 背景音乐的提示及识别方法、装置、设备以及介质
CN104731954A (zh) 基于群透视音乐推荐方法与系统
CN104504149A (zh) 一种实现应用推荐的方法及装置
CN104636407B (zh) 参数取值训练及搜索请求处理方法和装置
CN104423621A (zh) 拼音字符串处理方法和装置
CN103942328B (zh) 一种视频检索方法及视频装置
CN115883928B (zh) 一种直播社交大数据的信息推送方法及系统
CN116955833B (zh) 一种用户行为分析系统及方法
CN109740072A (zh) Ota平台下基于poi的酒店排序方法及系统
CN112684907A (zh) 一种文本输入方法、装置、设备及存储介质
CN115795175B (zh) 基于数据分析的多维度热点提取方法
CN113254810A (zh) 搜索结果输出方法、装置、计算机设备及可读存储介质
CN113592456A (zh) 一种基于人工智能的工程咨询管理系统及数据处理方法
CN103186375B (zh) 待机界面的图标自动排序方法和使用方法的装置
CN105989018B (zh) 标签生成方法及标签生成装置
CN117436956A (zh) 基于广告推送的智能营销管理系统
CN115630173B (zh) 一种基于兴趣度分析的用户数据管理方法
CN111768274A (zh) 一种基于人工智能数据分类存储系统
CN105824946A (zh) 基于数据评分进行多媒体推荐的方法及系统
CN110705318A (zh) 一种机器翻译引擎测评优选方法及系统
CN114443930A (zh) 一种新闻舆情智能监测分析方法、系统及计算机存储介质
CN112463920A (zh) 一种信息应答方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant