CN115689749A - 榜单信息的处理方法、装置、计算机可读介质及电子设备 - Google Patents
榜单信息的处理方法、装置、计算机可读介质及电子设备 Download PDFInfo
- Publication number
- CN115689749A CN115689749A CN202211319705.0A CN202211319705A CN115689749A CN 115689749 A CN115689749 A CN 115689749A CN 202211319705 A CN202211319705 A CN 202211319705A CN 115689749 A CN115689749 A CN 115689749A
- Authority
- CN
- China
- Prior art keywords
- time period
- data
- value
- weight value
- heat value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请属于计算机技术领域,具体涉及一种榜单信息的处理方法、装置、计算机可读介质及电子设备。该方法包括从数据库中获取用户应用数据,用户应用数据包括交易数据、搜索数据以及资讯数据中的至少一种;根据用户应用数据和不同时间段的用户应用数据所对应的权重值,计算各个虚拟资源在各个类型数据下的原始热度值;将同一分组下各个虚拟资源对应的原始热度值进行归一化处理,得到统一格式的热度值;根据统一格式的热度值,对虚拟资源进行分组展示。在本申请提供的技术方案中,基于用户应用数据以及其所对应的权重值计算得到各个虚拟资源在各个类型数据下的原始热度值,从而可以掌握虚拟资源的实时变化情况。
Description
技术领域
本申请属于计算机技术领域,具体涉及一种榜单信息的处理方法、装置、计算机可读介质及电子设备。
背景技术
目前,市面上的产品资源相关的应用程序都设置有与虚拟资源相关的各类榜单,其中,虚拟资源以股票为例,榜单中例如可以包括股票的交易热度榜、搜索热度榜以及资讯热度榜等,通过这些热度榜单信息的展示使得用户可以掌握股票相关的资讯情况。
在相关技术方案中,目前股票的榜单信息是一天计算一次进而进行更新,若采用该种更新方式,则无法抓住新股或者盘中热度激增的股票,从而导致股票热度榜整体信息比较滞后。
发明内容
本申请的目的在于提供一种榜单信息的处理方法、装置、计算机可读介质及电子设备,在一定程度上可以实现榜单信息的及时更新。
根据本申请实施例的一个方面,提供一种榜单信息的处理方法,所述方法包括:
从数据库中获取用户应用数据,所述用户应用数据包括交易数据、搜索数据以及资讯数据中的至少一种;
根据所述用户应用数据和不同时间段的用户应用数据所对应的权重值,计算各个虚拟资源在各个类型数据下的原始热度值;
将同一分组下各个虚拟资源对应的所述原始热度值进行归一化处理,得到统一格式的热度值;
根据所述统一格式的热度值,对所述虚拟资源进行分组展示。
根据本申请实施例的一个方面,提供一种榜单信息的处理装置,所述装置包括:
获取模块,用于从数据库中获取用户应用数据,所述用户应用数据包括交易数据、搜索数据以及资讯数据中的至少一种;
计算模块,用于根据所述用户应用数据和不同时间段的用户应用数据所对应的权重值,计算各个虚拟资源在各个类型数据下的原始热度值;
归一化模块,用于将同一分组下各个虚拟资源对应的所述原始热度值进行归一化处理,得到统一格式的热度值;
更新模块,用于根据所述统一格式的热度值,对所述虚拟资源进行分组展示。
在本申请的一些实施例中,基于以上技术方案,所述装置还包括设置模块,用于获取各个时间段距离当前时刻的时长;根据各个时间段距离当前时刻的时长设置各个用户应用数据所对应的权重值,其中,距离所述当前时刻越近的所述时间段,所述权重值设置得越大。
在本申请的一些实施例中,基于以上技术方案,所述用户应用数据包括交易数据,所述时间段包括第一时间段和第二时间段,所述第一时间段距离当前时刻的时长小于所述第二时间段距离当前时刻的时长;所述计算模块还用于,获取所述第一时间段的第一交易用户数量,以及所述第二时间段的第二交易用户数量;将所述第一交易用户数量对应的权重值设为第一权重值,将所述第二交易用户数量对应的权重值设为第二权重值,所述第一权重值大于所述第二权重值;将所述第一权重值与所述第一交易用户数量、以及所述第二权重值、所述第二交易用户数量进行加权求和,计算得到各个虚拟资源的原始交易热度值。
在本申请的一些实施例中,基于以上技术方案,所述用户应用数据包括搜索数据,所述时间段包括第一时间段和第二时间段,所述第一时间段距离当前时刻的时长小于所述第二时间段距离当前时刻的时长;所述计算模块还用于,获取所述第一时间段的第一搜索用户数量,以及所述第二时间段的第二搜索用户数量;将所述第一搜索用户数量对应的权重值设为第一权重值,将所述第二搜索用户数量对应的权重值设为第二权重值,所述第一权重值大于所述第二权重值;根据所述第一权重值与所述第一搜索用户数量、以及所述第二权重值、所述第二搜索用户数量进行加权求和,计算得到各个虚拟资源的原始搜索热度值。
在本申请的一些实施例中,基于以上技术方案,所述用户应用数据包括资讯数据,所述时间段包括第一时间段和第二时间段,所述第一时间段距离当前时刻的时长小于所述第二时间段距离当前时刻的时长;所述计算模块还用于,获取所述第一时间段的第一阅读用户数量,以及所述第二时间段的第二阅读用户数量;将所述第一阅读用户数量对应的权重值设为第一权重值,将所述第二阅读用户数量对应的权重值设为第二权重值,所述第一权重值大于所述第二权重值;根据所述第一权重值与所述第一阅读用户数量、以及所述第二权重值、所述第一阅读用户数量进行加权求和,计算得到各个虚拟资源的原始资讯热度值。
在本申请的一些实施例中,基于以上技术方案,所述归一化模块还用于,获取与所述虚拟资源对应的信息表;基于所述信息表,确定所述虚拟资源对应的证券市场;根据所述虚拟资源对应的证券市场对所述虚拟资源进行分组,得到属于同一证券市场的虚拟资源;将同一证券市场下的所述虚拟资源对应的所述原始热度值,进行归一化处理,所述得到统一格式的热度值。
在本申请的一些实施例中,基于以上技术方案,所述归一化模块还用于,从所述原始热度值中选择最大原始热度值和最小原始热度值;计算待归一化的原始热度值与所述最小原始热度值之间的差值,得到第一差值;计算所述最大原始热度值和所述最小原始热度值之间的差值,得到第二差值;根据所述第一差值与所述第二差值之间的比值,得到所述统一格式的热度值。
根据本申请实施例的一个方面,提供一种计算机可读介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如以上技术方案中的榜单信息的处理方法。
根据本申请实施例的一个方面,提供一种电子设备,该电子设备包括:处理器;以及存储器,用于存储所述处理器的可执行指令;其中,所述处理器被配置为经由执行所述可执行指令来执行如以上技术方案中的榜单信息的处理方法。
根据本申请实施例的一个方面,提供一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行如以上技术方案中的榜单信息的处理方法。
在本申请实施例提供的技术方案中,对不同时间段对应的用户应用数据设置不同的权重值,基于用户应用数据以及其所对应的权重值计算得到各个虚拟资源在各个类型数据下的原始热度值,然后将同一分组下得到的原始热度值进行归一化处理,得到统一格式的热度值,最后,根据统一格式的热度值,对虚拟资源进行分组展示。这样,实现了虚拟资源的实时更新,从而有利于用户掌握虚拟资源的实时变化情况。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本申请。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示意性地示出了应用本申请技术方案的示例性系统架构框图。
图2示意性地示出了本申请一实施例提供的榜单信息的处理方法步骤流程。
图3示意性地示出了本申请一实施例提供的虚拟资源按照市场分组展示的示意图。
图4示意性地示出了本申请一实施例提供的搜索热度榜示意图。
图5示意性地示出了本申请另一实施例提供的榜单信息的处理方法步骤流程。
图6示意性地示出了本申请实施例提供的榜单信息的处理装置的结构框图。
图7示意性示出了适于用来实现本申请实施例的电子设备的计算机系统结构框图。
具体实施方式
现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本申请将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。
此外,所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施例中。在下面的描述中,提供许多具体细节从而给出对本申请的实施例的充分理解。然而,本领域技术人员将意识到,可以实践本申请的技术方案而没有特定细节中的一个或更多,或者可以采用其它的方法、组元、装置、步骤等。在其它情况下,不详细示出或描述公知方法、装置、实现或者操作以避免模糊本申请的各方面。
附图中所示的方框图仅仅是功能实体,不一定必须与物理上独立的实体相对应。即,可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
附图中所示的流程图仅是示例性说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解,而有的操作/步骤可以合并或部分合并,因此实际执行的顺序有可能根据实际情况改变。
在相关技术方案中,虚拟资源以股票为例,目前股票的榜单信息是一天计算一次进而进行更新,若采用该种更新方式,则无法抓住新股或者盘中热度激增的股票,从而导致股票热度榜整体信息比较滞后。
因此,在虚拟资源的榜单数据的场景中,本申请实时例提出了一种榜单信息的处理方法。参见图1,图1示意性地示出了应用本申请技术方案的示例性系统架构框图。该客户端110和服务端120,客户端110和服务端120之间通过有线或者无线网络进行通信。客户端110中运行有虚拟资源相关的应用程序,应用程序中设置有虚拟资源相应的热榜,用于展示热度较高的一些资讯信息,用户可以在应用程序上可以查看虚拟资源的相关资讯信息。
其中,客户端110可以是智能手机、平板、笔记本电脑、计算机等任意能够运行视频播放客户端的电子设备,服务端120可以是独立的物理服务端,也可以是多个物理服务端构成的服务端集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN(Content Delivery Network,内容分发网络)以及大数据和人工智能平台等基础云计算服务的云服务端,本处不对此进行限制。
服务端120从数据库中获取用户应用数据,用户应用数据包括交易数据、搜索数据以及资讯数据中的至少一种;根据用户应用数据和不同时间段的用户应用数据所对应的权重值,计算各个虚拟资源在各个类型数据下的原始热度值;将同一分组下各个虚拟资源对应的原始热度值进行归一化处理,得到统一格式的热度值;根据统一格式的热度值,对虚拟资源进行分组展示。客户端110发送榜单刷新请求至服务端120;相应地,服务端120还根据榜单刷新请求获取更新后的榜单列表,并发送更新后的榜单列表至客户端110;相应地,客户端110还接收更新后的榜单列表,并展示更新后的榜单列表中含有的多个资讯信息。
通过实施本申请实施例的技术方案,对不同时间段对应的用户应用数据设置不同的权重值,基于用户应用数据以及其所对应的权重值计算得到各个虚拟资源在各个类型数据下的原始热度值,然后将同一分组下得到的原始热度值进行归一化处理,得到统一格式的热度值,最后,根据统一格式的热度值,对虚拟资源进行分组展示。这样,实现了基于原始热度值对虚拟资源的实时更新,从而有利于用户掌握虚拟资源的实时变化情况。
可以理解的是,在本申请的具体实施方式中,涉及到账户信息、用户数据等相关的数据,当本申请实施例运用到具体产品或技术中时,需要获得用户许可、同意或者授权,且相关数据的收集、使用和处理遵守相关国家和地区的相关法律法规和标准。
需要说明的是,本实施例中的虚拟资源可以包括股票、基金、期权等等交易品类;并且,虚拟资源对应的交易市场可以包括澳大利亚、美国、新加坡等等证券市场。
下面结合具体实施方式对本申请提供的榜单信息的处理方法、装置、计算机可读介质及电子设备做出详细说明。
参见图2,图2示意性地示出了本申请一实施例提供的榜单信息的处理方法步骤流程。该榜单信息的处理方法的执行主体可以为服务端,主要可以包括如下的步骤S201至步骤S204。
步骤S201,从数据库中获取用户应用数据,用户应用数据包括交易数据、搜索数据以及资讯数据中的至少一种。
从数据库中获取用户应用数据,用户应用数据可以包括交易数据、搜索数据以及咨询数据中的其中一种数据,或者其中两种数据或者这三种数据都包括。例如,当用户应用数据包括交易数据时,交易数据为当前交易日累计的交易用户数,当用户应用数据包括搜索数据时,搜索数据为当前交易日累计的搜素用户数量,当用户应用数据包括资讯数据时,资讯数据为当前交易日累计的阅读用户数量。其中,这些用户应用数据的具体来源可以是数据仓库的交易订单表、记录用户的搜索股票行为的罗盘搜索事件以及记录用户的浏览股票相关资讯行为的罗盘资讯事件。通过获取用户应用数据,且该用户应用数据均为当前交易日累积的用户应用数据,从而有利于根据这些用户应用数据对榜单信息进行实时更新。
需要说明的是,上述数据和计算过程为根据当天获取到的数据计算,以便于当天实时更新榜单信息。
步骤S202,根据用户应用数据和不同时间段的用户应用数据所对应的权重值,计算各个虚拟资源在各个类型数据下的原始热度值。
不同的时间段下的用户应用数据对应的权重值不同,根据用户应用数据以及其对应的权重值进行加权求和,从而可以计算虚拟资源的原始热度值。以用户应用数据包括交易数据为例,时间段包括第一时间段和第二时间段,第一时间段可以为距离当前时刻最近3分钟至最近30分钟的时间范围,第二时间段则为在3分钟到30分钟之前的时间段,例如距离当前时刻最近3分钟为第一时间段,则在3分钟之前的时间段称为第二时间段,假设第一时间段累计的交易用户数为X1,第二时间段累计的交易用户数为X2,则可以将第一时间段的权重值设置范围可以为1.1-1.5,第二时间段的权重值的范围可以设置为0.8-1.05,则得到原始交易热度值为:第一权重值*X1+第二权重值*X2。同样地,其他类型数据下的原始热度值以同样的方式进行计算,在此不予赘述。这样,基于用户应用数据以及其所对应的权重值计算得到各个虚拟资源在各个类型数据下的原始热度值,从而有利于反应虚拟资源的实时变化情况。
进一步的,本实施例中可以通过获取第一时间段对应的访问时长Dur_acc_、交易次数Num_tra以及评论次数Num_com,基于上述信息计算第一时间段对应的权重值Wei(t)为:
Wei(t)=α·Num_com·log2Dur_acc+β·Num_tra
其中,α、β用于表示预设的权重参数,通过上述结合访问时长、交易次数以及评论次数的方式衡量权重值,得到更能表示标的热度的数据,使得标的热度的计算和展示更加全面和精确。
需要说明的是,不同类型数据下,相同时间段下对应权重值可以设置相同,也可以设置不同,本领域技术人员可以根据实际需要进行设定,在此不予限制。
步骤S203,将同一分组下各个虚拟资源对应的原始热度值进行归一化处理,得到统一格式的热度值。
由于不同评价指标往往具有不同的量纲和量纲单位,这样的情况会影响到数据分析的结果。为了消除指标之间的量纲影响,需要进行数据标准化处理,以解决数据指标之间的可比性。因此,将同一分组下各个虚拟资源对应的原始热度值进行归一化处理,得到统一格式的热度值,原始数据经过数据标准化处理后,各指标处于同一数量级,适合进行综合对比评价,从而有利于掌握虚拟资源的变化情况。
步骤S204,根据统一格式的热度值,对虚拟资源进行分组展示。
在计算得到统一格式的热度值之后,对虚拟资源按照分组进行展示,例如可以按照同一证券市场对虚拟资源进行展示,这样,通过展示结果可以掌握虚拟资源的变化情况。
在本申请实施例提供的技术方案中,对不同时间段对应的用户应用数据设置不同的权重值,基于用户应用数据以及其所对应的权重值计算得到各个虚拟资源在各个类型数据下的原始热度值,然后将同一分组下得到的原始热度值进行归一化处理,得到统一格式的热度值,最后,根据统一格式的热度值,对虚拟资源进行分组展示。这样,实现了基于原始热度值对虚拟资源的实时更新,从而有利于用户掌握虚拟资源的实时变化情况。另外,本申请通过实时计算解决了离线计算信息滞后的缺点,可以让用户更容易发现盘中热度激增的虚拟资源。
在本申请的一个实施例中,在对不同时间段对应的用户应用数据设置不同的权重值是,该方法还包括:
获取各个时间段距离当前时刻的时长;
根据各个时间段距离当前时刻的时长设置各个用户应用数据所对应的权重值,其中,距离当前时刻越近的时间段,权重值设置得越大。
为了便于理解本申请的实施例,以时间段包括第一时间段和第二时间段为例,其中,第一时间段可以设置为距离当前时刻5分钟的时间段,第二时间段可以设置为距离当前时刻大于5分钟的时间段,假设当前时间为中午12点,则第一时间段为11点55分至12点的这段时间,第二时间段为11点55分之前的时间段。经过对比可知,第一时间段距离当前时刻比较近,此时则将第一时间段对应的权重值设置得比第二时间段对应的权重值的大。这样,通过将最近发生的虚拟资源相关行为权重提高,从而可以更好反映实时热度,以得到实时热度情况更能反映实际情况。
在本申请的一个实施例中,其中,以用户应用数据包括交易数据为例,时间段包括第一时间段和第二时间段,第一时间段距离当前时刻的时长小于第二时间段距离当前时刻的时长。根据用户应用数据和不同时间段的用户应用数据所对应的权重值,计算各个虚拟资源在各个类型数据下的原始热度值,具体可以包括:
获取第一时间段的第一交易用户数量,以及第二时间段的第二交易用户数量;
将第一交易用户数量对应的权重值设为第一权重值,将第二交易用户数量对应的权重值设为第二权重值,第一权重值大于第二权重值;
将第一权重值与第一交易用户数量、以及第二权重值、第二交易用户数量进行加权求和,计算得到各个虚拟资源的原始交易热度值。
在计算原始交易热度值时,还是以距离当前时刻5分钟为第一时间段,在5分钟之前的时间段为第二时间段为例,则将最近5分钟的权重提高,最近5分钟的累积量的权重是其他时间的1.2倍,这样可以反映盘中热度瞬时激增的股票,并在热度榜排序靠前。其中,原始交易热度值的计算公式如下:
原始交易热度值=第一交易用户数量*1.2+第二交易用户数量*1
这样,通过将最近时间段发生的虚拟资源相关行为权重提高,从而可以更好反映实时交易热度,得到实时交易热度情况从而有利于反映实际交易情况。
在本申请的一个实施例中,其中,以用户应用数据包括搜索数据为例,时间段包括第一时间段和第二时间段,第一时间段距离当前时刻的时长小于第二时间段距离当前时刻的时长。根据用户应用数据和不同时间段的用户应用数据所对应的权重值,计算各个虚拟资源在各个类型数据下的原始热度值,具体可以包括:
获取第一时间段的第一搜索用户数量,以及第二时间段的第二搜索用户数量;
将第一搜索用户数量对应的权重值设为第一权重值,将第二搜索用户数量对应的权重值设为第二权重值,第一权重值大于第二权重值;
根据第一权重值与第一搜索用户数量、以及第二权重值、第二搜索用户数量进行加权求和,计算得到各个虚拟资源的原始搜索热度值。
在计算原始搜索热度值时,还是以距离当前时刻5分钟为第一时间段,在5分钟之前的时间段为第二时间段为例,则将最近5分钟的权重提高,最近5分钟的累积量的权重是其他时间的1.2倍,这样可以反映盘中热度瞬时激增的股票,并在热度榜排序靠前。其中,原始搜索热度值的计算公式如下:
原始搜索热度值=第一搜索用户数量*1.2+第二搜索用户数量*1
这样,通过将最近时间段发生的虚拟资源相关行为权重提高,从而可以更好反映实时搜索热度,得到实时搜索热度情况从而有利于反映实际搜索情况。
在本申请的一个实施例中,其中,以用户应用数据包括资讯数据为例,时间段包括第一时间段和第二时间段,第一时间段距离当前时刻的时长小于第二时间段距离当前时刻的时长。根据用户应用数据和不同时间段的用户应用数据所对应的权重值,计算各个虚拟资源在各个类型数据下的原始热度值,具体可以包括:
获取第一时间段的第一阅读用户数量,以及第二时间段的第二阅读用户数量;
将第一阅读用户数量对应的权重值设为第一权重值,将第二阅读用户数量对应的权重值设为第二权重值,第一权重值大于第二权重值;
根据第一权重值与第一阅读用户数量、以及第二权重值、第一阅读用户数量进行加权求和,计算得到各个虚拟资源的原始资讯热度值。
在计算原始资讯热度值时,还是以距离当前时刻5分钟为第一时间段,在5分钟之前的时间段为第二时间段为例,则将最近5分钟的权重提高,最近5分钟的累积量的权重是其他时间的1.2倍,这样可以反映盘中热度瞬时激增的股票,并在热度榜排序靠前。其中,原始资讯热度值的计算公式如下:
原始资讯热度值=第一阅读用户数量*1.2+第一阅读用户数量*1这样,通过将最近时间段发生的虚拟资源相关行为权重提高,从而可以更好反映实时交易热度,得到实时交易热度情况从而有利于反映实际交易情况。
这样,通过将最近时间段发生的虚拟资源相关行为权重提高,从而可以更好反映实时资讯热度,得到实时资讯热度情况从而有利于反映实际资讯情况。
在本申请的一个实施例中,将同一分组下各个虚拟资源对应的原始热度值进行归一化处理,得到统一格式的热度值,包括:
获取与虚拟资源对应的信息表;
基于信息表,确定虚拟资源对应的证券市场;
根据虚拟资源对应的证券市场对虚拟资源进行分组,得到属于同一证券市场的虚拟资源;
将同一证券市场下的虚拟资源对应的原始热度值,进行归一化处理,得到统一格式的热度值。
在计算得到各个虚拟资源在各个类型数据下的原始热度值之后,需要对虚拟资源进行分组。在进行分组时,可以按照虚拟资源所属的证券市场进行分组。在按照所属证券市场进行分组时,具体可以先获取与虚拟资源对应的信息表,其中,信息表中包含虚拟资源的唯一标识符、所对应的证券市场、所对应的证券类型以及交易所挂牌代码等。通过获取信息表,从而可以确定虚拟资源对应的证券市场,然后根据虚拟资源对应的证券市场对虚拟资源进行分组,得到属于同一证券市场的虚拟资源。最后,将同一证券市场下的虚拟资源对应的原始热度值,进行归一化处理,得到统一格式的热度值,从而有利于展示同一证券市场的虚拟资源变化情况。参见图4,图3示意性地示出了本申请一实施例提供的虚拟资源按照市场分组展示的示意图。当然,在进行分组时,也可以不按照同一证券市场进行分组,也可以按照证券的类型进行分组,本领域技术人员可以根据实际需要进行分组。
在本申请的一个实施例中,将同一证券市场下的虚拟资源对应的原始热度值,进行归一化处理,得到统一格式的热度值,具体可以包括:
从原始热度值中选择最大原始热度值和最小原始热度值;
计算待归一化的原始热度值与最小原始热度值之间的差值,得到第一差值;
计算最大原始热度值和最小原始热度值之间的差值,得到第二差值;
根据第一差值与第二差值之间的比值,得到统一格式的热度值。
由于,不同评价指标往往具有不同的量纲和量纲单位,这样的情况会影响到数据分析的结果,为了消除指标之间的量纲影响,需要进行数据标准化处理,以解决数据指标之间的可比性。原始数据经过数据标准化处理后,各指标处于同一数量级,适合进行综合对比评价。三个热度的量级可能不同,所以要进行标准化处理,本申请实施例采用的是min-max标准化方法来实现归一化,其中,min-max标准化处理指的是对原始数据的线性变换,使结果值映射到[0-1]之间。
具体地,参见图4,图4示意性地示出了本申请一实施例提供的搜索热度榜示意图。以搜索热度为例,假设某一市场分组所有股票原始搜索热度为x1,x2,x3,x4,..,xn,其中,该市场分组原始股票搜索热度最小值为min,最大值为max,则对该市场分组某个股票i待归一化的原始搜索热度xi进行标准化处理结果为zi:
min=min(x1,x2,x3,x4,..,xn)
max=max(x1,x2,x3,x4,..,xn)
该将zi乘以100,得到最终的搜索热度:
z′i=zi*100
得到搜索热搜榜的榜单信息。
这样,通过对原始热度值进行归一化处理,以消除指标之间的量纲影响,以解决数据指标之间的可比性,从而有利于对结果的分析。
为了便于从整体上理解本申请的技术方案,参见图5,图5示意性地示出了本申请另一实施例提供的榜单信息的处理方法步骤流程。先获取来自于数据仓库的交易订单表、记录用户的搜索股票行为的罗盘搜索事件、记录用户的浏览股票相关资讯行为的罗盘资讯事件。其中,通过获取交易订单表用来计算原始交易热度,获取罗盘搜索事件用来计算原始搜索热度,获取罗盘资讯事件用来计算原始资讯热度。其次,为了让不同数据来源的股票有唯一的股票标识符,还需要标的信息表,其中,标的信息表包含有不同证券市场的股票的唯一标识符、股票的证券市场、股票的证券类型、股票交易所挂牌代码等。先用交易订单表、罗盘搜索事件和罗盘资讯事件先计算出原始的三个热度,然后分别和标的信息表联接,得到标的的唯一标识和所在的证券市场,因为实时股票热度榜是按不同证券市场来展示的,所以需要进一步按标的所在的证券市场和标的的唯一标识来分组,之后利用min-max标准化处理,最终将处理后的结果给到行情按不同市场展示热度榜。
应当注意,尽管在附图中以特定顺序描述了本申请中方法的各个步骤,但是,这并非要求或者暗示必须按照该特定顺序来执行这些步骤,或是必须执行全部所示的步骤才能实现期望的结果。附加的或备选的,可以省略某些步骤,将多个步骤合并为一个步骤执行,以及/或者将一个步骤分解为多个步骤执行等。
以下介绍本申请的装置实施例,可以用于执行本申请上述实施例中的榜单信息的处理方法。图6示意性地示出了本申请实施例提供的榜单信息的处理装置的结构框图。如图6所示,榜单信息的处理装置600包括:
获取模块601,用于从数据库中获取用户应用数据,用户应用数据包括交易数据、搜索数据以及资讯数据中的至少一种;
计算模块602,用于根据用户应用数据和不同时间段的用户应用数据所对应的权重值,计算各个虚拟资源在各个类型数据下的原始热度值;
归一化模块603,用于将同一分组下各个虚拟资源对应的原始热度值进行归一化处理,得到统一格式的热度值;
更新模块604,用于根据统一格式的热度值,对虚拟资源进行分组展示。
在本申请的一些实施例中,基于以上技术方案,装置还包括设置模块,用于获取各个时间段距离当前时刻的时长;根据各个时间段距离当前时刻的时长设置各个用户应用数据所对应的权重值,其中,距离当前时刻越近的时间段,权重值设置得越大。
在本申请的一些实施例中,基于以上技术方案,用户应用数据包括交易数据,时间段包括第一时间段和第二时间段,第一时间段距离当前时刻的时长小于第二时间段距离当前时刻的时长;计算模块602还用于,获取第一时间段的第一交易用户数量,以及第二时间段的第二交易用户数量;将第一交易用户数量对应的权重值设为第一权重值,将第二交易用户数量对应的权重值设为第二权重值,第一权重值大于第二权重值;将第一权重值与第一交易用户数量、以及第二权重值、第二交易用户数量进行加权求和,计算得到各个虚拟资源的原始交易热度值。
在本申请的一些实施例中,基于以上技术方案,用户应用数据包括搜索数据,时间段包括第一时间段和第二时间段,第一时间段距离当前时刻的时长小于第二时间段距离当前时刻的时长;计算模块602还用于,获取第一时间段的第一搜索用户数量,以及第二时间段的第二搜索用户数量;将第一搜索用户数量对应的权重值设为第一权重值,将第二搜索用户数量对应的权重值设为第二权重值,第一权重值大于第二权重值;根据第一权重值与第一搜索用户数量、以及第二权重值、第二搜索用户数量进行加权求和,计算得到各个虚拟资源的原始搜索热度值。
在本申请的一些实施例中,基于以上技术方案,用户应用数据包括资讯数据,时间段包括第一时间段和第二时间段,第一时间段距离当前时刻的时长小于第二时间段距离当前时刻的时长;计算模块602还用于,获取第一时间段的第一阅读用户数量,以及第二时间段的第二阅读用户数量;将第一阅读用户数量对应的权重值设为第一权重值,将第二阅读用户数量对应的权重值设为第二权重值,第一权重值大于第二权重值;根据第一权重值与第一阅读用户数量、以及第二权重值、第一阅读用户数量进行加权求和,计算得到各个虚拟资源的原始资讯热度值。
在本申请的一些实施例中,基于以上技术方案,归一化模块603还用于,获取与虚拟资源对应的信息表;基于信息表,确定虚拟资源对应的证券市场;根据虚拟资源对应的证券市场对虚拟资源进行分组,得到属于同一证券市场的虚拟资源;将同一证券市场下的虚拟资源对应的原始热度值,进行归一化处理,得到统一格式的热度值。
在本申请的一些实施例中,基于以上技术方案,归一化模块603还用于,从原始热度值中选择最大原始热度值和最小原始热度值;计算待归一化的原始热度值与最小原始热度值之间的差值,得到第一差值;计算最大原始热度值和最小原始热度值之间的差值,得到第二差值;根据第一差值与第二差值之间的比值,得到统一格式的热度值。
本申请各实施例中提供的榜单信息的处理装置的具体细节已经在对应的方法实施例中进行了详细的描述,此处不再赘述。
图7示意性地示出了用于实现本申请实施例的电子设备的计算机系统结构框图。
需要说明的是,图7示出的电子设备的计算机系统700仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。
如图7所示,计算机系统700包括中央处理器701(Central Processing Unit,CPU),其可以根据存储在只读存储器702(Read-Only Memory,ROM)中的程序或者从存储部分708加载到随机访问存储器703(Random Access Memory,RAM)中的程序而执行各种适当的动作和处理。在随机访问存储器703中,还存储有系统操作所需的各种程序和数据。中央处理器701、在只读存储器702以及随机访问存储器703通过总线704彼此相连。输入/输出接口705(Input/Output接口,即I/O接口)也连接至总线704。
以下部件连接至输入/输出接口705:包括键盘、鼠标等的输入部分706;包括诸如阴极射线管(Cathode Ray Tube,CRT)、液晶显示器(Liquid Crystal Display,LCD)等以及扬声器等的输出部分707;包括硬盘等的存储部分708;以及包括诸如局域网卡、调制解调器等的网络接口卡的通信部分709。通信部分709经由诸如因特网的网络执行通信处理。驱动器710也根据需要连接至输入/输出接口705。可拆卸介质711,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器710上,以便于从其上读出的计算机程序根据需要被安装入存储部分708。
特别地,根据本申请的实施例,各个方法流程图中所描述的过程可以被实现为计算机软件程序。例如,本申请的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分709从网络上被下载和安装,和/或从可拆卸介质711被安装。在该计算机程序被中央处理器701执行时,执行本申请的系统中限定的各种功能。
需要说明的是,本申请实施例所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(Erasable Programmable Read Only Memory,EPROM)、闪存、光纤、便携式紧凑磁盘只读存储器(Compact Disc Read-Only Memory,CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本申请中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本申请中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、有线等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本申请各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
应当注意,尽管在上文详细描述中提及了用于动作执行的设备的若干模块或者单元,但是这种划分并非强制性的。实际上,根据本申请的实施方式,上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之,上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。
通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本申请实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、触控终端、或者网络设备等)执行根据本申请实施方式的方法。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本申请的其它实施方案。本申请旨在涵盖本申请的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本申请的一般性原理并包括本申请未公开的本技术领域中的公知常识或惯用技术手段。
应当理解的是,本申请并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本申请的范围仅由所附的权利要求来限制。
Claims (10)
1.一种榜单信息的处理方法,其特征在于,所述方法包括:
从数据库中获取用户应用数据,所述用户应用数据包括交易数据、搜索数据以及资讯数据中的至少一种;
根据所述用户应用数据和不同时间段的用户应用数据所对应的权重值,计算各个虚拟资源在各个类型数据下的原始热度值;
将同一分组下各个虚拟资源对应的所述原始热度值进行归一化处理,得到统一格式的热度值;
根据所述统一格式的热度值,对所述虚拟资源进行分组展示。
2.根据权利要求1所述的榜单信息的处理方法,其特征在于,所述方法还包括:
获取各个时间段距离当前时刻的时长;
根据各个时间段距离当前时刻的时长设置各个用户应用数据所对应的权重值,其中,距离所述当前时刻越近的所述时间段,所述权重值设置得越大。
3.根据权利要求1所述的榜单信息的处理方法,其特征在于,所述用户应用数据包括交易数据,所述时间段包括第一时间段和第二时间段,所述第一时间段距离当前时刻的时长小于所述第二时间段距离当前时刻的时长;
所述根据所述用户应用数据和不同时间段的用户应用数据所对应的权重值,计算各个虚拟资源在各个类型数据下的原始热度值,包括:
获取所述第一时间段的第一交易用户数量,以及所述第二时间段的第二交易用户数量;
将所述第一交易用户数量对应的权重值设为第一权重值,将所述第二交易用户数量对应的权重值设为第二权重值,所述第一权重值大于所述第二权重值;
将所述第一权重值与所述第一交易用户数量、以及所述第二权重值、所述第二交易用户数量进行加权求和,计算得到各个虚拟资源的原始交易热度值。
4.根据权利要求1所述的榜单信息的处理方法,其特征在于,所述用户应用数据包括搜索数据,所述时间段包括第一时间段和第二时间段,所述第一时间段距离当前时刻的时长小于所述第二时间段距离当前时刻的时长;
所述根据所述用户应用数据和不同时间段的用户应用数据所对应的权重值,计算各个虚拟资源在各个类型数据下的原始热度值,包括:
获取所述第一时间段的第一搜索用户数量,以及所述第二时间段的第二搜索用户数量;
将所述第一搜索用户数量对应的权重值设为第一权重值,将所述第二搜索用户数量对应的权重值设为第二权重值,所述第一权重值大于所述第二权重值;
根据所述第一权重值与所述第一搜索用户数量、以及所述第二权重值、所述第二搜索用户数量进行加权求和,计算得到各个虚拟资源的原始搜索热度值。
5.根据权利要求1所述的榜单信息的处理方法,其特征在于,所述用户应用数据包括资讯数据,所述时间段包括第一时间段和第二时间段,所述第一时间段距离当前时刻的时长小于所述第二时间段距离当前时刻的时长;
所述根据所述用户应用数据和不同时间段的用户应用数据所对应的权重值,计算各个虚拟资源在各个类型数据下的原始热度值,包括:
获取所述第一时间段的第一阅读用户数量,以及所述第二时间段的第二阅读用户数量;
将所述第一阅读用户数量对应的权重值设为第一权重值,将所述第二阅读用户数量对应的权重值设为第二权重值,所述第一权重值大于所述第二权重值;
根据所述第一权重值与所述第一阅读用户数量、以及所述第二权重值、所述第一阅读用户数量进行加权求和,计算得到各个虚拟资源的原始资讯热度值。
6.根据权利要求1所述的榜单信息的处理方法,其特征在于,所述将同一分组下各个虚拟资源对应的所述原始热度值进行归一化处理,得到统一格式的热度值,包括:
获取与所述虚拟资源对应的信息表;
基于所述信息表,确定所述虚拟资源对应的证券市场;
根据所述虚拟资源对应的证券市场对所述虚拟资源进行分组,得到属于同一证券市场的虚拟资源;
将同一证券市场下的所述虚拟资源对应的所述原始热度值,进行归一化处理,所述得到统一格式的热度值。
7.根据权利要求6所述的榜单信息的处理方法,其特征在于,所述将同一证券市场下的所述虚拟资源对应的所述原始热度值,进行归一化处理,所述得到统一格式的热度值,包括:
从所述原始热度值中选择最大原始热度值和最小原始热度值;
计算待归一化的原始热度值与所述最小原始热度值之间的差值,得到第一差值;
计算所述最大原始热度值和所述最小原始热度值之间的差值,得到第二差值;
根据所述第一差值与所述第二差值之间的比值,得到所述统一格式的热度值。
8.一种榜单信息的处理装置,其特征在于,所述装置包括:
获取模块,用于从数据库中获取用户应用数据,所述用户应用数据包括交易数据、搜索数据以及资讯数据中的至少一种;
计算模块,用于根据所述用户应用数据和不同时间段的用户应用数据所对应的权重值,计算各个虚拟资源在各个类型数据下的原始热度值;
归一化模块,用于将同一分组下各个虚拟资源对应的所述原始热度值进行归一化处理,得到统一格式的热度值;
更新模块,用于根据所述统一格式的热度值,对所述虚拟资源进行分组展示。
9.一种计算机可读介质,其特征在于,所述计算机可读介质上存储有计算机程序,该计算机程序被处理器执行时实现权利要求1至7中任意一项所述的榜单信息的处理方法。
10.一种电子设备,其特征在于,包括:
处理器;以及
存储器,用于存储所述处理器的可执行指令;
其中,所述处理器配置为经由执行所述可执行指令来执行权利要求1至7中任意一项所述的榜单信息的处理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211319705.0A CN115689749A (zh) | 2022-10-26 | 2022-10-26 | 榜单信息的处理方法、装置、计算机可读介质及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211319705.0A CN115689749A (zh) | 2022-10-26 | 2022-10-26 | 榜单信息的处理方法、装置、计算机可读介质及电子设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115689749A true CN115689749A (zh) | 2023-02-03 |
Family
ID=85098844
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211319705.0A Pending CN115689749A (zh) | 2022-10-26 | 2022-10-26 | 榜单信息的处理方法、装置、计算机可读介质及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115689749A (zh) |
-
2022
- 2022-10-26 CN CN202211319705.0A patent/CN115689749A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20190012683A1 (en) | Method for predicting purchase probability based on behavior sequence of user and apparatus for the same | |
CN112800095B (zh) | 一种数据处理方法、装置、设备及存储介质 | |
CN109359812A (zh) | 理财产品推荐方法、服务器及计算机可读存储介质 | |
CN112287244A (zh) | 基于联邦学习的产品推荐方法、装置、计算机设备及介质 | |
CN113032682A (zh) | 基于协同过滤的产品推荐方法、装置、设备及存储介质 | |
CN111612581A (zh) | 一种物品推荐的方法、装置、设备及存储介质 | |
CN113836131A (zh) | 一种大数据清洗方法、装置、计算机设备及存储介质 | |
WO2022089235A1 (zh) | 产品的演示方法、装置、计算机设备及存储介质 | |
CN112346951A (zh) | 业务的测试方法及装置 | |
CN109785149A (zh) | 保障数据的分析装置、方法及存储介质 | |
CN114445102A (zh) | 报价数据处理方法及装置 | |
CN114115796A (zh) | 数据处理方法、装置、计算机可读介质及电子设备 | |
CN109785039A (zh) | 信息推荐的装置、方法及存储介质 | |
CN115689749A (zh) | 榜单信息的处理方法、装置、计算机可读介质及电子设备 | |
CN113792039B (zh) | 数据处理方法及装置、电子设备、存储介质 | |
CN114925275A (zh) | 产品推荐方法、装置、计算机设备及存储介质 | |
CN114925050A (zh) | 基于知识库的数据核查方法、装置、电子设备及存储介质 | |
CN113961797A (zh) | 资源推荐方法、装置、电子设备和可读存储介质 | |
CN110544165A (zh) | 一种信用风险评分卡创建方法、装置及电子设备 | |
US11989243B2 (en) | Ranking similar users based on values and personal journeys | |
CN113515713B (zh) | 网页缓存策略生成方法及装置、网页缓存方法及装置 | |
CN114253951B (zh) | 数据处理方法、系统及第二服务器 | |
CN110648208B (zh) | 群组识别方法、装置和电子设备 | |
CN115729974A (zh) | 数据处理方法及装置、电子设备、计算机可读存储介质 | |
CN115659167A (zh) | 多特征库合并方法及装置、设备、计算机可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |