CN113918799A - 基于数字历史信息系统的热搜榜排序方法 - Google Patents
基于数字历史信息系统的热搜榜排序方法 Download PDFInfo
- Publication number
- CN113918799A CN113918799A CN202111260057.1A CN202111260057A CN113918799A CN 113918799 A CN113918799 A CN 113918799A CN 202111260057 A CN202111260057 A CN 202111260057A CN 113918799 A CN113918799 A CN 113918799A
- Authority
- CN
- China
- Prior art keywords
- search
- information
- content
- time
- hot
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 28
- 238000004364 calculation method Methods 0.000 claims abstract description 28
- 230000003247 decreasing effect Effects 0.000 claims description 8
- 238000012163 sequencing technique Methods 0.000 abstract 1
- 230000006399 behavior Effects 0.000 description 10
- 230000009286 beneficial effect Effects 0.000 description 7
- 230000000694 effects Effects 0.000 description 5
- 230000032683 aging Effects 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供了一种基于数字历史信息系统的热搜榜排序方法。该方法包括:记录用户于数字历史信息系统中的每一搜索行为而获得相应的搜索数据,搜索数据包括搜索内容、搜索时间以及用户信息;计算搜索数据中所包括的所有搜索内容的热度值;基于各搜索内容最后一次被搜索到的搜索时间对各搜索内容的热度值进行基于时间的衰减计算;依据经衰减计算后的热度值对所有搜索内容进行排序,生成热搜榜。本发明使得热搜榜中的搜索内容不但能够自动产生,亦能够随时间进行自动调整,因而能够动态反映热点的变化。
Description
技术领域
本发明涉及数字化应用技术领域,具体涉及一种基于数字历史信息系统的热搜榜排序方法。
背景技术
各种信息系统均需要搜索功能,数字历史信息系统亦不例外。在企业数字化发展过程中,将企业历史进行数字化变成数字历史,从而形成数字历史信息系统,在很大程度上加速了信息的流动,进而加速了企业文化的传播和展示。然而,在大量的数据面前,如何让用户更快速、更精准地获取自己喜闻乐见的内容却并不是一件容易的事,通过搜索框来进行关键字搜索虽然也能得出一定的结果,但这些结果都是静态的,在数字化浪潮下,这种搜索方法无法让数据发挥更大的价值。用户不仅需要搜索,而且需要热搜榜的自动呈现来为其提供更多的信息。
热搜榜是利用数据和数据之间的联系、数据和用户之间的联系以及数据和时事之间的联系,通过一定的计算方法,将当前大部分用户关注的内容进行排序并提取摘要,以这些内容摘要作为候选关键字予以呈现,能极大方便用户进行内容获取,提升使用体验。然而,现有热搜榜通常是根据关键字的搜索频率进行排序得出,虽然能满足一定的需求,但不能随着时间和环境的变化而变化,极端情况下会出现一些搜索内容长期霸榜的现象,有待改善。
发明内容
本发明实施例所要解决的技术问题在于,提供一种能够随时间动态调整的基于数字历史信息系统的热搜榜排序方法。
为解决上述技术问题,本发明实施例提供一种基于数字历史信息系统的热搜榜排序方法,包括:
步骤S1,记录用户于所述数字历史信息系统中的每一搜索行为而获得相应的搜索数据,所述搜索数据包括搜索内容、搜索时间以及用户信息,其中所述搜索内容是在所述数字历史信息系统中进行所述搜索行为所产生的搜索结果;
步骤S2,根据所获得的所有搜索数据,计算搜索数据中所包括的所有搜索内容的热度值,其中各搜索内容的热度值是基于该搜索内容于所获得的所有搜索数据中出现的次数而获得;
步骤S3,根据所述搜索数据所包括的搜索时间,确定各搜索内容最后一次被搜索到的搜索时间,且基于各搜索内容最后一次被搜索到的搜索时间对各搜索内容的热度值进行基于时间的衰减计算;
步骤S4,依据经衰减计算后的热度值对所有搜索内容进行排序,生成热搜榜。
进一步地,所述步骤S2进一步包括计算每一搜索内容的热度值的步骤,包括:
针对每一搜索内容:
逐一查询包括所述搜索内容的搜索数据中的用户信息,其中每一用户信息对应一用户,并判断所述用户信息是否第一次出现:若所述用户信息是第一次出现,则增加所述搜索内容的热度值且增量为一固定值;否则,若所述用户信息不是第一次出现,则增加所述搜索内容的热度值且增量随所述用户信息出现的次数增多而递减;
直到查询完所述搜索内容所在的所有搜索数据。
进一步地,所述基于时间的衰减计算是基于时间的指数衰减计算。
进一步地,所述基于时间的衰减计算是根据所设定的间隔时间与衰减量的对应关系进行衰减计算,所述间隔时间是所述搜索内容最后一次被搜索到的搜索时间与进行所述衰减计算时的时间间隔。
进一步地,所述步骤S4进一步包括:
步骤S41,判断是否存在顶置信息,所述顶置信息是由所述数字历史系统信息的管理员设定,若存在顶置信息,则执行步骤S42;反之,若不存在顶置信息,则执行步骤S43;
步骤S42,将所有搜索内容依据经衰减计算后的热度值从高到低顺序排列于所述顶置信息之后,生成所述热搜榜;
步骤S43,直接将所有搜索内容依据经衰减计算后的热度值从高到低顺序排列,生成所述热搜榜。
进一步地,所述步骤S41进一步包括:若判断存在多个所述顶置信息,则先将所述多个顶置信息按照优先级从高到低顺序进行排列,之后,执行所述步骤S42,其中,所述多个顶置信息的优先级是由所述数字历史系统信息的管理员设定。
进一步地,所述步骤S42进一步包括:判断所有搜索内容中是否存在包含所述顶置信息的搜索内容,当所有搜索内容中存在包含所述顶置信息的搜索内容时,将包含所述顶置信息的搜索内容从所生成的热搜榜中删除。
进一步地,所述搜索行为包括用户于所述数字历史信息系统输入关键字进行搜索,以及用户点击所述数字历史信息系统提供的信息条目。
进一步地,所述信息条目包括所述热搜榜中提供的搜索内容。
实施本发明实施例,具有如下有益效果:本发明所提供的热搜榜排序方法使得热搜榜的搜索内容不但能够自动产生,亦能够随时间进行自动调整,甚至自动消亡,因而能够动态反映热点的变化;而且,本发明在生成热搜榜的过程中引入了对用户因素的考虑,能够降低同一用户频繁搜索同一内容对热度值的影响;此外,本发明还通过供管理员设置或下架顶置信息,来人工调整热搜榜,以利于企业进行活动推广或文化宣传。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例的基于数字历史信息系统的热搜榜排序方法的流程图。
具体实施方式
以下各实施例的说明是参考附图,用以示例本发明可以用以实施的特定实施例。
本发明实施例提供一种基于数字历史信息系统的热搜榜排序方法,其中数字历史信息系统是用于以数字化方法对企业的企业历史信息进行收集保存、查询和展示的系统,可以供用户上传数字历史信息,也可以供用户在系统中对已保存的数字历史信息进行搜索、浏览、收藏、评论、点赞等操作。本发明实施例主要是基于用户于数字历史信息系统中的搜索行为生成热搜榜,也可以同时于热搜榜中加入数字历史系统信息的管理员人工设定的信息,以利于企业进行活动推广或文化宣传。
请参照图1,本发明实施例的基于数字历史信息系统的热搜榜排序方法,包括下列步骤S1-S4。
首先,在步骤S1,记录用户于数字历史信息系统中的每一次搜索行为而获得相应的搜索数据,该搜索数据包括搜索内容(搜索结果)、搜索时间以及用户信息。
具体而言,用户于数字历史信息系统中的搜索行为可以包括用户于数字历史信息系统输入关键字进行搜索,以及用户点击数字历史信息系统提供的信息条目,但不限于此。其中信息条目也可以是热搜榜中提供的热搜条目即搜索内容。搜索内容则是基于用户的搜索行为而于数字历史信息系统所产生的搜索结果,而每一用户信息对应一用户。
在步骤S2,根据所获得的所有搜索数据,计算搜索数据中所包括的所有搜索内容的热度值,其中各搜索内容的热度值是基于该搜索内容于所获得的所有搜索数据中出现的次数而获得。
具体而言,上述所有搜索数据包括在数字历史信息系统中有上述搜索行为的所有用户的每一次搜索行为所产生的搜索数据。本发明实施例以搜索内容在所有搜索数据中出现的次数为基础,计算热度值,搜索内容出现的次数越多,其热度值越高,热度值可以随出现的次数线性递增。
进一步地,在计算热度值时,本发明实施例还可以结合用户信息,对同一用户针对同一搜索内容的多次搜索行为对热度值的影响进行限制,以防止同一用户频繁搜索同一内容导致其热度值突增。
因此,在一实施例中,步骤S2中计算每一搜索内容的热度值的步骤可以包括:
针对每一搜索内容:
逐一查询包括该搜索内容的搜索数据中的用户信息,并判断用户信息是否第一次出现:若用户信息是第一次出现,则增加搜索内容的热度值且增量为一固定值;否则,若用户信息不是第一次出现,则增加搜索内容的热度值且增量随用户信息出现的次数增多而递减;
直到查询完该搜索内容所在的所有搜索数据。
再以一实施例进行具体说明,即计算每一搜索内容的热度值的步骤可以包括:
设置搜索内容的热度值的初始值,该初始值可以设置为0;
逐一查询包括该搜索内容的搜索数据中的用户信息,并判断该用户信息是否第一次出现:
若用户信息是第一次出现,则增加搜索内容的热度值且增量为1,即将热度值增加1;
若同一用户信息不是第一次出现,则增加搜索内容的热度值但热度值的增量随用户信息出现的次数增多而递减,例如,可以设置:当同一用户信息第二次出现时,增量为0.5,即热度值增加0.5;第三次出现时,增量为0.25,即热度值增加0.25;以此类推,次数每增加一次增量减少一半,当然,也可以有其他设置方式,在此只是举例说明;
直到查询完搜索内容所在的所有搜索数据。
也就是说,对于不同用户的搜索行为产生的同一搜索内容,其热度值可以是该搜索内容于这些用户的搜索数据中出现的次数之和;而当同一用户的多次搜索行为产生同一搜索内容时,该搜索内容的热度值的增量根据该用户的搜索行为的次数逐渐递减。这样,同一用户对同一内容的搜索次数越多,热度值越高,但热度值的增量随次数递减,以防止同一用户频繁搜索同一内容导致其热度值突增。
在获得搜索数据中所包括的所有搜索内容的热度值之后,在步骤S3,根据搜索数据所包括的搜索时间,确定各搜索内容最后一次被搜索到的搜索时间,且基于各搜索内容最后一次被搜索到的搜索时间对各搜索内容的热度值进行基于时间的衰减计算。
由于搜索内容通常只在一段时间内被大量集中关注,随着时间的变化,用户的关注点也随之发生变化,因此本发明实施例在步骤S3对搜索内容的热度值进行衰减计算,也就是老化处理,这种衰减计算可以是基于时间的指数衰减计算。
作为另一种可选实施方式,该基于时间的衰减计算也可以是根据直接设定间隔时间与衰减量的对应关系进行衰减计算,该间隔时间可以是搜索内容最后一次被搜索到的搜索时间与进行所述衰减计算时的时间间隔,例如,若搜索内容最后一次被搜索到的搜索时间距离进行所述衰减计算时已超过24小时,则将搜索内容的热度值减少第一设定值;若已超过48小时,则将搜索内容的热度值减少第二设定值;若已超过72小时,则将搜索内容的热度值减少第三设定值;以此类推,当热度值降到预设值如0.1以下时,直接将热度值设置为初始值如0。
在步骤S4,依据经衰减计算后的热度值对所有搜索内容进行排序,生成热搜榜。
如此,本发明实施例所建立的热搜榜是以搜索内容(搜索结果)在所有搜索数据中出现的次数为基础,综合考虑时间因素和用户因素而获得。
进一步地,本发明实施例还可以同时于热搜榜中加入数字历史系统信息的管理员人工设定的信息,此时,上述步骤S4可以进一步包括:
步骤S41,判断是否存在顶置信息,该顶置信息是由数字历史系统信息的管理员设定,若存在顶置信息,则执行步骤S42;反之,若不存在顶置信息,则执行步骤S43;
步骤S42,将所有搜索内容依据经衰减计算后的热度值从高到低顺序排列于顶置信息之后,生成热搜榜;
步骤S43,直接将所有搜索内容依据经衰减计算后的热度值从高到低顺序排列,生成热搜榜。
在步骤S41中若判断存在多个顶置信息,则先将该多个顶置信息按照优先级从高到低顺序进行排列,之后,再执行步骤S42,其中,该多个顶置信息的优先级是由数字历史系统信息的管理员设定。
步骤S42还可以进一步包括:判断所有搜索内容中是否存在包含顶置信息的搜索内容,当存在包含顶置信息的搜索内容时,将包含顶置信息的搜索内容从所生成的热搜榜中删除。
上述顶置信息可以是管理员所设定的某条历史信息,将其设于热搜榜的最顶部,以利于企业进行活动推广或文化宣传。管理员可以通过设置优先级来区分顶置信息和非顶置信息,例如,顶置信息的优先级大于0,且设置有多条顶置信息时,多条顶置信息的优先级依次增加,在排列于热搜榜时位于热搜榜最顶部的顶置信息的优先级最高;而非顶置信息的优先级设置为0。进一步地,顶置信息也可以由管理员进行下架调整,即不再顶置,亦即其优先级改设为0。
由此,本发明实施例可以通过管理员设置和下架顶置信息对热搜榜进行人工调整,以利于企业进行活动推广或文化宣传。
通过上述说明可知,本发明实施例以搜索内容在所有搜索数据中出现的次数为基础,同时综合考虑时间因素和用户因素,对搜索内容进行热度值计算。首先,搜索内容出现的次数越多,其热度值越高,热度值可以随出现的次数线性递增;同时,本发明实施例考虑时间因素,对热度值进行老化处理:根据搜索内容最后一次被搜索到的搜索时间,对搜索内容的热度值进行基于时间的衰减计算,随着时间间隔变长,搜索内容的热度值会不断降低,从而避免搜索内容长期霸榜的现象;再者,本发明实施例还考虑用户因素,对于同一用户对同一内容进行多次搜索时产生的热度值增量进行限制,具体而言,同一用户对同一内容的搜索次数越多,热度值越高,但热度值的增量会随次数递减,由此以防止同一用户频繁搜索同一内容导致其热度值突增。此外,本发明实施例还可以供后台管理员设置或下架顶置信息,来人工调整热搜榜,以利于企业进行活动推广或文化宣传。
与现有技术相比,本发明的有益效果在于:本发明所提供的热搜榜排序方法使得热搜榜的搜索内容不但能够自动产生,亦能够随时间进行自动调整,甚至自动消亡,因而能够动态反映热点的变化;而且,本发明在生成热搜榜的过程中引入了对用户因素的考虑,能够降低同一用户频繁搜索同一内容对热度值的影响;此外,本发明还通过供管理员设置或下架顶置信息,来人工调整热搜榜,以利于企业进行活动推广或文化宣传。
以上所揭露的仅为本发明较佳实施例而已,当然不能以此来限定本发明之权利范围,因此依本发明权利要求所作的等同变化,仍属本发明所涵盖的范围。
Claims (9)
1.一种基于数字历史信息系统的热搜榜排序方法,其特征在于,包括:
步骤S1,记录用户于所述数字历史信息系统中的每一搜索行为而获得相应的搜索数据,所述搜索数据包括搜索内容、搜索时间以及用户信息,其中所述搜索内容是在所述数字历史信息系统中进行所述搜索行为所产生的搜索结果;
步骤S2,根据所获得的所有搜索数据,计算搜索数据中所包括的所有搜索内容的热度值,其中各搜索内容的热度值是基于该搜索内容于所获得的所有搜索数据中出现的次数而获得;
步骤S3,根据所述搜索数据所包括的搜索时间,确定各搜索内容最后一次被搜索到的搜索时间,且基于各搜索内容最后一次被搜索到的搜索时间对各搜索内容的热度值进行基于时间的衰减计算;
步骤S4,依据经衰减计算后的热度值对所有搜索内容进行排序,生成热搜榜。
2.根据权利要求1所述的方法,其特征在于,所述步骤S2进一步包括计算每一搜索内容的热度值的步骤,包括:
针对每一搜索内容:
逐一查询包括所述搜索内容的搜索数据中的用户信息,其中每一用户信息对应一用户,并判断所述用户信息是否第一次出现:若所述用户信息是第一次出现,则增加所述搜索内容的热度值且增量为一固定值;否则,若所述用户信息不是第一次出现,则增加所述搜索内容的热度值且增量随所述用户信息出现的次数增多而递减;
直到查询完所述搜索内容所在的所有搜索数据。
3.根据权利要求1所述的方法,其特征在于,所述基于时间的衰减计算是基于时间的指数衰减计算。
4.根据权利要求1所述的方法,其特征在于,所述基于时间的衰减计算是根据所设定的间隔时间与衰减量的对应关系进行衰减计算,所述间隔时间是所述搜索内容最后一次被搜索到的搜索时间与进行所述衰减计算时的时间间隔。
5.根据权利要求1所述的方法,其特征在于,所述步骤S4进一步包括:
步骤S41,判断是否存在顶置信息,所述顶置信息是由所述数字历史系统信息的管理员设定,若存在顶置信息,则执行步骤S42;反之,若不存在顶置信息,则执行步骤S43;
步骤S42,将所有搜索内容依据经衰减计算后的热度值从高到低顺序排列于所述顶置信息之后,生成所述热搜榜;
步骤S43,直接将所有搜索内容依据经衰减计算后的热度值从高到低顺序排列,生成所述热搜榜。
6.根据权利要求5所述的方法,其特征在于,所述步骤S41进一步包括:
若判断存在多个所述顶置信息,则先将所述多个顶置信息按照优先级从高到低顺序进行排列,之后,执行所述步骤S42,其中,所述多个顶置信息的优先级是由所述数字历史系统信息的管理员设定。
7.根据权利要求5所述的方法,其特征在于,所述步骤S42进一步包括:
判断所有搜索内容中是否存在包含所述顶置信息的搜索内容,当所有搜索内容中存在包含所述顶置信息的搜索内容时,将包含所述顶置信息的搜索内容从所生成的热搜榜中删除。
8.根据权利要求1所述的方法,其特征在于,所述搜索行为包括用户于所述数字历史信息系统输入关键字进行搜索,以及用户点击所述数字历史信息系统提供的信息条目。
9.根据权利要求8所述的方法,其特征在于,所述信息条目包括所述热搜榜中提供的搜索内容。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111260057.1A CN113918799A (zh) | 2021-10-28 | 2021-10-28 | 基于数字历史信息系统的热搜榜排序方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111260057.1A CN113918799A (zh) | 2021-10-28 | 2021-10-28 | 基于数字历史信息系统的热搜榜排序方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113918799A true CN113918799A (zh) | 2022-01-11 |
Family
ID=79243244
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111260057.1A Pending CN113918799A (zh) | 2021-10-28 | 2021-10-28 | 基于数字历史信息系统的热搜榜排序方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113918799A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115757923A (zh) * | 2023-01-09 | 2023-03-07 | 北京创新乐知网络技术有限公司 | 搜索热词的确定方法、装置、计算机设备及存储介质 |
CN116861063A (zh) * | 2023-06-07 | 2023-10-10 | 广州数说故事信息科技有限公司 | 一种发掘社媒热搜商业价值度的方法 |
-
2021
- 2021-10-28 CN CN202111260057.1A patent/CN113918799A/zh active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115757923A (zh) * | 2023-01-09 | 2023-03-07 | 北京创新乐知网络技术有限公司 | 搜索热词的确定方法、装置、计算机设备及存储介质 |
CN116861063A (zh) * | 2023-06-07 | 2023-10-10 | 广州数说故事信息科技有限公司 | 一种发掘社媒热搜商业价值度的方法 |
CN116861063B (zh) * | 2023-06-07 | 2024-02-27 | 广州数说故事信息科技有限公司 | 一种发掘社媒热搜商业价值度的方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8417697B2 (en) | Permitting users to remove documents | |
US7966324B2 (en) | Personalizing a search results page based on search history | |
CA2612895C (en) | Systems and methods for providing search results | |
CN113918799A (zh) | 基于数字历史信息系统的热搜榜排序方法 | |
US20180089198A1 (en) | Personalizing scoping and ordering of object types for search | |
US20040002945A1 (en) | Program for changing search results rank, recording medium for recording such a program, and content search processing method | |
US20150317397A1 (en) | Search Tool Using Multiple Different Search Engine Types Across Different Data Sets | |
US8082244B2 (en) | Systems and methods for determining document freshness | |
US7480652B2 (en) | Determining relevance of a document to a query based on spans of query terms | |
US20130151533A1 (en) | Provision of query suggestions independent of query logs | |
US20100131494A1 (en) | Automatically Showing More Search Results | |
WO2008042711A2 (en) | Convergence of terms within a collaborative tagging environment | |
US11443005B2 (en) | Unsupervised clustering of browser history using web navigational activities | |
US8666932B2 (en) | System and method for providing vector terms related to instant messaging conversations | |
CN106844680A (zh) | 推荐信息的展示方法和装置 | |
US10552438B2 (en) | Triggering method for instant search | |
WO2017003893A1 (en) | Automatic grouping of browser bookmarks | |
US8914398B2 (en) | Methods and apparatus for automated keyword refinement | |
US8271875B2 (en) | Providing help information | |
CA2764157A1 (en) | Searching methods and devices | |
JP2014517404A (ja) | 情報カテゴリおよび表示情報の間の一致度の決定 | |
WO2018204102A1 (en) | Stowing and unstowing browser tabs in groups each corresponding to a different subject | |
Diaz | On Evaluating Session-Based Recommendation with Implicit Feedback. | |
US10255326B1 (en) | Stopword inclusion for searches | |
CN114020956B (zh) | 数据智能化赋值方法和数据智能化赋值装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |