CN113435197A - 数据推送方法、装置、推送服务器及存储介质 - Google Patents

数据推送方法、装置、推送服务器及存储介质 Download PDF

Info

Publication number
CN113435197A
CN113435197A CN202110714652.1A CN202110714652A CN113435197A CN 113435197 A CN113435197 A CN 113435197A CN 202110714652 A CN202110714652 A CN 202110714652A CN 113435197 A CN113435197 A CN 113435197A
Authority
CN
China
Prior art keywords
target
enterprise
policy information
determining
pushing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110714652.1A
Other languages
English (en)
Other versions
CN113435197B (zh
Inventor
郭玉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An International Smart City Technology Co Ltd
Original Assignee
Ping An International Smart City Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An International Smart City Technology Co Ltd filed Critical Ping An International Smart City Technology Co Ltd
Priority to CN202110714652.1A priority Critical patent/CN113435197B/zh
Publication of CN113435197A publication Critical patent/CN113435197A/zh
Application granted granted Critical
Publication of CN113435197B publication Critical patent/CN113435197B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/216Parsing using statistical methods
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/55Push-based network services

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请涉及数据分析,提供一种数据推送方法、装置、推送服务器及存储介质,该方法包括:获取政策信息池;根据目标企业的属性信息,在政策信息池中确定多个与目标企业的属性信息相匹配的目标政策信息;获取对应目标企业的多个参照企业在预设历史时间段内搜索过的词汇;根据多个参照企业在预设历史时间段内搜索过的词汇的频次,确定至少部分词汇为对应目标企业的热度词;基于预设的匹配模型,根据对应目标企业的若干个预设的兴趣词和若干个热度词,确定各目标政策信息的推送分值;将推送分值超过预设推送阈值的目标政策信息推送给对应目标企业的终端设备。因此,根据兴趣词和热度词将政策信息推送给目标企业,能够提高政策推送的精准性。

Description

数据推送方法、装置、推送服务器及存储介质
技术领域
本申请涉及数据分析,提供一种数据推送方法、装置、推送服务器及存储介质。
背景技术
企业作为市场经济活动的主要参与者,对政策的关注必不可少。目前,部分企业通过政策订阅的方式接收政策,也即,推送方定时向企业推送政策。
在现有技术中,政策推送方式通常为:企业预先录入订阅标签,因此推送方可以根据政策具有的标签和企业预先录入的订阅标签,确定是否将该政策推送给企业。但是,企业可能会对标签所代表的实际意义存在理解偏差的问题,如此可能会导致推送的政策不够精准。
发明内容
基于此,本申请实施例提供了一种数据推送方法、装置、推送服务器及存储介质,以提高政策推送的精准性。
第一方面,本申请实施例提供了一种数据推送方法,用于推送服务器,所述方法包括:
获取政策信息池;
根据目标企业的属性信息,在所述政策信息池中确定多个与所述目标企业的属性信息相匹配的目标政策信息;
获取对应所述目标企业的多个参照企业在预设历史时间段内搜索过的词汇;
根据所述多个参照企业在预设历史时间段内搜索过的词汇的频次,确定至少部分所述词汇为对应所述目标企业的热度词;
基于预设的匹配模型,根据对应所述目标企业的若干个预设的兴趣词和若干个所述热度词,确定各所述目标政策信息的推送分值;
将所述推送分值超过预设推送阈值的所述目标政策信息推送给对应所述目标企业的终端设备。
第二方面,本申请实施例提供了一种数据推送装置,包括:
政策获取模块,用于获取政策信息池;
政策筛选模块,用于根据目标企业的属性信息,在所述政策信息池中确定多个与所述目标企业的属性信息相匹配的目标政策信息;
词汇获取模块,用于获取对应所述目标企业的多个参照企业在预设历史时间段内搜索过的词汇;
热词确定模块,用于根据所述多个参照企业在预设历史时间段内搜索过的词汇的频次,确定至少部分所述词汇为对应所述目标企业的热度词;
分值确定模块,用于基于预设的匹配模型,根据对应所述目标企业的若干个预设的兴趣词和若干个所述热度词,确定各所述目标政策信息的推送分值;
政策推送模块,用于将所述推送分值超过预设推送阈值的所述目标政策信息推送给对应所述目标企业的终端设备。
第三方面,本申请实施例提供了一种推送服务器,包括处理器与存储器;
所述存储器,用于存储计算机程序;
所述处理器,用于执行所述计算机程序并在执行所述计算机程序时实现如第一方面所述的数据推送方法。
第四方面,本申请实施例提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时使所述处理器实现如第一方面所述的数据推送方法。
本申请实施例提供的一种数据推送方法、装置、推送服务器及存储介质,该方法包括:获取政策信息池;根据目标企业的属性信息,在政策信息池中确定多个与目标企业的属性信息相匹配的目标政策信息;获取对应目标企业的多个参照企业在预设历史时间段内搜索过的词汇;根据多个参照企业在预设历史时间段内搜索过的词汇的频次,确定至少部分词汇为对应目标企业的热度词;基于预设的匹配模型,根据对应目标企业的若干个预设的兴趣词和若干个热度词,确定各目标政策信息的推送分值;将推送分值超过预设推送阈值的目标政策信息推送给对应目标企业的终端设备。由此可知,本申请实施例先根据目标企业的基本信息,在政策信息池中确定多个目标政策信息,接着根据若干个兴趣词和若干个热度词,确定各个目标政策信息的推送分值,因此可以将推送分值大于预设推送阈值的目标政策信息推送给目标企业,提高了政策推送的精准性。
附图说明
为了更清楚地说明本申请实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请各实施例的一个可选的应用场景示意图;
图2为本申请实施例提供的数据推送方法的一种流程示意图;
图3为本申请实施例中确定推送分值的一种流程示意图;
图4为本申请实施例提供的数据推送装置的一种结构示意性框图;
图5为本申请实施例提供的推送服务器的一种结构示意性框图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
应当理解,在此本申请说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本申请。如在本申请说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
还应当理解,本申请的说明书、权利要求书或上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序,不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。
还应当进一步理解,在本申请说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
在现有技术中,政策推送方式通常为:企业预先录入订阅标签,因此推送方可以根据政策具有的标签和企业预先录入的订阅标签,确定是否将该政策推送给企业。但是,企业可能会对标签所代表的实际意义存在理解偏差的问题,如此可能会导致推送的政策不够精准,这直接影响了企业的用户体验感。
为此,本申请实施例提供的一种数据推送方法,用于推送服务器,其中,推送服务器的数量可以是一个或多个,也即,由一个服务器单独执行本申请实施例所提供的方法,或者,由多个服务器共同执行本申请实施例所提供的方法。本申请实施例可以应用于如图1所示的场景,在该场景中,推送服务器与多个企业的终端设备连接,基于此,推送服务器可以执行本申请实施例所提供的方向,向各个企业推送政策。
如图2所示,数据推送方法可以包括步骤S10至步骤S60。
步骤S10、获取政策信息池。
在本申请实施例中,推送服务器可以通过数据库、第三方服务器等等获取政策信息池。在一些实施方式中,政策信息池中包括多个政策信息、以及各个政策信息对应的政策标签,其中,政策信息包括政策的标题、文本内容等等,而政策信息所对应的政策标签是根据政策的内容、标题和发布机构等预先设置的,并且,一个政策信息所对应的政策标签可以是一个或多个,例如,一政策信息所对应的政策标签有“人才”、“补贴”等等。
步骤S20、根据目标企业的属性信息,在政策信息池中确定多个与该目标企业的属性信息相匹配的目标政策信息。
其中,目标企业是图1中多个企业中的一个,而目标企业的属性信息可以包括该企业的基本信息、工商信息等等,例如目标企业的属性信息可以包括注册地、注册时间、所属行业等等。
由于政策信息池中包括了大量的政策信息,因此为了提高推送的效率,也为了减少推送服务器的运行压力,本申请实施例先基于目标企业的基本信息做初步筛选,也即,从政策信息池中筛选出来的多个目标政策信息都能够与目标企业的属性信息相匹配。可理解,根据目标企业的属性信息确定的多个目标政策信息,可以确保多个目标政策信息都是与目标企业相关的,从而为精确推送奠定了数据基础。
示例性的,目标企业的注册地可以是深圳、所属行业可以是电池行业,并且,政策信息池中第一政策信息的适用地区为深圳、适用行业为电池行业,第二政策信息的适用地区为广州、适用行业为电商行业。基于此,推送服务器可以根据目标企业的属性信息,确定第一政策信息为目标政策信息。
在一些实施例中,步骤S20可以包括步骤S210。
步骤S210、基于预设的政策标签和企业的属性信息的对应关系,若政策信息池中的政策信息有超过预设数量的政策标签与目标企业的属性信息相对应,则确定该政策信息为目标政策信息。
目标企业的属性信息可以理解为一个信息集合,而政策信息所对应的标签可以理解为单个信息。因此,可以根据预设的对应关系(即政策标签和属性信息的对应关系),确定政策信息的每个政策标签是否与目标企业的属性信息相对应,若有超过预设数量的政策标签能够与目标企业的属性信息相对应,则可以确定该政策信息为目标政策信息,否则确定该政策信息不为目标政策信息。
示例性的,目标企业的属性信息可以理解为如下信息集合:{注册地:深圳,所属行业:电池行业,企业性质:私营企业,企业类型:有限责任公司},且某个政策信息所对应的政策标签有多个,其中第一政策标签可以理解为如下单个信息:{适用地:深圳}、第二政策标签可以理解为如下单个信息:{适用行业:电池行业}、第三政策标签可以理解为如下单个信息:{适用企业性质:私营企业}。基于此,推送服务器可以根据预设的对应关系,确定该政策信息的第一政策标签、第二政策标签、第三政策标签能够与目标企业的属性信息相对应,若预设数量为2,则可确定该政策信息为目标政策信息。
步骤S30、获取对应目标企业的多个参照企业在预设历史时间段内搜索过的词汇。
步骤S40、根据多个参照企业在预设历史时间段内搜索过的词汇的频次,确定至少部分词汇为对应目标企业的热度词。
在本申请实施例中,参照企业指的是在属性信息上与目标企业较为近似的企业,也即,参照企业的属性信息与目标企业的属性信息较为近视,例如参照企业可以是目标企业的同行竞争对手等等。基于此,推送服务器可以获取所有参照企业在预设历史时间段内所述过的词汇,例如从数据库中获取各个参照企业搜索过的词汇,进而根据每个词汇被这些参照企业搜索过的频次,确定一部分为热度词。可理解,由于参照企业与目标企业在属性信息上较为近似,因此根据多个参照企业确定的热度词,可以认为目标企业在近期内也较为关注这些热度词。
示例性的,多个参照企业可以包括企业A、企业B和企业C,且这三个企业在预设历史时间段内(例如过去7天内)搜索过“人才引进”、“补贴”、“社保”等等,其中,“人才引进”、“补贴”被搜索的频次可以为4,“社保”被搜索的频次可以为1。基于此,推送服务器可以获取这些词汇,并且根据这些词汇被搜索的频次,确定至少一部分为热度词,例如,将被搜索频次超过3的词汇确定为热度词,则可确定“人才引进”、“补贴”为热度词。
在一实施例中,在步骤S30之前,该方法还可以包括步骤A10至步骤A30。
步骤A10、获取多个企业各自对应的属性信息。
步骤A20、基于预设的计算模型,确定多个企业中每个企业的属性信息与目标企业的属性信息之间的匹配度。
步骤A30、将匹配度超过预设匹配阈值的企业作为参照企业。
在一些实施方式中,多个企业可以为在推送服务器上注册过的企业,因此推送服务器可以获取多个企业各自对应的属性信息,例如从数据库中获取这些属性信息。
若一个企业的属性信息与目标企业的属性信息较为近似,则两者在属性信息上的匹配度将会超过一定值。因此可理解,推送服务器可以基于预设的计算模型,确定每个企业的属性信息与目标企业的属性信息之间的匹配度,并且将匹配度超过预设匹配阈值的企业作为参照企业,其中预设匹配阈值可以根据实际情况合理设置。
在一实施方式中,步骤A20中的“确定企业的属性信息与目标企业的属性信息之间的匹配度”,可以包括步骤A210至步骤A220。
步骤A210、确定企业的属性信息和目标企业的属性信息在各个元素上的近似值。
步骤A220、根据多个近似值,确定该企业的属性信息和目标企业的属性信息之间的匹配度。
在本申请实施例中,企业的属性信息可以理解为一个信息集合体,因此企业的属性信息中包括了多个元素。示例性的,企业的属性信息可以理解为如下信息集合:{注册地:深圳,所属行业:电池行业,企业性质:私营企业,企业类型:有限责任公司},则该属性信息包括了“注册地”、“所属行业”、“企业性质”和“企业类型”四个元素。
因此对于一个企业而言,可以确定该企业的属性信息和目标企业的属性信息在各个元素上的近似值,进而根据这些近似值确定两者在属性信息上的匹配度,可理解,按照相同的方式,可以得到每个企业与目标企业的匹配度。
示例性的,预设的计算模型可以包括如下公式:
Figure BDA0003134393420000071
Figure BDA0003134393420000072
其中,Q表示的是企业的属性信息和目标企业的属性信息之间的匹配度,X表示的是属性信息中元素的数量,RX表示的是企业和目标企业在元素X上的近似值,mX表示的是目标企业的元素X中包括的数据总量,nX表示的是企业的元素X中与目标企业的元素X之间相同部分的数量;另外,企业的属性信息可以包括注册地、所属行业、组织形式、企业规模和企业资质五个元素,则目标企业和企业A两者的属性信息具体如下表所示。基于此,可以根据前述计算模型,确定两者的属性信息在每个元素上的近似值,进而将多个近似值进行加和平均后得到两者在属性信息上的匹配度。具体的,以元素为“所属行业”为例进行说明,因目标企业的属性信息中“所属行业”包括b1对应的行业、b2对应的行业和b3对应的行业,因此mX=3,而企业A的属性信息中“所属行业”包括b3对应的行业和b4对应的行业,由于只有一个相同,因此nX=1,则根据上述公式可以确定两者在该元素上的近似值R2=33%,因此按照相同的方式,可以分别确定两者在每个元素上的近似值分别为R1=100%、R2=33%、R3=50%、R4=25%、R5=0%,进而根据上述公式对这五个近似值做加和平均后得到两者在属性信息上的匹配度Q为42%,因此,若预设匹配阈值被设置为40%,则可将企业A作为参照企业。
表1目标企业和企业A各自的属性信息
Figure BDA0003134393420000073
Figure BDA0003134393420000081
在一实施例中,在步骤S40之后,该方法还包括:基于预设的无效词库中包括的无效词汇,删除若干个所述热度词中属于无效词汇的词汇。
其中,无效词汇指的是会影响推送效果的词汇,通常是一些没有实际意义的词汇,例如可以是热点、政策、今天、项目等等。由于热度词是基于参照企业的历史行为确定的,因此在确定热度词时,应删除属于无效词汇的词汇,避免这些词汇对推送效果造成的影响。在一实施方式中,推送服务器还可以定期更新无效词库。
示例性的,根据多个参照企业在预设历史时间段内搜索过的词汇的频次,确定出的热度词例如有“人才”、“引进”、“补贴”、“政策”,则推送服务器可以基于预设的无效词库,将这些热度词中的“政策”删除,也即,删除之后的若干个热度词有“人才”、“引进”、“补贴”。
步骤S50、基于预设的匹配模型,根据对应目标企业的若干个预设的兴趣词和若干个热度词,确定各个目标政策信息的推送分值。
步骤S60、将推送分值超过预设推送阈值的目标政策信息推送给对应目标企业的终端设备。
其中,兴趣词指的是目标企业所感兴趣的政策词汇,在一实施方式中,兴趣词可以是目标企业预先设置的词汇。可理解,根据目标企业的属性信息确定的多个目标政策信息虽然与目标企业相关,但目标企业并一定对所有的目标政策信息感兴趣,因此需做进一步地筛选。具体而言,由于兴趣词为目标企业所感兴趣的政策词汇,且热度词也可以认为目标企业在近期内也较为关注,因此可以根据若干个兴趣词和若干个热度词,确定每一个目标政策信息的推送分值。可理解,目标政策信息的推送分值越大,则目标企业对该目标政策信息越感兴趣,因此可进一步理解,若目标政策信息的推送分值大于预设推送阈值(可合理设置),则可认为目标企业对该目标政策信息感兴趣,因此,推送服务器可以将推送分值超过预设推送阈值的目标政策信息推送给对应目标企业的终端设备,从而提高了政策推送的精准性。
示例性的,多个目标政策信息可以包括三个,分别为第一目标政策信息、第二目标政策信息和第三目标政策信息,且推送服务器根据若干个兴趣词和若干个热度词,确定这三个目标政策信息的推送分值依次为90、85、65,若预设推送阈值为80,则推送服务器可以将第一目标政策信息和第二目标政策信息推送给对应目标企业的终端设备,可理解,第一目标政策信息和第二目标政策是目标企业较为感兴趣的政策,因此可以提高政策推送的精准性。
在一实施例中,如图3所示,步骤S50可以包括步骤S510至步骤S550。
步骤S510、确定若干个兴趣词各自的兴趣分值。
步骤S520、根据若干个兴趣词各自的兴趣分值和各自在目标政策信息中出现的次数,确定该目标政策信息的第一分值。
步骤S530、确定若干个热度词各自的热度分值。
步骤S540、根据若干个热度词各自的热度分值和各自在该目标政策信息中出现的次数,确定该目标政策信息的第二分值。
步骤S550、根据第一分值和第二分值,确定该目标政策信息的推送分值。
其中,兴趣词的兴趣分值指的是目标企业对该词汇的感兴趣程度,可理解,兴趣词的兴趣分值越高,则表示目标企业越对该词汇感兴趣。相似的,热度词的热度分值用于表征该词汇被参照企业搜索的频率,可理解,热度词的热度分值越高,则说明该词汇被搜索的频率越高。
基于此,对于一个目标政策信息而言,其具体的政策内容中可能会包括一个或多个兴趣词、一个或多个热度词,而每个兴趣词、每个热度词都有各自对应的分值,因此,一方面,可以根据这些兴趣词各自的兴趣分值、以及各自在目标政策信息中出现的次数,确定该目标政策信息的第一分值;另一方面,还可以根据这些热度词各自的热度分值、以及各自在目标政策信息中出现的次数,确定该目标政策信息的第二分值。如此,可以根据第一分值和第二分值确定该目标政策信息的推送分值,例如将第一分值和第二分值的和作为推送分值。
示例性的,兴趣词可以包括a1、a2、a3,各自的兴趣分值可以依次为G(a1)、G(a2)、G(a3);热度词可以包括b1、b2、b3,各自的热度分值可以依次为R(b1)、R(b2)、R(b3)。另外,a1、a2、a3在目标政策信息中出现的次数可以依次为x1、x2、x3,b1、b2、b3在目标政策信息中出现的次数可以依次为y1、y2、y3。基于此,可以根据这些兴趣词各自的兴趣分值和各自在目标政策信息中出现的次数,确定第一分值,例如第一分值P1=G(a1)×x1+G(a2)×x2+G(a3)×x3;相似的,可以根据这些热度词各自的热度分值和各自在目标政策信息中出现的次数,确定第二分值,例如第二分值P2=R(b1)×y1+R(b2)×y2+R(b3)×y3。如此,根据第一分值和第二分值,即可确定该目标政策信息的推送分值,例如将第一分值P1和第二分值P2作和作为该目标政策的推送分值。
在一实施例中,步骤S510中的“确定兴趣词的兴趣分值”可以包括步骤S511至步骤S512。
步骤S511、基于预设的第一权重计算模型,确定目标企业浏览过的多个历史政策信息各自的第一权重。
步骤S512、根据多个历史政策信息各自的第一权重和各自在信息内容中出现兴趣词的次数,确定该兴趣词的兴趣分值。
在目标企业浏览过的历史政策信息中,各个历史政策信息的被查看时间、被查看次数可能不尽相同,因此可以根据预设的第一权重计算模型,确定这些历史政策信息各自的第一权重,可理解,第一权重与历史政策信息的被查看时间、被查看次数有关,并且,第一权重越大,则表明历史政策信息的被查看时间越靠近当前日期、被查看次数越多。
在一实施方式中,预设的第一权重计算模型可以包括如下公式:
Figure BDA0003134393420000101
其中,w表示的是历史政策信息的第一权重,x表示的是该历史政策信息被目标企业查看的次数,m表示的是最晚查看日期与当前日期相差的天数。示例性的,某个历史政策信息被目标企业查看的次数为一次(即x=1),最晚查看日期为昨天(即m=1),则此历史政策信息的第一权重w为0.5。在一种可行的实施方式中,若历史政策信息被收藏或下载,则可以将该历史政策信息对应的第一权重进行加权处理,例如进行翻倍处理(即将原来的权重乘以2)。
基于此,对于一个兴趣词而言,该兴趣词在各个历史政策信息中出现的次数可能不尽相同,因此可以根据每个历史政策信息各自的第一权重和在信息内容中该兴趣词出现的次数,确定该兴趣词的兴趣分值。可理解,按照相同的方式,可以确定每个兴趣词的兴趣分值。
在一实施方式中,可以根据如下公式确定兴趣词的兴趣分值:
Figure BDA0003134393420000102
其中,G表示的是兴趣词的兴趣分值,x表示的是有x个历史政策信息,wx表示的是历史政策信息x的第一权重,nx表示的是兴趣词在历史政策信息x中出现的次数。示例性的,假设有3个历史政策信息(即x=3),三个历史政策信息各自的第一权重依次为1、0.5、0.8,三个历史政策信息各自在信息内容中出现兴趣词的次数依次为30、40、50,则推送服务器可以根据上述公式,确定该兴趣词的兴趣分值为16.27。
在一实施例中,步骤S530中的“确定热度词的热度分值”可以包括步骤S531至步骤S532。
步骤S531、基于预设的第二权重计算模型,确定热度词的第二权重。
步骤S532、根据该热度词的第二权重、以及目标参照企业的属性信息与目标企业的属性信息之间的匹配度,确定该热度词的热度分值。
对于一个热度词而言,多个参照企业中并一定是所有的企业都搜索过,因此目标参照企业为多个参照企业中搜索过该热度词的企业。基于此,对于一个热度词而言,各个目标参照企业在预设历史时间段内对该词汇的搜索次数和搜索时间是不尽相同,因此可以确定该热度词的第二权重,可理解,第二权重与热度词的被搜索次数、被搜索时间有关,并且,第二权重越大,则表明热度词的被搜索时间越迟、被搜索次数越多。
在一实施方式中,预设的第二权重计算模型可以包括如下公式:
Figure BDA0003134393420000111
其中,w表示的是热度词的第二权重,N表示的是预设历史时间段的天数,比如预设历史时间段是过去七天,则N=7,Dn表示的是预设历史时间段中倒序为n的那天与今天相差的天数,比如,D0表示的是今天与今天相差的天数(即D0=0),D1表示的是昨天与今天相差的天数(即D1=1),nn表示的是预设历史时间段中倒序为n的那天中热度词被搜索的次数,比如,今天该热度词被搜索了1次,则n0=1,昨天该热度词被搜索了6次,则n1=6。示例性的,在过去五天内,某个热度词今天被搜索了1次,昨天被搜索了4次,前天被搜索10次,则通过第二权重计算模型,可确定该热度词的第二权重为22.49,具体计算过程如下:
Figure BDA0003134393420000112
在确定热度词的第二权重后,由于若干个参照企业中可能存在没有搜索过该热度词的企业,因此确定热度词的热度分值时应排除没有搜索过该热度词的参照企业,也即,应根据该热度词的第二权重、以及搜索过该热度词的参照企业(即目标参照企业)的匹配度,确定该热度词的热度分值,例如,将所有目标参照企业的匹配度作和之后值乘以第二权重,乘积值即为热度分值。可理解,按照相同的方式,可以确定每个热度词的热度分值。
在一实施方式中,推送服务器可以根据以下公式确定热度词的热度分值:
R=w×(Q1+Q2+...+Qn)
其中,R表示的是热度词的热度分值,w表示的是该热度词的第二权重,Q1+Q2+...+Qn表示的是所有目标参照企业与目标企业在属性信息上的匹配值之和。
综上所述,本申请实施例提供的一种数据推送方法,包括:获取政策信息池;根据目标企业的属性信息,在政策信息池中确定多个与目标企业的属性信息相匹配的目标政策信息;获取对应目标企业的多个参照企业在预设历史时间段内搜索过的词汇;根据多个参照企业在预设历史时间段内搜索过的词汇的频次,确定至少部分词汇为对应目标企业的热度词;基于预设的匹配模型,根据对应目标企业的若干个预设的兴趣词和若干个热度词,确定各目标政策信息的推送分值;将推送分值超过预设推送阈值的目标政策信息推送给对应目标企业的终端设备。由此可知,本申请实施例先根据目标企业的基本信息,在政策信息池中确定多个目标政策信息,接着根据若干个兴趣词和若干个热度词,确定各个目标政策信息的推送分值,因此可以将推送分值大于预设推送阈值的目标政策信息推送给目标企业,提高了政策推送的精准性。
本申请实施例还提供了一种数据推送装置,如图4所示,该装置包括:
政策获取模块,用于获取政策信息池;
政策筛选模块,用于根据目标企业的属性信息,在所述政策信息池中确定多个与所述目标企业的属性信息相匹配的目标政策信息;
词汇获取模块,用于获取对应所述目标企业的多个参照企业在预设历史时间段内搜索过的词汇;
热词确定模块,用于根据所述多个参照企业在预设历史时间段内搜索过的词汇的频次,确定至少部分所述词汇为对应所述目标企业的热度词;
分值确定模块,用于基于预设的匹配模型,根据对应所述目标企业的若干个预设的兴趣词和若干个所述热度词,确定各所述目标政策信息的推送分值;
政策推送模块,用于将所述推送分值超过预设推送阈值的所述目标政策信息推送给对应所述目标企业的终端设备。
上述方案的具体实施参见前文论述,此处不再赘述。
本申请实施例还提供了一种推送服务器,如图5所示,所述推送服务器包括处理器与存储器,所述存储器用于存储计算机程序;所述处理器,用于执行所述计算机程序并在执行所述计算机程序时实现本申请实施例提供的任一项数据推送方法。
应当理解的是,所述处理器可以是中央处理单元(Central Processing Unit,CPU),所述处理器还可以是其他通用处理器、数字信号处理器(Digital SignalProcessor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。其中,通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
本申请实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时,使所述处理器实现本申请实施例提供的任一项数据推送方法。
本领域普通技术人员可以理解,上文中所公开方法中的全部或某些步骤、系统、装置中的功能模块/单元可以被实施为软件、固件、硬件及其适当的组合。在硬件实施方式中,在以上描述中提及的功能模块/单元之间的划分不一定对应于物理组件的划分;例如,一个物理组件可以具有多个功能,或者一个功能或步骤可以由若干物理组件合作执行。某些物理组件或所有物理组件可以被实施为由处理器,如中央处理器、数字信号处理器或微处理器执行的软件,或者被实施为硬件,或者被实施为集成电路,如专用集成电路。这样的软件可以分布在计算机可读存储介质上,计算机可读存储介质可以包括计算机可读存储介质(或非暂时性介质)和通信介质(或暂时性介质)。
如本领域普通技术人员公知的,术语计算机可读存储介质包括在用于存储信息(诸如计算机可读指令、数据结构、程序模块或其他数据)的任何方法或技术中实施的易失性和非易失性、可移除和不可移除介质。计算机可读存储介质包括但不限于RAM、ROM、EEPROM、闪存或其他存储器技术、CD-ROM、数字多功能盘(DVD)或其他光盘存储、磁盒、磁带、磁盘存储或其他磁存储装置、或者可以用于存储期望的信息并且可以被计算机访问的任何其他的介质。此外,本领域普通技术人员公知的是,通信介质通常包含计算机可读指令、数据结构、程序模块或者诸如载波或其他传输机制之类的调制数据信号中的其他数据,并且可包括任何信息递送介质。
示例性的,所述计算机可读存储介质可以是前述实施例所述的推送服务器的内部存储单元,例如所述推送服务器的硬盘或内存。所述计算机可读存储介质也可以是所述推送服务器的外部存储设备,例如所述推送服务器上配备的插接式硬盘,智能存储卡(SmartMedia Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。

Claims (10)

1.一种数据推送方法,其特征在于,用于推送服务器,所述方法包括:
获取政策信息池;
根据目标企业的属性信息,在所述政策信息池中确定多个与所述目标企业的属性信息相匹配的目标政策信息;
获取对应所述目标企业的多个参照企业在预设历史时间段内搜索过的词汇;
根据所述多个参照企业在预设历史时间段内搜索过的词汇的频次,确定至少部分所述词汇为对应所述目标企业的热度词;
基于预设的匹配模型,根据对应所述目标企业的若干个预设的兴趣词和若干个所述热度词,确定各所述目标政策信息的推送分值;
将所述推送分值超过预设推送阈值的所述目标政策信息推送给对应所述目标企业的终端设备。
2.根据权利要求1所述的方法,其特征在于,所述政策信息池中包括多个政策信息、以及各所述政策信息对应的政策标签;
所述根据目标企业的属性信息,在所述政策信息池中确定多个与所述目标企业的属性信息相匹配的目标政策信息,包括:
基于预设的政策标签和企业的属性信息的对应关系,若所述政策信息池中的政策信息有超过预设数量的政策标签与所述目标企业的属性信息相对应,则确定所述政策信息为目标政策信息。
3.根据权利要求1所述的方法,其特征在于,所述获取对应所述目标企业的多个参照企业在预设历史时间段内搜索过的词汇之前,还包括:
获取多个企业各自对应的属性信息;
基于预设的计算模型,确定所述多个企业中每个企业的属性信息与所述目标企业的属性信息之间的匹配度;
将匹配度超过预设匹配阈值的企业作为所述参照企业。
4.根据权利要求3所述的方法,其特征在于,确定所述企业的属性信息与所述目标企业的属性信息之间的匹配度,包括:
确定所述企业的属性信息和所述目标企业的属性信息在各个元素上的近似值;
根据多个所述近似值,确定所述企业的属性信息和所述目标企业的属性信息之间的匹配度。
5.根据权利要求1所述的方法,其特征在于,所述确定至少部分所述词汇为对应所述目标企业的热度词之后,还包括:
基于预设的无效词库中包括的无效词汇,删除若干个所述热度词中属于无效词汇的词汇。
6.根据权利要求1-5任一项所述的方法,其特征在于,所述根据对应所述目标企业的若干个预设的兴趣词和若干个所述热度词,确定各所述目标政策信息的推送分值,包括:
确定若干个所述兴趣词各自的兴趣分值;
根据若干个所述兴趣词各自的兴趣分值和各自在所述目标政策信息中出现的次数,确定所述目标政策信息的第一分值;
确定若干个所述热度词各自的热度分值;
根据若干个所述热度词各自的热度分值和各自在所述目标政策信息中出现的次数,确定所述目标政策信息的第二分值;
根据所述第一分值和所述第二分值,确定所述目标政策信息的推送分值。
7.根据权利要求6所述的方法,其特征在于,确定所述兴趣词的兴趣分值,包括:
基于预设的第一权重计算模型,确定所述目标企业浏览过的多个历史政策信息各自的第一权重;
根据所述多个历史政策信息各自的第一权重和各自在信息内容中出现所述兴趣词的次数,确定所述兴趣词的兴趣分值;
确定所述热度词的热度分值,包括:
基于预设的第二权重计算模型,确定所述热度词的第二权重;
根据所述热度词的第二权重、以及目标参照企业的属性信息与所述目标企业的属性信息之间的匹配度,确定所述热度词的热度分值;其中,所述目标参照企业为所述多个参照企业中搜索过所述热度词的企业。
8.一种数据推送装置,其特征在于,包括:
政策获取模块,用于获取政策信息池;
政策筛选模块,用于根据目标企业的属性信息,在所述政策信息池中确定多个与所述目标企业的属性信息相匹配的目标政策信息;
词汇获取模块,用于获取对应所述目标企业的多个参照企业在预设历史时间段内搜索过的词汇;
热词确定模块,用于根据所述多个参照企业在预设历史时间段内搜索过的词汇的频次,确定至少部分所述词汇为对应所述目标企业的热度词;
分值确定模块,用于基于预设的匹配模型,根据对应所述目标企业的若干个预设的兴趣词和若干个所述热度词,确定各所述目标政策信息的推送分值;
政策推送模块,用于将所述推送分值超过预设推送阈值的所述目标政策信息推送给对应所述目标企业的终端设备。
9.一种推送服务器,其特征在于,包括处理器与存储器;
所述存储器,用于存储计算机程序;
所述处理器,用于执行所述计算机程序并在执行所述计算机程序时实现如权利要求1至7中任一项所述的数据推送方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时使所述处理器实现如权利要求1至7中任一项所述的数据推送方法。
CN202110714652.1A 2021-06-25 2021-06-25 数据推送方法、装置、推送服务器及存储介质 Active CN113435197B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110714652.1A CN113435197B (zh) 2021-06-25 2021-06-25 数据推送方法、装置、推送服务器及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110714652.1A CN113435197B (zh) 2021-06-25 2021-06-25 数据推送方法、装置、推送服务器及存储介质

Publications (2)

Publication Number Publication Date
CN113435197A true CN113435197A (zh) 2021-09-24
CN113435197B CN113435197B (zh) 2023-01-03

Family

ID=77754706

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110714652.1A Active CN113435197B (zh) 2021-06-25 2021-06-25 数据推送方法、装置、推送服务器及存储介质

Country Status (1)

Country Link
CN (1) CN113435197B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113674012A (zh) * 2020-05-14 2021-11-19 南宁富桂精密工业有限公司 广告信息推送方法及其系统
CN114971413A (zh) * 2022-07-04 2022-08-30 东莞先知大数据有限公司 一种科技政策推送方法
CN115147081A (zh) * 2022-07-12 2022-10-04 武汉初旦软件技术有限公司 基于人工智能的政策匹配方法、系统及存储介质
CN115577093A (zh) * 2022-05-26 2023-01-06 深圳格隆汇信息科技有限公司 金融信息的ai分析方法及系统

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015131748A1 (en) * 2014-03-07 2015-09-11 Tencent Technology (Shenzhen) Company Limited Method and apparatus for pushing target information
WO2017035970A1 (zh) * 2015-08-31 2017-03-09 北京百度网讯科技有限公司 信息推送的方法和装置
CN107944718A (zh) * 2017-11-29 2018-04-20 北京洪泰同创信息技术有限公司 一种企业政策评估系统及方法
WO2019019554A1 (zh) * 2017-07-26 2019-01-31 北京三快在线科技有限公司 一种推荐信息的获取方法及装置、电子设备
CN112765441A (zh) * 2021-04-07 2021-05-07 北京零号窗网络信息技术有限公司 用于数字政务的企业政策信息多重动态智能匹配推荐方法
CN112989156A (zh) * 2019-12-02 2021-06-18 重庆市科学技术研究院 一种基于大数据的政策与企业匹配的方法和系统

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015131748A1 (en) * 2014-03-07 2015-09-11 Tencent Technology (Shenzhen) Company Limited Method and apparatus for pushing target information
WO2017035970A1 (zh) * 2015-08-31 2017-03-09 北京百度网讯科技有限公司 信息推送的方法和装置
WO2019019554A1 (zh) * 2017-07-26 2019-01-31 北京三快在线科技有限公司 一种推荐信息的获取方法及装置、电子设备
CN107944718A (zh) * 2017-11-29 2018-04-20 北京洪泰同创信息技术有限公司 一种企业政策评估系统及方法
CN112989156A (zh) * 2019-12-02 2021-06-18 重庆市科学技术研究院 一种基于大数据的政策与企业匹配的方法和系统
CN112765441A (zh) * 2021-04-07 2021-05-07 北京零号窗网络信息技术有限公司 用于数字政务的企业政策信息多重动态智能匹配推荐方法

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113674012A (zh) * 2020-05-14 2021-11-19 南宁富桂精密工业有限公司 广告信息推送方法及其系统
CN115577093A (zh) * 2022-05-26 2023-01-06 深圳格隆汇信息科技有限公司 金融信息的ai分析方法及系统
CN115577093B (zh) * 2022-05-26 2023-05-16 深圳格隆汇信息科技有限公司 金融信息的ai分析方法及系统
CN114971413A (zh) * 2022-07-04 2022-08-30 东莞先知大数据有限公司 一种科技政策推送方法
CN115147081A (zh) * 2022-07-12 2022-10-04 武汉初旦软件技术有限公司 基于人工智能的政策匹配方法、系统及存储介质
CN115147081B (zh) * 2022-07-12 2023-10-27 芜湖中艺科技服务有限公司 基于人工智能的政策匹配方法、系统及存储介质

Also Published As

Publication number Publication date
CN113435197B (zh) 2023-01-03

Similar Documents

Publication Publication Date Title
CN113435197B (zh) 数据推送方法、装置、推送服务器及存储介质
US9703986B1 (en) Decentralized reputation service for synthetic identities
US10726071B2 (en) Content search engine
US8370358B2 (en) Tagging content with metadata pre-filtered by context
CN104081392A (zh) 社会媒体配置文件的影响评分
CN112559895B (zh) 一种数据处理方法、装置、电子设备及存储介质
WO2019085463A1 (zh) 部门需求的推荐方法、应用服务器及计算机可读存储介质
CN108399191B (zh) 一种招标信息的个性化推荐方法
CN111177568B (zh) 基于多源数据的对象推送方法、电子装置及存储介质
US20100274832A1 (en) Identifying Relevant Data from Unstructured Feeds
CN111310032A (zh) 资源推荐方法、装置、计算机设备及可读存储介质
US8825698B1 (en) Showing prominent users for information retrieval requests
CN110442801B (zh) 一种目标事件的关注用户的确定方法及装置
CN116842106A (zh) 资源线索的生成方法和装置
CN116451074A (zh) 目标对象的画像生成方法、装置、计算机设备、存储介质
CN112162991B (zh) 数据的智能管理方法及装置
US11321375B2 (en) Text object management system
CN113869859A (zh) 事件审批人员的替换方法、装置、终端设备和存储介质
CN113868373A (zh) 一种词云生成方法、装置、电子设备及存储介质
CN113934729A (zh) 一种基于知识图谱的数据管理方法、相关设备及介质
CN114661753A (zh) 话单检索方法及装置
CN110879835A (zh) 基于区块链的数据处理方法、装置、设备及可读存储介质
CN111125556A (zh) 推荐排序方法、系统、电子设备及可读存储介质
US11741062B2 (en) Data structure management system
CN109064216B (zh) 一种模拟广告订单的曝光量的方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant