CN117743681B - 一种基于特征匹配进行数据推送的方法和系统 - Google Patents
一种基于特征匹配进行数据推送的方法和系统 Download PDFInfo
- Publication number
- CN117743681B CN117743681B CN202311658236.XA CN202311658236A CN117743681B CN 117743681 B CN117743681 B CN 117743681B CN 202311658236 A CN202311658236 A CN 202311658236A CN 117743681 B CN117743681 B CN 117743681B
- Authority
- CN
- China
- Prior art keywords
- data item
- data
- items
- features
- determining
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 48
- 238000004590 computer program Methods 0.000 claims description 2
- 238000003058 natural language processing Methods 0.000 description 12
- 230000008901 benefit Effects 0.000 description 5
- 238000012545 processing Methods 0.000 description 5
- 230000000007 visual effect Effects 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 230000004044 response Effects 0.000 description 4
- 101000583474 Homo sapiens Phosphatidylinositol-binding clathrin assembly protein Proteins 0.000 description 2
- 102100031014 Phosphatidylinositol-binding clathrin assembly protein Human genes 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 230000003247 decreasing effect Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 238000007792 addition Methods 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 210000001503 joint Anatomy 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 238000005215 recombination Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明实施例公开了一种基于特征匹配进行数据推送的方法和装置,其中方法包括:对内容数据库中的所有数据项进行分类,从而获得多个数据项集合,为每个数据项集合确定多个集合特征;获取目标设备的标识信息和描述信息,以获取目标设备的多个标识特征和多个描述特征;基于多个标识特征从多个数据项集合中,选择至少一个数据项集合,将其中的所有数据项构成目标设备的推送集合;基于多个描述特征从目标设备的推送集合中选择多个待推送的数据项,并为多个待推送的数据项确定推送次序;以及基于多个待推送的数据项的推送次序,生成包括多个待推送的数据项的推送序列,基于推送序列为目标设备进行数据项推送。
Description
技术领域
本发明涉及信息处理技术领域,尤其是一种基于特征匹配进行数据推送的方法和系统、以及存储介质和电子设备。
背景技术
随着网络技术的发展,信息传递的速度越来越快,并且互联网中存在大量且各种类型的信息。在这种抢先看,用户设备或终端设备需要的信息需求也呈现定制化和精准化的趋势。定制化或精准化的信息传递,可以提升数据处理的效率,并且可以提升数据处理的结果准确度。
然而,现有的数据推送方式仍采用精准率较低的方式。为此,现有技术中存在根据不同的目标对象或目标设备,精准地推送数据的需求。
发明内容
为了解决现有技术中采用精准率较低的方式进行数据推送的现状,本申请技术方案提出了,一种基于特征匹配进行数据推送的方法和系统、以及存储介质和电子设备。
根据本发明的一个方面,提供一种基于特征匹配进行数据推送的方法,所述方法包括:
对内容数据库中的所有数据项进行分类,从而获得多个数据项集合,为每个数据项集合确定多个集合特征;
获取目标设备的标识信息和描述信息,基于标识信息获取目标设备的多个设备标识特征,并且基于描述信息确定目标设备的多个设备描述特征;
基于多个设备标识特征从多个数据项集合中,为目标设备选择至少一个数据项集合,将所选择的至少一个数据项集合中的所有数据项构成目标设备的数据推送集合;
基于多个设备描述特征从目标设备的数据推送集合中选择多个待推送的数据项,并为多个待推送的数据项确定推送次序;以及
基于多个待推送的数据项的推送次序,生成包括多个待推送的数据项的推送序列,基于推送序列为目标设备进行数据推送。
优选地,其中,对内容数据库中的所有数据项进行分类,包括:
获取内容数据库中每个数据项的数据项属性信息,并基于数据项属性信息确定每个数据项的多个分类特征;
基于多个分类特征,确定内容数据库中的每个数据项的类别描述信息;以及
基于类别描述信息,确定内容数据库中的每个数据项的类别名称,从而基于类别名称对内容数据库中的所有数据项进行分类。
优选地,所述数据项属性信息包括多个属性项,其中每个属性项包括:内容特征、访问热度值和内容权重值。
优选地,其中,基于数据项属性信息确定每个数据项的多个分类特征,包括:
基于内容特征、访问热度值和内容权重值,从数据项的数据项属性信息的多个属性项中选择多个用于确定分类特征的属性项;以及
基于数据项的多个用于确定分类特征的属性项,确定数据项的多个分类特征。
优选地,其中,基于内容特征、访问热度值和内容权重值,从数据项的数据项属性信息的多个属性项中选择多个用于确定分类特征的属性项,包括:
计算属性项中访问热度值和内容权重值的乘积,并将访问热度值和内容权重值的乘积,作为属性项中内容特征的分类权重值;
基于多个属性项中每个属性项的内容特征的分类权重值,确定数据项的分类权重阈值;以及
基于数据项的分类权重阈值,从数据项的数据项属性信息的多个属性项中选择多个用于确定分类特征的属性项。
优选地,其中,基于多个设备标识特征从多个数据项集合中,为目标设备选择至少一个数据项集合,包括:
确定目标设备的多个设备标识特征与每个数据项集合的匹配度,基于匹配度从多个数据项集合中,为目标设备选择至少一个数据项集合。
优选地,其中,确定目标设备的多个设备标识特征与每个数据项集合的匹配度,包括:
获取每个数据项集合的多个集合特征;
确定目标设备的多个设备标识特征中的每个设备标识特征与数据项集合的多个集合特征中的每个集合特征的标识匹配度;
基于目标设备的每个设备标识特征与数据项集合的每个集合特征的标识匹配度,确定目标设备的多个设备标识特征与每个数据项集合的匹配度。
根据本发明的另一方面,提供一种基于特征匹配进行数据推送的系统,所述系统包括:
分类单元,用于对内容数据库中的所有数据项进行分类,从而获得多个数据项集合,为每个数据项集合确定多个集合特征;
获取单元,用于获取目标设备的标识信息和描述信息,基于标识信息获取目标设备的多个设备标识特征,并且基于描述信息确定目标设备的多个设备描述特征;
选择单元,用于基于多个设备标识特征从多个数据项集合中,为目标设备选择至少一个数据项集合,将所选择的至少一个数据项集合中的所有数据项构成目标设备的数据推送集合;
确定单元,用于基于多个设备描述特征从目标设备的数据推送集合中选择多个待推送的数据项,并为多个待推送的数据项确定推送次序;以及
生成单元,用于基于多个待推送的数据项的推送次序,生成包括多个待推送的数据项的推送序列,基于推送序列为目标设备进行数据推送。
根据本发明的再一方面,提供一种电子设备,所述电子设备包括:存储器和处理器,所述存储器和所述处理器耦合;所述存储器存储有程序指令,所述程序指令由所述处理器执行时,使得所述电子设备执行如上任意一项所述的方法。
根据本发明的再一方面,提供一种计算机可读存储介质,包括计算机程序,当所述计算机程序在电子设备上运行时,使得所述电子设备执行如上任意一项所述的方法。
根据本发明的再一方面,提供一种进行数据推送的方法,所述方法包括:
收集原始数据(包括各种类型的数据项,例如,计算结果数据、中间结果数据、互联网数据、多媒体数据、科技数据),并根据数据项所属领域对原始数据中的数据项进行分类。
对目标对象或目标设备进行分类,例如,根据目标对象或目标设备的各种属性或特征为目标对象或目标设备确定类别。
根据目标对象或目标设备的类别与数据项的类别匹配程度,将数据项推送给相应的目标对象或目标设备。
将数据项的推送结果以可视化形式展示在网络平台上,包括目标对象或目标设备的信息,数据项的内容等。
现有技术中,数据项的展示主要依赖于传统的信息发布平台等。现有技术的方法虽然在一定程度上能够起到数据项目推送的作用,但无法提供数据推送的定制化和精确化。
根据本发明的技术方案,通过对数据项进行详细的分类和匹配,并且对目标对象和目标设备进行精准分类和匹配,实现数据项目与目标对象和目标设备的精准匹配,提升数据处理效率,实现了数据推送的准确性。
根据本发明的技术方案,通过对数据项的类别和目标对象或目标设备的交互式确定或匹配,能够确定目标对象或目标设备对于数据项的准确需求。
根据本发明的技术方案,通过对数据项的类别和目标对象或目标设备的高效率且准确地匹配,降低了数据推送处理的成本并且提升的数据推送处理的效率。
根据本发明的技术方案,通过对数据项的类别和目标对象或目标设备的高效率且准确地匹配,提升了目标对象或目标设备与数据推送方之间的信息通畅性。
根据本发明的技术方案,通过对数据项的类别和目标对象或目标设备的高效率且准确地匹配,提升了数据推送效率,并且将推送结果以可视化形式展示在网络平台上,实现数据项和目标对象或目标设备的精准对接,具有更高的效率和精度。此外,本申请的技术方案利用在线交流和反馈系统,增强数据推送的交互性和用户体验,降低成本和风险。此外,本申请的技术方案通过不断优化算法和更新数据,提高数据项内容的可见性和可操作性,推进信息传递的流畅性。
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
附图说明
通过结合附图对本发明实施例进行更详细的描述,本发明的上述以及其他目的、特征和优势将变得更加明显。附图用来提供对本发明实施例的进一步理解,并且构成说明书的一部分,与本发明实施例一起用于解释本发明,并不构成对本发明的限制。在附图中,相同的参考标号通常代表相同部件或步骤。
图1是本发明一示例性实施例提供的基于特征匹配进行数据推送的方法的流程示意图;
图2是本发明一示例性实施例提供的基于特征匹配进行数据推送的系统的结构示意图;
图3是本发明一示例性实施例提供的进行数据推送的方法的流程示意图。
具体实施方式
下面,将参考附图详细地描述根据本发明的示例实施例。显然,所描述的实施例仅仅是本发明的一部分实施例,而不是本发明的全部实施例,应理解,本发明不受这里描述的示例实施例的限制。
应注意到:除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本发明的范围。
本领域技术人员可以理解,本发明实施例中的“第一”、“第二”等术语仅用于区别不同步骤、设备或模块等,既不代表任何特定技术含义,也不表示它们之间的必然逻辑顺序。
还应理解,在本发明实施例中,“多个”可以指两个或两个以上,“至少一个”可以指一个、两个或两个以上。
还应理解,对于本发明实施例中提及的任一部件、数据或结构,在没有明确限定或者在前后文给出相反启示的情况下,一般可以理解为一个或多个。
图1是本发明一示例性实施例提供的基于特征匹配进行数据推送的方法的流程示意图。方法100包括:
步骤101,对内容数据库中的所有数据项进行分类,从而获得多个数据项集合,为每个数据项集合确定多个集合特征。
在一个实施例中,对内容数据库中的所有数据项进行分类,包括:获取内容数据库中每个数据项的数据项属性信息,并基于数据项属性信息确定每个数据项的多个分类特征;基于多个分类特征,确定内容数据库中的每个数据项的类别描述信息;以及基于类别描述信息,确定内容数据库中的每个数据项的类别名称,从而基于类别名称对内容数据库中的所有数据项进行分类。其中,分类特征可以用于确定类别描述信息,进而通过类别描述信息来确定类别名称。应当了解的是,不同的类别名称的数量越多,则分类越精确,这样有可能会导致计算量增加,以及部分类别名称中的数据项数量较少。为此,本申请通过实际情况,选择合适的类别名称的数量,以使得对内容数据库中的数据项进行分类的精确度和效率达到有效地平衡。
优选地,所述数据项属性信息包括多个属性项。其中每个属性项包括:内容特征、访问热度值和内容权重值。例如,每个数据项可以具有多个属性项,并且因此每个数据项可以具有多个内容特征。每个内容特征可以用于表征与数据项的内容相关的一个特征。访问热度值可以通过互联网服务来获取,例如,内容特征在各种类型的互联网服务平台、外部服务区域、内部服务区域等中的访问热度。具体地,访问热度值可以是0-100%之间的任意数值,也可以是大于1的合理数值。内容权重值可以用于表征内容特征的重要程度,例如内容权重值为0-100%之间的任意数值。应当了解的是,访问热度值和内容权重值可以取任意合理数值或具有任意合理取值范围。
在一个实施例中,基于数据项属性信息确定每个数据项的多个分类特征,包括:基于内容特征、访问热度值和内容权重值,从数据项的数据项属性信息的多个属性项中选择多个用于确定分类特征的属性项;以及基于数据项的多个用于确定分类特征的属性项,确定数据项的多个分类特征。
具体地,其中,基于内容特征、访问热度值和内容权重值,从数据项的数据项属性信息的多个属性项中选择多个用于确定分类特征的属性项,包括:计算属性项中访问热度值和内容权重值的乘积,并将访问热度值和内容权重值的乘积,作为属性项中内容特征的分类权重值;基于多个属性项中每个属性项的内容特征的分类权重值,确定数据项的分类权重阈值;以及基于数据项的分类权重阈值,从数据项的数据项属性信息的多个属性项中选择多个用于确定分类特征的属性项。
在一个实施例中,其中,基于多个属性项中每个属性项的内容特征的分类权重值,确定数据项的分类权重阈值,包括:
基于以下公式计算数据项的分类权重阈值:
其中,CLTHi为第i个数据项的分类权重阈值,CLWi,max为第i个数据项的多个属性项的内容特征的分类权重值中的最大值,CLWi,min为第i个数据项的多个属性项的内容特征的分类权重值中的最小值,CLWi,med为第i个数据项的多个属性项的内容特征的分类权重值中的中位数,CLWi,j为第i个数据项的第j个属性项的内容特征的分类权重值,NCLi为第i个数据项的属性项的数量,其中i和j为自然数,1≤i≤NdataItem,NdataItem、为内容数据库中数据项的数量并且1≤j≤NCLi,其中α为第一调节因子,0<α≤1。
可替换地,其中,基于多个属性项中每个属性项的内容特征的分类权重值,确定数据项的分类权重阈值,包括:确定多个属性项中每个属性项的内容特征的分类权重值的平均值,将多个属性项中每个属性项的内容特征的分类权重值的平均值作为数据项的分类权重阈值。
可替换地,其中,基于多个属性项中每个属性项的内容特征的分类权重值,确定数据项的分类权重阈值,包括:确定多个属性项中每个属性项的内容特征的分类权重值的平均值,将多个属性项中每个属性项的内容特征的分类权重值的平均值作为数据项的分类权重阈值。
在一个实施例中,其中,基于数据项的分类权重阈值,从数据项的数据项属性信息的多个属性项中选择多个用于确定分类特征的属性项,包括:
将数据项的数据项属性信息的多个属性项中,内容特征的分类权重值大于或等于分类权重阈值的属性项,选择作为用于确定分类特征的属性项,从而获得数据项的多个用于确定分类特征的属性项。
在一个实施例中,其中,基于数据项的多个用于确定分类特征的属性项,确定数据项的多个分类特征,包括:将数据项的多个用于确定分类特征的属性项中每个属性项的内容特征,作为分类特征,从而确定数据项的多个分类特征。具体地,基于多个分类特征,确定内容数据库中的每个数据项的类别描述信息,包括:获取数据项的多个分类特征中每个分类特征的分类权重值;按照分类权重值的降序顺序,将数据项的多个分类特征进行字符连接,以生成数据项的类别描述信息,从而确定内容数据库中的每个数据项的类别描述信息。例如,分类特征Af,分类权重值65%,分类特征Bd,分类权重值55%,分类特征Ck,分类权重值50%等等,那么按照分类权重值的降序顺序,将数据项的多个分类特征进行字符连接,生成数据项的类别描述信息AfBdCk。
在一个实施例中,其中,基于类别描述信息,确定内容数据库中的每个数据项的类别名称,从而基于类别名称对内容数据库中的所有数据项进行分类,包括:对类别描述信息进行语义识别,基于语义识别的结果确定内容数据库中的每个数据项的类别名称;按照数据项的类别名称,对内容数据库中的所有数据项进行分类。优选地,可以使用任何已知的自然语言处理(Natural Language Processing,NLP)技术或工具来进行语义识别。
在一个实施例中,其中,基于类别描述信息,确定内容数据库中的每个数据项的类别名称,从而基于类别名称对内容数据库中的所有数据项进行分类,包括:获取多个类别名称中每个类别名称的分类描述信息;将数据项的类别描述信息与每个类别名称的分类描述信息进行内容匹配,从而确定数据项的类别描述信息与每个类别名称的匹配度;将匹配度最大的类别名称确定为数据项的类别名称,从而确定内容数据库中的每个数据项的类别名称;以及按照数据项的类别名称,对内容数据库中的所有数据项进行分类。优选地,内容匹配例如是使用基于自然语言处理(Natural Language Processing,NLP)技术或工具对类别描述信息和分类描述信息进行内容匹配。
优选地,其中每个数据项集合均包括多个数据项,并且为每个数据项集合确定多个集合特征,包括:获取数据项集合所包括的多个数据项中每个数据项的数据项属性信息;基于数据项集合内每个数据项的数据项属性信息,确定数据项集合的多个集合特征。
在一个实施例中,基于数据项集合内每个数据项的数据项属性信息,确定数据项集合的多个集合特征,包括:获取数据项集合内每个数据项的数据项属性信息中的多个内容特征,构成数据项集合所涉及的所有内容特征;对数据项集合所涉及的所有内容特征进行统计,以确定数据项集合所涉及的不同内容特征的统计次数;基于不同内容特征的统计次数,选择统计次数最多的预定数量个内容特征;以及将统计次数最多的预定数量个内容特征,确定为数据项集合的多个集合特征。例如,数据项集合包括数据项A、B和C。数据项A的数据项属性信息中的多个内容特征为内容特征1、内容特征3和内容特征5。数据项B的数据项属性信息中的多个内容特征为内容特征1、内容特征2、内容特征4和内容特征6。数据项C的数据项属性信息中的多个内容特征为内容特征1、内容特征2和内容特征3。那么对数据项集合所涉及的所有内容特征进行统计,以确定数据项集合所涉及的不同内容特征的统计次数,为内容特征1的统计次数3次,内容特征2的统计次数2次,内容特征3的统计次数2次,内容特征4的统计次数1次,内容特征5的统计次数1次,内容特征6的统计次数1次。
步骤102,获取目标设备的标识信息和描述信息,基于标识信息获取目标设备的多个标识特征,并且基于描述信息确定目标设备的多个描述特征。
在一个实施例中,基于标识信息获取目标设备的多个设备标识特征,包括:将所述标识信息和目标设备的设备标识添加到设备标识特征获取请求中,并将所述设备标识特征获取请求发送给网络服务器;网络服务器基于所述设备标识特征获取请求中的目标设备的设备标识,对目标设备进行身份认证;当网络服务器基于目标设备的设备标识,确定目标设备的身份认证的认证结果为认证成功时,基于所述设备标识特征获取请求中的标识信息在网络数据库中进行搜索,从而确定与所述标识信息相关联的多个设备标识特征;以及将所述多个设备标识特征添加到设备标识特征获取响应中,并返回所述设备标识特征获取响应。
在一个实施例中,基于描述信息确定目标设备的多个设备描述特征,包括:基于语义识别对所述描述信息进行句子划分,从而获取多个特征句;将多个特征句中具有设备描述特征的特征句,确定为设备描述特征句;基于每个设备描述特征句生成至少一个设备描述特征,从而确定目标设备的多个设备描述特征。
步骤103,基于多个标识特征从多个数据项集合中,为目标设备选择至少一个数据项集合,将所选择的至少一个数据项集合中的所有数据项构成目标设备的推送集合。
在一个实施例中,基于多个设备标识特征从多个数据项集合中,为目标设备选择至少一个数据项集合,包括:确定目标设备的多个设备标识特征与每个数据项集合的匹配度,基于匹配度从多个数据项集合中,为目标设备选择至少一个数据项集合。
在一个实施例中,确定目标设备的多个设备标识特征与每个数据项集合的匹配度,包括:获取每个数据项集合的多个集合特征;确定目标设备的多个设备标识特征中的每个设备标识特征与数据项集合的多个集合特征中的每个集合特征的标识匹配度;基于目标设备的每个设备标识特征与数据项集合的每个集合特征的标识匹配度,确定目标设备的多个设备标识特征与每个数据项集合的匹配度。
在一个实施例中,基于目标设备的每个设备标识特征与数据项集合的每个集合特征的标识匹配度,确定目标设备的多个设备标识特征与每个数据项集合的匹配度,包括:
基于以下公式确定目标设备的多个设备标识特征与每个数据项集合的匹配度:
其中,Matchv为目标设备的多个设备标识特征与第v个数据项集合的匹配度,Matchfeaturey,w为第y个设备标识特征与第w个集合特征的标识匹配度,v,y和w为自然数,1≤v≤Ncollect,其中Ncollect为数据项集合的数量,1≤y≤Ndevicedes,其中Ndevicedes为目标设备的设备标识特征的数量,1≤w≤Ncollv,其中Ncollv为第v个数据项集合的集合特征的数量。
在一个实施例中,基于匹配度从多个数据项集合中,为目标设备选择至少一个数据项集合,包括:将目标设备的多个设备标识特征与每个数据项集合的匹配度与匹配度阈值进行比较:当存在大于或等于匹配度阈值的匹配度时,选择匹配度大于或等于匹配度阈值的数据项集合;当不存在大于或等于匹配度阈值的匹配度时,选择匹配度最大的数据项集合。
步骤104,基于多个描述特征从目标设备的推送集合中选择多个待推送的数据项,并为多个待推送的数据项确定推送次序。
在一个实施例中,基于多个设备描述特征从目标设备的数据推送集合中选择多个待推送的数据项,包括:基于多个设备描述特征和目标设备的数据推送集合中每个数据项的数据项属性信息,确定数据推送集合中每个数据项的推送匹配度;基于每个数据项的推送匹配度,从目标设备的数据推送集合的所有数据项中选择多个待推送的数据项。
在一个实施例中,基于多个设备描述特征和目标设备的数据推送集合中每个数据项的数据项属性信息,确定数据推送集合中每个数据项的推送匹配度,包括:基于目标设备的数据推送集合中每个数据项的数据项属性信息,确定目标设备的数据推送集合中每个数据项的数据项特征;确定目标设备的数据推送集合中每个数据项的数据项特征,与多个设备描述特征中每个设备描述特征的特征匹配度;以及基于每个数据项的数据项特征与每个设备描述特征的特征匹配度,确定数据推送集合中每个数据项的推送匹配度。
在一个实施例中,基于目标设备的数据推送集合中每个数据项的数据项属性信息,确定目标设备的数据推送集合中每个数据项的数据项特征,包括:从目标设备的数据推送集合中每个数据项的数据项属性信息中,提取多个内容特征;将数据项的多个内容特征进行字符连接,以生成数据项的数据项特征,从而确定目标设备的数据推送集合中每个数据项的数据项特征。
在一个实施例中,基于每个数据项的数据项特征与每个设备描述特征的特征匹配度,确定数据推送集合中每个数据项的推送匹配度,包括:
基于以下公式确定数据推送集合中每个数据项的推送匹配度:
其中,Mak为数据推送集合中第k个数据项的推送匹配度,Mdk,m为第k个数据项的数据项特征与第m个设备描述特征的特征匹配度,Mkm为第m个设备描述特征的特征系数,其中,k和m为自然数,1≤m≤NDF,其中NDF为目标设备的设备描述特征的数量,Nak为第k个数据项的所有Mdk,m×Mkm中,乘积大于Avgk的数量,1≤k≤NPushItem,其中NPushItem为目标设备的数据推送集合中数据项的数量,Avgk为第k个数据项的数据项特征与目标设备的多个设备描述特征的特征匹配度的平均值,Max为取最大值。
在一个实施例中,基于每个数据项的推送匹配度,从目标设备的数据推送集合的所有数据项中选择多个待推送的数据项,包括:基于每个数据项的推送匹配度,确定目标设备的数据推送集合中多个数据项的推送匹配度的平均值;将目标设备的数据推送集合中,推送匹配度大于或等于推送匹配度的平均值的数据项确定为待推送的数据项,从而从目标设备的数据推送集合的所有数据项中选择多个待推送的数据项。
在一个实施例中,为多个待推送的数据项确定推送次序,包括:获取目标设备的动态信息,并基于目标设备的动态信息和多个设备描述特征,确定每个待推送的数据项的推送系数;以及基于每个待推送的数据项的推送系数的降序顺序,为多个待推送的数据项确定推送次序。例如,待推送的数据项A的推送系数为a、待推送的数据项B的推送系数为b并且待推送的数据项C的推送系数为c,那么基于每个待推送的数据项的推送系数的降序顺序,为多个待推送的数据项确定推送次序为A、B、C。
在一个实施例中,基于目标设备的动态信息和描述信息,确定每个待推送的数据项的推送系数,包括:从所述目标设备的动态信息中,获取目标设备的每个设备描述特征的特征系数的动态调整值;基于每个设备描述特征的特征系数和特征系数的动态调整值,确定每个设备描述特征的动态特征系数;以及基于每个设备描述特征的动态特征系数,以及数据项的数据项特征与每个设备描述特征的特征匹配度,确定每个待推送的数据项的推送系数。
在一个实施例中,基于每个设备描述特征的特征系数和特征系数的动态调整值,确定每个设备描述特征的动态特征系数,包括:将每个设备描述特征的特征系数和特征系数的动态调整值的和,作为每个设备描述特征的动态特征系数。例如,目标设备的设备描述特征Da的特征系数为Da1,并且目标设备的设备描述特征Da的特征系数的动态调整值为Da2,那么设备描述特征Da的动态特征系数为Da1+Da2。在一些实例中,Da1和Da2均为正数。在另一些实例中,Da1为正数,Da2可以是正数可以是负数。
在一个实施例中,基于每个设备描述特征的动态特征系数,以及数据项的数据项特征与每个设备描述特征的特征匹配度,确定每个待推送的数据项的推送系数,包括:基于以下公式确定每个待推送的数据项的推送系数:
其中,Pushn是第n个待推送的数据项的推送系数,Mdn,m为第n个待推送的数据项的数据项特征与第m个设备描述特征的特征匹配度,Dkm为第m个设备描述特征的动态特征系数,n和m为自然数,1≤m≤NDF,其中NDF为目标设备的设备描述特征的数量,1≤n≤NP,其中NP为待推送的数据项的数量。
步骤105,基于多个待推送的数据项的推送次序,生成包括多个待推送的数据项的推送序列,基于推送序列为目标设备进行数据项推送。
在一个实施例中,基于多个待推送的数据项的推送次序,生成包括多个待推送的数据项的推送序列,包括:确定每个待推送的数据项的数据量,基于待推送的数据项的数据量,确定推送次序中相邻两个待推送的数据项的推送时间间隔;基于相邻两个待推送的数据项的推送时间间隔和多个待推送的数据项的推送次序,生成包括多个待推送的数据项的推送序列。
具体地,确定每个待推送的数据项的数据量,基于待推送的数据项的数据量,确定推送次序中相邻两个待推送的数据项的推送时间间隔,包括:基于以下公式确定推送次序中相邻两个待推送的数据项的推送时间间隔:
其中,Tintervalq→q+1为推送次序中相邻的第q个待推送的数据项和第q+1个待推送的数据项的推送时间间隔,DataVolq为第q个待推送的数据项的数据量,1≤q<q+1≤NP,其中NP为待推送的数据项的数量,Tpre为预先设置的推送时间间隔,其中β为第二调节因子,0<β≤1。
在一个实施例中,基于多个待推送的数据项的推送次序,生成包括多个待推送的数据项的推送序列,包括:获取用于相邻两个待推送的数据项的预先设置的推送时间间隔;基于用于相邻两个待推送的数据项的预先设置的推送时间间隔和多个待推送的数据项的推送次序,生成包括多个待推送的数据项的推送序列。
图2是本发明一示例性实施例提供的基于特征匹配进行数据推送的系统的结构示意图。系统200包括:分类单元201、获取单元202、选择单元203、确定单元204以及生成单元205。
分类单元201用于对内容数据库中的所有数据项进行分类,从而获得多个数据项集合,为每个数据项集合确定多个集合特征。
在一个实施例中,分类单元201对内容数据库中的所有数据项进行分类,包括:获取内容数据库中每个数据项的数据项属性信息,并基于数据项属性信息确定每个数据项的多个分类特征;基于多个分类特征,确定内容数据库中的每个数据项的类别描述信息;以及基于类别描述信息,确定内容数据库中的每个数据项的类别名称,从而基于类别名称对内容数据库中的所有数据项进行分类。其中,分类特征可以用于确定类别描述信息,进而通过类别描述信息来确定类别名称。应当了解的是,不同的类别名称的数量越多,则分类越精确,这样有可能会导致计算量增加,以及部分类别名称中的数据项数量较少。为此,本申请通过实际情况,选择合适的类别名称的数量,以使得对内容数据库中的数据项进行分类的精确度和效率达到有效地平衡。
优选地,所述数据项属性信息包括多个属性项。其中每个属性项包括:内容特征、访问热度值和内容权重值。例如,每个数据项可以具有多个属性项,并且因此每个数据项可以具有多个内容特征。每个内容特征可以用于表征与数据项的内容相关的一个特征。访问热度值可以通过互联网服务来获取,例如,内容特征在各种类型的互联网服务平台、外部服务区域、内部服务区域等中的访问热度。具体地,访问热度值可以是0-100%之间的任意数值,也可以是大于1的合理数值。内容权重值可以用于表征内容特征的重要程度,例如内容权重值为0-100%之间的任意数值。应当了解的是,访问热度值和内容权重值可以取任意合理数值或具有任意合理取值范围。
在一个实施例中,分类单元201基于数据项属性信息确定每个数据项的多个分类特征,包括:基于内容特征、访问热度值和内容权重值,从数据项的数据项属性信息的多个属性项中选择多个用于确定分类特征的属性项;以及基于数据项的多个用于确定分类特征的属性项,确定数据项的多个分类特征。
具体地,其中,基于内容特征、访问热度值和内容权重值,从数据项的数据项属性信息的多个属性项中选择多个用于确定分类特征的属性项,包括:计算属性项中访问热度值和内容权重值的乘积,并将访问热度值和内容权重值的乘积,作为属性项中内容特征的分类权重值;基于多个属性项中每个属性项的内容特征的分类权重值,确定数据项的分类权重阈值;以及基于数据项的分类权重阈值,从数据项的数据项属性信息的多个属性项中选择多个用于确定分类特征的属性项。
在一个实施例中,分类单元201基于多个属性项中每个属性项的内容特征的分类权重值,确定数据项的分类权重阈值,包括:
基于以下公式计算数据项的分类权重阈值:
其中,CLTHi为第i个数据项的分类权重阈值,CLWi,max为第i个数据项的多个属性项的内容特征的分类权重值中的最大值,CLWi,min为第i个数据项的多个属性项的内容特征的分类权重值中的最小值,CLWi,med为第i个数据项的多个属性项的内容特征的分类权重值中的中位数,CLWi,j为第i个数据项的第j个属性项的内容特征的分类权重值,NCLi为第i个数据项的属性项的数量,其中i和j为自然数,1≤i≤NdataItem,NdataItem、为内容数据库中数据项的数量并且1≤j≤NCLi,其中α为第一调节因子,0<α≤1。
可替换地,其中,基于多个属性项中每个属性项的内容特征的分类权重值,确定数据项的分类权重阈值,包括:确定多个属性项中每个属性项的内容特征的分类权重值的平均值,将多个属性项中每个属性项的内容特征的分类权重值的平均值作为数据项的分类权重阈值。
可替换地,其中,基于多个属性项中每个属性项的内容特征的分类权重值,确定数据项的分类权重阈值,包括:确定多个属性项中每个属性项的内容特征的分类权重值的平均值,将多个属性项中每个属性项的内容特征的分类权重值的平均值作为数据项的分类权重阈值。
在一个实施例中,分类单元201基于数据项的分类权重阈值,从数据项的数据项属性信息的多个属性项中选择多个用于确定分类特征的属性项,包括:
将数据项的数据项属性信息的多个属性项中,内容特征的分类权重值大于或等于分类权重阈值的属性项,选择作为用于确定分类特征的属性项,从而获得数据项的多个用于确定分类特征的属性项。
在一个实施例中,分类单元201基于数据项的多个用于确定分类特征的属性项,确定数据项的多个分类特征,包括:将数据项的多个用于确定分类特征的属性项中每个属性项的内容特征,作为分类特征,从而确定数据项的多个分类特征。具体地,基于多个分类特征,确定内容数据库中的每个数据项的类别描述信息,包括:获取数据项的多个分类特征中每个分类特征的分类权重值;按照分类权重值的降序顺序,将数据项的多个分类特征进行字符连接,以生成数据项的类别描述信息,从而确定内容数据库中的每个数据项的类别描述信息。例如,分类特征Af,分类权重值65%,分类特征Bd,分类权重值55%,分类特征Ck,分类权重值50%等等,那么按照分类权重值的降序顺序,将数据项的多个分类特征进行字符连接,生成数据项的类别描述信息AfBdCk。
在一个实施例中,分类单元201基于类别描述信息,确定内容数据库中的每个数据项的类别名称,从而基于类别名称对内容数据库中的所有数据项进行分类,包括:对类别描述信息进行语义识别,基于语义识别的结果确定内容数据库中的每个数据项的类别名称;按照数据项的类别名称,对内容数据库中的所有数据项进行分类。优选地,可以使用任何已知的自然语言处理(Natural Language Processing,NLP)技术或工具来进行语义识别。
在一个实施例中,分类单元201基于类别描述信息,确定内容数据库中的每个数据项的类别名称,从而基于类别名称对内容数据库中的所有数据项进行分类,包括:获取多个类别名称中每个类别名称的分类描述信息;将数据项的类别描述信息与每个类别名称的分类描述信息进行内容匹配,从而确定数据项的类别描述信息与每个类别名称的匹配度;将匹配度最大的类别名称确定为数据项的类别名称,从而确定内容数据库中的每个数据项的类别名称;以及按照数据项的类别名称,对内容数据库中的所有数据项进行分类。优选地,内容匹配例如是使用基于自然语言处理(Natural Language Processing,NLP)技术或工具对类别描述信息和分类描述信息进行内容匹配。
优选地,其中每个数据项集合均包括多个数据项,并且为每个数据项集合确定多个集合特征,包括:获取数据项集合所包括的多个数据项中每个数据项的数据项属性信息;基于数据项集合内每个数据项的数据项属性信息,确定数据项集合的多个集合特征。
在一个实施例中,分类单元201基于数据项集合内每个数据项的数据项属性信息,确定数据项集合的多个集合特征,包括:获取数据项集合内每个数据项的数据项属性信息中的多个内容特征,构成数据项集合所涉及的所有内容特征;对数据项集合所涉及的所有内容特征进行统计,以确定数据项集合所涉及的不同内容特征的统计次数;基于不同内容特征的统计次数,选择统计次数最多的预定数量个内容特征;以及将统计次数最多的预定数量个内容特征,确定为数据项集合的多个集合特征。例如,数据项集合包括数据项A、B和C。数据项A的数据项属性信息中的多个内容特征为内容特征1、内容特征3和内容特征5。数据项B的数据项属性信息中的多个内容特征为内容特征1、内容特征2、内容特征4和内容特征6。数据项C的数据项属性信息中的多个内容特征为内容特征1、内容特征2和内容特征3。那么对数据项集合所涉及的所有内容特征进行统计,以确定数据项集合所涉及的不同内容特征的统计次数,为内容特征1的统计次数3次,内容特征2的统计次数2次,内容特征3的统计次数2次,内容特征4的统计次数1次,内容特征5的统计次数1次,内容特征6的统计次数1次。
获取单元202,用于获取目标设备的标识信息和描述信息,基于标识信息获取目标设备的多个标识特征,并且基于描述信息确定目标设备的多个描述特征。
在一个实施例中,获取单元202基于标识信息获取目标设备的多个设备标识特征,包括:将所述标识信息和目标设备的设备标识添加到设备标识特征获取请求中,并将所述设备标识特征获取请求发送给网络服务器;网络服务器基于所述设备标识特征获取请求中的目标设备的设备标识,对目标设备进行身份认证;当网络服务器基于目标设备的设备标识,确定目标设备的身份认证的认证结果为认证成功时,基于所述设备标识特征获取请求中的标识信息在网络数据库中进行搜索,从而确定与所述标识信息相关联的多个设备标识特征;以及将所述多个设备标识特征添加到设备标识特征获取响应中,并返回所述设备标识特征获取响应。
在一个实施例中,获取单元202基于描述信息确定目标设备的多个设备描述特征,包括:基于语义识别对所述描述信息进行句子划分,从而获取多个特征句;将多个特征句中具有设备描述特征的特征句,确定为设备描述特征句;基于每个设备描述特征句生成至少一个设备描述特征,从而确定目标设备的多个设备描述特征。
选择单元203,用于基于多个标识特征从多个数据项集合中,为目标设备选择至少一个数据项集合,将所选择的至少一个数据项集合中的所有数据项构成目标设备的推送集合。
在一个实施例中,选择单元203基于多个设备标识特征从多个数据项集合中,为目标设备选择至少一个数据项集合,包括:确定目标设备的多个设备标识特征与每个数据项集合的匹配度,基于匹配度从多个数据项集合中,为目标设备选择至少一个数据项集合。
在一个实施例中,选择单元203确定目标设备的多个设备标识特征与每个数据项集合的匹配度,包括:获取每个数据项集合的多个集合特征;确定目标设备的多个设备标识特征中的每个设备标识特征与数据项集合的多个集合特征中的每个集合特征的标识匹配度;基于目标设备的每个设备标识特征与数据项集合的每个集合特征的标识匹配度,确定目标设备的多个设备标识特征与每个数据项集合的匹配度。
在一个实施例中,选择单元203基于目标设备的每个设备标识特征与数据项集合的每个集合特征的标识匹配度,确定目标设备的多个设备标识特征与每个数据项集合的匹配度,包括:
基于以下公式确定目标设备的多个设备标识特征与每个数据项集合的匹配度:
其中,Matchv为目标设备的多个设备标识特征与第v个数据项集合的匹配度,Matchfeaturey,w为第y个设备标识特征与第w个集合特征的标识匹配度,v,y和w为自然数,1≤v≤Ncollect,其中Ncollect为数据项集合的数量,1≤y≤Ndevicedes,其中Ndevicedes为目标设备的设备标识特征的数量,1≤w≤Ncollv,其中Ncollv为第v个数据项集合的集合特征的数量。
在一个实施例中,选择单元203基于匹配度从多个数据项集合中,为目标设备选择至少一个数据项集合,包括:将目标设备的多个设备标识特征与每个数据项集合的匹配度与匹配度阈值进行比较:当存在大于或等于匹配度阈值的匹配度时,选择匹配度大于或等于匹配度阈值的数据项集合;当不存在大于或等于匹配度阈值的匹配度时,选择匹配度最大的数据项集合。
确定单元204,用于基于多个描述特征从目标设备的推送集合中选择多个待推送的数据项,并为多个待推送的数据项确定推送次序。
在一个实施例中,确定单元204基于多个设备描述特征从目标设备的数据推送集合中选择多个待推送的数据项,包括:基于多个设备描述特征和目标设备的数据推送集合中每个数据项的数据项属性信息,确定数据推送集合中每个数据项的推送匹配度;基于每个数据项的推送匹配度,从目标设备的数据推送集合的所有数据项中选择多个待推送的数据项。
在一个实施例中,确定单元204基于多个设备描述特征和目标设备的数据推送集合中每个数据项的数据项属性信息,确定数据推送集合中每个数据项的推送匹配度,包括:基于目标设备的数据推送集合中每个数据项的数据项属性信息,确定目标设备的数据推送集合中每个数据项的数据项特征;确定目标设备的数据推送集合中每个数据项的数据项特征,与多个设备描述特征中每个设备描述特征的特征匹配度;以及基于每个数据项的数据项特征与每个设备描述特征的特征匹配度,确定数据推送集合中每个数据项的推送匹配度。
在一个实施例中,确定单元204基于目标设备的数据推送集合中每个数据项的数据项属性信息,确定目标设备的数据推送集合中每个数据项的数据项特征,包括:从目标设备的数据推送集合中每个数据项的数据项属性信息中,提取多个内容特征;将数据项的多个内容特征进行字符连接,以生成数据项的数据项特征,从而确定目标设备的数据推送集合中每个数据项的数据项特征。
在一个实施例中,确定单元204基于每个数据项的数据项特征与每个设备描述特征的特征匹配度,确定数据推送集合中每个数据项的推送匹配度,包括:
基于以下公式确定数据推送集合中每个数据项的推送匹配度:
其中,Mak为数据推送集合中第k个数据项的推送匹配度,Mdk,m为第k个数据项的数据项特征与第m个设备描述特征的特征匹配度,Mkm为第m个设备描述特征的特征系数,其中,k和m为自然数,1≤m≤NDF,其中NDF为目标设备的设备描述特征的数量,Nak为第k个数据项的所有Mdk,m×Mkm中,乘积大于Avgk的数量,1≤k≤NPushItem,其中NPushItem为目标设备的数据推送集合中数据项的数量,Avgk为第k个数据项的数据项特征与目标设备的多个设备描述特征的特征匹配度的平均值,Max为取最大值。
在一个实施例中,确定单元204基于每个数据项的推送匹配度,从目标设备的数据推送集合的所有数据项中选择多个待推送的数据项,包括:基于每个数据项的推送匹配度,确定目标设备的数据推送集合中多个数据项的推送匹配度的平均值;将目标设备的数据推送集合中,推送匹配度大于或等于推送匹配度的平均值的数据项确定为待推送的数据项,从而从目标设备的数据推送集合的所有数据项中选择多个待推送的数据项。
在一个实施例中,确定单元204为多个待推送的数据项确定推送次序,包括:获取目标设备的动态信息,并基于目标设备的动态信息和多个设备描述特征,确定每个待推送的数据项的推送系数;以及基于每个待推送的数据项的推送系数的降序顺序,为多个待推送的数据项确定推送次序。例如,待推送的数据项A的推送系数为a、待推送的数据项B的推送系数为b并且待推送的数据项C的推送系数为c,那么基于每个待推送的数据项的推送系数的降序顺序,为多个待推送的数据项确定推送次序为A、B、C。
在一个实施例中,确定单元204基于目标设备的动态信息和描述信息,确定每个待推送的数据项的推送系数,包括:从所述目标设备的动态信息中,获取目标设备的每个设备描述特征的特征系数的动态调整值;基于每个设备描述特征的特征系数和特征系数的动态调整值,确定每个设备描述特征的动态特征系数;以及基于每个设备描述特征的动态特征系数,以及数据项的数据项特征与每个设备描述特征的特征匹配度,确定每个待推送的数据项的推送系数。
在一个实施例中,确定单元204基于每个设备描述特征的特征系数和特征系数的动态调整值,确定每个设备描述特征的动态特征系数,包括:将每个设备描述特征的特征系数和特征系数的动态调整值的和,作为每个设备描述特征的动态特征系数。例如,目标设备的设备描述特征Da的特征系数为Da1,并且目标设备的设备描述特征Da的特征系数的动态调整值为Da2,那么设备描述特征Da的动态特征系数为Da1+Da2。在一些实例中,Da1和Da2均为正数。在另一些实例中,Da1为正数,Da2可以是正数可以是负数。
在一个实施例中,确定单元204基于每个设备描述特征的动态特征系数,以及数据项的数据项特征与每个设备描述特征的特征匹配度,确定每个待推送的数据项的推送系数,包括:基于以下公式确定每个待推送的数据项的推送系数:
其中,Pushn是第n个待推送的数据项的推送系数,Mdn,m为第n个待推送的数据项的数据项特征与第m个设备描述特征的特征匹配度,Dkm为第m个设备描述特征的动态特征系数,n和m为自然数,1≤m≤NDF,其中NDF为目标设备的设备描述特征的数量,1≤n≤NP,其中NP为待推送的数据项的数量。
生成单元205,用于基于多个待推送的数据项的推送次序,生成包括多个待推送的数据项的推送序列,基于推送序列为目标设备进行数据项推送。
在一个实施例中,生成单元205基于多个待推送的数据项的推送次序,生成包括多个待推送的数据项的推送序列,包括:确定每个待推送的数据项的数据量,基于待推送的数据项的数据量,确定推送次序中相邻两个待推送的数据项的推送时间间隔;基于相邻两个待推送的数据项的推送时间间隔和多个待推送的数据项的推送次序,生成包括多个待推送的数据项的推送序列。
具体地,生成单元205确定每个待推送的数据项的数据量,基于待推送的数据项的数据量,确定推送次序中相邻两个待推送的数据项的推送时间间隔,包括:基于以下公式确定推送次序中相邻两个待推送的数据项的推送时间间隔:
其中,Tintervalq→q+1为推送次序中相邻的第q个待推送的数据项和第q+1个待推送的数据项的推送时间间隔,DataVolq为第q个待推送的数据项的数据量,1≤q<q+1≤NP,其中NP为待推送的数据项的数量,Tpre为预先设置的推送时间间隔,其中β为第二调节因子,0<β≤1。
在一个实施例中,生成单元205基于多个待推送的数据项的推送次序,生成包括多个待推送的数据项的推送序列,包括:获取用于相邻两个待推送的数据项的预先设置的推送时间间隔;基于用于相邻两个待推送的数据项的预先设置的推送时间间隔和多个待推送的数据项的推送次序,生成包括多个待推送的数据项的推送序列。
图3是本发明一示例性实施例提供的进行数据推送的方法的流程示意图。方法300包括:
步骤301,收集原始数据(包括各种类型的数据项,例如,计算结果数据、中间结果数据、互联网数据、多媒体数据、科技数据),并根据数据项所属领域对原始数据中的数据项进行分类。
步骤302,对目标对象或目标设备进行分类,例如,根据目标对象或目标设备的各种属性或特征为目标对象或目标设备确定类别。
步骤303,根据目标对象或目标设备的类别与数据项的类别匹配程度,将数据项推送给相应的目标对象或目标设备。
步骤304,将数据项的推送结果以可视化形式展示在网络平台上,包括目标对象或目标设备的信息,数据项的内容等。
在实施本申请的技术方案时,首先需要收集和整理数据项,并根据数据项所属领域进行分类,可以包括但不限于新材料、生物医药、新能源、智能制造等不同领域。然后,针对目标对象,例如,各种类型的企业,或者目标设备,例如,各种类型的终端设备,进行分类,例如可以包括但不限于不同领域或类别。接着,根据目标对象或目标设备的领域或类别与数据项的匹配程度,利用算法筛选的方式将数据项推荐给相应的目标对象或目标设备。最后,将推荐结果以可视化形式展示在平台上,包括推荐列表、数据项介绍、目标对象或目标设备信息等,方便目标对象或目标设备按照数据项进行查找和了解相关信息。
可视化的展示方式可以包括但不限于表格、列表、图片、视频等多媒体形式,可以通过平台来实现交互式的操作和查看。同时,平台可以提供在线咨询、留言反馈、联系电话等功能,方便沟通和交流。此外,平台还可以根据用户的使用情况和反馈信息进行优化和改进,提高推荐准确度和用户体验。
以上结合具体实施例描述了本公开的基本原理,但是,需要指出的是,在本公开中提及的优点、优势、效果等仅是示例而非限制,不能认为这些优点、优势、效果等是本公开的各个实施例必须具备的。另外,上述公开的具体细节仅是为了示例的作用和便于理解的作用,而非限制,上述细节并不限制本公开为必须采用上述具体的细节来实现。
本说明书中各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似的部分相互参见即可。对于系统实施例而言,由于其与方法实施例基本对应,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本公开中涉及的器件、装置、设备、系统的方框图仅作为例示性的例子并且不意图要求或暗示必须按照方框图示出的方式进行连接、布置、配置。如本领域技术人员将认识到的,可以按任意方式连接、布置、配置这些器件、装置、设备、系统。诸如“包括”、“包含”、“具有”等等的词语是开放性词汇,指“包括但不限于”,且可与其互换使用。这里所使用的词汇“或”和“和”指词汇“和/或”,且可与其互换使用,除非上下文明确指示不是如此。这里所使用的词汇“诸如”指词组“诸如但不限于”,且可与其互换使用。
可能以许多方式来实现本公开的方法和装置。例如,可通过软件、硬件、固件或者软件、硬件、固件的任何组合来实现本公开的方法和装置。用于所述方法的步骤的上述顺序仅是为了进行说明,本公开的方法的步骤不限于以上具体描述的顺序,除非以其它方式特别说明。此外,在一些实施例中,还可将本公开实施为记录在记录介质中的程序,这些程序包括用于实现根据本公开的方法的机器可读指令。因而,本公开还覆盖存储用于执行根据本公开的方法的程序的记录介质。
还需要指出的是,在本公开的装置、设备和方法中,各部件或各步骤是可以分解和/或重新组合的。这些分解和/或重新组合应视为本公开的等效方案。提供所公开的方面的以上描述以使本领域的任何技术人员能够做出或者使用本公开。对这些方面的各种修改对于本领域技术人员而言是非常显而易见的,并且在此定义的一般原理可以应用于其他方面而不脱离本公开的范围。因此,本公开不意图被限制到在此示出的方面,而是按照与在此公开的原理和新颖的特征一致的最宽范围。
为了例示和描述的目的已经给出了以上描述。此外,此描述不意图将本公开的实施例限制到在此公开的形式。尽管以上已经讨论了多个示例方面和实施例,但是本领域技术人员将认识到其某些变型、修改、改变、添加和子组合。
Claims (10)
1.一种基于特征匹配进行数据推送的方法,所述方法包括:
对内容数据库中的所有数据项进行分类,从而获得多个数据项集合,为每个数据项集合确定多个集合特征;
获取目标设备的标识信息和描述信息,基于标识信息获取目标设备的多个设备标识特征,并且基于描述信息确定目标设备的多个设备描述特征;
基于多个设备标识特征从多个数据项集合中,为目标设备选择至少一个数据项集合,将所选择的至少一个数据项集合中的所有数据项构成目标设备的数据推送集合;
基于多个设备描述特征从目标设备的数据推送集合中选择多个待推送的数据项,并为多个待推送的数据项确定推送次序;以及
基于多个待推送的数据项的推送次序,生成包括多个待推送的数据项的推送序列,基于推送序列为目标设备进行数据推送。
2.根据权利要求1所述的方法,其中,对内容数据库中的所有数据项进行分类,包括:
获取内容数据库中每个数据项的数据项属性信息,并基于数据项属性信息确定每个数据项的多个分类特征;
基于多个分类特征,确定内容数据库中的每个数据项的类别描述信息;以及
基于类别描述信息,确定内容数据库中的每个数据项的类别名称,从而基于类别名称对内容数据库中的所有数据项进行分类。
3.根据权利要求2所述的方法,所述数据项属性信息包括多个属性项,其中每个属性项包括:内容特征、访问热度值和内容权重值。
4.根据权利要求3所述的方法,其中,基于数据项属性信息确定每个数据项的多个分类特征,包括:
基于内容特征、访问热度值和内容权重值,从数据项的数据项属性信息的多个属性项中选择多个用于确定分类特征的属性项;以及
基于数据项的多个用于确定分类特征的属性项,确定数据项的多个分类特征。
5.根据权利要求4所述的方法,其中,基于内容特征、访问热度值和内容权重值,从数据项的数据项属性信息的多个属性项中选择多个用于确定分类特征的属性项,包括:
计算属性项中访问热度值和内容权重值的乘积,并将访问热度值和内容权重值的乘积,作为属性项中内容特征的分类权重值;
基于多个属性项中每个属性项的内容特征的分类权重值,确定数据项的分类权重阈值;以及
基于数据项的分类权重阈值,从数据项的数据项属性信息的多个属性项中选择多个用于确定分类特征的属性项。
6.根据权利要求1所述的方法,其中,基于多个设备标识特征从多个数据项集合中,为目标设备选择至少一个数据项集合,包括:
确定目标设备的多个设备标识特征与每个数据项集合的匹配度,基于匹配度从多个数据项集合中,为目标设备选择至少一个数据项集合。
7.根据权利要求6所述的方法,其中,确定目标设备的多个设备标识特征与每个数据项集合的匹配度,包括:
获取每个数据项集合的多个集合特征;
确定目标设备的多个设备标识特征中的每个设备标识特征与数据项集合的多个集合特征中的每个集合特征的标识匹配度;
基于目标设备的每个设备标识特征与数据项集合的每个集合特征的标识匹配度,确定目标设备的多个设备标识特征与每个数据项集合的匹配度。
8.一种基于特征匹配进行数据推送的系统,所述系统包括:
分类单元,用于对内容数据库中的所有数据项进行分类,从而获得多个数据项集合,为每个数据项集合确定多个集合特征;
获取单元,用于获取目标设备的标识信息和描述信息,基于标识信息获取目标设备的多个设备标识特征,并且基于描述信息确定目标设备的多个设备描述特征;
选择单元,用于基于多个设备标识特征从多个数据项集合中,为目标设备选择至少一个数据项集合,将所选择的至少一个数据项集合中的所有数据项构成目标设备的数据推送集合;
确定单元,用于基于多个设备描述特征从目标设备的数据推送集合中选择多个待推送的数据项,并为多个待推送的数据项确定推送次序;以及
生成单元,用于基于多个待推送的数据项的推送次序,生成包括多个待推送的数据项的推送序列,基于推送序列为目标设备进行数据推送。
9.一种电子设备,其特征在于,所述电子设备包括:存储器和处理器,所述存储器和所述处理器耦合;所述存储器存储有程序指令,所述程序指令由所述处理器执行时,使得所述电子设备执行如权利要求1至7任意一项所述的方法。
10.一种计算机可读存储介质,其特征在于,包括计算机程序,当所述计算机程序在电子设备上运行时,使得所述电子设备执行如权利要求1至7任意一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311658236.XA CN117743681B (zh) | 2023-12-05 | 2023-12-05 | 一种基于特征匹配进行数据推送的方法和系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311658236.XA CN117743681B (zh) | 2023-12-05 | 2023-12-05 | 一种基于特征匹配进行数据推送的方法和系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117743681A CN117743681A (zh) | 2024-03-22 |
CN117743681B true CN117743681B (zh) | 2024-05-14 |
Family
ID=90251851
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311658236.XA Active CN117743681B (zh) | 2023-12-05 | 2023-12-05 | 一种基于特征匹配进行数据推送的方法和系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117743681B (zh) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108268573A (zh) * | 2017-01-04 | 2018-07-10 | 百度在线网络技术(北京)有限公司 | 用于推送信息的方法和装置 |
CN110263235A (zh) * | 2019-06-05 | 2019-09-20 | 深圳市腾讯计算机系统有限公司 | 信息推送对象更新方法、装置和计算机设备 |
CN115222478A (zh) * | 2022-06-15 | 2022-10-21 | 深圳市九洲电器有限公司 | 产品消息推送方法、电子设备及可读存储介质 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107465766B (zh) * | 2017-09-21 | 2018-05-04 | 掌阅科技股份有限公司 | 信息推送方法、电子设备及计算机存储介质 |
-
2023
- 2023-12-05 CN CN202311658236.XA patent/CN117743681B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108268573A (zh) * | 2017-01-04 | 2018-07-10 | 百度在线网络技术(北京)有限公司 | 用于推送信息的方法和装置 |
CN110263235A (zh) * | 2019-06-05 | 2019-09-20 | 深圳市腾讯计算机系统有限公司 | 信息推送对象更新方法、装置和计算机设备 |
CN115222478A (zh) * | 2022-06-15 | 2022-10-21 | 深圳市九洲电器有限公司 | 产品消息推送方法、电子设备及可读存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN117743681A (zh) | 2024-03-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103324665B (zh) | 一种基于微博的热点信息提取的方法和装置 | |
US9449271B2 (en) | Classifying resources using a deep network | |
CN105138653B (zh) | 一种基于典型度和难度的题目推荐方法及其推荐装置 | |
CN112074857A (zh) | 组合机器学习和社交数据以生成个性化推荐 | |
Tsai et al. | A learning objects recommendation model based on the preference and ontological approaches | |
CN110442781A (zh) | 一种基于生成对抗网络的对级排序项目推荐方法 | |
CN106021364A (zh) | 图片搜索相关性预测模型的建立、图片搜索方法和装置 | |
CN108363804A (zh) | 基于用户聚类的局部模型加权融合Top-N电影推荐方法 | |
US20100262597A1 (en) | Method and system for searching information of collective emotion based on comments about contents on internet | |
US20110196860A1 (en) | Method and apparatus for rating user generated content in search results | |
CN101346718A (zh) | 用于向用户提供选定内容项的方法 | |
CN109992674B (zh) | 一种融合自动编码器和知识图谱语义信息的推荐方法 | |
Rupapara et al. | Improving video ranking on social video platforms | |
CN111949848B (zh) | 一种基于特定事件的跨平台传播态势评估及分级方法 | |
US20230334314A1 (en) | Content recommendation method and apparatus, device, storage medium, and program product | |
CN111324773A (zh) | 一种背景音乐构建方法、装置、电子设备和存储介质 | |
CN104572915B (zh) | 一种基于内容环境增强的用户事件相关度计算方法 | |
JP2009187522A (ja) | コンテンツ評価装置 | |
CN110633410A (zh) | 信息处理方法及装置、存储介质、电子装置 | |
CN115982473A (zh) | 一种基于aigc的舆情分析编排系统 | |
Su et al. | Classification and interaction of new media instant music video based on deep learning under the background of artificial intelligence | |
Rao et al. | Product recommendation system from users reviews using sentiment analysis | |
Liao et al. | TIRR: A code reviewer recommendation algorithm with topic model and reviewer influence | |
CN117743681B (zh) | 一种基于特征匹配进行数据推送的方法和系统 | |
Zhu | A book recommendation algorithm based on collaborative filtering |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |