CN115423569B - 一种基于大数据的推荐方法及基于大数据的推荐系统 - Google Patents
一种基于大数据的推荐方法及基于大数据的推荐系统 Download PDFInfo
- Publication number
- CN115423569B CN115423569B CN202211164888.3A CN202211164888A CN115423569B CN 115423569 B CN115423569 B CN 115423569B CN 202211164888 A CN202211164888 A CN 202211164888A CN 115423569 B CN115423569 B CN 115423569B
- Authority
- CN
- China
- Prior art keywords
- business data
- category
- electric business
- vector
- electric
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0631—Item recommendations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/02—Knowledge representation; Symbolic representation
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- General Physics & Mathematics (AREA)
- Marketing (AREA)
- Data Mining & Analysis (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- Development Economics (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- General Business, Economics & Management (AREA)
- Evolutionary Computation (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请提供的一种基于大数据的推荐方法及AI推荐系统,通过确定待推荐电商业务数据的不少于两个种类的电商业务数据知识向量,能够便于通过不少于两个种类的电商业务数据知识向量在在先配置的电商业务数据集中进行目标电商业务数据的若干次探索;这样基于不少于两个种类的电商业务数据知识向量,在在先配置的电商业务数据集中若干次挑选,能够挑选到与待推荐电商业务数据更加关联的目标电商业务数据;因此,通过不少于两个种类的知识向量能够有效的对于大量的指定电商业务数据集进行挑选,既能够提高挑选目标电商业务数据的效率又能够提高挑选目标电商业务数据的准确性;从而能够更加准确的进行数据推送,且体改数据推送的准确率和可靠性。
Description
技术领域
本申请涉及数据推送技术领域,具体而言,涉及一种基于大数据的推荐方法及基于大数据的推荐系统。
背景技术
大数据(big data),或称巨量资料,指的是所涉及的资料量规模巨大到无法透过主流软件工具,在合理时间内达到撷取、管理、处理、并整理成为帮助企业经营决策更积极目的的资讯。
现目前,信息量越来越多,用户在筛选数据时,可能由于数据量过大而导致用户很难做出选择,这样一来,容易损失用户。因此,亟需一种技术方案以改善上述技术问题。
发明内容
为改善相关技术中存在的技术问题,本申请提供了一种基于大数据的推荐方法及基于大数据的推荐系统。
第一方面,提供一种基于大数据的推荐方法,该方法至少包括:获得待推荐电商业务数据;确定所述待推荐电商业务数据的不少于两个种类的电商业务数据知识向量;结合所述不少于两个种类的电商业务数据知识向量,在在先配置的电商业务数据集中挑选所述待推荐电商业务数据关联的目标电商业务数据。
在一种独立实施的实施例中,所述确定所述待推荐电商业务数据的不少于两个种类的电商业务数据知识向量,包括:结合所述待推荐电商业务数据所在的商品种类,确定表征存在差异的知识向量数目的不少于两个种类;在所述不少于两个种类上,逐一对所述待推荐电商业务数据进行知识向量抽取,确定所述不少于两个种类的电商业务数据知识向量。
在一种独立实施的实施例中,所述不少于两个种类包括X个种类,X为不小于1的整数,所述确定所述待推荐电商业务数据的不少于两个种类的电商业务数据知识向量,包括:在所述第a个种类上对所述待推荐电商业务数据进行知识向量抽取,得到第a个种类的电商业务数据知识向量;其中,a为不小于1且不大于X的整数;结合所述第a-1个种类对所述第a个种类的电商业务数据知识向量进行简单随机抽样,确定所述第a-1个种类的电商业务数据知识向量;其中,所述第a个种类的优先等级超过所述第a-1个种类的优先等级。
在一种独立实施的实施例中,所述结合所述不少于两个种类的电商业务数据知识向量,在在先配置的电商业务数据集中挑选所述待推荐电商业务数据关联的目标电商业务数据,包括:结合所述不少于两个种类,获得挑选数据推送对象;结合所述挑选数据推送对象,在在先配置的电商业务数据集中挑选所述待推荐电商业务数据关联的目标电商业务数据。
在一种独立实施的实施例中,所述结合所述不少于两个种类,获得挑选数据推送对象,包括:依照种类表征的知识向量的数目,对所述不少于两个种类的种类优先等级进行分布,得到第一分布列表;其中,所述种类表征的知识向量的数目越大,所述种类的优先等级越高;将依照所述第一分布列表从小优先等级种类至高优先等级种类进行逐步挑选,确定为所述挑选数据推送对象。
在一种独立实施的实施例中,所述结合所述不少于两个种类,获得挑选数据推送对象,包括:获得每一个种类的挑选可能性,以及,获得每一个种类的挑选全局周期;结合所述每一个种类的挑选可能性,确定挑选可能性之间的比较向量小于指定比较向量的连续不少于两个种类;在所述连续不少于两个种类中,确定挑选全局周期最小的目标个种类;在所述不少于两个种类中,对所述连续不少于两个种类中所述目标个种类之外的种类进行清洗,得到其余种类;对所述其余种类中的种类优先等级进行分布,得到第二分布列表;将依照所述第二分布列表从小优先等级种类至高优先等级种类进行挑选,确定为所述挑选数据推送对象。
在一种独立实施的实施例中,所述结合所述挑选数据推送对象,在在先配置的电商业务数据集中挑选所述待推荐电商业务数据关联的目标电商业务数据,包括:在所述指定电商业务数据集中,依照所述挑选数据推送对象中的分布列表从小优先等级种类至高优先等级种类,挑选与所述待推荐电商业务数据的电商业务数据知识向量关联的待定电商业务数据簇;结合所述随机一个种类对应的待定电商业务数据簇和所述随机一个种类的种类优先等级,确定所述随机一个种类是否符合表征挑选终止的指定要求;响应于所述随机一个种类符合所述指定要求,结合所述随机一个种类的电商业务数据知识向量,在所述随机一个种类的低一个种类对应的待定电商业务数据簇中挑选所述目标电商业务数据。
在一种独立实施的实施例中,所述指定要求包括以下至少之一:所述随机一个种类对应的待定电商业务数据簇的第一向量不大于指定数目目标值;所述随机一个种类对应的待定电商业务数据簇相比于所述指定电商业务数据集的总挑选可能性不大于指定挑选可能性目标值;所述随机一个种类的种类优先等级为最第一种类;所述随机一个种类的目标挑选全局周期在连续不少于两个种类中最小,其中,所述随机一个种类与所述连续不少于两个种类的目标挑选可能性之间的比较向量小于指定比较向量,且所述连续不少于两个种类和所述随机一个种类中包括最高优先等级的种类。
在一种独立实施的实施例中,在所述不少于两个种类包括X个种类的前提上,所述在所述指定电商业务数据集中,依照所述挑选数据推送对象中的分布列表从小优先等级种类至高优先等级种类,挑选与所述待推荐电商业务数据的电商业务数据知识向量关联的待定电商业务数据簇,包括:从第1个种类开始,依照所述挑选数据推送对象中的分布列表在第a-1个种类对应的待定电商业务数据簇中挑选与第a个种类的电商业务数据知识向量相关联的待定电商业务数据簇,直到所述第a种类符合所述指定要求;其中,所述第1个种类表征所述X个种类中的最低个种类,在a取值为1的前提上,所述第a-1个种类对应的待定电商业务数据簇为所述指定电商业务数据集。
在一种独立实施的实施例中,所述获得每一个种类的挑选可能性,包括:获得随机一个种类对应的待定电商业务数据簇的第一向量,以及所述随机一个种类的低一个种类对应的待定电商业务数据簇的第二向量;结合所述第二向量和所述第一向量,确定所述随机一个种类的挑选可能性。
在一种独立实施的实施例中,所述获得每一个种类的挑选全局周期,包括:获得随机一个种类的片段簇和挑选数量;其中,所述片段簇包括:所述随机一个种类和所述随机一个种类的低个种类在每一次挑选中的片段;结合所述随机一个种类的片段簇和挑选数量,确定所述随机一个种类的挑选全局周期。
第二方面,提供一种基于大数据的推荐系统,包括互相之间通信的处理器和存储器,所述处理器用于从所述存储器中读取计算机程序并执行,以实现上述的方法。
本申请实施例所提供的一种基于大数据的推荐方法及基于大数据的推荐系统,对于获得的待推荐电商业务数据;通过确定待推荐电商业务数据的不少于两个种类的电商业务数据知识向量,能够便于通过不少于两个种类的电商业务数据知识向量在在先配置的电商业务数据集中进行目标电商业务数据的若干次探索;这样基于不少于两个种类的电商业务数据知识向量,在在先配置的电商业务数据集中若干次挑选,能够挑选到与待推荐电商业务数据更加关联的目标电商业务数据;因此,通过不少于两个种类的知识向量能够有效的对于大量的指定电商业务数据集进行挑选,既能够提高挑选目标电商业务数据的效率又能够提高挑选目标电商业务数据的准确性;从而能够更加准确的进行数据推送,且提高数据推送的准确率和可靠性。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本申请实施例所提供的一种基于大数据的推荐方法的流程图。
图2为本申请实施例所提供的一种基于大数据的推荐装置的框图。
图3为本申请实施例所提供的一种基于大数据的推荐系统的架构图。
实施方式
为了更好的理解上述技术方案,下面通过附图以及具体实施例对本申请技术方案做详细的说明,应当理解本申请实施例以及实施例中的具体特征是对本申请技术方案的详细的说明,而不是对本申请技术方案的限定,在不冲突的情况下,本申请实施例以及实施例中的技术特征可以相互组合。
请参阅图1,示出了一种基于大数据的推荐方法,该方法可以包括以下步骤S101-步骤步骤S103所描述的技术方案。
步骤S101,获得待推荐电商业务数据。
在本实施例中,该待推荐电商业务数据可以是通过电商业务数据采集设备采集得到的,还可以是获取到的剩余设备传输的电商业务数据。该待推荐电商业务数据可以是信息描述简单的电商业务数据还可以是信息描述复杂的电商业务数据。
对于一些可能实施的实施例而言,待推荐电商业务数据可以是一种或者多种电商信息属性的电商业务数据。该待推荐电商业务数据可以是对初始采集的电商业务数据进行电商业务数据预处理操作后得到的电商业务数据,譬如,对初始采集到的电商业务数据进行清洗等操作,得到待推荐电商业务数据。
步骤S102,确定所述待推荐电商业务数据的不少于两个种类的电商业务数据知识向量。
在本实施例中,该不少于两个种类表征对电商业务数据知识向量进行重要节点筛选出的种类,存在差异的的种类表征对待推荐电商业务数据中的目标对象筛选的重要节点的数目存在差异的。以待推荐电商业务数据为局部电商业务数据为例,存在差异的种类表征对局部电商业务数据中抽取的局部重要节点数的存在差异的。在本实施例中,不少于两个种类包括:第一种类、第二种类和第三种类,其中,第一种类对应的电商业务数据重要节点的数目大于第二种类对应的电商业务数据重要节点的数目,第二种类对应的电商业务数据重要节点的数目大于第三种类对应的电商业务数据重要节点的数目。譬如,以待推荐电商业务数据为局部电商业务数据为例,第一种类对应的电商业务数据重要节点的数目可以是162个重要节点或者136个重要节点,第一种类对应的电商业务数据重要节点的数目可以是91个重要节点,第三种类对应的电商业务数据重要节点的数目可以是42个重要节点等。
对于一些可能实施的实施例而言,可以依照存在差异的种类逐一对待推荐电商业务数据进行电商业务数据知识向量抽取,得到存在差异的种类的电商业务数据知识向量;譬如,通过人工智能线程依照存在差异的种类对待推荐电商业务数据进行知识向量抽取,该人工智能线程可以是随机单元的能够进行知识向量抽取的线程。这样一来,通过获得待推荐电商业务数据的不少于两个种类的电商业务数据知识向量,能够便于后续基于存在差异的种类的电商业务数据知识向量在在先配置的电商业务数据集中进行寻找,可以精确地寻找到目标电商业务数据。
步骤S103,结合所述不少于两个种类的电商业务数据知识向量,在在先配置的电商业务数据集中挑选所述待推荐电商业务数据关联的目标电商业务数据。
在本实施例中,指定电商业务数据集中包括大量的电商业务数据数据;其中,这些电商业务数据数据的信息描述可以是与待推荐电商业务数据的信息描述种类一致,也可以存在差异的。该指定电商业务数据集中可以存储大量的电商业务数据数据。
对于一些可能实施的实施例而言,依照不少于两个种类的电商业务数据知识向量中的每一种类,在在先配置的电商业务数据集中逐步挑选与待推荐电商业务数据关联的电商业务数据,以得到目标电商业务数据。通过对不少于两个种类进行布局,依照从第三种类到第一种类的顺序,在在先配置的电商业务数据集中逐步进行挑选,以得到目标电商业务数据。对于一些可能实施的实施例而言,首先,依照不少于两个种类中第三种类的电商业务数据知识向量,在在先配置的电商业务数据集中挑选与该第三种类的电商业务数据知识向量相似度较高的电商业务数据簇;然后,在该电商业务数据簇的基础上,进一步依照第二种类的电商业务数据知识向量在该电商业务数据簇中挑选与第二种类的电商业务数据知识向量相似度较高的电商业务数据簇,直到挑选到目标电商业务数据或者挑选的种类达到最第一种类,终止挑选并将最终挑选到的电商业务数据作为目标电商业务数据。
在一种可替换的实施例中,对于获得的待推荐电商业务数据;通过确定待推荐电商业务数据的不少于两个种类的电商业务数据知识向量,能够便于通过不少于两个种类的电商业务数据知识向量逐步在在先配置的电商业务数据集中进行目标电商业务数据的寻找;这样基于不少于两个种类的电商业务数据知识向量,在在先配置的电商业务数据集中挑选所述待推荐电商业务数据关联的目标电商业务数据;因此,通过不少于两个种类的 知识向量能够有效的对于大量的指定电商业务数据集进行挑选,既能够提高挑选目标电商业务数据的效率又能够提高挑选目标电商业务数据的准确性;从而能够更加准确的进行数据推送,且提高数据推送的准确率和可靠性。
在本实施例中,为得到待推荐电商业务数据的存在差异的种类的电商业务数据知识向量,可以依照存在差异的种类分别进行知识向量抽取,还可以在第一种类特征的基础上进行简单随机抽样,得到存在差异的种类的电商业务数据知识向量,即上述步S102可以通过以下两种方式实现:
(1):依照不少于两个种类逐一对待推荐电商业务数据进行知识向量抽取,可以通过以下步骤S121和S122实现。
步骤S121,结合所述待推荐电商业务数据所在的商品种类,确定表征存在差异的知识向量数目的不少于两个种类。
在本实施例中,待推荐电商业务数据所在的商品种类表征该待推荐电商业务数据的信息描述所对应的商品种类。
步骤S122,在所述不少于两个种类上,逐一对所述待推荐电商业务数据进行知识向量抽取,确定所述不少于两个种类的电商业务数据知识向量。
在本实施例中,在每一种类上逐一对待推荐电商业务数据进行知识向量抽取,得到该种类的电商业务数据知识向量。可以通过并行的人工智能线程分支,同时每一种类上对待推荐电商业务数据进行知识向量抽取,一个人工智能线程分支对应一个种类;还可以是采用一个人工智能线程经过若干次对待推荐电商业务数据进行知识向量抽取,得到不少于两个种类的电商业务数据知识向量;其中,每一次的知识向量抽取对应一个种类。
通过上述步骤S121和S122能够依照存在差异的的种类进行知识向量抽取,实现多种特征种类混合抽取,便于后续基于混合抽取的特征在在先配置的电商业务数据集中进行逐步寻找。
(2):通过先抽取第一种类的电商业务数据知识向量,然后对第一种类的电商业务数据知识向量进行简单随机抽样,得到存在差异的种类的电商业务数据知识向量,即上述步骤S102可以通过以下步骤S123和S124实现。
步骤S123,在所述第a个种类上对所述待推荐电商业务数据进行知识向量抽取,得到第a个种类的电商业务数据知识向量。
在本实施例中,a为不小于1且不大于X的整数。在不少于两个种类包括第一种类和第二种类的前提上,第a个种类可以是不少于两个种类中优先等级最高的种类,第二种类的优先等级超过第一种类。依照第a个种类表征的知识向量数目,对待推荐电商业务数据进行知识向量抽取,得到第a种类的电商业务数据知识向量。譬如,第a种类表征的知识向量数目为136,那么对待推荐电商业务数据抽取136个知识向量,这136个知识向量即为第a个种类的电商业务数据知识向量。
步骤S124,结合所述第a-1个种类对所述第a个种类的电商业务数据知识向量进行简单随机抽样,确定所述第a-1个种类的电商业务数据知识向量。
在本实施例中,第a种类的优先等级超过所述第a-1种类的优先等级。以第a种类的电商业务数据知识向量为基础,依照第a-1种类所表征的知识向量的数目对第a个种类的电商业务数据知识向量进行简单随机抽样,从而得到第第a-1种类对应的电商业务数据知识向量。譬如,第a-1种类表征的知识向量数目为98,那么在第a个种类的电商业务数据知识向量中简单随机抽样得到这98个知识向量,即第a-1个种类的电商业务数据知识向量。因此,通过对第一种类知识向量进行简单随机抽样,即可得到第三种类知识向量,使得知识向量的抽取过程更佳的准确且可靠。
在本实施例中,依照初始电商业务数据主题的种类,确定对该初始电商业务数据主题进行处理的方式,进而得到电商业务数据评估较高的待推荐电商业务数据,即上述步骤S101可以通过以下两种方式实现。
(1):对于电商信息属性的主题,进行预处理后得到待推荐电商业务数据,即上述步骤S101可以通过以下步骤S111和S112实现。
步骤S111,获得输入的初始电商业务数据主题。
步骤S112,响应于所述初始电商业务数据主题的种类为电商信息属性,对所述初始电商业务数据主题进行预处理,确定所述待推荐电商业务数据。
在本实施例中,如果初始电商业务数据主题的种类为电商信息属性。
(2):得到待推荐电商业务数据,即上述步骤S101可以通过以下步骤S113和S114实现。
步骤S113,响应于所述初始电商业务数据主题的种类为事件种类,在所述初始电商业务数据主题中选择电商业务数据评估符合指定要求的不少于一个商业务数据。
步骤S114,对所述不少于一个电商业务数据进行预处理,确定所述待推荐电商业务数据。
在本实施例中,通过获得对指定电商业务数据集进行挑选的数据推送对象,依照挑选数据推送对象实现对指定电商业务数据集的挑选,即上述步骤S103可以通过如下步骤实现。
步骤S201,结合所述不少于两个种类,获得挑选数据推送对象。
在本实施例中,挑选数据推送对象可以是存储在数据推送对象库中,在该数据推送对象库中存储有若干个挑选数据推送对象,其中,存在差异的的挑选数据推送对象对应的种类属性存在差异的。依照需要的种类属性,获得与该种类属性的挑选数据推送对象。
对于一些可能实施的实施例而言,挑选数据推送对象可以是依照种类属性进行逐步挑选,还可以是依照种类属性从小优先等级种类至高优先等级种类进行挑选。
对于一些可能实施的实施例而言,可以通过以下两种方式获得挑选数据推送对象,即步骤S201可以通过通过以下两种方式实现,其中。
(1):依照若干个种类的分布列表,在电商业务数据集中逐步挑选,从而挑选出目标电商业务数据,即上述步骤S201可以通过以下步骤S211和S211实现。
步骤S211,依照种类表征的知识向量的数目,对所述不少于两个种类的种类优先等级进行分布,得到第一分布列表。
这里,依照种类表征的知识向量的数目确定该种类的优先等级,进而依照不少于两个种类的优先等级的高低,对不少于两个种类进行分布;其中,种类表征的知识向量数目越大,该种类的优先等级越高。这样,依照种类表征的知识向量数目的大小,对不少于两个种类进行分布;譬如,可以依照数目从小到大对不少于两个种类进行分布,得到的分布列表中分布在第一位即使表征知识向量数目最小的种类,即优先等级最低的种类。
步骤S212,将依照所述第一分布列表从小优先等级种类至高优先等级种类进行逐步挑选,确定为所述挑选数据推送对象。
这里,依照不少于两个种类的种类优先等级的第一分布列表,在在先配置的电商业务数据集中逐步挑选与本次挑选的种类的电商业务数据知识向量关联的电商业务数据,实现一次挑选。
对于一些可能实施的实施例而言,基于该分布列表,依照种类优先等级从小到大,依次在在先配置的电商业务数据集中寻找与本次寻找的种类对应的电商业务数据知识向量相似度较高的待定电商业务数据簇。譬如,不少于两个种类包括:第一种类、第二种类和第三种类,那么依照第三种类、第二种类和第一种类的顺序,在在先配置的电商业务数据集中先寻找与第三种类的电商业务数据知识向量关联度较高的待定电商业务数据簇;在此基础上继续寻找与第二种类的电商业务数据知识向量关联度较高的待定电商业务数据簇;在此基础上继续寻找与第一种类的电商业务数据知识向量关联度较高的待定电商业务数据簇,直到寻找到表征挑选终止的指定要求的随机一个种类。这样,依照种类表征的知识向量的数目,对若干个种类进行分布,从而能够通过分布列表表明每一个种类的优先等级高低;在得到分布列表之后,从小优先等级种类至高优先等级种类进行逐步挑选,依照这样的挑选数据推送对象对指定电商业务数据集进行挑选,能够更加精确地挑选的到目标电商业务数据。
上述步骤S211和S212,从小优先等级种类开始在在先配置的电商业务数据集中逐步挑选,直到挑选到符合表征挑选终止的指定要求的种类。这样,将从小优先等级种类至高优先等级种类进行逐步挑选作为挑选数据推送对象,便于后续依照该挑选数据推送对象对指定电商业务数据集中逐步挑选,能够更佳准确的挑选到待推荐电商业务数据关联的目标电商业务数据。
(2):通过每一个种类的挑选可能性以及挑选全局周期,对若干个种类中挑选全局周期较大或者挑选可能性较大的种类进行清洗,从而依照清洗后的若干个种类设计挑选数据推送对象,即可以通过以下步骤S213至S218实现。
步骤S213,获得每一个种类的挑选可能性,以及,获得每一个种类的挑选全局周期。
在本实施例中,种类表征的知识向量的数目越大,种类的优先等级越高。每一个种类的挑选可能性表征该个种类挑选出的电商业务数据向量相对于被挑选的电商业务数据向量的置信度。每一个种类的挑选全局周期表征该个种类在在先配置的电商业务数据集中进行一次挑选的周期。
步骤S214,结合所述每一个种类的挑选可能性,确定挑选可能性之间的比较向量小于指定比较向量的连续不少于两个种类。
在本实施例中,确定随机一个种类的挑选可能性之后,判断随机一个种类的挑选可能性与已挑选的连续种类的挑选可能性之间的比较向量。
步骤S215,在所述连续不少于两个种类中,确定挑选全局周期最小的目标个种类。
在本实施例中,确定出挑选可能性比较向量小于指定比较向量的连续不少于两个种类之后,获得连续不少于两个种类中每一个种类的挑选全局周期。将每一个种类的挑选全局周期进行比较,以确定挑选全局周期最小的目标个种类。
步骤S216,在所述不少于两个种类中,对所述连续不少于两个种类中所述目标个种类之外的种类进行清洗,得到其余种类。
在本实施例中,连续不少于两个种类中所述目标个种类之外的种类,即为挑选可能性与目标个种类的挑选可能性之间的比较向量小于指定比较向量,且挑选全局周期大于目标个种类。
步骤S217,对所述其余种类中的种类优先等级进行分布,得到第二分布列表。
在本实施例中,在其余种类中可以依照从小优先等级种类到大优先等级种类进行分布,得到第二分布列表;还可以是依照从大优先等级种类到小优先等级种类进行分布,得到第二分布列表。
步骤S218,将依照所述第二分布列表从小优先等级种类至高优先等级种类进行挑选,确定为所述挑选数据推送对象。
在本实施例中,通过在待推荐电商业务数据的不少于两个种类中清洗连续不少于两个种类中所述目标个种类之外的种类;依照其余种类的第二分布列表,从小优先等级种类到大优先等级种类在在先配置的电商业务数据集中进行挑选,这样在挑选数据推送对象中削弱了对挑选全局周期较大的种类的挑选过程,从而优化了挑选数据推送对象。
在上述步骤S213至S218中,通过获得每一个种类的挑选可能性和挑选全局周期,首先,判断挑选可能性之间的比较向量小于指定比较向量的连续不少于两个种类;这样,能够在待推荐电商业务数据的若干个种类中挑选出挑选可能性相差不多的连续不少于两个种类,即确定出虽然种类优先等级存在差异的但是挑选可能性却相近的种类。然后,将连续不少于两个种类中挑选全局周期最小的个种类作为目标个种类,并在待推荐电商业务数据的不少于两个种类中,将连续不少于两个种类中目标个种类之外的种类进行清洗,得到其余种类;这样,在不少于两个种类中,清洗挑选可能性与目标个种类相差很小但是挑选全局周期又大于目标个种类的挑选全局周期的种类,以减少待推荐电商业务数据的若干个种类中挑选全局周期较大的种类;从而能够在挑选数据推送对象中减少对挑选全局周期较大的种类的不必要挑选,能够优化挑选数据推送对象,从而提高对待推荐电商业务数据的其余种类进行挑选的效率。
步骤S202,结合所述挑选数据推送对象,在在先配置的电商业务数据集中挑选所述待推荐电商业务数据关联的目标电商业务数据。
在本实施例中,依照挑选数据推送对象中指示的挑选方式对指定电商业务数据集进行若干次挑选,从而得到待推荐电商业务数据关联的目标电商业务数据。挑选数据推送对象存在差异的,对指定电商业务数据集进行挑选的过程则存在差异的。在(1)中,如果挑选数据推送对象为依照第一分布列表从小优先等级种类至高优先等级种类进行逐步挑选,那么在在先配置的电商业务数据集中从小优先等级种类至高优先等级种类进行逐步挑选,在挑选的过程中,将低一个种类的待定电商业务数据簇作为高一个种类的被挑选的电商业务数据,并且将指定电商业务数据集作为最低优先等级种类的被挑选电商业务数据。
在本实施例中,指定数目目标值可以是基于当前处理的任务设定的。如果待定电商业务数据簇的向量不大于指定数目目标值说明该待定电商业务数据簇的向量符合指定数目目标值,说明基于该种类的知识向量能够寻找到关联度较高的电商业务数据,实现了在在先配置的电商业务数据集中的精细化处理。如果当前优先等级种类达到最第一种类,说明已经对指定电商业务数据集进行了多次挑选,为使得挑选工作量不至于过大,终止挑选,并将最第一种类下电商业务数据知识向量挑选到的待定电商业务数据簇作为目标电商业务数据。这样,采用若干个种类的电商业务数据知识向量在在先配置的电商业务数据集中进行逐步挑选,既能够降低挑选过程所消耗的数据量,还能够使得挑选到的目标电商业务数据与待推荐电商业务数据的关联度较高。
在本实施例中,对于随机一个种类来说,通过统计该个种类挑选的电商业务数据向量以及该个种类的低一个种类挑选的电商业务数据向量,确定该个种类的挑选可能性,即上述步骤S213中“获得每一个种类的挑选可能性”可以通过以下步骤实现。
第一步,获得随机一个种类对应的待定电商业务数据簇的第一向量,以及所述随机一个种类的低一个种类对应的待定电商业务数据簇的第二向量。
这里,将随机一个种类的低一个种类对应的待定电商业务数据簇作为被挑选电商业务数据,依照随机一个种类的电商业务数据知识向量,在被挑选电商业务数据中进行挑选,从而得到随机一个种类对应的待定电商业务数据簇。统计随机一个种类对应的待定电商业务数据簇中的向量,即得到第一向量。第二向量即被挑选电商业务数据的向量。对于最低优先等级种类来说,被挑选电商业务数据为指定电商业务数据集,那么第二向量即为指定电商业务数据集中电商业务数据的向量,第一向量为最低优先等级种类的电商业务数据知识向量在在先配置的电商业务数据集中挑选得到的待定电商业务数据簇的向量。
在本实施例中,随机一个种类为本次挑选的种类,譬如,本次挑选的种类为98重要节点的种类,那么随机一个种类即为表征重要节点数目为98的种类。随机一个种类的低一个种类表征与随机一个种类的优先等级相邻且比该随机一个种类低一级的种类,还可以理解为是与随机一个种类的优先等级相邻且表征的知识向量数目小于随机一个种类表征的知识向量数目。对低一个种类的电商业务数据知识向量在低一个种类的低一个种类所对应的待定电商业务数据簇中进行寻找之后,得到小一个种类的待定电商业务数据簇,并统计待定电商业务数据簇的向量。
第二步,结合所述第二向量和所述第一向量,确定所述随机一个种类的挑选可能性。
在本实施例中,上述第二步可以通过两种方式实现。
(1):在开始对待推荐电商业务数据进行逐步挑选之前,依照该个种类表征的知识向量的进行系统预热,以获得每一个种类的挑选可能性。
这里,根据该个种类表征的知识向量在在先配置的电商业务数据集中进行寻找,以统计该个种类的知识向量在在先配置的电商业务数据集中能够挑选出的电商业务数据向量;将该向量于指定电商业务数据集中的全局向量加权处理,即可得到该个种类的挑选可能性。还可以是依照挑选数据推送对象在在先配置的电商业务数据集中进行挑选的过程中,确定该个种类挑选到的电商业务数据向量以及被挑选的电商业务数据向量,从而实时优化该个种类的挑选可能性。
对于一些可能实施的实施例而言,基于随机一个种类的电商业务数据知识向量,在随机一个种类的低一优先等级种类对应的待定电商业务数据簇中,寻找与该随机一个种类的电商业务数据知识向量关联度较高的待定电商业务数据簇,并统计这些寻找到的待定电商业务数据簇的向量。对于当前优先等级种类而言,第二向量即为随机一个种类的被挑选电商业务数据的向量,第一向量为从被挑选电商业务数据中挑选出的电商业务数据的向量。这样,通过将第一向量与第二向量加权处理,即可得到随机一个种类的挑选可能性。如此,既能够通过指定电商业务数据集依照随机一个种类的电商业务数据知识向量回归分析这一个种类的挑选可能性,还能够在挑选过程中,实时对回归分析的挑选可能性进行优化,以提供随机一个种类的更加准确的挑选可能性。
(2):在对待推荐电商业务数据进行逐步挑选的过程,实时对系统指定的挑选可能性进行优化。
这里,基于该种类的电商业务数据知识向量,在随机一个种类的低一优先等级种类对应的待定电商业务数据簇中,寻找与该任一优先等级种类的电商业务数据知识向量关联度较高的待定电商业务数据簇,并统计这些寻找到的待定电商业务数据簇的向量。对于任一别种类而言,第一向量即为任一优先等级种类的被挑选电商业务数据的向量,第二向量为从被挑选电商业务数据中挑选出的电商业务数据的向量。这样,通过将第一向量与第二向量加权处理,即可得到任一优先等级种类的挑选可能性。
在一种可替换的实施例中,对于若干个种类中的随机一个种类,通过统计随机一个种类的待定电商业务数据簇的向量,以及作为被挑选电商业务数据的向量,能够快速统计每一个种类的待定电商业务数据簇的向量;这样,依照一个种类的待定电商业务数据簇的向量与低一个种类的待定电商业务数据簇的向量,即可准确统计这一个种类的挑选可能性。
对于一些可能实施的实施例而言,对于随机一个种类来说,通过统计随机一个种类挑选的电商业务数据向量以及该个种类挑选数量,确定该个种类的挑选可能性,即上述步骤S213中“获得每一个种类的挑选可能性”可以通过以下步骤实现。
第一步,获得随机一个种类的片段簇和挑选数量。
在本实施例中,片段簇包括:所述随机一个种类和所述随机一个种类的低个种类在每一次挑选中的片段。
第二步,结合所述随机一个种类的片段簇和挑选数量,确定所述随机一个种类的挑选全局周期。
在本实施例中,依照挑选数据推送对象,基于若干个种类的电商业务数据知识向量在电商业务数据集中进行挑选,从而挑选出目标电商业务数据,即上述步骤S202可以通过如下步骤实现。
步骤S301,在所述指定电商业务数据集中,依照所述挑选数据推送对象中的分布列表从小优先等级种类至高优先等级种类,挑选与所述待推荐电商业务数据的电商业务数据知识向量关联的待定电商业务数据簇。
在本实施例中,依照挑选路径规第二种类优先等级的分布列表,在在先配置的电商业务数据集中逐步挑选与本次挑选的种类的电商业务数据知识向量关联的电商业务数据,即得到本次挑选的种类待定电商业务数据簇。这样,依照挑选数据推送对象中的分布列表从小优先等级种类至高优先等级种类,能够为每一个种类挑选与该个种类的电商业务数据知识向量关联的待定电商业务数据簇。
对于一些可能实施的实施例而言,基于该分布列表,依照种类优先等级从小到大,依次在在先配置的电商业务数据集中寻找与本次寻找的种类对应的电商业务数据知识向量相似度较高的待定电商业务数据簇。譬如,不少于两个种类包括:第一种类、第二种类和第三种类,那么依照第三种类、第二种类和第一种类的顺序,在在先配置的电商业务数据集中先寻找与低优先等级的种类的电商业务数据知识向量关联度较高的待定电商业务数据簇,在此基础上继续寻找与第二种类的电商业务数据知识向量关联度较高的待定电商业务数据簇,在此基础上继续寻找与第一种类的电商业务数据知识向量关联度较高的待定电商业务数据簇。
步骤S302,结合所述随机一个种类对应的待定电商业务数据簇和所述随机一个种类的种类优先等级,确定随机一个种类是否符合表征挑选终止的指定要求。
在本实施例中,确定待推荐电商业务数据的最低个种类的电商业务数据知识向量之后,在在先配置的电商业务数据集中挑选与最低个种类的电商业务数据知识向量相似度大于一定目标值的待定电商业务数据簇。
对于一些可能实施的实施例而言,假设指定要求为随机一个种类对应的待定电商业务数据簇的第一向量不大于指定数目目标值。依照最低个种类的电商业务数据知识向量在在先配置的电商业务数据集中进行初筛之后,确定挑选到的待定电商业务数据簇的向量。如果向量不大于指定数目目标值,说明基于该最低个种类的电商业务数据知识向量进行的一次初筛即达到了电商业务数据关联的需求,可以将挑选到的待定电商业务数据簇直接作为目标电商业务数据。如果向量不大于指定数目目标值,说明基于该最低个种类的电商业务数据知识向量进行的初筛未达到电商业务数据关联的需求,那么需要在挑选到的待定电商业务数据簇的基础上,依照该最低个种类的高一个种类的电商业务数据知识向量进行寻找,已得到大一个种类的待定电商业务数据簇。这样,得到大一个种类的待定电商业务数据簇之后,进一步判断种类对应的待定电商业务数据簇的向量是否不大于指定数目目标值,以确定该待定电商业务数据簇是否可以作为目标电商业务数据。
示例性的,以不少于两个种类包括:第一种类、第二种类和第三种类为例,首先,依照第三种类的电商业务数据知识向量在在先配置的电商业务数据集中进行初筛,确定挑选到的待定电商业务数据簇的向量;然后,如果该向量大于指定数目目标值,依照第二种类的电商业务数据知识向量在在先配置的电商业务数据集中进行进一步精筛,并确定挑选到的待定电商业务数据簇的向量;最后,如果该向量大于指定数目目标值,依照第一种类的电商业务数据知识向量在在先配置的电商业务数据集中进行精细化处理,无论挑选到的待定电商业务数据簇的向量是否不大于指定数目目标值,都将本轮挑选到的待定电商业务数据簇视为目标电商业务数据。
在本实施例中,指定要求可以包括如下要求。
(a):所述随机一个种类对应的待定电商业务数据簇的第一向量不大于指定数目目标值。
(b):所述随机一个种类对应的待定电商业务数据簇相比于所述指定电商业务数据集的总挑选可能性不大于指定挑选可能性目标值。
这里,在(a)和(b)中,指定数目目标值和指定挑选可能性目标值都可以是基于当前处理的任务配置的。如果待定电商业务数据簇的向量不大于指定数目目标值说明该待定电商业务数据簇的向量符合指定数目目标值,说明基于该种类的知识向量能够寻找到关联度较高的电商业务数据,实现了在在先配置的电商业务数据集中的精细化处理。
(c):所述随机一个种类的种类优先等级为最第一种类。
这里,如果随机一个种类达到待推荐电商业务数据中不少于两个种类中的最第一种类,说明已经对指定电商业务数据集进行了多次挑选,为使得挑选任务量小,终止挑选,并将最第一种类下电商业务数据知识向量挑选到的待定电商业务数据簇作为目标电商业务数据。
(d):所述随机一个种类的挑选全局周期在连续不少于两个种类中最小。
这里,所述随机一个种类与所述连续不少于两个种类的挑选可能性之间的比较向量小于指定比较向量,且所述连续不少于两个种类和所述随机一个种类中包括最高优先等级的种类。在对待推荐电商业务数据的不少于两个种类,在在先配置的电商业务数据集中进行挑选的过程中,每次挑选之后,统计本次挑选的挑选可能性以及与低一个种类的挑选可能性之间的比较向量;连续不少于两个种类的挑选可能性之间的比较向量为连续的每两个种类之间的比较向量。如果这样连续不少于两个种类的挑选可能性之间的比较向量均小于指定比较向量,而且连续不少于两个种类中还包括最高优先等级的种类,说明待推荐电商业务数据的整个挑选过程已完成。这样,如果连续不少于两个种类的挑选可能性之间的比较向量均小于指定比较向量,说明这几个种类的挑选可能性相差不多,那么通过另一个指标挑选全局周期判断这几个种类的挑选效果。如此,在挑选可能性相差不多的连续不少于两个种类中,将挑选全局周期最小的种类作为挑选终止的种类,能够为待推荐电商业务数据挑选出更为准确的待定电商业务数据簇。这样表征挑选终止的指定要求中充分考虑了挑选周期和挑选可能性,使得挑选周期和挑选可能性满足指定要求。
在上述(a)至(d)中,无论挑选的随机一个种类符合(a)至(d)中的随机一个,都终止挑选,将该随机一个种类作为最终的种类,既能够减少不必要的挑选数量,还能够提高挑选到的待定电商业务数据簇的精确度。
步骤S303,响应于所述随机一个种类符合所述指定要求,结合所述随机一个种类的电商业务数据知识向量,在所述随机一个种类的低一个种类对应的待定电商业务数据簇中挑选所述目标电商业务数据。
在本实施例中,确定随机一个种类符合所述指定要求之后(譬如,确定挑选全局周期在连续不少于两个种类中最小),获得该随机一个种类的电商业务数据知识向量。在该随机一个种类的低一个种类的待定电商业务数据簇的基础上,采用该随机一个种类所表征的电商业务数据知识向量,在该低一个种类对应的待定电商业务数据簇中进行寻找,以寻找到与随机一个种类所表征的电商业务数据知识向量相似度较高的目标电商业务数据。这样,以该随机一个种类的低一个种类的待定电商业务数据簇作为被挑选的电商业务数据,依照该随机一个种类所表征的电商业务数据知识向量,在被挑选的电商业务数据中进行寻找,以得到该随机一个种类的待定电商业务数据簇,级该目标电商业务数据。
通过上述步骤S301至步骤S303,从最低个种类开始,依照依照所述挑选数据推送对象中的分布列表,在在先配置的电商业务数据集中挑选出与待推荐电商业务数据的电商业务数据知识向量关联的待定电商业务数据簇;这样,能够得到每一次挑选的每一个种类对应的待定电商业务数据簇,便于后续依照每一个种类的待定电商业务数据簇的挑选可能性和种类优先等级判断是否在该个种类终止挑选。譬如,如果随机一个种类的挑选全局周期在连续不少于两个种类中最小,那么在该随机一个种类终止挑选;并且将该随机一个种类的低一个种类对应的待定电商业务数据簇作为被挑选的电商业务数据,依照随机一个种类的电商业务数据知识向量,在被挑选的电商业务数据中能够挑选到与待推荐电商业务数据相似度较高的目标电商业务数据,进而提升了挑选到的目标电商业务数据的可信度。
本申请实施例提供的基于大数据的推荐方法,具体可以包括如下步骤。、
步骤S401,获得局部电商业务数据。
对于一些可能实施的实施例而言,可以通过步骤获得局部电商业务数据所描述的步骤,具体可以包括以下内容。
步骤S501,获得初始电商业务数据主题。
步骤S502,确定初始电商业务数据主题是否为电商业务数据种类主题。
这里,如果初始电商业务数据主题是电商业务数据种类主题进入步骤S504,如果初始电商业务数据主题不是电商业务数据种类主题进入步骤S503。
步骤S503,在视频主题中选取至少一帧电商业务数据作为待推荐电商业务数据。
步骤S504,获得电商信息属性的电商业务数据主题。
通过上述步骤S501至步骤S504获得局部电商业务数据。
步骤S402,对局部电商业务数据抽取存在差异的大小种类的局部知识向量。
在本实施例中,输入为已获得的局部电商业务数据。输出为存在差异的大小种类的局部知识向量。
在上述基础上,请结合参阅图2,提供了一种基于大数据的推荐装置200,应用于基于大数据的推荐系统,所述装置包括:
数据获得模块210,用于获得待推荐电商业务数据;
向量确定模块220,用于确定所述待推荐电商业务数据的不少于两个种类的电商业务数据知识向量;
数据推荐模块230,用于结合所述不少于两个种类的电商业务数据知识向量,在在先配置的电商业务数据集中挑选所述待推荐电商业务数据关联的目标电商业务数据。
在上述基础上,请结合参阅图3,示出了一种基于大数据的推荐系统300,包括互相之间通信的处理器310和存储器320,所述处理器310用于从所述存储器320中读取计算机程序并执行,以实现上述的方法。
在上述基础上,还提供了一种计算机可读存储介质,其上存储的计算机程序在运行时实现上述的方法。
综上,基于上述方案,对于获得的待推荐电商业务数据;通过确定待推荐电商业务数据的不少于两个种类的电商业务数据知识向量,能够便于通过不少于两个种类的电商业务数据知识向量在在先配置的电商业务数据集中进行目标电商业务数据的若干次探索;这样基于不少于两个种类的电商业务数据知识向量,在在先配置的电商业务数据集中若干次挑选,能够挑选到与待推荐电商业务数据更加关联的目标电商业务数据;因此,通过不少于两个种类的 知识向量能够有效的对于大量的指定电商业务数据集进行挑选,既能够提高挑选目标电商业务数据的效率又能够提高挑选目标电商业务数据的准确性;从而能够更加准确的进行数据推送,且提高数据推送的准确率和可靠性。
应当理解,上述所示的系统及其模块可以利用各种方式来实现。例如,在一些实施例中,系统及其模块可以通过硬件、软件或者软件和硬件的结合来实现。其中,硬件部分可以利用专用逻辑来实现;软件部分则可以存储在存储器中,由适当的指令执行系统,例如微处理器或者专用设计硬件来执行。本领域技术人员可以理解上述的方法和系统可以使用计算机可执行指令和/或包含在处理器控制代码中来实现,例如在诸如磁盘、CD或DVD-ROM的载体介质、诸如只读存储器(固件)的可编程的存储器或者诸如光学或电子信号载体的数据载体上提供了这样的代码。本申请的系统及其模块不仅可以有诸如超大规模集成电路或门阵列、诸如逻辑芯片、晶体管等的半导体、或者诸如现场可编程门阵列、可编程逻辑设备等的可编程硬件设备的硬件电路实现,也可以用例如由各种类型的处理器所执行的软件实现,还可以由上述硬件电路和软件的结合(例如,固件)来实现。
需要说明的是,不同实施例可能产生的有益效果不同,在不同的实施例里,可能产生的有益效果可以是以上任意一种或几种的组合,也可以是其他任何可能获得的有益效果。
上文已对基本概念做了描述,显然,对于本领域技术人员来说,上述详细披露仅仅作为示例,而并不构成对本申请的限定。虽然此处并没有明确说明,本领域技术人员可能会对本申请进行各种修改、改进和修正。该类修改、改进和修正在本申请中被建议,所以该类修改、改进、修正仍属于本申请示范实施例的精神和范围。
同时,本申请使用了特定词语来描述本申请的实施例。如“一个实施例”、“一实施例”、和/或“一些实施例”意指与本申请至少一个实施例相关的某一特征、结构或特点。因此,应强调并注意的是,本说明书中在不同位置两次或多次提及的“一实施例”或“一个实施例”或“一个替代性实施例”并不一定是指同一实施例。此外,本申请的一个或多个实施例中的某些特征、结构或特点可以进行适当的组合。
此外,本领域技术人员可以理解,本申请的各方面可以通过若干具有可专利性的种类或情况进行说明和描述,包括任何新的和有用的工序、机器、产品或物质的组合,或对他们的任何新的和有用的改进。相应地,本申请的各个方面可以完全由硬件执行、可以完全由软件(包括固件、常驻软件、微码等)执行、也可以由硬件和软件组合执行。以上硬件或软件均可被称为“数据块”、“模块”、“引擎”、“单元”、“组件”或“系统”。此外,本申请的各方面可能表现为位于一个或多个计算机可读介质中的计算机产品,该产品包括计算机可读程序编码。
计算机存储介质可能包含一个内含有计算机程序编码的传播数据信号,例如在基带上或作为载波的一部分。该传播信号可能有多种表现形式,包括电磁形式、光形式等,或合适的组合形式。计算机存储介质可以是除计算机可读存储介质之外的任何计算机可读介质,该介质可以通过连接至一个指令执行系统、装置或设备以实现通讯、传播或传输供使用的程序。位于计算机存储介质上的程序编码可以通过任何合适的介质进行传播,包括无线电、电缆、光纤电缆、RF、或类似介质,或任何上述介质的组合。
本申请各部分操作所需的计算机程序编码可以用任意一种或多种程序语言编写,包括面向对象编程语言如Java、Scala、Smalltalk、Eiffel、JADE、Emerald、C++、C#、VB.NET、Python等,常规程序化编程语言如C语言、Visual Basic、Fortran 2003、Perl、COBOL 2002、PHP、ABAP,动态编程语言如Python、Ruby和Groovy,或其他编程语言等。该程序编码可以完全在用户计算机上运行、或作为独立的软件包在用户计算机上运行、或部分在用户计算机上运行部分在远程计算机运行、或完全在远程计算机或服务器上运行。在后种情况下,远程计算机可以通过任何网络形式与用户计算机连接,比如局域网(LAN)或广域网(WAN),或连接至外部计算机(例如通过因特网),或在云计算环境中,或作为服务使用如软件即服务(SaaS)。
此外,除非权利要求中明确说明,本申请所述处理元素和序列的顺序、数字字母的使用、或其他名称的使用,并非用于限定本申请流程和方法的顺序。尽管上述披露中通过各种示例讨论了一些目前认为有用的发明实施例,但应当理解的是,该类细节仅起到说明的目的,附加的权利要求并不仅限于披露的实施例,相反,权利要求旨在覆盖所有符合本申请实施例实质和范围的修正和等价组合。例如,虽然以上所描述的系统组件可以通过硬件设备实现,但是也可以只通过软件的解决方案得以实现,如在现有的服务器或移动设备上安装所描述的系统。
同理,应当注意的是,为了简化本申请披露的表述,从而帮助对一个或多个发明实施例的理解,前文对本申请实施例的描述中,有时会将多种特征归并至一个实施例、附图或对其的描述中。但是,这种披露方法并不意味着本申请对象所需要的特征比权利要求中提及的特征多。实际上,实施例的特征要少于上述披露的单个实施例的全部特征。
一些实施例中使用了描述成分、属性数量的数字,应当理解的是,此类用于实施例描述的数字,在一些示例中使用了修饰词“大约”、“近似”或“大体上”来修饰。除非另外说明,“大约”、“近似”或“大体上”表明所述数字允许有适应性的变化。相应地,在一些实施例中,说明书和权利要求中使用的数值参数均为近似值,该近似值根据个别实施例所需特点可以发生改变。在一些实施例中,数值参数应考虑规定的有效数位并采用一般位数保留的方法。尽管本申请一些实施例中用于确认其范围广度的数值域和参数为近似值,在具体实施例中,此类数值的设定在可行范围内尽可能精确。
针对本申请引用的每个专利、专利申请、专利申请公开物和其他材料,如文章、书籍、说明书、出版物、文档等,特此将其全部内容并入本申请作为参考。与本申请内容不一致或产生冲突的申请历史文件除外,对本申请权利要求最广范围有限制的文件(当前或之后附加于本申请中的)也除外。需要说明的是,如果本申请附属材料中的描述、定义、和/或术语的使用与本申请所述内容有不一致或冲突的地方,以本申请的描述、定义和/或术语的使用为准。
最后,应当理解的是,本申请中所述实施例仅用以说明本申请实施例的原则。其他的变形也可能属于本申请的范围。因此,作为示例而非限制,本申请实施例的替代配置可视为与本申请的教导一致。相应地,本申请的实施例不仅限于本申请明确介绍和描述的实施例。
以上仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。
Claims (2)
1.一种基于大数据的推荐方法,其特征在于,该方法至少包括:
获得待推荐电商业务数据;
确定所述待推荐电商业务数据的不少于两个种类的电商业务数据知识向量;
结合所述不少于两个种类的电商业务数据知识向量,在在先配置的电商业务数据集中挑选所述待推荐电商业务数据关联的目标电商业务数据;
所述获得待推荐电商业务数据的步骤,包括:
获得输入的初始电商业务数据主题;
响应于所述初始电商业务数据主题的种类为电商信息属性,对所述初始电商业务数据主题进行预处理,确定所述待推荐电商业务数据;
或者,响应于所述初始电商业务数据主题的种类为事件种类,在所述初始电商业务数据主题中选择电商业务数据评估符合指定要求的不少于一个电商业务数据;
对所述不少于一个电商业务数据进行预处理,确定所述待推荐电商业务数据;
所述确定所述待推荐电商业务数据的不少于两个种类的电商业务数据知识向量,包括以下两种方式之一:
方式一,结合所述待推荐电商业务数据所在的商品种类,确定表征存在差异的知识向量数目的不少于两个;
在所述不少于两个的表征存在差异的知识向量上,逐一对所述待推荐电商业务数据进行知识向量抽取,确定所述不少于两个种类的电商业务数据知识向量;
或者,方式二,所述不少于两个种类包括X个种类,X为不小于1的整数,在第a个种类上对所述待推荐电商业务数据进行知识向量抽取,得到第a个种类的电商业务数据知识向量;其中,a为不小于1且不大于X的整数;
结合第a-1个种类对所述第a个种类的电商业务数据知识向量进行简单随机抽样,确定所述第a-1个种类的电商业务数据知识向量;其中,所述第a个种类的优先等级超过所述第a-1个种类的优先等级;
所述结合所述不少于两个种类的电商业务数据知识向量,在在先配置的电商业务数据集中挑选所述待推荐电商业务数据关联的目标电商业务数据,包括:
结合所述不少于两个种类,获得挑选数据推送对象;
结合所述挑选数据推送对象,在在先配置的电商业务数据集中挑选所述待推荐电商业务数据关联的目标电商业务数据;
所述结合所述不少于两个种类,获得挑选数据推送对象,包括以下两种方式之一:
方式一,依照种类表征的知识向量的数目,对所述不少于两个种类的种类优先等级进行分布,得到第一分布列表;其中,所述种类表征的知识向量的数目越大,所述种类的优先等级越高;
将依照所述第一分布列表从低优先等级种类至高优先等级种类进行逐步挑选,确定为所述挑选数据推送对象;
或者,方式二,获得每一个种类的挑选可能性,以及,获得每一个种类的挑选全局周期;
结合所述每一个种类的挑选可能性,确定挑选可能性之间的比较向量小于指定比较向量的连续不少于两个种类;
在所述连续不少于两个种类中,确定挑选全局周期最小的目标个种类;
在所述不少于两个种类中,对所述连续不少于两个种类中所述目标个种类之外的种类进行清洗,得到其余种类;
对所述其余种类中的种类优先等级进行分布,得到第二分布列表;将依照所述第二分布列表从低优先等级种类至高优先等级种类进行挑选,确定为所述挑选数据推送对象;
所述结合所述挑选数据推送对象,在在先配置的电商业务数据集中挑选所述待推荐电商业务数据关联的目标电商业务数据,包括:
在指定电商业务数据集中,依照所述挑选数据推送对象中的分布列表从低优先等级种类至高优先等级种类,挑选与所述待推荐电商业务数据的电商业务数据知识向量关联的待定电商业务数据簇;
结合随机一个种类对应的待定电商业务数据簇和所述随机一个种类的种类优先等级,确定所述随机一个种类是否符合表征挑选终止的指定要求;
响应于所述随机一个种类符合所述指定要求,结合所述随机一个种类的电商业务数据知识向量,在所述随机一个种类的低一个种类对应的待定电商业务数据簇中挑选所述目标电商业务数据;
所述指定要求包括以下至少之一:
所述随机一个种类对应的待定电商业务数据簇的第一向量不大于指定数目目标值;
所述随机一个种类对应的待定电商业务数据簇相比于所述指定电商业务数据集的总挑选可能性不大于指定挑选可能性目标值;
所述随机一个种类的种类优先等级为最第一种类;
所述随机一个种类的目标挑选全局周期在连续不少于两个种类中最小,其中,所述随机一个种类与所述连续不少于两个种类的目标挑选可能性之间的比较向量小于指定比较向量,且所述连续不少于两个种类和所述随机一个种类中包括最高优先等级的种类;
其中,在对待推荐电商业务数据的不少于两个种类,在在先配置的电商业务数据集中进行挑选的过程中,每次挑选之后,统计本次挑选的挑选可能性以及与低一个种类的挑选可能性之间的比较向量;连续不少于两个种类的挑选可能性之间的比较向量为连续的每两个种类之间的比较向量,如果这样连续不少于两个种类的挑选可能性之间的比较向量均小于指定比较向量,而且连续不少于两个种类中还包括最高优先等级的种类,说明待推荐电商业务数据的整个挑选过程已完成;
其中,在所述不少于两个种类包括X个种类的前提上,所述在指定电商业务数据集中,依照所述挑选数据推送对象中的分布列表从低优先等级种类至高优先等级种类,挑选与所述待推荐电商业务数据的电商业务数据知识向量关联的待定电商业务数据簇,包括:
从第1个种类开始,依照所述挑选数据推送对象中的分布列表在第a-1个种类对应的待定电商业务数据簇中挑选与第a个种类的电商业务数据知识向量相关联的待定电商业务数据簇,直到所述第a个种类符合所述指定要求;其中,所述第1个种类表征所述X个种类中的最低个种类,在a取值为1的前提上,所述第a-1个种类对应的待定电商业务数据簇为所述指定电商业务数据集;
所述获得每一个种类的挑选可能性,包括:获得随机一个种类对应的待定电商业务数据簇的第一向量,以及所述随机一个种类的低一个种类对应的待定电商业务数据簇的第二向量;结合所述第二向量和所述第一向量,确定所述随机一个种类的挑选可能性;
其中,所述获得每一个种类的挑选全局周期,包括:获得随机一个种类的片段簇和挑选数量;其中,所述片段簇包括:所述随机一个种类和所述随机一个种类的低个种类在每一次挑选中的片段;结合所述随机一个种类的片段簇和挑选数量,确定所述随机一个种类的挑选全局周期;
其中,确定待推荐电商业务数据的最低个种类的电商业务数据知识向量之后,在在先配置的电商业务数据集中挑选与最低个种类的电商业务数据知识向量相似度大于一定目标值的待定电商业务数据簇,当指定要求为随机一个种类对应的待定电商业务数据簇的第一向量不大于指定数目目标值时,依照最低个种类的电商业务数据知识向量在在先配置的电商业务数据集中进行初筛之后,确定挑选到的待定电商业务数据簇的向量,如果该待定电商业务数据簇的向量不大于指定数目目标值,将挑选到的待定电商业务数据簇直接作为目标电商业务数据,如果该待定电商业务数据簇的向量不大于指定数目目标值,在挑选到的待定电商业务数据簇的基础上,依照该最低个种类的高一个种类的电商业务数据知识向量进行寻找,得到高一个种类的待定电商业务数据簇;其中,依照第三种类的电商业务数据知识向量在在先配置的电商业务数据集中进行初筛,确定挑选到的待定电商业务数据簇的向量;如果该待定电商业务数据簇的向量大于指定数目目标值,依照第二种类的电商业务数据知识向量在在先配置的电商业务数据集中进行进一步精筛,并确定挑选到的待定电商业务数据簇的向量,如果该待定电商业务数据簇的向量大于指定数目目标值,依照第一种类的电商业务数据知识向量在在先配置的电商业务数据集中进行精细化处理,将本轮挑选到的待定电商业务数据簇视为目标电商业务数据;
每一个种类的挑选可能性表征该个种类挑选出的电商业务数据向量相对于被挑选的电商业务数据向量的置信度,每一个种类的挑选全局周期表征该个种类在在先配置的电商业务数据集中进行一次挑选的周期;
不少于两个种类包括:第一种类、第二种类和第三种类,其中,第一种类对应的电商业务数据重要节点的数目大于第二种类对应的电商业务数据重要节点的数目,第二种类对应的电商业务数据重要节点的数目大于第三种类对应的电商业务数据重要节点的数目。
2.一种基于大数据的推荐系统,其特征在于,包括互相之间通信的处理器和存储器,所述处理器用于从所述存储器中读取计算机程序并执行,以实现权利要求1所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211164888.3A CN115423569B (zh) | 2022-09-23 | 2022-09-23 | 一种基于大数据的推荐方法及基于大数据的推荐系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211164888.3A CN115423569B (zh) | 2022-09-23 | 2022-09-23 | 一种基于大数据的推荐方法及基于大数据的推荐系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115423569A CN115423569A (zh) | 2022-12-02 |
CN115423569B true CN115423569B (zh) | 2023-09-01 |
Family
ID=84204412
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211164888.3A Active CN115423569B (zh) | 2022-09-23 | 2022-09-23 | 一种基于大数据的推荐方法及基于大数据的推荐系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115423569B (zh) |
Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104537065A (zh) * | 2014-12-29 | 2015-04-22 | 北京奇虎科技有限公司 | 一种搜索结果的推送方法及系统 |
CN110909176A (zh) * | 2019-11-20 | 2020-03-24 | 腾讯科技(深圳)有限公司 | 数据推荐方法、装置、计算机设备以及存储介质 |
CN111523010A (zh) * | 2019-02-03 | 2020-08-11 | 阿里巴巴集团控股有限公司 | 推荐方法、装置、终端设备及计算机存储介质 |
CN111552880A (zh) * | 2020-04-30 | 2020-08-18 | 杭州网易再顾科技有限公司 | 基于知识图谱的数据处理方法、装置、介质及电子设备 |
CN112612973A (zh) * | 2020-12-31 | 2021-04-06 | 重庆邮电大学 | 结合知识图谱的个性化智能服装搭配推荐方法 |
CN113326441A (zh) * | 2020-11-17 | 2021-08-31 | 崔海燕 | 基于大数据业务定位的信息推送方法及系统 |
CN113360762A (zh) * | 2021-06-19 | 2021-09-07 | 阚忠建 | 基于人工智能的内容推荐方法及人工智能内容推荐系统 |
CN114117235A (zh) * | 2021-12-07 | 2022-03-01 | 绥化市纯互联网商务有限公司 | 采用人工智能分析的电商内容推送方法及电商大数据系统 |
CN114143035A (zh) * | 2021-11-04 | 2022-03-04 | 广州大学 | 知识图谱推荐系统的对抗攻击方法、系统、设备及介质 |
CN114221991A (zh) * | 2021-11-08 | 2022-03-22 | 梅瑞生 | 基于大数据的会话推荐反馈处理方法及深度学习服务系统 |
WO2022095701A1 (zh) * | 2020-11-04 | 2022-05-12 | 北京沃东天骏信息技术有限公司 | 一种对象推荐方法及装置、设备、存储介质 |
CN114547439A (zh) * | 2022-01-25 | 2022-05-27 | 王金山 | 基于大数据和人工智能的业务优化方法及电子商务ai系统 |
CN114880456A (zh) * | 2022-04-11 | 2022-08-09 | 董金龙 | 应用于数字化经济的跨境电商大数据分析方法及系统 |
WO2022188534A1 (zh) * | 2021-03-11 | 2022-09-15 | 北京沃东天骏信息技术有限公司 | 信息推送的方法和装置 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102131099B1 (ko) * | 2014-02-13 | 2020-08-05 | 삼성전자 주식회사 | 지식 그래프에 기초한 사용자 인터페이스 요소의 동적 수정 방법 |
US11537844B2 (en) * | 2020-02-03 | 2022-12-27 | Intuit Inc. | Systems and methods of business categorization and service recommendation |
US11526956B2 (en) * | 2020-02-14 | 2022-12-13 | Accenture Global Solutions Limited | Skill acquisition platform |
-
2022
- 2022-09-23 CN CN202211164888.3A patent/CN115423569B/zh active Active
Patent Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104537065A (zh) * | 2014-12-29 | 2015-04-22 | 北京奇虎科技有限公司 | 一种搜索结果的推送方法及系统 |
CN111523010A (zh) * | 2019-02-03 | 2020-08-11 | 阿里巴巴集团控股有限公司 | 推荐方法、装置、终端设备及计算机存储介质 |
CN110909176A (zh) * | 2019-11-20 | 2020-03-24 | 腾讯科技(深圳)有限公司 | 数据推荐方法、装置、计算机设备以及存储介质 |
CN111552880A (zh) * | 2020-04-30 | 2020-08-18 | 杭州网易再顾科技有限公司 | 基于知识图谱的数据处理方法、装置、介质及电子设备 |
WO2022095701A1 (zh) * | 2020-11-04 | 2022-05-12 | 北京沃东天骏信息技术有限公司 | 一种对象推荐方法及装置、设备、存储介质 |
CN113326441A (zh) * | 2020-11-17 | 2021-08-31 | 崔海燕 | 基于大数据业务定位的信息推送方法及系统 |
CN112612973A (zh) * | 2020-12-31 | 2021-04-06 | 重庆邮电大学 | 结合知识图谱的个性化智能服装搭配推荐方法 |
WO2022188534A1 (zh) * | 2021-03-11 | 2022-09-15 | 北京沃东天骏信息技术有限公司 | 信息推送的方法和装置 |
CN113360762A (zh) * | 2021-06-19 | 2021-09-07 | 阚忠建 | 基于人工智能的内容推荐方法及人工智能内容推荐系统 |
CN114143035A (zh) * | 2021-11-04 | 2022-03-04 | 广州大学 | 知识图谱推荐系统的对抗攻击方法、系统、设备及介质 |
CN114221991A (zh) * | 2021-11-08 | 2022-03-22 | 梅瑞生 | 基于大数据的会话推荐反馈处理方法及深度学习服务系统 |
CN114117235A (zh) * | 2021-12-07 | 2022-03-01 | 绥化市纯互联网商务有限公司 | 采用人工智能分析的电商内容推送方法及电商大数据系统 |
CN114547439A (zh) * | 2022-01-25 | 2022-05-27 | 王金山 | 基于大数据和人工智能的业务优化方法及电子商务ai系统 |
CN114880456A (zh) * | 2022-04-11 | 2022-08-09 | 董金龙 | 应用于数字化经济的跨境电商大数据分析方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN115423569A (zh) | 2022-12-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11526799B2 (en) | Identification and application of hyperparameters for machine learning | |
US10621493B2 (en) | Multiple record linkage algorithm selector | |
CN111309614A (zh) | A/b测试方法、装置及电子设备 | |
CN110339567B (zh) | 系统资源配置、场景预测模型训练方法和装置 | |
EP3853782A1 (en) | Application-or algorithm-specific quantum circuit design | |
JP2015526800A (ja) | ビジネスオブジェクトのプッシュ | |
CN114880314B (zh) | 应用人工智能策略的大数据清洗决策方法及ai处理系统 | |
US11928137B2 (en) | Management and optimization of search term clustering based on performance data | |
CN114565001A (zh) | 一种基于随机森林的图数据处理框架自动调优方法 | |
Mohammed et al. | Feature reduction based on hybrid efficient weighted gene genetic algorithms with artificial neural network for machine learning problems in the big data | |
CN112463859A (zh) | 基于大数据和业务分析的用户数据处理方法及大数据平台 | |
CN115423569B (zh) | 一种基于大数据的推荐方法及基于大数据的推荐系统 | |
CN112364185B (zh) | 多媒体资源的特征确定方法、装置、电子设备和存储介质 | |
CN113837807B (zh) | 热度预测方法、装置、电子设备及可读存储介质 | |
US9805290B2 (en) | Skeleton data point clustering | |
CN114625961A (zh) | 应用于大数据的智能化在线服务推送方法及大数据服务器 | |
CN113032547B (zh) | 基于人工智能的大数据处理方法、系统及云平台 | |
CN114489574B (zh) | 一种基于svm的流处理框架的自动调优方法 | |
US20200387811A1 (en) | Systems and methods for neighbor frequency aggregation of parametric probability distributions with decision trees | |
CN112860759A (zh) | 基于区块链安全认证的大数据挖掘方法及云认证服务系统 | |
CN113596849B (zh) | 一种智能家居的无线通信信道动态分配方法及系统 | |
CN116303097B (zh) | 智能合约的模糊测试方法、装置、设备、介质和程序产品 | |
CN114063879B (zh) | 用于处理操作命令的方法、电子设备和存储介质 | |
CN115564450B (zh) | 一种风控方法、装置、存储介质及设备 | |
CN117370471B (zh) | 基于修剪平均的全局预测方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20230802 Address after: Unit 602-1, No. 1126 Jimei North Avenue, Phase III, Software Park, Torch High tech Zone, Xiamen City, Fujian Province, 361115 Applicant after: Xiamen Ganqilai Technology Co.,Ltd. Address before: No. 36, Qixingguan District, Bijie City, Guizhou Province, 551700 Applicant before: Li Zhen |
|
GR01 | Patent grant | ||
GR01 | Patent grant |