CN112988845B - 在大数据业务场景下的数据信息处理方法及信息服务平台 - Google Patents

在大数据业务场景下的数据信息处理方法及信息服务平台 Download PDF

Info

Publication number
CN112988845B
CN112988845B CN202110354790.3A CN202110354790A CN112988845B CN 112988845 B CN112988845 B CN 112988845B CN 202110354790 A CN202110354790 A CN 202110354790A CN 112988845 B CN112988845 B CN 112988845B
Authority
CN
China
Prior art keywords
commerce
online
data
noise
service
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110354790.3A
Other languages
English (en)
Other versions
CN112988845A (zh
Inventor
毕延杰
花壮林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
HUNAN MACHINE HOME INFORMATION TECHNOLOGY CO.,LTD.
Original Assignee
Hunan Machine Home Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hunan Machine Home Information Technology Co ltd filed Critical Hunan Machine Home Information Technology Co ltd
Priority to CN202110354790.3A priority Critical patent/CN112988845B/zh
Publication of CN112988845A publication Critical patent/CN112988845A/zh
Application granted granted Critical
Publication of CN112988845B publication Critical patent/CN112988845B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2465Query processing support for facilitating data mining operations in structured databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2462Approximate or statistical queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/285Clustering or classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0203Market surveys; Market polls

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Finance (AREA)
  • Strategic Management (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Probability & Statistics with Applications (AREA)
  • General Engineering & Computer Science (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Fuzzy Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Game Theory and Decision Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请公开的在大数据业务场景下的数据信息处理方法及信息服务平台,由于模型配置数据与互动数据是存在关联的,且在线电商互动数据的当前业务噪声状态信息基于在线电商互动数据的业务转化程度信息确定的,因而不需要对单独的数据片段进行拆分处理,在出现数据片段互相关联的情况时,无需对多个数据片段进行拆分,针对不同状态信息的在线电商噪声互动数据,根据预先完成训练的当前业务噪声状态信息对应的模型配置数据,可以得到提升数据片段内容完整性、内容真实性以及内容准确性的去除业务噪声后的在线电商互动数据,进而获得噪声比较低的高质量在线电商互动数据。

Description

在大数据业务场景下的数据信息处理方法及信息服务平台
技术领域
本申请涉及大数据及信息处理技术领域,特别涉及在大数据业务场景下的数据信息处理方法及信息服务平台。
背景技术
依托于大数据的发展,各类互动业务得以在云端进行处理。以在线电商业务为例,当今的在线电商业务发展迅猛,以逐渐取代传统的线下商务模式,同时也催生出许多新兴产业和职业,为社会的数字化进程添砖加瓦。
电子商务(Electronic Commerce)通常是指在全球各地广泛的商业贸易活动中,在因特网开放的网络环境下,基于客户端/服务端应用方式,买卖双方不谋面地进行各种商贸活动,实现消费者的网上购物、商户之间的网上交易和在线电子支付以及各种商务活动、交易活动、金融活动和相关的综合服务活动的一种新型的商业运营模式。
随着电子商务竞争的加剧,为了确保用户存留率,各大电商平台几乎都在利用大数据挖掘技术进行用户分析,从而实现业务推送和服务升级。利用大数据挖掘技术进行用户分析的关键是对业务数据的分析。然而,如何获得噪声比较低的高质量业务数据是现目前需要改善的一个技术问题。
发明内容
为改善相关技术中存在的技术问题,本申请提供了在大数据业务场景下的数据信息处理方法及信息服务平台。
第一方面,本申请提供了一种在大数据业务场景下的数据信息处理方法,所述方法包括:
采集在线电商互动数据,并通过整合所述在线电商互动数据的业务转化程度信息,确定所述在线电商互动数据的当前业务噪声状态信息;
根据所述当前业务噪声状态信息,以及业务噪声状态信息与人工智能模型的模型配置数据的映射策略,确定所述当前业务噪声状态信息对应的人工智能模型的模型配置数据;其中,所述映射策略为通过对多组在线电商有效互动数据和多组在线电商噪声互动数据组成的训练样本集合进行训练得到的;
根据所述模型配置数据,对所述在线电商互动数据进行噪声数据过滤处理,得到去除业务噪声后的在线电商互动数据。
优选地,所述业务转化程度信息至少根据所述在线电商互动数据的电商流量转化指标确定,或者至少根据所述在线电商互动数据的电商页面访问量确定;
所述在线电商互动数据的业务转化程度信息包括在线电商互动数据的业务推广信息或在线电商互动数据的互动意向信息;
所述人工智能模型是决策树模型时,所述人工智能模型的模型配置数据为每个决策层所使用的决策条件内的决策参数,所述决策条件内的决策参数包括每个决策路径的决策条件内的决策参数;
所述映射策略的训练过程包括:
根据在线电商有效互动数据与在线电商噪声互动数据的唯一对应的映射策略,通过对多组在线电商有效互动数据和多组在线电商噪声互动数据组成训练样本集合,针对每一组训练样本对应的在线电商噪声互动数据,进行噪声数据过滤处理,使得过滤处理后的在线电商互动轨迹数据与该组训练样本对应的在线电商有效互动数据匹配,确定匹配时,所使用的人工智能模型的模型配置数据作为该组训练样本对中在线电商噪声互动数据对应的业务噪声状态信息的人工智能模型的模型配置数据。
优选地,所述业务噪声状态信息包括:全局业务噪声状态信息、局部业务噪声状态信息及潜在业务噪声状态信息,
或者,所述业务噪声状态信息包括:第1类状态信息至第n类状态信息,其中,n为大于或等于2的整数。
优选地,所述采集在线电商互动数据,包括:
采集历史电商平台互动数据;
整合所述历史电商平台互动数据的互动频率信息;
根据所述互动频率信息,得到采集所述历史电商平台互动数据时的交互时段信息;
调节所述交互时段信息,得到满足预设互动频率指标的频率信息;
采集具有所述频率信息的在线电商互动数据的互动数据内容;根据所述互动数据内容,提取在线电商互动数据;
相应的,所述通过整合所述在线电商互动数据的业务转化程度信息,确定所述在线电商互动数据的当前业务噪声状态信息,包括:
整合所述在线电商互动数据的电商流量转化指标;
对所述电商流量转化指标进行配对,并根据预设的电商流量转化指标与业务互动噪声状态信息的配对关系,确定所述在线电商互动数据的当前业务噪声状态信息;
或者,获取在线调试的在线电商噪声互动数据的电商流量转化指标及所对应的业务噪声状态信息,确定所述在线调试的在线电商噪声互动数据的电商流量转化指标中与所述在线电商互动数据的电商流量转化指标相等的电商流量转化指标所对应的业务噪声状态信息为所述在线电商互动数据的当前业务噪声状态信息。
优选地,所述采集在线电商互动数据,并通过整合所述在线电商互动数据的业务转化程度信息,确定所述在线电商互动数据的当前业务噪声状态信息之前,所述方法还包括:
获取多组在线电商有效互动数据及多组在线电商噪声互动数据,并将每个在线电商有效互动数据及所对应的在线电商噪声互动数据作为训练样本对,组成训练样本集合;
根据预设参数确定所述训练样本集合中所有训练样本对的业务噪声状态信息,其中,所述预设参数为预设业务除噪时长或者预设业务交互时长;
将所述训练样本集合中具有相同业务噪声状态信息的所有训练样本对及由相同业务噪声状态信息的训练样本对确定的状态关联结果,输入线性回归模型,进行训练;
在所述状态关联结果的权重值小于设定权重值时,完成所述训练,得到业务噪声状态信息与人工智能模型的模型配置数据的映射策略。
优选地,所述获取多组在线电商有效互动数据及多组在线电商噪声互动数据,并将每个在线电商有效互动数据及所对应的在线电商噪声互动数据作为训练样本对,组成训练样本集合,包括:
获取设定业务交互时刻采集的多组在线电商有效互动数据,及设定业务交互时段采集的多组在线电商噪声互动数据;
将同时采集的在线电商有效互动数据与在线电商噪声互动数据进行互动数据统计操作,得到互动标签相匹配的第一在线电商有效互动数据与第一在线电商噪声互动数据;
获得包含所述第一在线电商有效互动数据与所述第一在线电商噪声互动数据的训练样本对;
获得不同采集时刻下的训练样本对,组成训练样本集合。
优选地,所述获取多组在线电商有效互动数据及多组在线电商噪声互动数据,并将每个在线电商有效互动数据及所对应的在线电商噪声互动数据作为训练样本对,组成训练样本集合,包括:
获取设定业务交互时刻采集的多组在线电商有效互动数据;
根据噪声分类方式,对每个在线电商有效互动数据进行冗余数据除噪处理,生成每个在线电商有效互动数据对应的在线电商噪声互动数据;
获得包含第二在线电商有效互动数据与所述第二在线电商有效互动数据对应的第二在线电商噪声互动数据的训练样本对,其中,所述第二在线电商有效互动数据为所有在线电商有效互动数据中的任一在线电商有效互动数据;
获得每组在线电商有效互动数据对应的训练样本对,组成训练样本集合。
优选地,在所述业务噪声状态信息包括全局业务噪声状态信息、局部业务噪声状态信息及潜在业务噪声状态信息时,所述根据所述当前业务噪声状态信息,以及业务噪声状态信息与人工智能模型的模型配置数据的映射策略,确定所述当前业务噪声状态信息对应的人工智能模型的模型配置数据,包括:
在所述当前业务噪声状态信息为全局业务噪声状态信息时,从所述映射策略中选择全局业务噪声状态信息对应的人工智能模型的模型配置数据;
在所述当前业务噪声状态信息为局部业务噪声状态信息时,从所述映射策略中选择局部业务噪声状态信息对应的人工智能模型的模型配置数据;
在所述当前业务噪声状态信息为潜在业务噪声状态信息时,从所述映射策略中选择潜在业务噪声状态信息对应的人工智能模型的模型配置数据;
相应的,所述根据所述模型配置数据,对所述在线电商互动数据进行噪声数据过滤处理,得到去除业务噪声后的在线电商互动数据,包括:
根据所述全局业务噪声状态信息对应的人工智能模型的模型配置数据,对所述在线电商互动数据进行噪声数据过滤处理,得到去除业务噪声后的在线电商互动数据;
或者,根据所述局部业务噪声状态信息对应的人工智能模型的模型配置数据,对所述在线电商互动数据进行噪声数据过滤处理,得到去除业务噪声后的在线电商互动数据;
或者,根据所述潜在业务噪声状态信息对应的人工智能模型的模型配置数据,对所述在线电商互动数据进行噪声数据过滤处理,得到去除业务噪声后的在线电商互动数据。
优选地,所述根据所述模型配置数据,对所述在线电商互动数据进行噪声数据过滤处理,得到去除业务噪声后的在线电商互动数据之后,所述方法还包括:
对所述去除业务噪声后的在线电商互动数据进行格式转换,得到格式转换后的去除业务噪声的在线电商互动数据。
第二方面,本申请还提供了一种信息服务平台,包括处理器和存储器;所述处理器和所述存储器通信连接,所述处理器用于从所述存储器中读取计算机程序并执行,以实现上述方法。
本申请的实施例提供的技术方案可以包括以下有益效果。
本申请实施例提供的一种在大数据业务场景下的数据信息处理方法、装置及系统,通过采集多组在线电商有效互动数据及多组在线电商噪声互动数据,并组成训练样本集合,并通过对训练样本集合中的所有训练样本对进行训练,得到不同状态信息的在线电商噪声互动数据对应的人工智能模型的模型配置数据,通过获取采集的在线电商互动数据的当前业务噪声状态信息,选择当前业务噪声状态信息对应的人工智能模型的模型配置数据,对在线电商互动数据进行噪声数据过滤处理得到去除业务噪声后的在线电商互动数据。在本方案中,由于模型配置数据与互动数据是存在关联的,且在线电商互动数据的当前业务噪声状态信息基于在线电商互动数据的业务转化程度信息确定的,因而不需要对单独的数据片段进行拆分处理,在出现数据片段互相关联的情况时,无需对多个数据片段进行拆分,针对不同状态信息的在线电商噪声互动数据,根据预先完成训练的当前业务噪声状态信息对应的模型配置数据,可以得到提升数据片段内容完整性、内容真实性以及内容准确性的去除业务噪声后的在线电商互动数据,进而获得噪声比较低的高质量在线电商互动数据。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并于说明书一起用于解释本申请的原理。
图1是本申请实施例提供的一种信息服务平台的硬件结构示意图。
图2是本申请实施例提供的一种在大数据业务场景下的数据信息处理方法的流程图。
图3是本申请实施例提供的一种在大数据业务场景下的数据信息处理装置的框图。
图4是本申请实施例提供的一种在大数据业务场景下的数据信息处理系统的通信架构示意图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。
本申请实施例所提供的方法实施例可以在信息服务平台(大数据服务器)、计算机设备或者类似的运算装置中执行。以运行在信息服务平台上为例,图1是本申请实施例的实施在大数据业务场景下的数据信息处理方法的信息服务平台的硬件结构框图。如图1所示,信息服务平台10可以包括一个或多个(图1中仅示出一个)处理器102(处理器102可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)和用于存储数据的存储器104,可选地,上述信息服务平台还可以包括用于通信功能的传输装置106。本领域普通技术人员可以理解,图1所示的结构仅为示意,其并不对上述信息服务平台的结构造成限定。例如,信息服务平台10还可包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。
存储器104可用于存储计算机程序,例如,应用软件的软件程序以及模块,如本申请实施例中的在大数据业务场景下的数据信息处理方法对应的计算机程序,处理器102通过运行存储在存储器104内的计算机程序,从而执行各种功能应用以及数据处理,即实现上述的方法。存储器104可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器104可进一步包括相对于处理器102远程设置的存储器,这些远程存储器可以通过网络连接至信息服务平台10。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
传输装置106用于经由一个网络接收或者发送数据。上述的网络具体实例可包括信息服务平台10的通信供应商提供的无线网络。在一个实例中,传输装置106包括一个网络适配器(Network Interface Controller,简称为NIC),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输装置106可以为射频(Radio Frequency,简称为RF)模块,其用于通过无线方式与互联网进行通讯。
如图2所示,本申请实施例所提供的一种在大数据业务场景下的数据信息处理方法,可以包括如下步骤:
S101,采集在线电商互动数据,并通过整合在线电商互动数据的业务转化程度信息,确定在线电商互动数据的当前业务噪声状态信息。
其中,采集在线电商互动数据,可以是通过互动数据采集设备采集的,也可以是通过互动数据采集线程采集的。一般情况下,在线电商互动数据的采集过程是将模拟数据信息转化为数字数据信息,采集到的数据格式可以是整数数据格式、字符数据格式、指针数据格式等格式数据中的任一种。在线电商互动数据的业务转化程度信息可以是在线电商互动数据的业务推广信息,也可以是在线电商互动数据的互动意向信息,业务转化程度信息的转化程度越大,代表在线电商互动数据转化成功(比如促成某次互动交易事件),也就是说,在线电商互动数据的业务噪声状态信息越少。
在一些相关的实施例中,在线电商互动数据可以是仅仅包含在线电商侧的互动数据,也可以是包含在线电商侧、在线电商交互环境等信息的互动数据,一般情况下,在线电商互动数据可以理解为仅包含在线电商侧的互动数据。在线电商互动数据的业务噪声状态信息代表了在线电商互动数据的业务噪声程度,业务噪声状态信息可以是根据业务噪声的全局程度设定的全局业务噪声状态信息、局部业务噪声状态信息、潜在业务噪声状态信息,也可以是根据业务转化程度信息的程度值设定的多个业务噪声状态信息,例如1类业务噪声至10类业务噪声。
获取在线电商互动数据的业务转化程度信息,可以根据在线电商互动数据的电商流量转化指标确定,电商流量转化指标越大,在线电商互动数据的业务转化程度越高、业务噪声状态信息越低;获取在线电商互动数据的业务转化程度信息,也可以根据在线电商互动数据的电商页面访问量确定,电商页面访问量越高,在线电商互动数据的业务转化程度越高、业务噪声状态信息越低。这都是可以选择的,这里不做限定,当然,其他获取在线电商互动数据的业务转化程度信息的方法也属于本申请实施例的保护范围。
可选的,所述业务噪声状态信息可以包括:全局业务噪声状态信息、局部业务噪声状态信息及潜在业务噪声状态信息,或者,所述业务噪声状态信息包括:第1类状态信息至第n类状态信息,其中,n为大于或等于2的整数。
可以理解的是,根据在线电商互动数据对应的业务噪声的全局业务噪声程度设定全局业务噪声状态信息、局部业务噪声状态信息、潜在业务噪声状态信息三个业务噪声状态信息,减少了业务噪声状态信息划分的运算量,保证后续根据业务噪声状态信息确定模型配置数据步骤的效率。
在一些相关的实施例中,由于在采集在线电商互动数据时,交互时段信息的不同,使得采集到的在线电商互动数据的互动频率存在很大的差异,在采集的在线电商互动数据相对较少或者相对较多时,可能不宜于后续的整合在线电商互动数据的业务转化程度信息的步骤。
可选的,为了提高互动数据处理的效率,在相关数据采集线程或者数据采集单元采集的为包含在线电商、在线电商交互环境等信息的历史电商平台互动数据时,所述采集在线电商互动数据的步骤,可以包括以下内容。
首先,采集历史电商平台互动数据。
在本实施例中,采集的历史电商平台互动数据为通过互动数据采集设备或者互动数据采集线程采集的包含有电商平台、在线电商和/或其他在线电商交互环境的历史互动数据。
其次,整合历史电商平台互动数据的互动频率信息。
在一些相关的实施例中,互动频率信息可以是历史电商平台互动数据的频率快慢程度,可以用x1~x2的数值表示互动数据的频率信息,其中,x1表示互动数据的互动频率最少,x2表示互动数据的互动频率最多。相关技术中,得到互动频率信息有多种方法,最常用的方法是利用互动数据中数据特征的特征权重值进行整合,即利用互动数据中数据特征的多维度特征的频率特征权重值进行整合。
再次,根据互动频率信息,得到采集历史电商平台互动数据时的交互时段信息。
在一些相关的实施例中,互动频率信息与采集历史电商平台互动数据时的交互时段信息具有映射策略,其中,交互时段信息可以包括交互环节、使用间隔等时间段信息。则通过互动频率信息可以得到采集历史电商平台互动数据时的交互时段信息。
然后,调节交互时段信息,得到满足预设互动频率指标的频率信息。
再然后,采集具有该频率信息的在线电商互动数据的互动数据内容。
其中,预设互动频率指标为:互动频率信息与预设互动频率信息的对比结果小于预设对比结果。在一些相关的实施例中,在采集的历史电商平台互动数据相对较多或者相对较少时,可以通过调节交互时段信息,将采集的历史电商平台互动数据的互动频率信息调节至与预设互动频率信息的对比结果小于预设对比结果,其中,预设互动频率信息为频率适中、便于识别并进行处理的互动频率。该预设互动频率可以预先设定为经验值。通过本实施例,在采集历史电商平台互动数据时,通过调节交互时段信息,将采集的历史电商平台互动数据的互动频率信息调节至与预设互动频率信息的对比结果小于预设对比结果,便于历史电商平台互动数据的识别及处理。其中,历史电商平台互动数据的互动数据内容可以为在采集历史电商平台互动数据之后将模拟数据信息转换为例如数字数据信息等数字片段的数组片段。
最后,根据互动数据内容,提取在线电商互动数据。
在一些相关的实施例中,历史电商平台互动数据中在在线电商互动数据内容的数组会出现内容量化描述值,因此,根据互动数据内容的内容量化描述值可以确定在线电商所处的业务繁忙状态,提取该交互环境的在线电商互动数据,使得后续步骤处理的互动数据更为精确。提取在线电商互动数据的方法可以利用例如图数据分析的方法,这里不再赘述。
可选的,所述通过整合在线电商互动数据的业务转化程度信息,确定在线电商互动数据的当前业务噪声状态信息的步骤,可以包括以下内容。
首先,整合在线电商互动数据的电商流量转化指标。
在一些相关的实施例中,电商流量转化指标表征了互动数据的业务推广信息,业务推广信息是互动数据的基本特征,在在线电商互动数据中,业务推广信息越丰富,则在线电商转化的程度越高。
然后,对电商流量转化指标进行配对,并根据预设的电商流量转化指标与业务互动噪声状态信息的配对关系,确定在线电商互动数据的当前业务噪声状态信息;或者,获取在线调试的在线电商噪声互动数据的电商流量转化指标及所对应的业务噪声状态信息,确定在线调试的在线电商噪声互动数据的电商流量转化指标中与在线电商互动数据的电商流量转化指标相等的电商流量转化指标所对应的业务噪声状态信息为在线电商互动数据的当前业务噪声状态信息。
在一些相关的实施例中,由于一组互动数据中业务推广分布只占很小的一部分,则整组互动数据的电商流量转化指标的越接近非业务推广分布的分布指标数据,即电商流量转化指标越大则互动数据的业务转换程度越高,而业务噪声状态信息越低。
可以预先设定电商流量转化指标与互动数据的业务噪声状态信息的配对关系,根据电商流量转化指标确定在线电商互动数据的业务噪声状态信息。当然也可以是在在线调试时,确定在线电商噪声互动数据的电商流量转化指标及业务噪声状态信息,通过比较在线调试的在线电商噪声互动数据的电商流量转化指标与在线电商互动数据的电商流量转化指标,从在线调试的在线电商噪声互动数据的电商流量转化指标中选择与在线电商互动数据的电商流量转化指标相等的电商流量转化指标,确定该电商流量转化指标对应的业务噪声状态信息为在线电商互动数据的当前业务噪声状态信息。
应用本实施例,通过提取采集的历史电商平台互动数据的互动数据内容,确定在线电商所处的业务繁忙状态,提取该交互环境的在线电商互动数据,使得后续步骤处理的互动数据更为精确。并且通过获取在线电商互动数据的电商流量转化指标,确定在线电商互动数据的业务噪声状态信息,提高了互动数据处理的效率。
S102,根据当前业务噪声状态信息,以及业务噪声状态信息与人工智能模型的模型配置数据的映射策略,确定当前业务噪声状态信息对应的人工智能模型的模型配置数据。
其中,映射策略为通过对多组在线电商有效互动数据和多组在线电商噪声互动数据组成的训练样本集合进行训练得到的,在线电商有效互动数据与在线电商噪声互动数据有唯一对应的对应的关系。
在一些相关的实施例中,本实施例在进行去除业务噪声之前,根据在线电商有效互动数据与在线电商噪声互动数据的唯一对应的映射策略,通过对多组在线电商有效互动数据和多组在线电商噪声互动数据组成训练样本集合,针对每一组训练样本对中的在线电商噪声互动数据,进行噪声数据过滤处理,使得过滤处理后的在线电商互动轨迹数据与该组训练样本对的在线电商有效互动数据匹配,确定匹配时,所使用的人工智能模型的模型配置数据作为该组训练样本对中在线电商噪声互动数据对应业务噪声状态信息的人工智能模型的模型配置数据。
通过上述的在线调试过程,得到业务噪声状态信息与人工智能模型的模型配置数据的映射策略,根据该映射策略,可以得到当前业务噪声状态信息所对应的人工智能模型的模型配置数据。通过对当前在线电商互动数据的业务噪声程度进行预测,自适应从在线调试好的多个决策树模型参数中选择最合适的一组参数,针对性的提取网络模型配置数据,提升了运算的效率。
在一些可能的实施例中,作为训练样本对的在线电商有效互动数据和在线电商噪声互动数据的数量一般很多,数据太少无法保证包含所有情况。在线电商有效互动数据及在线电商噪声互动数据的格式可以为整数数据格式、字符数据格式、指针数据格式等中的任一种格式数据。
可选的,所述在线电商有效互动数据及在线电商噪声互动数据的格式均为整数数据格式。
在一些相关的实施例中,相对于格式转换后的互动数据,整数数据样本的精度更高,有利于人工智能模型学习出性能更好的模型配置数据。
S103,根据当前业务噪声状态信息对应的人工智能模型的模型配置数据,对在线电商互动数据进行噪声数据过滤处理,得到去除业务噪声后的在线电商互动数据。
在一些相关的实施例中,对在线电商互动数据所进行的噪声数据过滤处理在这里不做限定,一般情况下,最常用的噪声数据过滤处理为决策树运算,以决策树运算为例,人工智能模型的模型配置数据为每个决策层所使用的决策条件内的决策参数。
例如,第一组决策条件的条件规模为3×3,决策路径数为3,每个决策路径的决策条件内的决策参数分别为:
{1,0.4,1;1,0.8,1;0.5,1,0.2};
{0.5,0.7,1;0.2,0.3,0.6;0.9,0.8,0.2};
{0.1,0.2,0.3;0.9,0.8,0.3;0.6,0.7,0.4}。
则人工智能模型的第一个决策层的模型配置数据为:
{1,0.4,1;1,0.8,1;0.5,1,0.2};
{0.5,0.7,1;0.2,0.3,0.6;0.9,0.8,0.2};
{0.1,0.2,0.3;0.9,0.8,0.3;0.6,0.7,0.4}。
由于在线调试中在线电商噪声互动数据与在线电商有效互动数据对应,因此通过对在线电商互动数据进行噪声数据过滤处理,得到的去除业务噪声后的在线电商互动数据与相同业务噪声状态信息的在线电商噪声互动数据对应的在线电商有效互动数据基本相同。
可选的,所述根据当前业务噪声状态信息,以及业务噪声状态信息与人工智能模型的模型配置数据的映射策略,确定当前业务噪声状态信息对应的人工智能模型的模型配置数据的步骤,可以包括:
在当前业务噪声状态信息为全局业务噪声状态信息时,从映射策略中选择全局业务噪声状态信息对应的人工智能模型的模型配置数据;
或者,
在当前业务噪声状态信息为局部业务噪声状态信息时,从映射策略中选择局部业务噪声状态信息对应的人工智能模型的模型配置数据;
或者,
在当前业务噪声状态信息为潜在业务噪声状态信息时,从映射策略中选择潜在业务噪声状态信息对应的人工智能模型的模型配置数据;
所述根据当前业务噪声状态信息对应的人工智能模型的模型配置数据,对在线电商互动数据进行噪声数据过滤处理,得到去除业务噪声后的在线电商互动数据的步骤,可以包括:
根据全局业务噪声状态信息对应的人工智能模型的模型配置数据,对在线电商互动数据进行噪声数据过滤处理,得到去除业务噪声后的在线电商互动数据;
或者,
根据局部业务噪声状态信息对应的人工智能模型的模型配置数据,对在线电商互动数据进行噪声数据过滤处理,得到去除业务噪声后的在线电商互动数据;
或者,
根据潜在业务噪声状态信息对应的人工智能模型的模型配置数据,对在线电商互动数据进行噪声数据过滤处理,得到去除业务噪声后的在线电商互动数据。
在一些相关的实施例中,根据在线电商互动数据业务噪声的全局程度设定全局业务噪声状态信息、局部业务噪声状态信息、潜在业务噪声状态信息三个业务噪声状态信息,根据业务噪声状态信息的不同,从模型配置数据中获取的人工智能模型的模型配置数据也不同,将互动数据的业务转化程度划分为三个业务噪声状态信息,有效减少业务噪声状态信息划分的运算量。
应用本实施例,通过采集多组在线电商有效互动数据及多组在线电商噪声互动数据,并组成训练样本集合,并通过对训练样本集合中的所有训练样本对进行训练,得到不同状态信息的在线电商噪声互动数据对应的人工智能模型的模型配置数据,通过获取采集的在线电商互动数据的当前业务噪声状态信息,选择当前业务噪声状态信息对应的人工智能模型的模型配置数据,对在线电商互动数据进行噪声数据过滤处理得到去除业务噪声后的在线电商互动数据。
在本方案中,由于模型配置数据与互动数据是存在关联的,且在线电商互动数据的当前业务噪声状态信息基于在线电商互动数据的业务转化程度信息确定的,因而不需要对单独的数据片段进行拆分处理,在出现数据片段互相关联的情况时,无需对多个数据片段进行拆分,针对不同状态信息的在线电商噪声互动数据,根据预先完成训练的当前业务噪声状态信息对应的模型配置数据,可以得到提升数据片段内容完整性、内容真实性以及内容准确性的去除业务噪声后的在线电商互动数据。
基于上述描述内容的基础上,本申请实施例所提供的一种在大数据业务场景下的数据信息处理方法,在如图2所示实施例的基础上,S101之前,在大数据业务场景下的数据信息处理方法还可以包括:
S201,获取多组在线电商有效互动数据及多组在线电商噪声互动数据,并将每个在线电商有效互动数据及所对应的在线电商噪声互动数据作为训练样本对,组成训练样本集合。
在一些可能的实施例中,作为训练样本对的在线电商有效互动数据和在线电商噪声互动数据的数量一般很多,数据太少无法保证包含所有情况。在线电商有效互动数据与在线电商噪声互动数据可以是同时采集的,也可以是先采集其中一种互动数据再通过运算得到对应的另一种互动数据得到的,这都是可以选择的。
可选的,所述获取多组在线电商有效互动数据及多组在线电商噪声互动数据,并将每个在线电商有效互动数据及所对应的在线电商噪声互动数据作为训练样本对,组成训练样本集合的步骤,可以包括:
首先,获取设定业务交互时刻采集的多组在线电商有效互动数据,及设定业务交互时段采集的多组在线电商噪声互动数据。
在一些相关的实施例中,设定业务交互时刻为采集互动数据的业务交互时刻较为固定,例如下午3点,通过设定业务交互时刻通常能够采集到具有较低信噪比的在线电商互动数据;而业务交互时长为采集互动数据的业务交互时长较为长,例如40ms,由于采集时间长,采集的互动数据往往为可变业务噪声的在线电商互动数据。在每一次有一个在线电商运行的时候同时采集该在线电商的在线电商有效互动数据和在线电商噪声互动数据。
其次,将同时采集的在线电商有效互动数据与在线电商噪声互动数据进行互动数据统计操作,得到互动标签相匹配的第一在线电商有效互动数据与第一在线电商噪声互动数据。
在一些相关的实施例中,即便在线电商有效互动数据与在线电商噪声互动数据是同时采集的,两个互动数据之间也可能存在交互频率不相同的情况,为了后续处理的方便,以及数据的统一性,在采集到在线电商有效互动数据与在线电商噪声互动数据后,需对这两个在线电商互动数据的进行互动数据统计操作,保证两个互动数据的互动标签相匹配。
然后,获得包含所述第一在线电商有效互动数据与所述第一在线电商噪声互动数据的训练样本对。
最后,获得不同采集时刻下的训练样本对,组成训练样本集合。
可以理解的是,每次采集的在线电商有效互动数据与在线电商噪声互动数据作为一个训练样本对,并将所有训练样本对组成训练样本集合,便于针对每一组训练样本对中的在线电商噪声互动数据进行运算,通过不断训练找到过滤处理后的在线电商互动轨迹数据与在线电商有效互动数据匹配时对应的人工智能模型的模型配置数据。
在一些相关的实施例中,本实施例在采集样本时,分别通过设定业务交互时刻及业务交互时长,同时采集大量的在线电商有效互动数据和在线电商噪声互动数据。本实施例中的在线电商噪声互动数据为实际采集的,故基于该训练样本对训练的网络,能更好的适应实际的可变业务噪声问题。
可选的,所述获取多组在线电商有效互动数据及多组在线电商噪声互动数据,并将每个在线电商有效互动数据及所对应的在线电商噪声互动数据作为训练样本对,组成训练样本集合的步骤,还可以包括:
首先,获取设定业务交互时刻采集的多组在线电商有效互动数据。
在一些相关的实施例中,设定业务交互时刻为采集互动数据的业务交互时刻较为固定,例如10ms,通过设定业务交互时刻通常能够采集到具有较低信噪比的在线电商互动数据。
其次,根据噪声分类方式,对每个在线电商有效互动数据进行冗余数据除噪处理,生成每个在线电商有效互动数据对应的在线电商噪声互动数据。
然后,获得包含第二在线电商有效互动数据与所述第二在线电商有效互动数据对应的第二在线电商噪声互动数据的训练样本对。
最后,获得每组在线电商有效互动数据对应的训练样本对,组成训练样本集合。
其中,第二在线电商有效互动数据为所有在线电商有效互动数据中的任一在线电商有效互动数据。可以理解的是,每次采集的在线电商有效互动数据与降质得到的在线电商噪声互动数据作为一个训练样本对,并将所有训练样本对组成训练样本集合,便于针对每一组训练样本对中的在线电商噪声互动数据进行运算,通过不断训练找到过滤处理后的在线电商互动轨迹数据与在线电商有效互动数据匹配时对应的人工智能模型的模型配置数据。
在一些相关的实施例中,本实施例在采集样本时,基于可变业务噪声仅与在线电商的运行状态变化速度及运行状态变化轨迹有关的假设,采用线性的业务除噪方式对在线电商有效互动数据进行处理来生成训练样本对。这种生成训练样本对的方法操作简单,且比较符合实际的业务噪声情况。
S202,根据预设参数确定训练样本集合中所有训练样本对的业务噪声状态信息。
其中,预设参数为预设业务除噪时长或者预设业务交互时长。
根据S201,生成训练样本集合,可以是通过设定业务交互时刻及业务交互时长、同时采集大量的在线电商有效互动数据和在线电商噪声互动数据生成的,也可以是通过基于可变业务噪声仅与在线电商的运行状态变化速度及运行状态变化轨迹有关的假设、采用线性的业务除噪方式对在线电商有效互动数据进行处理生成的。
通过设定业务交互时刻及业务交互时长、同时采集大量的在线电商有效互动数据和在线电商噪声互动数据生成训练样本集合的方式中,预设业务交互时长决定了业务噪声状态信息,预设业务交互时长越大则采集的互动数据的业务噪声状态信息越多;采用线性的业务除噪方式对在线电商有效互动数据进行处理生成训练样本集合的方式中,预设业务除噪时长决定了业务噪声状态信息,预设业务除噪时长越大则采集的互动数据的业务噪声状态信息越多。其中,预设业务除噪时长及预设业务交互时长可以预先设定。
S203,将所述训练样本集合中具有相同业务噪声状态信息的所有训练样本对及由相同业务噪声状态信息的训练样本对确定的状态关联结果,输入线性回归模型,进行训练。
在一些相关的实施例中,对训练样本对的在线电商噪声互动数据进行噪声数据过滤处理在这里不做限定,一般情况下,最常采用的人工智能模型为决策树模型。训练样本对的在线电商噪声互动数据的业务噪声状态信息代表了该在线电商噪声互动数据的业务噪声程度,业务噪声状态信息可以是根据业务噪声的全局程度设定的全局业务噪声状态信息、局部业务噪声状态信息、潜在业务噪声状态信息,也可以是根据业务转化程度信息的转化程度值设定的多个业务噪声状态信息,例如1类业务噪声至10类业务噪声。
相同的业务噪声状态信息可以对应有很多训练样本对,需要对所有训练样本对的在线电商噪声互动数据的业务转化程度信息进行整合,可以根据该在线电商噪声互动数据的电商流量转化指标确定,电商流量转化指标越大,在线电商互动数据的业务转化程度越高、业务噪声状态信息越低;对训练样本对的在线电商噪声互动数据的业务转化程度信息进行整合,也可以根据该在线电商噪声互动数据的电商页面访问量确定,电商页面访问量越高,在线电商互动数据的业务转化程度越高、业务噪声状态信息越低。这都是可以选择的,这里不做限定,当然,其他整合在线电商噪声互动数据的业务转化程度信息的方法也属于本申请实施例的保护范围。
状态关联结果是根据相同业务噪声状态信息的训练样本对中的在线电商噪声互动数据与对应的在线电商有效互动数据确定的,代表了在线电商噪声互动数据和在线电商有效互动数据的相近程度。一种具体实现方式中,状态关联结果是通过对在线电商噪声互动数据和在线电商有效互动数据的对应业务互动记录的记录轨迹作对比,将所有的对比结果进行加权融合处理得到。在一些可能的实施例中,除了上述得到状态关联结果的方法之外,其他实现求取状态关联结果的方法均属于本申请的保护范围,这里不再一一列举。
S204,在状态关联结果的权重值小于设定权重值时,完成训练,得到业务噪声状态信息与人工智能模型的模型配置数据的映射策略。
在一些相关的实施例中,状态关联结果的权重值越小,则说明对在线电商噪声互动数据的训练结果与在线电商有效互动数据越相近,在状态关联结果的权重值等于0时,训练结果与在线电商有效互动数据近似相同。因此,本实施例中给定了一个预设值,在状态关联结果的权重值小于该预设值时,可以认为训练的结果已经与在线电商有效互动数据有很高的匹配度,则得到该训练结果的模型配置数据可以作为该在线电商噪声互动数据对应的业务噪声状态信息的最优模型配置数据。
在一些可能的实施例中,S201至S204按顺序执行,S101与S201至S204可以是并行执行的,S101至S103与图2所示实施例的步骤完全相同,这里不再赘述。
应用本实施例,通过采集多组在线电商有效互动数据及多组在线电商噪声互动数据,并组成训练样本集合,并通过对训练样本集合中的所有训练样本对进行训练,得到不同状态信息的在线电商噪声互动数据对应的人工智能模型的模型配置数据,通过获取采集的在线电商互动数据的当前业务噪声状态信息,选择当前业务噪声状态信息对应的人工智能模型的模型配置数据,对在线电商互动数据进行噪声数据过滤处理得到去除业务噪声后的在线电商互动数据。
在本方案中,由于模型配置数据与互动数据是存在关联的,且在线电商互动数据的当前业务噪声状态信息基于在线电商互动数据的业务转化程度信息确定的,因而不需要对单独的数据片段进行拆分处理,在出现数据片段互相关联的情况时,无需对多个数据片段进行拆分,针对不同状态信息的在线电商噪声互动数据,根据预先完成训练的当前业务噪声状态信息对应的模型配置数据,可以得到提升数据片段内容完整性、内容真实性以及内容准确性的去除业务噪声后的在线电商互动数据。
通过采集大量在线电商互动数据,作为样本集对决策树模型进行训练,以使对当前在线电商互动数据的业务噪声程度进行估计,自适应从在线调试好的多个决策树模型参数中选择最合适的一组参数,相对于只采用一组模型配置数据处理任意业务噪声程度的在线电商互动数据,具有较佳的效果。
在另外的一些实施例中,本申请实施例还提供了一种在大数据业务场景下的数据信息处理方法,在如图2所示实施例的基础上,S103之后,在大数据业务场景下的数据信息处理方法还可以包括:
S301,对去除业务噪声后的在线电商互动数据进行格式转换,得到格式转换后的去除业务噪声的在线电商互动数据。
在一些相关的实施例中,对去除业务噪声后的在线电商互动数据进行格式转换就是对该去除业务噪声后的在线电商互动数据进行压缩,以便于存储和传输。相关技术中,对互动数据进行格式转换的方法具有很多种,本申请实施例可以使用任一种格式转换方法。这里不再一一赘述。
在一些可能的实施例中,由于格式转换会加剧互动数据业务噪声的问题,因此,本实施例采用在格式转换前进行去除业务噪声处理,可以降低格式转换对业务噪声现象的影响,提升业务噪声内容完整性、内容真实性以及内容准确性。S101至S103与图2所示实施例的步骤完全相同,这里不再赘述。
应用本实施例,通过采集多组在线电商有效互动数据及多组在线电商噪声互动数据,并组成训练样本集合,并通过对训练样本集合中的所有训练样本对进行训练,得到不同状态信息的在线电商噪声互动数据对应的人工智能模型的模型配置数据,通过获取采集的在线电商互动数据的当前业务噪声状态信息,选择当前业务噪声状态信息对应的人工智能模型的模型配置数据,对在线电商互动数据进行噪声数据过滤处理得到去除业务噪声后的在线电商互动数据。
在本方案中,由于模型配置数据与互动数据是存在关联的,且在线电商互动数据的当前业务噪声状态信息基于在线电商互动数据的业务转化程度信息确定的,因而不需要对单独的数据片段进行拆分处理,在出现数据片段互相关联的情况时,无需对多个数据片段进行拆分,针对不同状态信息的在线电商噪声互动数据,根据预先完成训练的当前业务噪声状态信息对应的模型配置数据,可以得到提升数据片段内容完整性、内容真实性以及内容准确性的去除业务噪声后的在线电商互动数据。并且对去除业务噪声后的在线电商互动数据进行格式转换,降低存储及网络传输带宽,且由于在格式转换前进行去除业务噪声处理,降低格式转换对业务噪声现象的影响,提升业务噪声内容完整性、内容真实性以及内容准确性。
与相关技术相比,本方案中,通过采集多组在线电商有效互动数据及多组在线电商噪声互动数据,并组成训练样本集合,并通过对训练样本集合中的所有训练样本对进行训练,得到不同状态信息的在线电商噪声互动数据对应的人工智能模型的模型配置数据,通过获取采集的在线电商互动数据的当前业务噪声状态信息,选择当前业务噪声状态信息对应的人工智能模型的模型配置数据,对在线电商互动数据进行噪声数据过滤处理得到去除业务噪声后的在线电商互动数据。
在本方案中,由于模型配置数据与互动数据是存在关联的,且在线电商互动数据的当前业务噪声状态信息基于在线电商互动数据的业务转化程度信息确定的,因而不需要对单独的数据片段进行拆分处理,在出现数据片段互相关联的情况时,无需对多个数据片段进行拆分,针对不同状态信息的在线电商噪声互动数据,根据预先完成训练的当前业务噪声状态信息对应的模型配置数据,可以得到提升数据片段内容完整性、内容真实性以及内容准确性的去除业务噪声后的在线电商互动数据,进而获得噪声比较低的高质量在线电商互动数据。
在一些选择性的实施例中,在上述S103的基础上,该方法还可以包括以下内容:确定与所述去除业务噪声后的在线电商互动数据对应的电商用户操作数据,根据所述电商用户操作数据确定所述去除业务噪声后的在线电商互动数据对应的电商用户画像轨迹。
在相关实施例中,电商用户画像轨迹用于表征去除业务噪声后的在线电商互动数据对应的电商用户的画像变化情况,这样可以根据电商用户画像轨迹针对性地进行产品推送或者服务升级,提高电商业务交互的效率,减少不必要的产品推送带来的网络带宽资源的占用以及不合适的服务升级带来的计算资源的浪费。
在一些选择性的实施例中,上述步骤所述描述的根据所述电商用户操作数据确定所述去除业务噪声后的在线电商互动数据对应的电商用户画像轨迹,可以包括以下步骤a-步骤d所描述的内容。
步骤a,根据所述电商用户操作数据,获取所述去除业务噪声后的在线电商互动数据对应的待进行拟合的目标电商用户画像集;对所述目标电商用户画像集中的多个电商用户画像信息分别进行在线类意图分析和离线类意图分析,得到在线类意图分析结果列表和离线类意图分析结果列表。
在一个选择性的实施例中,上述步骤所描述的对所述目标电商用户画像集中的多个电商用户画像信息分别进行在线类意图分析和离线类意图分析,得到在线类意图分析结果列表和离线类意图分析结果列表,可以包括以下内容:对所述目标电商用户画像集中的多个电商用户画像信息分别进行在线类意图分析,得到各个电商用户画像信息中的在线类意图分析事件、以及各在线类意图分析事件所对应的原始画像意图类型;基于各电商用户画像信息中的在线类意图分析事件和相应的原始画像意图类型,确定在线类意图分析结果列表;对所述目标电商用户画像集中的多个电商用户画像信息分别进行离线类意图分析,得到离线类意图分析结果列表。如此设计,能够对在线类意图分析事件及其对应的原始画像意图类型进行拆分处理和分析,从而确保在线类意图分析结果列表的准确性和完整性。
在一个选择性的实施例中,上述步骤所描述的对所述目标电商用户画像集中的多个电商用户画像信息分别进行离线类意图分析,得到离线类意图分析结果列表,可以通过以下实施方式实现:对所述目标电商用户画像信息中的多个电商用户画像信息分别进行画像特征分析,得到各电商用户画像信息分别对应的画像特征内容;对所述目标电商用户画像信息中的多个电商用户画像信息分别进行业务场景分析,得到各电商用户画像信息分别对应的业务场景分析结果;将对应于相同交互状态的画像特征内容和业务场景分析结果进行匹配;基于所述目标电商用户画像信息中与目标画像特征内容相匹配的业务场景分析结果进行离线类意图分析处理,得到离线类意图分析结果列表。如此设计,能够结合画像特征内容和业务场景分析结果进行离线类意图分析处理,从而确保离线状态下画像特征和业务场景的匹配性,这样可以提高离线类意图分析结果列表的可信度。
步骤b,依据预设的在线意图筛分策略,对所述在线类意图分析结果列表进行在线意图筛分处理,得到包括有在线类意图标签的第一电商用户画像子集;依据预设的离线意图筛分策略,对所述离线类意图分析结果列表进行离线意图筛分处理,得到包括有离线类意图标签的第二电商用户画像子集。
在一些选择性的实施例中,上述步骤所描述的依据预设的在线意图筛分策略,对所述在线类意图分析结果列表进行在线意图筛分处理,得到包括有在线类意图标签的第一电商用户画像子集,可以包括以下内容:对所述在线类意图分析结果列表中的每个电商用户画像信息分别进行意图类型配对,得到每个电商用户画像信息各自对应的不重复的画像意图类型;基于每个电商用户画像信息中与相应不重复的画像意图类型对应的在线类意图分析事件的事件热度,分别进行分析事件更新处理,得到更新后的在线类意图分析结果列表;对所述更新后的在线类意图分析结果列表进行动态持续更新处理,得到多个包括有在线类意图标签的第一备选电商用户画像子集;根据各所述第一备选电商用户画像子集分别所属的在线类型,对属于相同在线类型的第一备选电商用户画像子集进行画像分布调整,得到包括有在线类意图标签的第一电商用户画像子集。如此设计,在进行筛分处理时,能够考虑不同画像意图类型之间的关联性,从而确保得到的包括有在线类意图标签的第一电商用户画像子集中的电商用户画像信息之间的区分度。
步骤c,基于所述第一电商用户画像子集和所述第二电商用户画像子集进行噪声去除处理,得到所述目标电商用户画像集中与目标意图相匹配的目标电商用户画像子集;所述目标意图包括在线类意图和离线类意图中的至少一种,所述目标电商用户画像子集用于对所述目标电商用户画像集进行拟合。可以理解,通过进行噪声去除,能够确保目标电商用户画像子集的画像信息质量。
步骤d,通过所述目标电商用户画像子集对所述目标电商用户画像集进行基于时序特征的拟合,得到所述电商用户画像轨迹。可以理解,基于时序特征的拟合是按照时间先后顺序对目标电商用户画像集进行拟合,从而得到在时间顺序上连续的电商用户画像轨迹。
这样一来,通过实施上述步骤a-步骤d,能够进行在线类意图分析和离线类意图分析,从而考虑不同类型的画像意图,这样可以确定出画像信息质量较高的目标电商用户画像子集,进而基于目标电商用户画像子集按照时间先后顺序对目标电商用户画像集进行拟合,从而得到在时间顺序上连续的电商用户画像轨迹,这样可以根据电商用户画像轨迹针对性地进行产品推送或者服务升级,提高电商业务交互的效率,减少不必要的产品推送带来的网络带宽资源的占用以及不合适的服务升级带来的计算资源的浪费。
在上述基础上,请结合图3,本申请还提供了一种在大数据业务场景下的数据信息处理装置300框图,所述装置包括以下功能模块。
数据采集模块310,用于采集在线电商互动数据,并通过整合所述在线电商互动数据的业务转化程度信息,确定所述在线电商互动数据的当前业务噪声状态信息。
数据确定模块320,用于根据所述当前业务噪声状态信息,以及业务噪声状态信息与人工智能模型的模型配置数据的映射策略,确定所述当前业务噪声状态信息对应的人工智能模型的模型配置数据;其中,所述映射策略为通过对多组在线电商有效互动数据和多组在线电商噪声互动数据组成的训练样本集合进行训练得到的。
数据过滤模块330,用于根据所述模型配置数据,对所述在线电商互动数据进行噪声数据过滤处理,得到去除业务噪声后的在线电商互动数据。
在上述基础上,请结合图4,基于上述同样的发明构思,本申请还提供了一种在大数据业务场景下的数据信息处理系统40,所述系统包括相互通信的信息服务平台10及互动数据采集设备20,信息服务平台10获取互动数据采集设备20采集的在线电商互动数据,并通过整合所述在线电商互动数据的业务转化程度信息,确定所述在线电商互动数据的当前业务噪声状态信息;根据所述当前业务噪声状态信息,以及业务噪声状态信息与人工智能模型的模型配置数据的映射策略,确定所述当前业务噪声状态信息对应的人工智能模型的模型配置数据;其中,所述映射策略为通过对多组在线电商有效互动数据和多组在线电商噪声互动数据组成的训练样本集合进行训练得到的;根据所述模型配置数据,对所述在线电商互动数据进行噪声数据过滤处理,得到去除业务噪声后的在线电商互动数据。
进一步地,还提供了一种可读存储介质,其上存储有程序,该程序被处理器执行时实现上述的方法。
应当理解,上述所示的系统及其模块可以利用各种方式来实现。例如,在一些实施例中,系统及其模块可以通过硬件、软件或者软件和硬件的结合来实现。其中,硬件部分可以利用专用逻辑来实现;软件部分则可以存储在存储器中,由适当的指令执行系统,例如微处理器或者专用设计硬件来执行。本领域技术人员可以理解上述的方法和系统可以使用计算机可执行指令和/或包含在处理器控制代码中来实现,例如在诸如磁盘、CD或DVD-ROM的载体介质、诸如只读存储器(固件)的可编程的存储器或者诸如光学或电子信号载体的数据载体上提供了这样的代码。本申请的系统及其模块不仅可以有诸如超大规模集成电路或门阵列、诸如逻辑芯片、晶体管等的半导体、或者诸如现场可编程门阵列、可编程逻辑设备等的可编程硬件设备的硬件电路实现,也可以用例如由各种类型的处理器所执行的软件实现,还可以由上述硬件电路和软件的结合(例如,固件)来实现。
需要说明的是,不同实施例可能产生的有益效果不同,在不同的实施例里,可能产生的有益效果可以是以上任意一种或几种的组合,也可以是其他任何可能获得的有益效果。
上文已对基本概念做了描述,显然,对于本领域技术人员来说,上述详细披露仅仅作为示例,而并不构成对本申请的限定。虽然此处并没有明确说明,本领域技术人员可能会对本申请进行各种修改、改进和修正。该类修改、改进和修正在本申请中被建议,所以该类修改、改进、修正仍属于本申请示范实施例的精神和范围。
同时,本申请使用了特定词语来描述本申请的实施例。如“一个实施例”、“一实施例”、和/或“一些实施例”意指与本申请至少一个实施例相关的某一特征、结构或特点。因此,应强调并注意的是,本说明书中在不同位置两次或多次提及的“一实施例”或“一个实施例”或“一个替代性实施例”并不一定是指同一实施例。此外,本申请的一个或多个实施例中的某些特征、结构或特点可以进行适当的组合。
此外,本领域技术人员可以理解,本申请的各方面可以通过若干具有可专利性的种类或情况进行说明和描述,包括任何新的和有用的工序、机器、产品或物质的组合,或对他们的任何新的和有用的改进。相应地,本申请的各个方面可以完全由硬件执行、可以完全由软件(包括固件、常驻软件、微码等)执行、也可以由硬件和软件组合执行。以上硬件或软件均可被称为“数据块”、“模块”、“引擎”、“单元”、“组件”或“系统”。此外,本申请的各方面可能表现为位于一个或多个计算机可读介质中的计算机产品,该产品包括计算机可读程序编码。
计算机存储介质可能包含一个内含有计算机程序编码的传播数据信号,例如在基带上或作为载波的一部分。该传播信号可能有多种表现形式,包括电磁形式、光形式等,或合适的组合形式。计算机存储介质可以是除计算机可读存储介质之外的任何计算机可读介质,该介质可以通过连接至一个指令执行系统、装置或设备以实现通讯、传播或传输供使用的程序。位于计算机存储介质上的程序编码可以通过任何合适的介质进行传播,包括无线电、电缆、光纤电缆、RF、或类似介质,或任何上述介质的组合。
本申请各部分操作所需的计算机程序编码可以用任意一种或多种程序语言编写,包括面向对象编程语言如Java、Scala、Smalltalk、Eiffel、JADE、Emerald、C++、C#、VB.NET、Python等,常规程序化编程语言如C语言、Visual Basic、Fortran 2003、Perl、COBOL 2002、PHP、ABAP,动态编程语言如Python、Ruby和Groovy,或其他编程语言等。该程序编码可以完全在用户计算机上运行、或作为独立的软件包在用户计算机上运行、或部分在用户计算机上运行部分在远程计算机运行、或完全在远程计算机或服务器上运行。在后种情况下,远程计算机可以通过任何网络形式与用户计算机连接,比如局域网(LAN)或广域网(WAN),或连接至外部计算机(例如通过因特网),或在云计算环境中,或作为服务使用如软件即服务(SaaS)。
此外,除非权利要求中明确说明,本申请所述处理元素和序列的顺序、数字字母的使用、或其他名称的使用,并非用于限定本申请流程和方法的顺序。尽管上述披露中通过各种示例讨论了一些目前认为有用的发明实施例,但应当理解的是,该类细节仅起到说明的目的,附加的权利要求并不仅限于披露的实施例,相反,权利要求旨在覆盖所有符合本申请实施例实质和范围的修正和等价组合。例如,虽然以上所描述的系统组件可以通过硬件设备实现,但是也可以只通过软件的解决方案得以实现,如在现有的服务器或移动设备上安装所描述的系统。
同理,应当注意的是,为了简化本申请披露的表述,从而帮助对一个或多个发明实施例的理解,前文对本申请实施例的描述中,有时会将多种特征归并至一个实施例、附图或对其的描述中。但是,这种披露方法并不意味着本申请对象所需要的特征比权利要求中提及的特征多。实际上,实施例的特征要少于上述披露的单个实施例的全部特征。
一些实施例中使用了描述成分、属性数量的数字,应当理解的是,此类用于实施例描述的数字,在一些示例中使用了修饰词“大约”、“近似”或“大体上”来修饰。除非另外说明,“大约”、“近似”或“大体上”表明所述数字允许有适应性的变化。相应地,在一些实施例中,说明书和权利要求中使用的数值参数均为近似值,该近似值根据个别实施例所需特点可以发生改变。在一些实施例中,数值参数应考虑规定的有效数位并采用一般位数保留的方法。尽管本申请一些实施例中用于确认其范围广度的数值域和参数为近似值,在具体实施例中,此类数值的设定在可行范围内尽可能精确。
针对本申请引用的每个专利、专利申请、专利申请公开物和其他材料,如文章、书籍、说明书、出版物、文档等,特此将其全部内容并入本申请作为参考。与本申请内容不一致或产生冲突的申请历史文件除外,对本申请权利要求最广范围有限制的文件(当前或之后附加于本申请中的)也除外。需要说明的是,如果本申请附属材料中的描述、定义、和/或术语的使用与本申请所述内容有不一致或冲突的地方,以本申请的描述、定义和/或术语的使用为准。
最后,应当理解的是,本申请中所述实施例仅用以说明本申请实施例的原则。其他的变形也可能属于本申请的范围。因此,作为示例而非限制,本申请实施例的替代配置可视为与本申请的教导一致。相应地,本申请的实施例不仅限于本申请明确介绍和描述的实施例。

Claims (9)

1.一种在大数据业务场景下的数据信息处理方法,其特征在于,所述方法包括:
采集在线电商互动数据,并通过整合所述在线电商互动数据的业务转化程度信息,确定所述在线电商互动数据的当前业务噪声状态信息;
根据所述当前业务噪声状态信息,以及业务噪声状态信息与人工智能模型的模型配置数据的映射策略,确定所述当前业务噪声状态信息对应的人工智能模型的模型配置数据;其中,所述映射策略为通过对多组在线电商有效互动数据和多组在线电商噪声互动数据组成的训练样本集合进行训练得到的;
根据所述模型配置数据,对所述在线电商互动数据进行噪声数据过滤处理,得到去除业务噪声后的在线电商互动数据;
其中,所述业务转化程度信息至少根据所述在线电商互动数据的电商流量转化指标确定,或者至少根据所述在线电商互动数据的电商页面访问量确定;所述在线电商互动数据的业务转化程度信息包括在线电商互动数据的业务推广信息或在线电商互动数据的互动意向信息;所述人工智能模型是决策树模型时,所述人工智能模型的模型配置数据为每个决策层所使用的决策条件内的决策参数,所述决策条件内的决策参数包括每个决策路径的决策条件内的决策参数;
所述映射策略的训练过程包括:根据在线电商有效互动数据与在线电商噪声互动数据的唯一对应的映射策略,通过对多组在线电商有效互动数据和多组在线电商噪声互动数据组成训练样本集合,针对每一组训练样本对应的在线电商噪声互动数据,进行噪声数据过滤处理,使得过滤处理后的在线电商互动轨迹数据与该组训练样本对应的在线电商有效互动数据匹配,确定匹配时,所使用的人工智能模型的模型配置数据作为该组训练样本对中在线电商噪声互动数据对应的业务噪声状态信息的人工智能模型的模型配置数据。
2.根据权利要求1所述的在大数据业务场景下的数据信息处理方法,其特征在于,所述业务噪声状态信息包括:全局业务噪声状态信息、局部业务噪声状态信息及潜在业务噪声状态信息,
或者,所述业务噪声状态信息包括:第1类状态信息至第n类状态信息,其中,n为大于或等于2的整数。
3.根据权利要求1所述的在大数据业务场景下的数据信息处理方法,其特征在于,所述采集在线电商互动数据,包括:
采集历史电商平台互动数据;
整合所述历史电商平台互动数据的互动频率信息;
根据所述互动频率信息,得到采集所述历史电商平台互动数据时的交互时段信息;
调节所述交互时段信息,得到满足预设互动频率指标的频率信息;
采集具有所述频率信息的在线电商互动数据的互动数据内容;根据所述互动数据内容,提取在线电商互动数据;
相应的,所述通过整合所述在线电商互动数据的业务转化程度信息,确定所述在线电商互动数据的当前业务噪声状态信息,包括:
整合所述在线电商互动数据的电商流量转化指标;
对所述电商流量转化指标进行配对,并根据预设的电商流量转化指标与业务互动噪声状态信息的配对关系,确定所述在线电商互动数据的当前业务噪声状态信息;
或者,获取在线调试的在线电商噪声互动数据的电商流量转化指标及所对应的业务噪声状态信息,确定所述在线调试的在线电商噪声互动数据的电商流量转化指标中与所述在线电商互动数据的电商流量转化指标相等的电商流量转化指标所对应的业务噪声状态信息为所述在线电商互动数据的当前业务噪声状态信息。
4.根据权利要求1所述的在大数据业务场景下的数据信息处理方法,其特征在于,所述采集在线电商互动数据,并通过整合所述在线电商互动数据的业务转化程度信息,确定所述在线电商互动数据的当前业务噪声状态信息之前,所述方法还包括:
获取多组在线电商有效互动数据及多组在线电商噪声互动数据,并将每个在线电商有效互动数据及所对应的在线电商噪声互动数据作为训练样本对,组成训练样本集合;
根据预设参数确定所述训练样本集合中所有训练样本对的业务噪声状态信息,其中,所述预设参数为预设业务除噪时长或者预设业务交互时长;
将所述训练样本集合中具有相同业务噪声状态信息的所有训练样本对及由相同业务噪声状态信息的训练样本对确定的状态关联结果,输入线性回归模型,进行训练;
在所述状态关联结果的权重值小于设定权重值时,完成所述训练,得到业务噪声状态信息与人工智能模型的模型配置数据的映射策略。
5.根据权利要求4所述的在大数据业务场景下的数据信息处理方法,其特征在于,所述获取多组在线电商有效互动数据及多组在线电商噪声互动数据,并将每个在线电商有效互动数据及所对应的在线电商噪声互动数据作为训练样本对,组成训练样本集合,包括:
获取设定业务交互时刻采集的多组在线电商有效互动数据,及设定业务交互时段采集的多组在线电商噪声互动数据;
将同时采集的在线电商有效互动数据与在线电商噪声互动数据进行互动数据统计操作,得到互动标签相匹配的第一在线电商有效互动数据与第一在线电商噪声互动数据;
获得包含所述第一在线电商有效互动数据与所述第一在线电商噪声互动数据的训练样本对;
获得不同采集时刻下的训练样本对,组成训练样本集合。
6.根据权利要求4所述的在大数据业务场景下的数据信息处理方法,其特征在于,所述获取多组在线电商有效互动数据及多组在线电商噪声互动数据,并将每个在线电商有效互动数据及所对应的在线电商噪声互动数据作为训练样本对,组成训练样本集合,包括:
获取设定业务交互时刻采集的多组在线电商有效互动数据;
根据噪声分类方式,对每个在线电商有效互动数据进行冗余数据除噪处理,生成每个在线电商有效互动数据对应的在线电商噪声互动数据;
获得包含第二在线电商有效互动数据与所述第二在线电商有效互动数据对应的第二在线电商噪声互动数据的训练样本对,其中,所述第二在线电商有效互动数据为所有在线电商有效互动数据中的任一在线电商有效互动数据;
获得每组在线电商有效互动数据对应的训练样本对,组成训练样本集合。
7.根据权利要求2所述的在大数据业务场景下的数据信息处理方法,其特征在于,在所述业务噪声状态信息包括全局业务噪声状态信息、局部业务噪声状态信息及潜在业务噪声状态信息时,所述根据所述当前业务噪声状态信息,以及业务噪声状态信息与人工智能模型的模型配置数据的映射策略,确定所述当前业务噪声状态信息对应的人工智能模型的模型配置数据,包括:
在所述当前业务噪声状态信息为全局业务噪声状态信息时,从所述映射策略中选择全局业务噪声状态信息对应的人工智能模型的模型配置数据;
在所述当前业务噪声状态信息为局部业务噪声状态信息时,从所述映射策略中选择局部业务噪声状态信息对应的人工智能模型的模型配置数据;
在所述当前业务噪声状态信息为潜在业务噪声状态信息时,从所述映射策略中选择潜在业务噪声状态信息对应的人工智能模型的模型配置数据;
相应的,所述根据所述模型配置数据,对所述在线电商互动数据进行噪声数据过滤处理,得到去除业务噪声后的在线电商互动数据,包括:
根据所述全局业务噪声状态信息对应的人工智能模型的模型配置数据,对所述在线电商互动数据进行噪声数据过滤处理,得到去除业务噪声后的在线电商互动数据;
或者,根据所述局部业务噪声状态信息对应的人工智能模型的模型配置数据,对所述在线电商互动数据进行噪声数据过滤处理,得到去除业务噪声后的在线电商互动数据;
或者,根据所述潜在业务噪声状态信息对应的人工智能模型的模型配置数据,对所述在线电商互动数据进行噪声数据过滤处理,得到去除业务噪声后的在线电商互动数据。
8.根据权利要求1所述的在大数据业务场景下的数据信息处理方法,其特征在于,所述根据所述模型配置数据,对所述在线电商互动数据进行噪声数据过滤处理,得到去除业务噪声后的在线电商互动数据之后,所述方法还包括:
对所述去除业务噪声后的在线电商互动数据进行格式转换,得到格式转换后的去除业务噪声的在线电商互动数据。
9.一种信息服务平台,其特征在于,包括处理器和存储器;所述处理器和所述存储器通信连接,所述处理器用于从所述存储器中读取计算机程序并执行,以实现上述权利要求1-8任一项所述的方法。
CN202110354790.3A 2021-04-01 2021-04-01 在大数据业务场景下的数据信息处理方法及信息服务平台 Active CN112988845B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110354790.3A CN112988845B (zh) 2021-04-01 2021-04-01 在大数据业务场景下的数据信息处理方法及信息服务平台

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110354790.3A CN112988845B (zh) 2021-04-01 2021-04-01 在大数据业务场景下的数据信息处理方法及信息服务平台

Publications (2)

Publication Number Publication Date
CN112988845A CN112988845A (zh) 2021-06-18
CN112988845B true CN112988845B (zh) 2021-11-16

Family

ID=76338838

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110354790.3A Active CN112988845B (zh) 2021-04-01 2021-04-01 在大数据业务场景下的数据信息处理方法及信息服务平台

Country Status (1)

Country Link
CN (1) CN112988845B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113329034B (zh) * 2021-06-25 2021-12-07 广州华资软件技术有限公司 基于人工智能的大数据业务优化方法、服务器及存储介质
CN113435933A (zh) * 2021-06-30 2021-09-24 上海苍苔信息技术有限公司 一种广告延迟转化方法和系统
CN114048387B (zh) * 2021-11-23 2023-03-24 中山市明源云科技有限公司 基于大数据和ai预测的内容推荐方法及人工智能云系统
CN114697128B (zh) * 2022-04-13 2023-10-24 广东数字金服信息技术有限公司 通过人工智能决策的大数据去噪方法及大数据采集系统
CN114840513B (zh) * 2022-05-25 2023-07-14 金润方舟科技股份有限公司 服务于大数据去噪优化的ai分析输出方法及人工智能系统
CN115794785B (zh) * 2023-02-01 2023-10-10 中软国际科技服务有限公司 基于大数据的电商数据筛查方法、系统及云平台

Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102523246A (zh) * 2011-11-23 2012-06-27 陈刚 一种云计算处理系统及方法
CN104516983A (zh) * 2015-01-08 2015-04-15 龙思薇 数据展示方法
CN106339502A (zh) * 2016-09-18 2017-01-18 电子科技大学 一种基于用户行为数据分片聚类的建模推荐方法
CN108073578A (zh) * 2016-11-07 2018-05-25 阿里巴巴集团控股有限公司 一种进行对象推荐的方法和系统
CN109035025A (zh) * 2018-08-17 2018-12-18 北京奇虎科技有限公司 评价股票评论可靠性的方法和装置
CN109299252A (zh) * 2018-08-17 2019-02-01 北京奇虎科技有限公司 基于机器学习的股票评论的观点极性分类方法和装置
CN109919684A (zh) * 2019-03-18 2019-06-21 上海盛付通电子支付服务有限公司 用于生成信息预测模型的方法、电子设备和计算机可读存储介质
US10339656B1 (en) * 2016-09-29 2019-07-02 Amazon Technologies, Inc. Inferring count of items using image
CN110110078A (zh) * 2018-01-11 2019-08-09 北京搜狗科技发展有限公司 数据处理方法和装置、用于数据处理的装置
CN110390041A (zh) * 2019-07-02 2019-10-29 上海上湖信息技术有限公司 在线学习方法及装置、计算机可读存储介质
CN111242239A (zh) * 2020-01-21 2020-06-05 腾讯科技(深圳)有限公司 一种训练样本选取方法、装置、以及计算机存储介质
CN111259254A (zh) * 2020-02-07 2020-06-09 齐鲁工业大学 一种基于会话噪声的滤波推荐方法及系统
CN111680221A (zh) * 2020-08-11 2020-09-18 腾讯科技(深圳)有限公司 信息推荐方法、装置、设备及计算机可读存储介质
CN112115131A (zh) * 2020-09-29 2020-12-22 腾讯科技(深圳)有限公司 数据去噪方法、装置、设备及计算机可读存储介质

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106169117A (zh) * 2016-06-24 2016-11-30 河海大学 一种虚拟电厂日前和实时竞标模型
CN107609461A (zh) * 2017-07-19 2018-01-19 阿里巴巴集团控股有限公司 模型的训练方法、数据相似度的确定方法、装置及设备
CN109740887A (zh) * 2018-12-24 2019-05-10 上海商然数据服务有限公司 一种基于语音互动的大数据决策辅助系统

Patent Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102523246A (zh) * 2011-11-23 2012-06-27 陈刚 一种云计算处理系统及方法
CN104516983A (zh) * 2015-01-08 2015-04-15 龙思薇 数据展示方法
CN106339502A (zh) * 2016-09-18 2017-01-18 电子科技大学 一种基于用户行为数据分片聚类的建模推荐方法
US10339656B1 (en) * 2016-09-29 2019-07-02 Amazon Technologies, Inc. Inferring count of items using image
CN108073578A (zh) * 2016-11-07 2018-05-25 阿里巴巴集团控股有限公司 一种进行对象推荐的方法和系统
CN110110078A (zh) * 2018-01-11 2019-08-09 北京搜狗科技发展有限公司 数据处理方法和装置、用于数据处理的装置
CN109035025A (zh) * 2018-08-17 2018-12-18 北京奇虎科技有限公司 评价股票评论可靠性的方法和装置
CN109299252A (zh) * 2018-08-17 2019-02-01 北京奇虎科技有限公司 基于机器学习的股票评论的观点极性分类方法和装置
CN109919684A (zh) * 2019-03-18 2019-06-21 上海盛付通电子支付服务有限公司 用于生成信息预测模型的方法、电子设备和计算机可读存储介质
CN110390041A (zh) * 2019-07-02 2019-10-29 上海上湖信息技术有限公司 在线学习方法及装置、计算机可读存储介质
CN111242239A (zh) * 2020-01-21 2020-06-05 腾讯科技(深圳)有限公司 一种训练样本选取方法、装置、以及计算机存储介质
CN111259254A (zh) * 2020-02-07 2020-06-09 齐鲁工业大学 一种基于会话噪声的滤波推荐方法及系统
CN111680221A (zh) * 2020-08-11 2020-09-18 腾讯科技(深圳)有限公司 信息推荐方法、装置、设备及计算机可读存储介质
CN112115131A (zh) * 2020-09-29 2020-12-22 腾讯科技(深圳)有限公司 数据去噪方法、装置、设备及计算机可读存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于分类模型的电商用户复购行为预测研究;杜世民;《基于分类模型的电商用户复购行为预测研究》;20200115;C042-2395 *

Also Published As

Publication number Publication date
CN112988845A (zh) 2021-06-18

Similar Documents

Publication Publication Date Title
CN112988845B (zh) 在大数据业务场景下的数据信息处理方法及信息服务平台
US20200380017A1 (en) Automatic feature learning from a relational database for predictive modelling
CN112818023B (zh) 在关联云业务场景下的大数据分析方法及云计算服务器
CN111898675B (zh) 信贷风控模型生成方法、装置、评分卡生成方法、机器可读介质及设备
CN110598620A (zh) 模型训练方法和装置、目标检测方法和装置
US20190188221A1 (en) Using cross-matching between users and matching against reference data to facilitate content identification
CN112801155B (zh) 基于人工智能的业务大数据分析方法及服务器
CN112365355A (zh) 实时计算基金估值和风险指标的方法、装置及可读介质
CN112861894A (zh) 一种数据流分类方法、装置及系统
CN113472860A (zh) 大数据和数字化环境下的业务资源分配方法及服务器
CN113497785B (zh) 恶意加密流量检测方法、系统、存储介质和云端服务器
CN114329116B (zh) 基于人工智能的智慧园区资源匹配度分析方法及系统
CN115712843A (zh) 基于人工智能的数据匹配检测处理方法及系统
CN112801156B (zh) 用于人工智能机器学习的业务大数据采集方法及服务器
CN111209105A (zh) 扩容处理方法、装置、设备及可读存储介质
CN109769027A (zh) 一种消息推送方法、装置及设备
CN114625961A (zh) 应用于大数据的智能化在线服务推送方法及大数据服务器
CN108961049B (zh) 用于模糊匹配控制的阈值确定方法及装置、交易监控方法
CN104951802A (zh) 一种分类器更新方法
CN114625624B (zh) 结合人工智能的数据处理方法、系统及云平台
CN114140140B (zh) 一种场景筛选方法、装置及设备
US11875374B2 (en) Automated auditing and recommendation systems and methods
CN110119406B (zh) 实时任务记录的核对方法及装置
CN115499234A (zh) 基于人工智能的社区安全预警方法及系统
CN114282088A (zh) 一种智慧国土云平台信息处理装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20211102

Address after: 410000 Room 303, building 7, phase I, Changsha Zhongdian Software Park, No. 39, Jianshan Road, Changsha high tech Development Zone, Yuelu District, Changsha City, Hunan Province

Applicant after: HUNAN MACHINE HOME INFORMATION TECHNOLOGY CO.,LTD.

Address before: B21, entrepreneurship base of Harbin Institute of technology, 73 Huanghe Road, Nangang District, Harbin City, Heilongjiang Province

Applicant before: Bi Yanjie

TA01 Transfer of patent application right
GR01 Patent grant
GR01 Patent grant