CN115982236A - 一种应用于ai的大数据优化方法及服务器 - Google Patents

一种应用于ai的大数据优化方法及服务器 Download PDF

Info

Publication number
CN115982236A
CN115982236A CN202211659880.4A CN202211659880A CN115982236A CN 115982236 A CN115982236 A CN 115982236A CN 202211659880 A CN202211659880 A CN 202211659880A CN 115982236 A CN115982236 A CN 115982236A
Authority
CN
China
Prior art keywords
knowledge
big data
behavior preference
preference description
digital service
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202211659880.4A
Other languages
English (en)
Other versions
CN115982236B (zh
Inventor
邓小东
杨彬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hainan Yilei Investment Co ltd
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN202211659880.4A priority Critical patent/CN115982236B/zh
Publication of CN115982236A publication Critical patent/CN115982236A/zh
Application granted granted Critical
Publication of CN115982236B publication Critical patent/CN115982236B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供的应用于AI的大数据优化方法及服务器,通过将行为偏好描述知识KV2与行为偏好描述知识KV3进行知识汇集得到行为偏好描述知识KV4,能够提升利用行为偏好描述知识KV1所包含的用户行为偏好向量优化行为偏好描述知识KV2所包含的用户行为偏好向量的质量,即能够提升利用第一数字服务交互大数据的用户行为偏好向量优化第二数字服务交互大数据的数据细节。根据行为偏好描述知识KV4对第二数字服务交互大数据进行知识细节优化,能够提升第一已优化数字服务大数据的数据细节丰富程度和完整性,即能够提升对第二数字服务交互大数据的优化性能,也即可使第二数字服务交互大数据的细节特征尽可能不出现缺失,为后续的数据推送分析提供高质量的分析依据。

Description

一种应用于AI的大数据优化方法及服务器
技术领域
本发明涉及大数据技术领域,尤其涉及一种应用于AI的大数据优化方法及服务器。
背景技术
社会经济不断发展的过程中,信息数据量也呈现出迅速增长的发展趋势,与此同时,信息数据的存储、整合、搜索等工作的开展,对计算机网络技术提出的要求也随之进一步提高。所以,人工智能就成为了帮助人们处理信息数据最有效的方法。大数据时代下的人工智能技术在计算机网络中的应用,作为一种高效、准确的网络技术手段。能够利用其自身的智能化优势,合理的进行计算机系统中海量数据信息的分类和处理。当下,基于人工智能的数据挖掘和分析技术热度不减,而如何高质量实现特征层面的数据优化处理是其中一个难题。
发明内容
本发明提供一种应用于AI的大数据优化方法及服务器,为实现上述技术目的,本发明采用如下技术方案。
第一方面是一种应用于AI的大数据优化方法,应用于大数据优化服务器,所述方法包括:获得第一数字服务交互大数据的行为偏好描述知识KV1和第二数字服务交互大数据的行为偏好描述知识KV2;其中,所述第一数字服务交互大数据和所述第二数字服务交互大数据皆属于满足大数据优化条件的互动日志,所述第一数字服务交互大数据的数字签名值与所述第二数字服务交互大数据的数字签名值的差值不大于设定时序值;基于所述行为偏好描述知识KV1,得到不少于一个行为偏好描述知识KV3;其中,所述不少于一个行为偏好描述知识KV3在会话服务场景层面的分布特征皆与所述行为偏好描述知识KV1在所述会话服务场景层面的分布特征存在比较结果;将所述行为偏好描述知识KV2与所述不少于一个行为偏好描述知识KV3进行知识汇集,得到行为偏好描述知识KV4;基于所述行为偏好描述知识KV4对所述第二数字服务交互大数据进行知识细节优化,得到第一已优化数字服务大数据。
可见,大数据优化服务器在获得第一数字服务交互大数据的行为偏好描述知识KV1和行为偏好描述知识KV2,第一数字服务交互大数据和第二数字服务交互大数据为满足大数据优化条件的互动日志中数字签名值不同的两组数字服务交互大数据的基础上,根据行为偏好描述知识KV1得到在会话服务场景层面的分布特征与行为偏好描述知识KV1不同的不少于一个行为偏好描述知识KV3,这样提升不少于一个行为偏好描述知识KV3包括与行为偏好描述知识KV2在会话服务场景层面的分布特征相同的行为偏好描述知识的可能性。
如此设计,通过将行为偏好描述知识KV2与不少于一个行为偏好描述知识KV3进行知识汇集得到行为偏好描述知识KV4,能够提升利用行为偏好描述知识KV1所包含的用户行为偏好向量优化行为偏好描述知识KV2所包含的用户行为偏好向量的质量,即能够提升利用第一数字服务交互大数据的用户行为偏好向量优化第二数字服务交互大数据的数据细节。
基于此,根据行为偏好描述知识KV4对第二数字服务交互大数据进行知识细节优化,得到第一已优化数字服务大数据,能够提升第一已优化数字服务大数据的数据细节丰富程度和完整性,即能够提升对第二数字服务交互大数据的优化性能,也即可使第二数字服务交互大数据的细节特征尽可能不出现缺失,为后续的数据推送分析提供高质量的分析依据。
在一些可能的实施例中,所述满足大数据优化条件的互动日志还包括第三数字服务交互大数据,所述第二数字服务交互大数据数字签名值处于所述第一数字服务交互大数据的数字签名值与所述第三数字服务交互大数据的数字签名值之间;在所述基于所述行为偏好描述知识KV4对所述第二数字服务交互大数据进行知识细节优化,得到第一已优化数字服务大数据之前,所述方法还包括:获得所述第三数字服务交互大数据的行为偏好描述知识KV5;对所述行为偏好描述知识KV4和所述行为偏好描述知识KV5进行知识汇集,得到行为偏好描述知识KV6;所述基于所述行为偏好描述知识KV4对所述第二数字服务交互大数据进行知识细节优化,得到第一已优化数字服务大数据,包括:基于所述行为偏好描述知识KV6对所述第二数字服务交互大数据进行知识细节优化,得到所述第一已优化数字服务大数据。
可见,大数据优化服务器在利用行为偏好描述知识KV1所包含的用户行为偏好向量优化行为偏好描述知识KV2所包含的用户行为偏好向量得到行为偏好描述知识KV4的基础上,通过对行为偏好描述知识KV4和行为偏好描述知识KV5进行知识汇集得到行为偏好描述知识KV6,并根据行为偏好描述知识KV6得到第一已优化数字服务大数据。如此不仅能够基于第一数字服务交互大数据的用户行为偏好向量优化第二数字服务交互大数据,还能够基于第三数字服务交互大数据的用户行为偏好向量优化第二数字服务交互大数据。
鉴于第二数字服务交互大数据的数字签名值位于第一数字服务交互大数据的数字签名值和第三数字服务交互大数据的数字签名值之间,基于此能够提升对第二数字服务交互大数据的优化性能(特征优化质量)。
此外,大数据优化服务器先利用行为偏好描述知识KV1所包含的用户行为偏好向量优化行为偏好描述知识KV2所包含的用户行为偏好向量得到行为偏好描述知识KV4,再利用行为偏好描述知识KV5所包含的用户行为偏好向量优化行为偏好描述知识KV4所包含的用户行为偏好向量得到行为偏好描述知识KV6。可以理解为先对第一数字服务交互大数据的用户行为偏好向量和第二数字服务交互大数据的用户行为偏好向量进行知识汇集,再对第三数字服务交互大数据的用户行为偏好向量和第二数字服务交互大数据的用户行为偏好向量进行知识汇集,即可以理解为实现了双重知识汇集。
鉴于第一数字服务交互大数据、第二数字服务交互大数据、第三数字服务交互大数据中的任意两组数字服务交互大数据在会话服务场景层面的分布特征都存在差异,如果直接通过对第一数字服务交互大数据的用户行为偏好向量、第二数字服务交互大数据的用户行为偏好向量、第三数字服务交互大数据的用户行为偏好向量进行知识汇集,需要同时分析三组数字服务交互大数据在会话服务场景层面的分布特征差异,进而导致优化第二数字服务交互大数据的数据细节丰富程度和完整性,优化性能差。但是通过所述技术思路,在每轮知识汇集时,都只用分析两组数字服务交互大数据在会话服务场景层面的分布特征差异,相比于直接将三组数字服务交互大数据的用户行为偏好向量进行知识汇集,能够提升优化性能。
在一些可能的实施例中,所述行为偏好描述知识KV5的关注维度数为U,所述U为大于1的正数;所述对所述行为偏好描述知识KV4和所述行为偏好描述知识KV5进行知识汇集,得到行为偏好描述知识KV6,包括:从所述行为偏好描述知识KV5中筛选W个关注维度的向量字段,得到行为偏好描述知识KV7,所述W小于所述U;对所述行为偏好描述知识KV4和所述行为偏好描述知识KV7进行知识汇集,得到所述行为偏好描述知识KV6。
可见,鉴于行为偏好描述知识KV7的知识容量比行为偏好描述知识KV5的知识容量小,大数据优化服务器通过所述设计思路,可能够实现行为偏好描述知识KV6的轻量化处理。
在一些可能的实施例中,所述基于所述行为偏好描述知识KV6对所述第二数字服务交互大数据进行知识细节优化,得到所述第一已优化数字服务大数据,包括:对所述行为偏好描述知识KV6进行知识再提炼,得到行为偏好描述知识KV8;对所述行为偏好描述知识KV8进行细节挖掘操作,得到行为偏好描述知识KV9;对所述行为偏好描述知识KV9进行知识衍生,得到行为偏好描述知识KV10;所述行为偏好描述知识KV10的规模与所述行为偏好描述知识KV6的规模相同;对所述行为偏好描述知识KV10进行知识翻译,得到所述第一已优化数字服务大数据。
可见,大数据优化服务器先对行为偏好描述知识KV6进行知识再提炼得到行为偏好描述知识KV8,再对行为偏好描述知识KV8进行细节挖掘操作得到行为偏好描述知识KV9,可增大细节挖掘操作的挖掘范围,进而提高细节挖掘操作的质量。基于此,通过将行为偏好描述知识KV9进行知识衍生得到规模与行为偏好描述知识KV6相同的行为偏好描述知识KV10,并通过对行为偏好描述知识KV10进行知识翻译,得到第一已优化数字服务大数据,可提升第一已优化数字服务大数据的数据细节丰富程度和完整性。
在一些可能的实施例中,所述将所述行为偏好描述知识KV2与所述不少于一个行为偏好描述知识KV3进行知识汇集,得到行为偏好描述知识KV4,包括:对所述行为偏好描述知识KV2和所述不少于一个行为偏好描述知识KV3进行基于第一关注维度策略的知识汇集,得到行为偏好描述知识KV11;对所述行为偏好描述知识KV11进行基于第二关注维度策略的知识汇集,得到行为偏好描述知识KV12;基于所述行为偏好描述知识KV12,得到所述行为偏好描述知识KV4。
可见,大数据优化服务器通过对行为偏好描述知识KV2和不少于一个行为偏好描述知识KV3进行基于第一关注维度策略的知识汇集得到行为偏好描述知识KV11,再对行为偏好描述知识KV11进行基于第二关注维度策略的知识汇集得到行为偏好描述知识KV12,可以理解为通过两次局部特征的拼接实现全局特征的拼接。如此设计,既可提升行为偏好描述知识KV2和不少于一个行为偏好描述知识KV3的拼接效果,还能够减少知识汇集/拼接过程中的资源开销。
在一些可能的实施例中,所述行为偏好描述知识KV12包括行为偏好描述知识KV13和行为偏好描述知识KV14,所述行为偏好描述知识KV13属于所述行为偏好描述知识KV12的第一关注维度,所述行为偏好描述知识KV14属于所述行为偏好描述知识KV12的第二关注维度;所述基于所述行为偏好描述知识KV12,得到所述行为偏好描述知识KV4,包括:获得所述第一关注维度的第一偏置因子和所述第二关注维度的第二偏置因子;将所述第一偏置因子作为所述行为偏好描述知识KV13的联动偏置因子,所述第二偏置因子作为所述行为偏好描述知识KV14的联动偏置因子,对所述行为偏好描述知识KV13和所述行为偏好描述知识KV14进行全局整理,得到所述行为偏好描述知识KV4。
可见,鉴于第一偏置因子表征第一关注维度的信息的贡献度,第二偏置因子表征第二关注维度的信息的贡献度,而行为偏好描述知识KV13为第一关注维度的向量字段,行为偏好描述知识KV14为第二关注维度的向量字段,大数据优化服务器根据第一关注维度的第一偏置因子和第二关注维度的第二偏置因子,对行为偏好描述知识KV13和行为偏好描述知识KV14进行全局整理得到行为偏好描述知识KV4,能够提升知识汇集的精度。
在一些可能的实施例中,所述基于所述行为偏好描述知识KV1,得到不少于一个行为偏好描述知识KV3,包括:获得不少于一个知识调整指示;基于所述不少于一个知识调整指示将所述行为偏好描述知识KV1在所述会话服务场景层面下进行调整,得到所述不少于一个行为偏好描述知识KV3。
可见,大数据优化服务器根据不少于一个知识调整指示将行为偏好描述知识KV1在会话服务场景层面中进行调整,可得到不少于一个行为偏好描述知识KV3。
在一些可能的实施例中,在得到所述第一已优化数字服务大数据后,所述方法还包括:通过所述第一已优化数字服务大数据覆盖所述满足大数据优化条件的互动日志中的所述第二数字服务交互大数据。
可见,大数据优化服务器通过第一已优化数字服务大数据覆盖满足大数据优化条件的互动日志中的第二数字服务交互大数据,得到优化后的互动日志,能够提升满足大数据优化条件的互动日志的互动日志质量。
在一些可能的实施例中,所述应用于AI的大数据优化方法通过大数据优化算法实现,所述大数据优化算法包括知识提炼单元、知识汇集单元、知翻译单元;所述基于所述行为偏好描述知识KV1,得到不少于一个行为偏好描述知识KV3,包括:通过所述知识汇集单元基于所述行为偏好描述知识KV1,得到不少于一个行为偏好描述知识KV3;所述将所述行为偏好描述知识KV2与所述不少于一个行为偏好描述知识KV3进行知识汇集,得到行为偏好描述知识KV4,包括:通过所述知识汇集单元将所述行为偏好描述知识KV2与所述不少于一个行为偏好描述知识KV3进行知识汇集,得到行为偏好描述知识KV4;所述基于所述行为偏好描述知识KV4对所述第二数字服务交互大数据进行知识细节优化,得到第一已优化数字服务大数据,包括:通过所述知识汇集单元和所述知翻译单元基于所述行为偏好描述知识KV4,得到所述第二数字服务交互大数据的第一已优化数字服务大数据;所述获得第一数字服务交互大数据的行为偏好描述知识KV1和第二数字服务交互大数据的行为偏好描述知识KV2,包括:通过所述知识提炼单元提炼所述第一数字服务交互大数据的用户行为偏好向量,得到所述行为偏好描述知识KV1;通过所述知识提炼单元提炼所述第二数字服务交互大数据的用户行为偏好向量,得到所述行为偏好描述知识KV2。
在一些可能的实施例中,所述应用于AI的大数据优化方法还包括所述大数据优化算法的调试步骤:获得算法调试样例集,所述算法调试样例集包括数字服务交互大数据样例E1和数字服务交互大数据样例E2,所述数字服务交互大数据样例E1的数字签名值与所述数字服务交互大数据样例E2的数字签名值的差值不大于所述设定时序值;利用所述数字服务交互大数据样例E1优化所述数字服务交互大数据样例E2,得到第二已优化数字服务大数据;基于所述第二已优化数字服务大数据与先验数字服务交互大数据dataT的第一比较结果,得到第一算法代价;所述先验数字服务交互大数据dataT为所述数字服务交互大数据样例E2的正确参考依据;所述第一算法代价与所述第一比较结果具有设定量化关系;基于所述第一算法代价,改进所述大数据优化算法的算法变量。
可见,大数据优化服务器可通过对大数据优化算法进行调试,使大数据优化算法推演出数字服务交互大数据优化的性能,从而实现应用于AI的大数据优化方法。
在一些可能的实施例中,所述利用所述数字服务交互大数据样例E1优化所述数字服务交互大数据样例E2,得到第二已优化数字服务大数据,包括:通过所述知识提炼单元提炼所述数字服务交互大数据样例E1的用户行为偏好向量,得到行为偏好描述知识KV15;通过所述知识提炼单元提炼所述数字服务交互大数据样例E2的用户行为偏好向量,得到行为偏好描述知识KV16;通过所述知识汇集单元对所述行为偏好描述知识KV15和所述行为偏好描述知识KV16进行处理,得到行为偏好描述知识KV17,所述行为偏好描述知识KV17为所述数字服务交互大数据样例E2的优化后的行为偏好描述知识;通过所述知翻译单元基于所述行为偏好描述知识KV17,得到所述第二已优化数字服务大数据。
在一些可能的实施例中,在所述基于所述第一算法代价,改进所述大数据优化算法的算法变量之前,所述调试步骤还包括:对所述行为偏好描述知识KV16进行知识翻译,得到数字服务交互测试数据;基于所述数字服务交互测试数据的特征识别评分与先验数字服务交互大数据dataT的特征识别评分的第二比较结果,得到第二算法代价;所述第二算法代价与所述第二比较结果具有设定量化关系;所述基于所述第一算法代价,改进所述大数据优化算法的算法变量,包括:基于所述第一算法代价和所述第二算法代价,改进所述大数据优化算法的算法变量。
可见,大数据优化服务器在调试步骤中,通过知识汇集单元对行为偏好描述知识KV15和行为偏好描述知识KV16进行处理得到行为偏好描述知识KV17。通过知翻译单元对行为偏好描述知识KV17进行处理,得到数字服务交互大数据样例E2的第二已优化数字服务大数据。根据第二已优化数字服务大数据与先验数字服务交互大数据dataT的第一比较结果得到第一算法代价。
通过知识提炼单元分别提炼数字服务交互大数据样例E1的用户行为偏好向量和数字服务交互大数据样例E2的用户行为偏好向量,得到行为偏好描述知识KV15和行为偏好描述知识KV16。通过对行为偏好描述知识KV16进行知识翻译得到数字服务交互测试数据。根据数字服务交互测试数据的特征识别评分与先验数字服务交互大数据dataT的特征识别评分的第二比较结果得到第二算法代价,由此根据第二算法代价改进待优化算法的算法变量,可减少知识提炼单元所提炼的噪声的用户行为偏好向量。由此根据第一算法代价和第二算法代价改进待优化算法的算法变量,能够提升待优化算法的优化性能。。
第二方面是一种大数据优化服务器,包括存储器和处理器;所述存储器和所述处理器耦合;所述存储器用于存储计算机程序代码,所述计算机程序代码包括计算机指令;其中,当所述处理器执行所述计算机指令时,使得所述大数据优化服务器执行第一方面的方法。
第三方面是一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序在运行时执行第一方面的方法。
附图说明
图1为本发明实施例提供的应用于AI的大数据优化方法的流程示意图。
图2为本发明实施例提供的应用于AI的大数据优化装置的模块框图。
具体实施方式
以下,术语“第一”、“第二”和“第三”等仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”或“第三”等的特征可以明示或者隐含地包括一个或者更多个该特征。
图1示出了本发明实施例提供的应用于AI的大数据优化方法的流程示意图,应用于AI的大数据优化方法可以通过大数据优化服务器实现,大数据优化服务器可以包括存储器和处理器;所述存储器和所述处理器耦合;所述存储器用于存储计算机程序代码,所述计算机程序代码包括计算机指令;其中,当所述处理器执行所述计算机指令时,使得所述大数据优化服务器执行步骤101-步骤104所描述的技术方案。
步骤101、获得第一数字服务交互大数据的行为偏好描述知识KV1和第二数字服务交互大数据的行为偏好描述知识KV2。
本发明实施例中,第一数字服务交互大数据和第二数字服务交互大数据为满足大数据优化条件的互动日志中的任意两组数字服务交互大数据,比如第一数字服务交互大数据和第二数字服务交互大数据皆属于满足大数据优化条件的互动日志(待优化的互动日志),第一数字服务交互大数据的数字签名值(时间戳)与第二数字服务交互大数据的数字签名值的差值不大于设定时序值(时间阈值)。
本发明实施例中,满足大数据优化条件的互动日志可以是离线互动日志,也可以是实时互动日志。互动日志中的两组数字服务交互大数据的数字签名值的差值越小,这两组数字服务交互大数据的数字服务交互大数据内容的联系度越高。本发明实施例中,互动日志中的数字服务交互大数据的数字签名值表征在处理互动日志的过程中数字服务交互大数据的激活时刻。例如,满足大数据优化条件的互动日志包括数字服务交互大数据DATA_a,若数字服务交互大数据DATA_a的数字签名值为time sign1,则在满足大数据优化条件的互动日志的第time sign1节点激活数字服务交互大数据DATA_a。
本发明实施例中,以设定时序值为依据区分两组数字服务交互大数据的数字签名值的差值是大还是小。示例性的,两组数字服务交互大数据的数字签名值的差值大于设定时序值,说明两组数字服务交互大数据的数字签名值的差值大;两组数字服务交互大数据的数字签名值的差值不大于设定时序值,说明两组数字服务交互大数据的数字签名值的差值小。
举例而言,第一数字服务交互大数据和第二数字服务交互大数据为满足大数据优化条件的互动日志中连续的两组数字服务交互大数据。进一步地,数字服务交互大数据可以是电子商务服务的交互大数据,也可以是元宇宙服务的交互大数据,还可以是智慧企服的交互大数据,本发明实施例对数字服务交互大数据的具体领域不作限制。
本发明实施例中,数字服务交互大数据的用户行为偏好向量(包括所述第一数字服务交互大数据的用户行为偏好向量和所述第二数字服务交互大数据的用户行为偏好向量,以及后续的第x-1组数字服务交互大数据的用户行为偏好向量、第x组数字服务交互大数据的用户行为偏好向量、第x+1组数字服务交互大数据的用户行为偏好向量、数字服务交互大数据样例E1的用户行为偏好向量、数字服务交互大数据样例E2的用户行为偏好向量)包括以下至少一种信息:数字服务交互大数据的用户兴趣事项、数字服务交互大数据的需求类型、数字服务交互大数据内的服务反馈的文本情绪特征、数字服务交互大数据的特征识别评分(可以理解为特征识别度)信息、数字服务交互大数据内不同服务反馈的相对关联信息。而数字服务交互大数据的行为偏好描述知识(基于AI的专家系统生成的一类特征向量)携带数字服务交互大数据的用户行为偏好向量(也可以理解为特征向量)。
示例性的,行为偏好描述知识KV1携带第一数字服务交互大数据的用户行为偏好向量,其中,第一数字服务交互大数据的用户行为偏好向量包括以下至少一种信息:第一数字服务交互大数据的用户兴趣事项、第一数字服务交互大数据的需求类型、第一数字服务交互大数据内的服务反馈的文本情绪特征、第一数字服务交互大数据的特征识别评分信息、第一数字服务交互大数据内不同服务反馈的相对关联信息。行为偏好描述知识KV2携带第二数字服务交互大数据的用户行为偏好向量,其中,第二数字服务交互大数据的用户行为偏好向量包括以下至少一种信息:第二数字服务交互大数据的用户兴趣事项、第二数字服务交互大数据的需求类型、第二数字服务交互大数据内的服务反馈的文本情绪特征、第二数字服务交互大数据的特征识别评分信息、第二数字服务交互大数据内不同服务反馈的相对关联信息。
在一种获得第一数字服务交互大数据的行为偏好描述知识KV1和第二数字服务交互大数据的行为偏好描述知识KV2的思路中,大数据优化服务器接收外部输入的行为偏好描述知识KV1和行为偏好描述知识KV2。
在又一种获得第一数字服务交互大数据的行为偏好描述知识KV1和第二数字服务交互大数据的行为偏好描述知识KV2的思路中,大数据优化服务器通过对第一数字服务交互大数据进行细节挖掘操作(特征提取处理)得到行为偏好描述知识KV1,通过对第二数字服务交互大数据进行细节挖掘操作得到行为偏好描述知识KV2。进一步地,行为偏好描述知识KV可以理解为knowledge vector(也即知识向量)。
步骤102、根据所述行为偏好描述知识KV1,得到不少于一个行为偏好描述知识KV3。
本发明实施例中,不少于一个行为偏好描述知识KV3在会话服务场景层面的分布特征皆与行为偏好描述知识KV1在会话服务场景层面的分布特征存在比较结果,即任意一个行为偏好描述知识KV3在AI特征空间中的分布特征与行为偏好描述知识KV1在AI特征空间中的分布特征都存在差异。可选的,不少于一个行为偏好描述知识KV3所包含的信息皆与行为偏好描述知识KV1所包含的信息相同。
对于一些示例而言,大数据优化服务器获得行为偏好描述知识KV1在会话服务场景层面的第一分布特征,将第一分布特征与不少于一个知识调整指示(特征偏移量)求和,得到不少于一个第二分布特征,其中,在知识调整指示的数目大于1的基础上,任意两个知识调整指示都存在差异。将行为偏好描述知识KV1分别调整至不少于一个第二分布特征中的各个分布特征(比如将行为偏好描述知识的分布位置进行调整或者偏移),得到不少于一个行为偏好描述知识KV3。在知识调整指示的数目大于1的基础上,不少于一个知识调整指示互相之间的差值一致。
对于另一些示例而言,大数据优化服务器获得不少于一个预设分布特征,其中,在预设分布特征的数目大于1的基础上,任意两个预设分布特征都存在差异。将行为偏好描述知识KV1分别调整至不少于一个预设分布特征中的各个分布特征,得到不少于一个行为偏好描述知识KV3。
步骤103、将所述行为偏好描述知识KV2与所述不少于一个行为偏好描述知识KV3拼接(知识汇集或者知识汇总),得到行为偏好描述知识KV4。
可以理解的是,第一数字服务交互大数据的数字签名值与第二数字服务交互大数据的数字签名值的差值小,因此第一数字服务交互大数据的数字服务交互大数据内容和第二数字服务交互大数据的数字服务交互大数据内容联系度高。基于此,通过对第一数字服务交互大数据和第二数字服务交互大数据进行知识汇集,可利用第一数字服务交互大数据优化第二数字服务交互大数据的数据细节丰富程度和完整性。
而不少于一个行为偏好描述知识KV3均携带第一数字服务交互大数据的用户行为偏好向量,行为偏好描述知识KV2携带第二数字服务交互大数据的用户行为偏好向量。因此,通过将行为偏好描述知识KV2与不少于一个行为偏好描述知识KV3进行知识汇集,可利用第一数字服务交互大数据的用户行为偏好向量优化第二数字服务交互大数据的用户行为偏好向量,从而取得优化第二数字服务交互大数据的数据细节(该数据细节能够全面丰富地反映用户兴趣和用户需求)。
比如,通过将行为偏好描述知识KV2与不少于一个行为偏好描述知识KV3进行知识汇集,可利用不少于一个行为偏好描述知识KV3所包含的用户兴趣事项充实行为偏好描述知识KV2所包含的用户兴趣事项,从而取得优化第二数字服务交互大数据的纹理的质量。
又比如,通过将行为偏好描述知识KV2与不少于一个行为偏好描述知识KV3进行知识汇集,可利用不少于一个行为偏好描述知识KV3所包含的需求类型对行为偏好描述知识KV4所包含的需求类型进行修改,从而取得修改第二数字服务交互大数据的需求类型的质量。
鉴于在满足大数据优化条件的互动日志中,任意两组数字签名值不同的两组数字服务交互大数据在会话服务场景层面的分布特征都存在差异,直接对数字签名值不同的两组数字服务交互大数据的行为偏好描述知识进行知识汇集,带来的拼接效果差。因此为提高知识汇集的精度,可在将数字签名值不同的两组数字服务交互大数据的行为偏好描述知识拼接之前,通过对数字签名值不同的两组数字服务交互大数据的行为偏好描述知识在会话服务场景层面匹配,减少数字签名值不同的两组数字服务交互大数据的行为偏好描述知识在会话服务场景层面的分布特征差异,进而提高知识汇集的精度。
本发明实施例中,大数据优化服务器根据行为偏好描述知识KV1,得到在会话服务场景层面的分布特征与行为偏好描述知识KV1在会话服务场景层面的分布特征存在比较结果的不少于一个行为偏好描述知识KV3,进而可将不少于一个行为偏好描述知识KV3,作为包括将行为偏好描述知识KV1向行为偏好描述知识KV2匹配后的行为偏好描述知识。
鉴于行为偏好描述知识KV1和行为偏好描述知识KV2在会话服务场景层面的分布特征差异是不确定的,行为偏好描述知识KV3与行为偏好描述知识KV1在会话服务场景层面的分布特征差异,为对行为偏好描述知识KV1与行为偏好描述知识KV2在会话服务场景层面的分布特征差异的预测结果。因此行为偏好描述知识KV3的数目越多,不少于一个行为偏好描述知识KV3包括与行为偏好描述知识KV1在会话服务场景层面的分布特征相同的行为偏好描述知识的可能性越大。
大数据优化服务器通过将行为偏好描述知识KV2与包括将行为偏好描述知识KV1向行为偏好描述知识KV2匹配(对齐)后的行为偏好描述知识的不少于一个行为偏好描述知识KV3拼接,可提升第一数字服务交互大数据的行为偏好描述知识与第二数字服务交互大数据的行为偏好描述知识的拼接效果。
步骤104、根据所述行为偏好描述知识KV4对所述第二数字服务交互大数据进行知识细节优化,得到第一已优化数字服务大数据。
本发明实施例中,第一已优化数字服务大数据为优化第二数字服务交互大数据的数据细节丰富程度和完整性后得到的数字服务交互大数据,即第一已优化数字服务大数据的数据细节丰富程度和完整性高于第二数字服务交互大数据的数据细节丰富程度和完整性。
对于一些示例而言,大数据优化服务器通过对行为偏好描述知识KV4进行知识翻译,实现对第二数字服务交互大数据的优化,得到第一已优化数字服务大数据。
本发明实施例中,大数据优化服务器在获得第一数字服务交互大数据的行为偏好描述知识KV1和行为偏好描述知识KV2,第一数字服务交互大数据和第二数字服务交互大数据为满足大数据优化条件的互动日志中数字签名值不同的两组数字服务交互大数据的基础上,根据行为偏好描述知识KV1得到在会话服务场景层面的分布特征与行为偏好描述知识KV1不同的不少于一个行为偏好描述知识KV3,这样提升不少于一个行为偏好描述知识KV3包括与行为偏好描述知识KV2在会话服务场景层面的分布特征相同的行为偏好描述知识的可能性。
如此设计,通过将行为偏好描述知识KV2与不少于一个行为偏好描述知识KV3进行知识汇集得到行为偏好描述知识KV4,能够提升利用行为偏好描述知识KV1所包含的用户行为偏好向量优化行为偏好描述知识KV2所包含的用户行为偏好向量的质量,即能够提升利用第一数字服务交互大数据的用户行为偏好向量优化第二数字服务交互大数据的数据细节。
基于此,根据行为偏好描述知识KV4对第二数字服务交互大数据进行知识细节优化,得到第一已优化数字服务大数据,能够提升第一已优化数字服务大数据的数据细节丰富程度和完整性,即能够提升对第二数字服务交互大数据的优化性能,也即可使第二数字服务交互大数据的细节特征尽可能不出现缺失。
在一些可能的实施例中,第满足大数据优化条件的互动日志可包括g组数字服务交互大数据,其中,g为大于1的正整数。而且在g大于2的基础上,大数据优化服务器可对任意一张数字服务交互大数据进行知识细节优化,优化的实现方式均为利用数字签名值与待已优化数字服务大数据的数字签名值的差值不大于设定时序值的数字服务交互大数据,对待已优化数字服务大数据进行知识细节优化。示例性的设计思路可结合步骤101至步骤104所述的利用第一数字服务交互大数据对第二数字服务交互大数据进行知识细节优化(特征强化、特征修复)的思路。
作为一种可能的思路,满足大数据优化条件的互动日志还包括第三数字服务交互大数据,第二数字服务交互大数据数字签名值处于第一数字服务交互大数据的数字签名值与第三数字服务交互大数据的数字签名值之间。例如,第一数字服务交互大数据的数字签名值为time sign1,第二数字服务交互大数据的数字签名值为time sign2,第三数字服务交互大数据的数字签名值为time sign3。那么,time sign1<time sign2<time sign3,或time sign3<time sign2<time sign1。
进一步地,第一数字服务交互大数据、第二数字服务交互大数据、第三数字服务交互大数据为满足大数据优化条件的互动日志中相邻的三组数字服务交互大数据。
在一些可能的实施例中,大数据优化服务器还可以实施如下内容。
步骤201、获得所述第三数字服务交互大数据的行为偏好描述知识KV5。
本发明实施例中,行为偏好描述知识KV5携带第三数字服务交互大数据的用户行为偏好向量,其中,第三数字服务交互大数据的用户行为偏好向量包括以下至少一种信息:第三数字服务交互大数据的用户兴趣事项、第三数字服务交互大数据的需求类型、第三数字服务交互大数据内的服务反馈的文本情绪特征、第三数字服务交互大数据的特征识别评分信息、第三数字服务交互大数据内不同服务反馈的相对关联信息。
在一种获得第三数字服务交互大数据的行为偏好描述知识KV5的思路中,大数据优化服务器接收外部输入的行为偏好描述知识KV5。在另一种获得第三数字服务交互大数据的行为偏好描述知识KV5的思路中,大数据优化服务器接收已认证AI系统发送的行为偏好描述知识KV5。在又一种获得第三数字服务交互大数据的行为偏好描述知识KV5的思路中,大数据优化服务器通过对第三数字服务交互大数据进行细节挖掘操作得到行为偏好描述知识KV5。
步骤202、对所述行为偏好描述知识KV4和所述行为偏好描述知识KV5进行知识汇集,得到行为偏好描述知识KV6。
大数据优化服务器通过将行为偏好描述知识KV4和行为偏好描述知识KV5进行知识汇集得到行为偏好描述知识KV6,可利用行为偏好描述知识KV5所包含的用户行为偏好向量优化行为偏好描述知识KV4所包含的用户行为偏好向量,从而取得优化第二数字服务交互大数据的数据细节。
比如,通过将行为偏好描述知识KV4与行为偏好描述知识KV5拼接,可利用行为偏好描述知识KV5所包含的用户兴趣事项丰富行为偏好描述知识KV4所包含的用户兴趣事项,从而取得优化第二数字服务交互大数据的用户兴趣事项的质量。又比如,通过将行为偏好描述知识KV4与行为偏好描述知识KV5拼接,可利用行为偏好描述知识KV5所包含的需求类型对行为偏好描述知识KV4所包含的需求类型进行修改,从而取得修改第二数字服务交互大数据的需求类型的质量。
在得到行为偏好描述知识KV6的基础上,大数据优化服务器在执行步骤104的过程中实施如下内容:
步骤203、根据所述行为偏好描述知识KV6对所述第二数字服务交互大数据进行知识细节优化,得到所述第一已优化数字服务大数据。
对于一些示例而言,大数据优化服务器通过对行为偏好描述知识KV6进行知识翻译(特征解码),实现对第二数字服务交互大数据的优化,得到第一已优化数字服务大数据。
比如,大数据优化服务器在利用行为偏好描述知识KV1所包含的用户行为偏好向量优化行为偏好描述知识KV2所包含的用户行为偏好向量得到行为偏好描述知识KV4的基础上,通过对行为偏好描述知识KV4和行为偏好描述知识KV5进行知识汇集得到行为偏好描述知识KV6,并根据行为偏好描述知识KV6得到第一已优化数字服务大数据。如此不仅能够基于第一数字服务交互大数据的用户行为偏好向量优化第二数字服务交互大数据,还能够基于第三数字服务交互大数据的用户行为偏好向量优化第二数字服务交互大数据。
鉴于第二数字服务交互大数据的数字签名值位于第一数字服务交互大数据的数字签名值和第三数字服务交互大数据的数字签名值之间,基于此能够提升对第二数字服务交互大数据的优化性能。
另外,基于该实施例,大数据优化服务器先利用行为偏好描述知识KV1所包含的用户行为偏好向量优化行为偏好描述知识KV2所包含的用户行为偏好向量得到行为偏好描述知识KV4,再利用行为偏好描述知识KV5所包含的用户行为偏好向量优化行为偏好描述知识KV4所包含的用户行为偏好向量得到行为偏好描述知识KV6。可以理解为先对第一数字服务交互大数据的用户行为偏好向量和第二数字服务交互大数据的用户行为偏好向量进行知识汇集,再对第三数字服务交互大数据的用户行为偏好向量和第二数字服务交互大数据的用户行为偏好向量进行知识汇集,即可以理解为实现了双重知识汇集。
鉴于第一数字服务交互大数据、第二数字服务交互大数据、第三数字服务交互大数据中的任意两组数字服务交互大数据在会话服务场景层面的分布特征都存在差异,如果直接通过对第一数字服务交互大数据的用户行为偏好向量、第二数字服务交互大数据的用户行为偏好向量、第三数字服务交互大数据的用户行为偏好向量进行知识汇集,需要同时分析三组数字服务交互大数据在会话服务场景层面的分布特征差异,进而导致优化第二数字服务交互大数据的数据细节丰富程度和完整性,优化性能差。
但是通过所述技术思路,在每轮知识汇集时,都只用分析两组数字服务交互大数据在会话服务场景层面的分布特征差异,相比于直接将三组数字服务交互大数据的用户行为偏好向量进行知识汇集,能够提升优化性能。
作为一种可能的思路,行为偏好描述知识KV5的关注维度数为U,其中,U为大于1的整数。
大数据优化服务器在执行步骤202时实施如下内容。
步骤301、从所述行为偏好描述知识KV5中筛选W个关注维度的向量字段,得到行为偏好描述知识KV7。
本发明实施例中,W为小于U的正整数。例如,U为3,行为偏好描述知识KV5的三个关注维度分别关注维度Fa、关注维度Fb和关注维度Fc。在行为偏好描述知识KV5中,属于关注维度Fa的数据为向量1,属于关注维度Fb的数据为向量2,属于关注维度Fc的数据为向量3。若W=1,那么行为偏好描述知识KV7可以为向量1、向量2、向量3中的任意一个。
步骤302、对所述行为偏好描述知识KV4和所述行为偏好描述知识KV7进行知识汇集,得到所述行为偏好描述知识KV6。
鉴于行为偏好描述知识KV7的知识容量比行为偏好描述知识KV5的知识容量小,大数据优化服务器通过执行步骤301和步骤302,可能够实现行为偏好描述知识KV6的轻量化处理。
作为一种可能的思路,大数据优化服务器在执行步骤203时实施如下内容。
步骤401、对所述行为偏好描述知识KV6进行知识再提炼,得到行为偏好描述知识KV8。
大数据优化服务器通过对行为偏好描述知识KV6进行知识再提炼(下采样处理),可提炼行为偏好描述知识KV6的用户行为偏好向量,得到行为偏好描述知识KV8。
步骤402、对所述行为偏好描述知识KV8进行细节挖掘操作,得到行为偏好描述知识KV9。
步骤403、对所述行为偏好描述知识KV9进行知识衍生,得到行为偏好描述知识KV10。
本发明实施例中,大数据优化服务器通过对行为偏好描述知识KV9进行知识衍生,可增大行为偏好描述知识KV9的规模的用户行为偏好向量,得到行为偏好描述知识KV10,其中,行为偏好描述知识KV10的规模与行为偏好描述知识KV6的规模(向量尺寸/向量维度)相同。
步骤404、对所述行为偏好描述知识KV10进行知识翻译,得到所述第一已优化数字服务大数据。
基于该实施例,大数据优化服务器先对行为偏好描述知识KV6进行知识再提炼得到行为偏好描述知识KV8,再对行为偏好描述知识KV8进行细节挖掘操作得到行为偏好描述知识KV9,可增大细节挖掘操作的挖掘范围,进而提高细节挖掘操作的质量。
鉴于此,通过将行为偏好描述知识KV9进行知识衍生得到规模与行为偏好描述知识KV6相同的行为偏好描述知识KV10,并通过对行为偏好描述知识KV10进行知识翻译,得到第一已优化数字服务大数据,可提升第一已优化数字服务大数据的数据细节丰富程度和完整性。
作为一种可能的思路,大数据优化服务器在得到行为偏好描述知识KV10的基础上,还可以实施如下内容。
步骤501、将行为偏好描述知识KV6与行为偏好描述知识KV10拼接,得到行为偏好描述知识KV18。
鉴于行为偏好描述知识KV8通过提炼行为偏好描述知识KV6的用户行为偏好向量得到,行为偏好描述知识KV6相较于行为偏好描述知识KV8,所包含的低阶用户行为偏好向量更丰富,其中,低阶用户行为偏好向量包括以下中的至少一种:用户兴趣事项、需求类型、相对关联信息、文本情绪特征。而行为偏好描述知识KV8相较于行为偏好描述知识KV6,所包含的细节更丰富。
鉴于此,大数据优化服务器在基于行为偏好描述知识KV8,得到规模与行为偏好描述知识KV6相同的行为偏好描述知识KV10的基础上,通过对行为偏好描述知识KV6和行为偏好描述知识KV10进行知识汇集,可丰富行为偏好描述知识KV10中的低阶用户行为偏好向量,得到行为偏好描述知识KV18。
在得到行为偏好描述知识KV18的基础上,大数据优化服务器在执行步骤404时实施如下内容。
步骤502、对所述行为偏好描述知识KV18进行知识翻译,得到所述第一已优化数字服务大数据。
基于该实施例,大数据优化服务器在基于行为偏好描述知识KV8,得到规模与行为偏好描述知识KV6相同的行为偏好描述知识KV10的基础上,通过对行为偏好描述知识KV6和行为偏好描述知识KV10进行知识汇集,可丰富行为偏好描述知识KV10中的低阶用户行为偏好向量,得到行为偏好描述知识KV18。由此通过对行为偏好描述知识KV18进行知识翻译得到第一已优化数字服务大数据,能够提升第一已优化数字服务大数据的数据细节丰富程度和完整性,进而提高第二数字服务交互大数据的优化性能。
作为一种可能的思路,大数据优化服务器在执行步骤103时实施如下内容。
步骤601、对所述行为偏好描述知识KV2和所述不少于一个行为偏好描述知识KV3进行基于第一关注维度策略的知识汇集,得到行为偏好描述知识KV11。
本发明实施例中,基于第一关注维度策略的知识汇集即拼接不同关注维度的向量字段所包含的用户行为偏好向量。对于一些示例而言,大数据优化服务器通过对行为偏好描述知识KV2和不少于一个行为偏好描述知识KV3进行关注维度间的卷积处理,得到行为偏好描述知识KV11。
可选的,大数据优化服务器通过规模为1*1的卷积单元对行为偏好描述知识KV2和不少于一个行为偏好描述知识KV3进行关注维度间的卷积,得到行为偏好描述知识KV11。
步骤602、对所述行为偏好描述知识KV11进行基于第二关注维度策略的知识汇集,得到行为偏好描述知识KV12。
本发明实施例中,基于第二关注维度策略的知识汇集指分别对各个关注维度的向量字段进行知识汇集,即在所述会话服务场景层面进行用户行为偏好向量的拼接。对于一些示例而言,大数据优化服务器通过对行为偏好描述知识KV11进行关注维度内的卷积,得到行为偏好描述知识KV12。
可选的,大数据优化服务器通过规模为r*r的卷积单元对行为偏好描述知识KV11进行关注维度内的卷积,得到行为偏好描述知识KV12。其中,r为大于5的单数。
步骤603、根据所述行为偏好描述知识KV12,得到所述行为偏好描述知识KV4。
对于一些示例而言,大数据优化服务器将行为偏好描述知识KV12作为行为偏好描述知识KV4。
对于另一些示例而言,大数据优化服务器通过对行为偏好描述知识KV12进行基于第一关注维度策略的知识汇集,得到行为偏好描述知识KV4。
基于该实施例,大数据优化服务器通过对行为偏好描述知识KV2和不少于一个行为偏好描述知识KV3进行基于第一关注维度策略的知识汇集得到行为偏好描述知识KV11,再对行为偏好描述知识KV11进行基于第二关注维度策略的知识汇集得到行为偏好描述知识KV12,可以理解为通过两次局部特征的拼接实现全局特征的拼接。如此设计,既可提升行为偏好描述知识KV2和不少于一个行为偏好描述知识KV3的拼接效果,还能够减少知识汇集/拼接过程中的资源开销。
作为一种可能的思路,行为偏好描述知识KV12包括行为偏好描述知识KV13和行为偏好描述知识KV14,行为偏好描述知识KV13属于行为偏好描述知识KV12的第一关注维度,行为偏好描述知识KV14属于行为偏好描述知识KV12的第二关注维度。
大数据优化服务器在执行步骤603时实施如下内容。
步骤701、获得所述第一关注维度的第一偏置因子和所述第二关注维度的第二偏置因子。
本发明实施例中,第一偏置因子(权重)表征第一关注维度(注意力层面/通道维度)的信息的贡献度,第二偏置因子表征第二关注维度的用户行为偏好向量的贡献度。示例性的,第一关注维度的信息的贡献度(重要性)越高第一偏置因子越大,第二关注维度的信息的贡献度越高第二偏置因子越大。
示例性的,在第一关注维度的信息的贡献度比第二关注维度的信息的贡献度高的基础上,第一偏置因子比第二偏置因子大;在第一关注维度的信息的贡献度比第二关注维度的信息的贡献度低的基础上,第一偏置因子比第二偏置因子小;在第一关注维度的信息的贡献度与第二关注维度的信息的贡献度相同的基础上,第一偏置因子等于第二偏置因子。
本发明实施例中,关注维度的信息的贡献度越高,表征利用该关注维度的信息已优化数字服务大数据质量取得的优化性能越好。
在一种获得第一关注维度的第一偏置因子的第二关注维度的第二偏置因子的思路中,大数据优化服务器接收外部输入的第一偏置因子和第二偏置因子。在又一种获得第一关注维度的第一偏置因子的第二关注维度的第二偏置因子的思路中,第一偏置因子和第二偏置因子通过对AI算法进行调试得到。
步骤702、将所述第一偏置因子作为所述行为偏好描述知识KV13的联动偏置因子,所述第二偏置因子作为所述行为偏好描述知识KV14的联动偏置因子,对所述行为偏好描述知识KV13和所述行为偏好描述知识KV14进行全局整理,得到所述行为偏好描述知识KV4。
基于该实施例,鉴于第一偏置因子表征第一关注维度的信息的贡献度,第二偏置因子表征第二关注维度的信息的贡献度,而行为偏好描述知识KV13为第一关注维度的向量字段,行为偏好描述知识KV14为第二关注维度的向量字段,大数据优化服务器根据第一关注维度的第一偏置因子和第二关注维度的第二偏置因子,对行为偏好描述知识KV13和行为偏好描述知识KV14进行全局整理得到行为偏好描述知识KV4,能够提升知识汇集的精度。
作为一种可能的思路,大数据优化服务器在执行步骤102时实施如下内容。
步骤801、获得不少于一个知识调整指示。
本发明实施例中,知识调整指示的数目与行为偏好描述知识KV3的数目相同,知识调整指示与行为偏好描述知识KV3一一对应。在知识调整指示的数目大于1的基础上,任意两个知识调整指示都存在差异。
在一种获得不少于一个知识调整指示的思路中,大数据优化服务器接收外部输入的不少于一个知识调整指示。在另一种获得不少于一个知识调整指示的思路中,大数据优化服务器接收已认证的AI系统上传的不少于一个知识调整指示。
步骤802、根据所述不少于一个知识调整指示将所述行为偏好描述知识KV1在所述会话服务场景层面中进行调整,得到所述不少于一个行为偏好描述知识KV3。
本发明实施例中,行为偏好描述知识KV3与行为偏好描述知识KV1在会话服务场景层面内的分布特征差异为所述知识调整指示。例如,不少于一个调整值包括知识调整指示index_a,不少于一个行为偏好描述知识KV3包括行为偏好描述知识KV3b。那么行为偏好描述知识KV3b与行为偏好描述知识KV1在会话服务场景层面的分布特征差异为知识调整指示index_a。
又比如,不少于一个调整值包括知识调整指示index_a和知识调整指示index_b,不少于一个行为偏好描述知识KV3包括行为偏好描述知识KV3c和行为偏好描述知识KV3d,其中,行为偏好描述知识KV3c根据知识调整指示index_a将行为偏好描述知识KV1在会话服务场景层面中进行调整得到,行为偏好描述知识KV3d根据知识调整指示index_b将行为偏好描述知识KV1在会话服务场景层面中进行调整得到。那么行为偏好描述知识KV3c与行为偏好描述知识KV1在会话服务场景层面的分布特征差异为知识调整指示index_a,行为偏好描述知识KV3c与行为偏好描述知识KV1在会话服务场景层面的分布特征差异为知识调整指示index_b。
基于该实施例,大数据优化服务器根据不少于一个知识调整指示将行为偏好描述知识KV1在会话服务场景层面中进行调整,可得到不少于一个行为偏好描述知识KV3。
作为一种可能的思路,大数据优化服务器还可以实施如下内容。
步骤901、通过所述第一已优化数字服务大数据覆盖所述满足大数据优化条件的互动日志中的所述第二数字服务交互大数据。
大数据优化服务器通过第一已优化数字服务大数据覆盖满足大数据优化条件的互动日志中的第二数字服务交互大数据,得到优化后的互动日志,能够提升满足大数据优化条件的互动日志的互动日志质量。
基于本发明实施例提供的技术方案,本发明实施例还提供了一种大数据优化算法,该大数据优化算法可实现上述的技术方案。
大数据优化算法(可以是根据实际情况选择的神经网络模型)包括知识提炼单元(特征挖掘层)、知识汇集单元(特征融合层)、知翻译单元(特征解码层)。通过知识提炼单元可提炼数字服务交互大数据的用户行为偏好向量,得到数字服务交互大数据的行为偏好描述知识。示例性的,通过知识提炼单元提炼第一数字服务交互大数据的用户行为偏好向量得到行为偏好描述知识KV1,通过知识提炼单元提炼第二数字服务交互大数据的用户行为偏好向量得到行为偏好描述知识KV2。
通过知识汇集单元对行为偏好描述知识KV1和行为偏好描述知识KV2进行处理,得到行为偏好描述知识KV4。可选的,上述的步骤102和步骤103均可通过知识汇集单元实现,即通过知识汇集单元根据行为偏好描述知识KV1得到不少于一个行为偏好描述知识KV3,通过知识汇集单元将行为偏好描述知识KV2与不少于一个行为偏好描述知识KV3进行知识汇集得到行为偏好描述知识KV4。
通过知识汇集单元和知翻译单元可实现步骤104,示例性的,在步骤104的实现过程包括知识翻译的基础上,知识翻译通过知翻译单元实现。例如,大数据优化服务器在实施步骤104时,通过对行为偏好描述知识KV4进行知识翻译,得到第一已优化数字服务大数据,此时,可通过知翻译单元对行为偏好描述知识KV4进行知识翻译。又例如,大数据优化服务器在实施步骤104时,通过对行为偏好描述知识KV6进行知识翻译,得到第一已优化数字服务大数据,此时,可通过知翻译单元对行为偏好描述知识KV6进行知识翻译。
对于一些示例而言,就大数据优化算法的网络结构而言。第x-1组数字服务交互大数据、第x组数字服务交互大数据、第x+1组数字服务交互大数据为满足大数据优化条件的互动日志中连续的三组数字服务交互大数据。知识提炼单元可分别提炼这三组数字服务交互大数据的用户行为偏好向量,得到第x-1组数字服务交互大数据的行为偏好描述知识、第x组数字服务交互大数据的行为偏好描述知识、第x+1组数字服务交互大数据的行为偏好描述知识。
经知识汇集单元对第x-1组数字服务交互大数据的行为偏好描述知识、第x组数字服务交互大数据的行为偏好描述知识、第x+1组数字服务交互大数据的行为偏好描述知识进行处理,得到第x-1组数字服务交互大数据的优化后的行为偏好描述知识、第x组数字服务交互大数据的优化后的行为偏好描述知识、第x+1组数字服务交互大数据的优化后的行为偏好描述知识。
将第x-1组数字服务交互大数据与第x-1组数字服务交互大数据的优化后的行为偏好描述知识进行拼接处理,得到第x-1组数字服务交互大数据的待翻译行为偏好描述知识。将第x组数字服务交互大数据与第x组数字服务交互大数据的优化后的行为偏好描述知识进行拼接处理,得到第x组数字服务交互大数据的待翻译行为偏好描述知识。将第x+1组数字服务交互大数据与第x+1组数字服务交互大数据的优化后的行为偏好描述知识进行拼接处理,得到第x+1组数字服务交互大数据的待翻译行为偏好描述知识。
经知翻译单元对第x-1组数字服务交互大数据的待翻译行为偏好描述知识进行知识翻译得到优化后的第x-1组数字服务交互大数据。经知翻译单元对第x组数字服务交互大数据的待翻译行为偏好描述知识进行知识翻译得到优化后的第x组数字服务交互大数据。经知翻译单元对第x+1组数字服务交互大数据的待翻译行为偏好描述知识进行知识翻译得到优化后的第x+1组数字服务交互大数据。
本发明实施例中,大卷积单元对输入数据依次进行基于第一关注维度策略的知识汇集、基于第二关注维度策略的知识汇集、全局整理。具体实现过程可参见步骤601至步骤603、步骤701至步骤702。
作为一种可能的思路,大数据优化算法的调试步骤包括如下内容。
步骤1001、获得算法调试样例集。
本发明实施例中,算法调试样例集包括数字服务交互大数据样例E1和数字服务交互大数据样例E2,其中,数字服务交互大数据样例E1的数字签名值与数字服务交互大数据样例E2的数字签名值的差值不大于设定时序值。
在一种获得算法调试样例集的思路中,大数据优化服务器接收外部输入的算法调试样例集。在另一种获得算法调试样例集的思路中,大数据优化服务器接收已认证的AI系统上传的算法调试样例集。
其中,样例可以理解为训练样本。
步骤1002、利用所述数字服务交互大数据样例E1优化所述数字服务交互大数据样例E2,得到第二已优化数字服务大数据。
对于一些示例而言,通过知识提炼单元提炼数字服务交互大数据样例E1的用户行为偏好向量,得到行为偏好描述知识KV15。通过知识提炼单元提炼数字服务交互大数据样例E2的用户行为偏好向量,得到行为偏好描述知识KV16。通过知识汇集单元对行为偏好描述知识KV15和行为偏好描述知识KV16进行处理,得到行为偏好描述知识KV17。知翻译单元根据行为偏好描述知识KV17,得到数字服务交互大数据样例E2的第二已优化数字服务大数据。
本发明实施例中,行为偏好描述知识KV17为数字服务交互大数据样例E2的优化后的行为偏好描述知识。即通过知识汇集单元对行为偏好描述知识KV15和行为偏好描述知识KV16进行处理,利用行为偏好描述知识KV15所包含的用户行为偏好向量优化行为偏好描述知识KV16,得到行为偏好描述知识KV17。
步骤1003、根据所述第二已优化数字服务大数据与先验数字服务交互大数据dataT的第一比较结果,得到第一算法代价。
本发明实施例中,先验数字服务交互大数据dataT为数字服务交互大数据样例E2的正确参考依据(真值)。示例性的,先验数字服务交互大数据dataT的数字服务交互大数据内容与数字服务交互大数据样例E2的数字服务交互大数据内容相同,先验数字服务交互大数据dataT的数据细节丰富程度和完整性高于数字服务交互大数据样例E2的数据细节丰富程度和完整性。
本发明实施例中,第一算法代价与第一比较结果具有设定量化关系。
步骤1004、根据所述第一算法代价,改进所述大数据优化算法的算法变量。
对于一些示例而言,大数据优化服务器根据第一算法代价改进大数据优化算法的算法变量,直至全局算法代价趋于稳定,完成对大数据优化算法的优化。
作为一种可能的思路,大数据优化服务器还可以实施如下内容。
步骤1101、对所述行为偏好描述知识KV16进行知识翻译,得到数字服务交互测试数据。
步骤1102、根据所述数字服务交互测试数据的特征识别评分与先验数字服务交互大数据dataT的特征识别评分的第二比较结果,得到第二算法代价。
通过确定数字服务交互测试数据的特征识别评分与先验数字服务交互大数据dataT的特征识别评分的差值异得到第二比较结果,进而可根据第二比较结果得到第二算法代价,其中,第二算法代价与第二比较结果具有设定量化关系(呈正相关)。算法代价可以理解为损失值或者损失函数值。
噪声的存在会使数字服务交互大数据的架构数据产生偏移,而数字服务交互大数据的架构数据的偏移会使数字服务交互大数据匹配的精度降低。因此在数字服务交互大数据中存在噪声的基础上,会导致数字服务交互大数据匹配的精度降低,进而导致通过将数字服务交互大数据信息拼接已优化数字服务大数据质量的优化性能变差。
在通过提炼数字服务交互大数据样例E2的用户行为偏好向量得到行为偏好描述知识KV16时,所提炼出的用户行为偏好向量可能包括噪声的用户行为偏好向量,进而可能导致行为偏好描述知识KV16携带噪声的用户行为偏好向量,由此导致根据行为偏好描述知识KV16得到的数字服务交互大数据样例E2的第二已优化数字服务大数据中存在噪声,从而降低优化性能。
鉴于先验数字服务交互大数据dataT为数字服务交互大数据样例E2正确参考依据,先验数字服务交互大数据dataT相较于数字服务交互大数据样例E2噪声更少。因此,可以先验数字服务交互大数据dataT为依据确定行为偏好描述知识KV16是否携带的噪声的用户行为偏好向量。
考虑到噪声的存在会使数字服务交互大数据的特征识别评分发生变化,因此,在通过对行为偏好描述知识KV16进行知识翻译得到数字服务交互测试数据,并根据数字服务交互测试数据的特征识别评分与先验数字服务交互大数据dataT的特征识别评分的第二比较结果得到第二算法代价的基础上,可根据第二算法代价监督知识提炼单元从数字服务交互大数据样例E2中提炼用户行为偏好向量时,是否提炼噪声的用户行为偏好向量。基于此,根据第二算法代价改进待优化算法的算法变量,可减少知识提炼单元所提炼的噪声的用户行为偏好向量。
在得到第二算法代价的基础上,大数据优化服务器在执行步骤1004时实施如下内容。
步骤1103、根据所述第一算法代价和所述第二算法代价,改进所述大数据优化算法的算法变量。
对于一些示例而言,大数据优化服务器计算第一算法代价和第二算法代价的和得到大数据优化算法的全局算法代价。根据全局算法代价改进大数据优化算法的算法变量,直至全局算法代价趋于稳定,完成对大数据优化算法的优化。
对于另一些示例而言,大数据优化服务器对第一算法代价和第二算法代价进行加权求和得到大数据优化算法的全局算法代价。根据全局算法代价改进大数据优化算法的算法变量,直至全局算法代价趋于稳定,完成对大数据优化算法的优化。
对于又一些示例而言,大数据优化服务器计算第一算法代价和第二算法代价的和得到大数据优化算法的全局算法代价。根据全局算法代价改进大数据优化算法的算法变量,直至全局算法代价和第一算法代价均趋于稳定,完成对大数据优化算法的优化。
本发明实施例中,大数据优化服务器在调试步骤中,通过知识汇集单元对行为偏好描述知识KV15和行为偏好描述知识KV16进行处理得到行为偏好描述知识KV17。通过知翻译单元对行为偏好描述知识KV17进行处理,得到数字服务交互大数据样例E2的第二已优化数字服务大数据。根据第二已优化数字服务大数据与先验数字服务交互大数据dataT的第一比较结果得到第一算法代价。
通过知识提炼单元分别提炼数字服务交互大数据样例E1的用户行为偏好向量和数字服务交互大数据样例E2的用户行为偏好向量,得到行为偏好描述知识KV15和行为偏好描述知识KV16。通过对行为偏好描述知识KV16进行知识翻译得到数字服务交互测试数据。根据数字服务交互测试数据的特征识别评分与先验数字服务交互大数据dataT的特征识别评分的第二比较结果得到第二算法代价,由此根据第二算法代价改进待优化算法的算法变量,可减少知识提炼单元所提炼的噪声的用户行为偏好向量。由此根据第一算法代价和第二算法代价改进待优化算法的算法变量,能够提升待优化算法的优化性能。
可以理解的是,算法调试样例集中的数字服务交互大数据样例E1和数字服务交互大数据样例E2是为简洁的描述待优化算法的调试步骤所确定的描述对象。不应理解为在待优化算法的调试步骤中,仅通过对算法调试样例集中的数字服务交互大数据样例E1和数字服务交互大数据样例E2进行处理得到第一算法代价和第二算法代价,进而根据第一算法代价和第二算法代价改进待优化算法的算法变量。在实际调试步骤中,可对算法调试样例集中的任意两组数字服务交互大数据执行如对数字服务交互大数据样例E1和数字服务交互大数据样例E2所做的处理。
作为一种可能的思路,在大数据优化算法的调试步骤中,知识提炼单元通过J个特征提炼单元分别提炼算法调试样例集中每组数字服务交互大数据的用户行为偏好向量得到各组数字服务交互大数据的行为偏好描述知识。
将各组数字服务交互大数据的行为偏好描述知识输入知识汇集单元,知识汇集单元通过J个特征拼接单元对各组数字服务交互大数据的行为偏好描述知识进行处理,得到各组数字服务交互大数据的优化后的行为偏好描述知识。
通过对各组数字服务交互大数据的行为偏好描述知识分别进行监督得到各组数字服务交互大数据的第二算法代价。示例性的,通过对各组数字服务交互大数据的行为偏好描述知识分别进行知识翻译,得到各组数字服务交互大数据的数字服务交互测试数据。根据各组数字服务交互大数据的数字服务交互测试数据的特征识别评分和各组数字服务交互大数据的正确参考依据的特征识别评分的第二比较结果,得到各组数字服务交互大数据的第二算法代价。通过知翻译单元分别对各组数字服务交互大数据的优化后的行为偏好描述知识进行知识翻译,得到各组数字服务交互大数据的已优化数字服务大数据。根据各组数字服务交互大数据的已优化数字服务大数据和各组数字服务交互大数据的正确参考依据的特征识别评分的第一比较结果,得到各组数字服务交互大数据的第一算法代价。
进一步地,根据各组数字服务交互大数据的第一算法代价和各组数字服务交互大数据的第二算法代价,改进待优化算法的算法变量(算法参数),完成待优化算法的调试。
在一些可独立的设计思路下,在基于所述行为偏好描述知识KV4对所述第二数字服务交互大数据进行知识细节优化,得到第一已优化数字服务大数据之后,该方法还可以包括如下内容:响应于信息推送请求,提取所述第一已优化数字服务大数据中的用户推送偏好向量;利用所述用户推送偏好向量进行信息推送。
在本发明实施例中,可以根据信息推送请求的推送关键词从完成知识细节优化的第一已优化数字服务大数据中针对性地提取用户推送偏好向量,从而尽量减少后续针对用户推送偏好向量进行推送分析决策和处理的干扰。
在一些可独立的设计思路下,利用所述用户推送偏好向量进行信息推送,可以包括如下内容:从所述用户推送偏好向量中提取目标偏好关键词向量簇;对所述目标偏好关键词向量簇中的多个偏好关键词向量分别进行离线推送兴趣挖掘和在线推送兴趣挖掘,得到离线推送兴趣挖掘结果集和在线推送兴趣挖掘结果集;通过第一设定除噪指示,对所述离线推送兴趣挖掘结果集进行第一除噪处理,得到包括有离线推送兴趣的第一偏好关键词向量关系网;通过第二设定除噪指示,对所述在线推送兴趣挖掘结果集进行第二除噪处理,得到包括有在线推送兴趣的第二偏好关键词向量关系网;基于所述第一偏好关键词向量关系网和所述第二偏好关键词向量关系网进行合并处理,得到所述目标偏好关键词向量簇中与目标推送兴趣相匹配的目标偏好关键词向量关系网;所述目标推送兴趣包括离线推送兴趣和在线推送兴趣中的至少一种;基于目标偏好关键词向量关系网确定所述目标偏好关键词向量簇的推送决策策略;利用所述推送决策策略进行大数据推送。
例如,除噪处理可以理解为纠错,比如进行缺失向量的补全,错误向量的修正等。如此设计,可以考虑时效性不同的推送兴趣,从而准确确定出推送决策策略,这样能够实现个性化且智能的大数据推送。
在一些可独立的设计思路下,所述对所述目标偏好关键词向量簇中的多个偏好关键词向量分别进行离线推送兴趣挖掘和在线推送兴趣挖掘,得到离线推送兴趣挖掘结果集和在线推送兴趣挖掘结果集,包括:对所述目标偏好关键词向量簇中的多个偏好关键词向量分别进行离线推送兴趣挖掘,得到各个偏好关键词向量中的离线推送兴趣挖掘信息、以及各离线推送兴趣挖掘信息所对应的基础推送兴趣主题;基于各偏好关键词向量中的离线推送兴趣挖掘信息和相应的基础推送兴趣主题,确定离线推送兴趣挖掘结果集;对所述目标偏好关键词向量簇中的多个偏好关键词向量分别进行在线推送兴趣挖掘,得到在线推送兴趣挖掘结果集。
基于同样的发明构思,图2示出了本发明实施例提供的应用于AI的大数据优化装置的模块框图,应用于AI的大数据优化装置可以包括实施图1所示的相关方法步骤的知识获取模块21,用于获得第一数字服务交互大数据的行为偏好描述知识KV1和第二数字服务交互大数据的行为偏好描述知识KV2;其中,所述第一数字服务交互大数据和所述第二数字服务交互大数据皆属于满足大数据优化条件的互动日志,所述第一数字服务交互大数据的数字签名值与所述第二数字服务交互大数据的数字签名值的差值不大于设定时序值;基于所述行为偏好描述知识KV1,得到不少于一个行为偏好描述知识KV3;其中,所述不少于一个行为偏好描述知识KV3在会话服务场景层面的分布特征皆与所述行为偏好描述知识KV1在所述会话服务场景层面的分布特征存在比较结果;知识汇集模块22,用于将所述行为偏好描述知识KV2与所述不少于一个行为偏好描述知识KV3进行知识汇集,得到行为偏好描述知识KV4;知识优化模块23,用于基于所述行为偏好描述知识KV4对所述第二数字服务交互大数据进行知识细节优化,得到第一已优化数字服务大数据。
以上所述,仅为本发明的具体实施方式。熟悉本技术领域的技术人员根据本发明提供的具体实施方式,可想到变化或替换,都应涵盖在本发明的保护范围之内。

Claims (10)

1.一种应用于AI的大数据优化方法,其特征在于,应用于大数据优化服务器,所述方法包括:
获得第一数字服务交互大数据的行为偏好描述知识KV1和第二数字服务交互大数据的行为偏好描述知识KV2;其中,所述第一数字服务交互大数据和所述第二数字服务交互大数据皆属于满足大数据优化条件的互动日志,所述第一数字服务交互大数据的数字签名值与所述第二数字服务交互大数据的数字签名值的差值不大于设定时序值;
基于所述行为偏好描述知识KV1,得到不少于一个行为偏好描述知识KV3;其中,所述不少于一个行为偏好描述知识KV3在会话服务场景层面的分布特征皆与所述行为偏好描述知识KV1在所述会话服务场景层面的分布特征存在比较结果;
将所述行为偏好描述知识KV2与所述不少于一个行为偏好描述知识KV3进行知识汇集,得到行为偏好描述知识KV4;基于所述行为偏好描述知识KV4对所述第二数字服务交互大数据进行知识细节优化,得到第一已优化数字服务大数据。
2.根据权利要求1所述的方法,其特征在于,所述满足大数据优化条件的互动日志还包括第三数字服务交互大数据,所述第二数字服务交互大数据数字签名值处于所述第一数字服务交互大数据的数字签名值与所述第三数字服务交互大数据的数字签名值之间;
在所述基于所述行为偏好描述知识KV4对所述第二数字服务交互大数据进行知识细节优化,得到第一已优化数字服务大数据之前,所述方法还包括:获得所述第三数字服务交互大数据的行为偏好描述知识KV5;对所述行为偏好描述知识KV4和所述行为偏好描述知识KV5进行知识汇集,得到行为偏好描述知识KV6;
所述基于所述行为偏好描述知识KV4对所述第二数字服务交互大数据进行知识细节优化,得到第一已优化数字服务大数据,包括:基于所述行为偏好描述知识KV6对所述第二数字服务交互大数据进行知识细节优化,得到所述第一已优化数字服务大数据。
3.根据权利要求2所述的方法,其特征在于,所述行为偏好描述知识KV5的关注维度数为U,所述U为大于1的正数;所述对所述行为偏好描述知识KV4和所述行为偏好描述知识KV5进行知识汇集,得到行为偏好描述知识KV6,包括:
从所述行为偏好描述知识KV5中筛选W个关注维度的向量字段,得到行为偏好描述知识KV7,所述W小于所述U;
对所述行为偏好描述知识KV4和所述行为偏好描述知识KV7进行知识汇集,得到所述行为偏好描述知识KV6。
4.根据权利要求3所述的方法,其特征在于,所述基于所述行为偏好描述知识KV6对所述第二数字服务交互大数据进行知识细节优化,得到所述第一已优化数字服务大数据,包括:
对所述行为偏好描述知识KV6进行知识再提炼,得到行为偏好描述知识KV8;
对所述行为偏好描述知识KV8进行细节挖掘操作,得到行为偏好描述知识KV9;
对所述行为偏好描述知识KV9进行知识衍生,得到行为偏好描述知识KV10;所述行为偏好描述知识KV10的规模与所述行为偏好描述知识KV6的规模相同;
对所述行为偏好描述知识KV10进行知识翻译,得到所述第一已优化数字服务大数据。
5.根据权利要求4所述的方法,其特征在于,所述将所述行为偏好描述知识KV2与所述不少于一个行为偏好描述知识KV3进行知识汇集,得到行为偏好描述知识KV4,包括:对所述行为偏好描述知识KV2和所述不少于一个行为偏好描述知识KV3进行基于第一关注维度策略的知识汇集,得到行为偏好描述知识KV11;对所述行为偏好描述知识KV11进行基于第二关注维度策略的知识汇集,得到行为偏好描述知识KV12;基于所述行为偏好描述知识KV12,得到所述行为偏好描述知识KV4;
其中,所述行为偏好描述知识KV12包括行为偏好描述知识KV13和行为偏好描述知识KV14,所述行为偏好描述知识KV13属于所述行为偏好描述知识KV12的第一关注维度,所述行为偏好描述知识KV14属于所述行为偏好描述知识KV12的第二关注维度;所述基于所述行为偏好描述知识KV12,得到所述行为偏好描述知识KV4,包括:获得所述第一关注维度的第一偏置因子和所述第二关注维度的第二偏置因子;将所述第一偏置因子作为所述行为偏好描述知识KV13的联动偏置因子,所述第二偏置因子作为所述行为偏好描述知识KV14的联动偏置因子,对所述行为偏好描述知识KV13和所述行为偏好描述知识KV14进行全局整理,得到所述行为偏好描述知识KV4。
6.根据权利要求1所述的方法,其特征在于,所述基于所述行为偏好描述知识KV1,得到不少于一个行为偏好描述知识KV3,包括:获得不少于一个知识调整指示;基于所述不少于一个知识调整指示将所述行为偏好描述知识KV1在所述会话服务场景层面下进行调整,得到所述不少于一个行为偏好描述知识KV3。
7.根据权利要求1所述的方法,其特征在于,在得到所述第一已优化数字服务大数据后,所述方法还包括:通过所述第一已优化数字服务大数据覆盖所述满足大数据优化条件的互动日志中的所述第二数字服务交互大数据。
8.根据权利要求1所述的方法,其特征在于,所述应用于AI的大数据优化方法通过大数据优化算法实现,所述大数据优化算法包括知识提炼单元、知识汇集单元、知翻译单元;
所述基于所述行为偏好描述知识KV1,得到不少于一个行为偏好描述知识KV3,包括:通过所述知识汇集单元基于所述行为偏好描述知识KV1,得到不少于一个行为偏好描述知识KV3;
所述将所述行为偏好描述知识KV2与所述不少于一个行为偏好描述知识KV3进行知识汇集,得到行为偏好描述知识KV4,包括:通过所述知识汇集单元将所述行为偏好描述知识KV2与所述不少于一个行为偏好描述知识KV3进行知识汇集,得到行为偏好描述知识KV4;
所述基于所述行为偏好描述知识KV4对所述第二数字服务交互大数据进行知识细节优化,得到第一已优化数字服务大数据,包括:通过所述知识汇集单元和所述知翻译单元基于所述行为偏好描述知识KV4,得到所述第二数字服务交互大数据的第一已优化数字服务大数据;
所述获得第一数字服务交互大数据的行为偏好描述知识KV1和第二数字服务交互大数据的行为偏好描述知识KV2,包括:通过所述知识提炼单元提炼所述第一数字服务交互大数据的用户行为偏好向量,得到所述行为偏好描述知识KV1;通过所述知识提炼单元提炼所述第二数字服务交互大数据的用户行为偏好向量,得到所述行为偏好描述知识KV2。
9.根据权利要求8所述的方法,其特征在于,所述应用于AI的大数据优化方法还包括所述大数据优化算法的调试步骤:获得算法调试样例集,所述算法调试样例集包括数字服务交互大数据样例E1和数字服务交互大数据样例E2,所述数字服务交互大数据样例E1的数字签名值与所述数字服务交互大数据样例E2的数字签名值的差值不大于所述设定时序值;利用所述数字服务交互大数据样例E1优化所述数字服务交互大数据样例E2,得到第二已优化数字服务大数据;基于所述第二已优化数字服务大数据与先验数字服务交互大数据dataT的第一比较结果,得到第一算法代价;所述先验数字服务交互大数据dataT为所述数字服务交互大数据样例E2的正确参考依据;所述第一算法代价与所述第一比较结果具有设定量化关系;基于所述第一算法代价,改进所述大数据优化算法的算法变量;
其中,所述利用所述数字服务交互大数据样例E1优化所述数字服务交互大数据样例E2,得到第二已优化数字服务大数据,包括:通过所述知识提炼单元提炼所述数字服务交互大数据样例E1的用户行为偏好向量,得到行为偏好描述知识KV15;通过所述知识提炼单元提炼所述数字服务交互大数据样例E2的用户行为偏好向量,得到行为偏好描述知识KV16;通过所述知识汇集单元对所述行为偏好描述知识KV15和所述行为偏好描述知识KV16进行处理,得到行为偏好描述知识KV17,所述行为偏好描述知识KV17为所述数字服务交互大数据样例E2的优化后的行为偏好描述知识;通过所述知翻译单元基于所述行为偏好描述知识KV17,得到所述第二已优化数字服务大数据;
其中,在所述基于所述第一算法代价,改进所述大数据优化算法的算法变量之前,所述调试步骤还包括:对所述行为偏好描述知识KV16进行知识翻译,得到数字服务交互测试数据;基于所述数字服务交互测试数据的特征识别评分与先验数字服务交互大数据dataT的特征识别评分的第二比较结果,得到第二算法代价;所述第二算法代价与所述第二比较结果具有设定量化关系;所述基于所述第一算法代价,改进所述大数据优化算法的算法变量,包括:基于所述第一算法代价和所述第二算法代价,改进所述大数据优化算法的算法变量。
10.一种大数据优化服务器,其特征在于,包括:存储器和处理器;所述存储器和所述处理器耦合;所述存储器用于存储计算机程序代码,所述计算机程序代码包括计算机指令;其中,当所述处理器执行所述计算机指令时,使得所述大数据优化服务器执行如权利要求1-9中任意一项所述的方法。
CN202211659880.4A 2022-12-23 2022-12-23 一种应用于ai的大数据优化方法及服务器 Active CN115982236B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211659880.4A CN115982236B (zh) 2022-12-23 2022-12-23 一种应用于ai的大数据优化方法及服务器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211659880.4A CN115982236B (zh) 2022-12-23 2022-12-23 一种应用于ai的大数据优化方法及服务器

Publications (2)

Publication Number Publication Date
CN115982236A true CN115982236A (zh) 2023-04-18
CN115982236B CN115982236B (zh) 2023-08-22

Family

ID=85962110

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211659880.4A Active CN115982236B (zh) 2022-12-23 2022-12-23 一种应用于ai的大数据优化方法及服务器

Country Status (1)

Country Link
CN (1) CN115982236B (zh)

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040210661A1 (en) * 2003-01-14 2004-10-21 Thompson Mark Gregory Systems and methods of profiling, matching and optimizing performance of large networks of individuals
US20200402133A1 (en) * 2019-06-21 2020-12-24 NBTV Channels, LLC Systems and methods for user personalization and recommendations
CN114048387A (zh) * 2021-11-23 2022-02-15 赵运柱 基于大数据和ai预测的内容推荐方法及人工智能云系统
CN114611006A (zh) * 2022-03-29 2022-06-10 李保林 基于用户兴趣挖掘的大数据分析方法及系统
CN114691953A (zh) * 2022-03-31 2022-07-01 刘国成 结合大数据的沉浸式交互偏好挖掘方法及系统
CN114840486A (zh) * 2022-06-28 2022-08-02 广州趣米网络科技有限公司 用户行为数据采集方法、系统及云平台
CN114969504A (zh) * 2022-03-31 2022-08-30 任国明 结合用户兴趣分析的大数据处理方法及系统
CN115114531A (zh) * 2021-12-07 2022-09-27 张春艳 基于电商行为大数据的信息推送方法及人工智能预测系统
CN115145981A (zh) * 2022-07-25 2022-10-04 朱海斌 基于数字云服务的用户活动兴趣分析方法及系统
CN115222051A (zh) * 2022-07-27 2022-10-21 张志强 基于数字互联网的大数据挖掘方法及系统
CN115249082A (zh) * 2021-04-28 2022-10-28 腾讯科技(深圳)有限公司 用户兴趣预测方法、装置、存储介质和电子设备
CN115282606A (zh) * 2022-07-26 2022-11-04 赵文权 基于智能可视化的云游戏大数据挖掘方法及系统

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040210661A1 (en) * 2003-01-14 2004-10-21 Thompson Mark Gregory Systems and methods of profiling, matching and optimizing performance of large networks of individuals
US20200402133A1 (en) * 2019-06-21 2020-12-24 NBTV Channels, LLC Systems and methods for user personalization and recommendations
CN115249082A (zh) * 2021-04-28 2022-10-28 腾讯科技(深圳)有限公司 用户兴趣预测方法、装置、存储介质和电子设备
CN114048387A (zh) * 2021-11-23 2022-02-15 赵运柱 基于大数据和ai预测的内容推荐方法及人工智能云系统
CN115114531A (zh) * 2021-12-07 2022-09-27 张春艳 基于电商行为大数据的信息推送方法及人工智能预测系统
CN114611006A (zh) * 2022-03-29 2022-06-10 李保林 基于用户兴趣挖掘的大数据分析方法及系统
CN114691953A (zh) * 2022-03-31 2022-07-01 刘国成 结合大数据的沉浸式交互偏好挖掘方法及系统
CN114969504A (zh) * 2022-03-31 2022-08-30 任国明 结合用户兴趣分析的大数据处理方法及系统
CN114840486A (zh) * 2022-06-28 2022-08-02 广州趣米网络科技有限公司 用户行为数据采集方法、系统及云平台
CN115145981A (zh) * 2022-07-25 2022-10-04 朱海斌 基于数字云服务的用户活动兴趣分析方法及系统
CN115282606A (zh) * 2022-07-26 2022-11-04 赵文权 基于智能可视化的云游戏大数据挖掘方法及系统
CN115222051A (zh) * 2022-07-27 2022-10-21 张志强 基于数字互联网的大数据挖掘方法及系统

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
刘平峰;章佩璐;聂规划;: "客户服务价值感知偏好的智能获取研究", 武汉理工大学学报, no. 13 *
曹蒙;袁小群;曾元祥;: "数字出版用户偏好模型的构建", 科技与出版, no. 03 *
胡慕海;陈艳霞;谢静;陈勇跃;: "社群涌现语义适用性视角的情境敏感型群偏好预测研究", 情报理论与实践, no. 05 *

Also Published As

Publication number Publication date
CN115982236B (zh) 2023-08-22

Similar Documents

Publication Publication Date Title
CN110557659B (zh) 视频推荐方法、装置、服务器及存储介质
CN113486833B (zh) 多模态特征提取模型训练方法、装置、电子设备
CN116561542B (zh) 模型的优化训练系统、方法以及相关装置
CN113949577A (zh) 一种应用于云服务的数据攻击分析方法及服务器
CN113806482A (zh) 视频文本跨模态检索方法、装置、存储介质和设备
CN108319672A (zh) 基于云计算的移动终端不良信息过滤方法及系统
CN112100504A (zh) 内容推荐方法、装置、电子设备及存储介质
CN114663190A (zh) 关于定向大数据推送的信息处理方法及系统
CN113761282B (zh) 视频查重方法、装置、电子设备以及存储介质
CN111858875A (zh) 智能交互方法、装置、设备及存储介质
CN115982236B (zh) 一种应用于ai的大数据优化方法及服务器
CN113407772A (zh) 视频推荐模型的生成方法、视频推荐方法、装置
CN114625961A (zh) 应用于大数据的智能化在线服务推送方法及大数据服务器
CN115393100A (zh) 资源推荐方法及装置
CN109388786B (zh) 一种文档相似度计算方法、装置、设备及介质
CN115240106B (zh) 任务自适应的小样本行为识别方法及系统
CN116975455B (zh) 用户兴趣识别方法及装置
CN113205091B (zh) 题目识别方法、装置、设备及介质
Huang et al. Video Recommendation Method Based on Deep Learning of Group Evaluation Behavior Sequences
CN117540062B (zh) 基于知识图谱的检索模型推荐方法及装置
CN116319050B (zh) 基于智慧互联网的网络攻击ai检测分析方法及服务器
CN112417895A (zh) 弹幕数据处理方法、装置、设备以及存储介质
CN115712614A (zh) 基于数据传输流控制的信息处理方法及系统
CN116204703A (zh) 一种基于综合传播影响力增长指数的新闻推荐方法
CN115222967A (zh) 相似度模型训练方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20230706

Address after: Room 11-601, Bailuzhou, Jingye, Nanbao Town, Lingao County, Hainan 571832

Applicant after: Hainan Yilei Investment Co.,Ltd.

Address before: No. 107 Yunhuan Road, Baiyun District, Guiyang City, Guizhou Province, 550000

Applicant before: Deng Xiaodong

GR01 Patent grant
GR01 Patent grant