CN117093769A - 一种数据处理方法、装置、计算机设备以及可读存储介质 - Google Patents

一种数据处理方法、装置、计算机设备以及可读存储介质 Download PDF

Info

Publication number
CN117093769A
CN117093769A CN202310912482.7A CN202310912482A CN117093769A CN 117093769 A CN117093769 A CN 117093769A CN 202310912482 A CN202310912482 A CN 202310912482A CN 117093769 A CN117093769 A CN 117093769A
Authority
CN
China
Prior art keywords
media
network
identification
task
recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310912482.7A
Other languages
English (en)
Inventor
周权
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN202310912482.7A priority Critical patent/CN117093769A/zh
Publication of CN117093769A publication Critical patent/CN117093769A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9536Search customisation based on social or collaborative filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/2866Architectures; Arrangements
    • H04L67/30Profiles
    • H04L67/306User profiles
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/55Push-based network services

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Business, Economics & Management (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请实施例提供了一种数据处理方法、装置、计算机设备以及可读存储介质,方法包括:获取样本拼接媒体特征,以及样本对象针对样本多媒体数据的N维标注交互标签;调用初始识别模型中的共享网络,从样本拼接媒体特征中提取与N个媒体识别任务相关联的共享媒体特征;调用初始识别模型中的专属网络i,从样本拼接媒体特征中提取专属媒体特征i;调用初始识别模型中的识别网络i,根据共享媒体特征以及专属媒体特征i,识别第i维预测交互标签;根据N维标注交互标签和N维预测交互标签对初始识别模型进行训练,得到多任务识别模型。采用本申请可以提高训练后的初始识别模型的媒体识别准确度,进而提高多媒体数据的推送准确性。

Description

一种数据处理方法、装置、计算机设备以及可读存储介质
技术领域
本申请涉及金融技术领域,尤其涉及一种数据处理方法、装置、计算机设备以及可读存储介质。
背景技术
随着互联网技术的发展和网络数据规模的日益增大,对象(如用户)的需求也越来越多样化和个性化,推送系统已成为大众在面对海量互联网信息筛选出对象感兴趣的多媒体数据(如广告数据、新闻数据以及游戏数据等)时的常用解决方案,通过多媒体数据推送的方式对呈现给对象的内容进行合理地把控,从而能够更好地实现多媒体数据的价值。
目前,在推送系统中,主要通过训练后的媒体识别模型向对象推送多媒体数据,实践中发现,由于训练数据具有稀疏性等因素,造成训练后的媒体识别模型的媒体识别准确度比较低,进而,导致多媒体数据的推送准确度比较低。
发明内容
本申请实施例提供一种数据处理方法、装置、计算机设备以及可读存储介质,提高训练后的初始识别模型的媒体识别准确度,进而提高多媒体数据的推送准确性。
本申请实施例一方面提供了一种数据处理方法,包括:
获取样本拼接媒体特征,以及样本对象针对样本多媒体数据的N维标注交互标签;样本拼接媒体特征是对样本多媒体数据的媒体属性特征,和样本对象的历史媒体交互特征进行拼接得到的;N维标注交互标签与N个媒体识别任务对应;N为大于1的整数;
调用初始识别模型中的共享网络,从样本拼接媒体特征中提取与N个媒体识别任务相关联的共享媒体特征;
调用初始识别模型中的专属网络i,从样本拼接媒体特征中提取与媒体识别任务i相关联的专属媒体特征i;专属网络i为初始识别模型的N个专属网络中,与媒体识别任务i相关联的专属网络,i为小于或等于N的正整数;
调用初始识别模型中关于媒体识别任务i的识别网络i,根据共享媒体特征以及专属媒体特征i,识别样本对象针对样本多媒体数据的第i维预测交互标签;
根据N维标注交互标签和N维预测交互标签对初始识别模型进行训练,直到训练后的初始识别模型满足停止训练条件,得到多任务识别模型。
本申请实施例一方面提供了一种数据处理装置,包括:
第一获取模块,用于获取样本拼接媒体特征,以及样本对象针对样本多媒体数据的N维标注交互标签;样本拼接媒体特征是对样本多媒体数据的媒体属性特征,和样本对象的历史媒体交互特征进行拼接得到的;N维标注交互标签与N个媒体识别任务对应;N为大于1的整数;
第一提取模块,用于调用初始识别模型中的共享网络,从样本拼接媒体特征中提取与N个媒体识别任务相关联的共享媒体特征;
第二提取模块,用于调用初始识别模型中的专属网络i,从样本拼接媒体特征中提取与媒体识别任务i相关联的专属媒体特征i;专属网络i为初始识别模型的N个专属网络中,与媒体识别任务i相关联的专属网络,i为小于或等于N的正整数;
第一识别模块,用于调用初始识别模型中关于媒体识别任务i的识别网络i,根据共享媒体特征以及专属媒体特征i,识别样本对象针对样本多媒体数据的第i维预测交互标签;
训练模块,用于根据N维标注交互标签和N维预测交互标签对初始识别模型进行训练,直到训练后的初始识别模型满足停止训练条件,得到多任务识别模型。
本申请实施例一方面提供了一种计算机设备,包括:处理器和存储器;
处理器与存储器相连,其中,存储器用于存储计算机程序,计算机程序被处理器执行时,使得该计算机设备执行本申请实施例提供的方法。
本申请实施例一方面提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,该计算机程序适于由处理器加载并执行,以使得具有该处理器的计算机设备执行本申请实施例提供的方法。
本申请实施例一方面提供了一种计算机程序产品,该计算机程序产品包括计算机程序,该计算机程序存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机程序,处理器执行该计算机程序,使得该计算机设备执行本申请实施例提供的方法。
在本申请实施例中,通过基于样本拼接媒体特征构建一个多任务识别模型,即该多任务识别模型能够用于识别对象针对多媒体数据的多维交互标签,一维交互标签对应一个媒体识别任务,也即该多任务识别模型能够用于处理多个媒体识别任务,不需要为每个媒体识别任务单独构建媒体识别模型,降低多任务识别模型训练时所需要的资源开销,提高多任务识别模型的训练效率。同时,在多任务识别模型的训练过程中,首先,构建包括共享网络、多个专属网络以及多个识别网络的初始识别模型,一个专属网络、一个识别网络均与一个媒体识别任务相对应。在识别媒体识别任务i下的第i维预测交互标签时,通过初始识别模型中的识别网络i结合共享媒体特征和媒体识别任务i关联的专属媒体特征i,识别样本对象针对多媒体数据的第i维预测交互标签,根据N维标注交互标签和N维预测交互标签对初始识别模型进行训练,得到多任务识别模型。此处的共享媒体特征是由初始识别模型的共享网络从样本拼接媒体特征中所提取到的,专属媒体特征i是由初始识别模型中与媒体识别任务i关联的专属网络从样本拼接媒体特征中提取得到的。换言之,在识别媒体识别任务i下的第i维预测交互标签时,不仅结合了与媒体识别任务i直接关联的专属媒体特征i,还结合了与媒体识别任务i间接关联的共享媒体特征,为识别媒体识别任务i下的第i维预测交互标签提供更多信息量。即不同媒体识别任务之间能够共用共享媒体特征,即为针对不同媒体识别任务的训练过程提供更多训练数据,这样能够避免由于训练数据具有稀疏性,造成训练后的初始识别模型(即任务识别模型)的媒体识别准确度比较低问题,提高训练后的初始识别模型的媒体识别准确度,进而提高多媒体数据的推送准确性。
附图说明
为了更清楚地说明本申请实施例或相关技术中的技术方案,下面将对实施例或相关技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的一种数据处理系统的结构示意图;
图2是本申请实施例提供的一种数据处理的应用场景示意图;
图3是本申请实施例提供的一种数据处理方法的流程示意图;
图4是本申请实施例提供的一种初始识别模型的模型结构的示意图;
图5是本申请实施例提供的一种门控子网络的网络结构的示意图;
图6是本申请实施例提供的一种初始识别模型的模型结构的示意图;
图7是本申请实施例提供的一种数据处理方法的流程示意图;
图8是本申请实施例提供的一种数据处理装置的结构示意图;
图9是本申请实施例提供的一种计算机设备的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请涉及人工智能技术领域,本申请具体可以通过样本拼接媒体特征对初始识别模型进行模型训练,得到用于多任务识别的多任务识别模型,如该多任务识别模型可以用于同时识别多个媒体识别任务下的多维识别交互标签(如关注率标签、购买率标签、分享率标签等),提高训练后的初始识别模型的媒体识别准确度,进而提高多媒体数据的推送准确性。
其中,人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习、自动驾驶、智慧交通等几大方向。
具体的,本申请具体涉及人工智能技术下属的机器学习。机器学习(MachineLearning,ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、式教学习等技术。
请参见图1,图1是本申请实施例提供的一种数据处理系统的结构示意图。如图1所示,该数据处理系统可以包括服务器10和终端设备集群。该终端设备集群可以包括一个或者多个终端设备,这里将不对终端设备的数量进行限制。如图1所示,具体可以包括终端设备100a、终端设备100b、终端设备100c、…、终端设备100n。如图1所示,终端设备100a、终端设备100b、终端设备100c、…、终端设备100n可以分别与上述服务器10进行网络连接,以便于每个终端设备可以通过该网络连接与服务器10进行数据交互。当然,终端设备100a、终端设备100b、终端设备100c、…、终端设备100n之间可以通过网络直连的方式进行通信,即各个终端设备之间可实现点对点的通信;也就是说,每两个终端设备之间需要进行数据交互时,一个终端设备(即发送终端设备)可将数据直接发送至另一个终端设备(即接收终端)。
其中,终端设备集群中的每个终端设备均可以包括:智能手机、平板电脑、笔记本电脑、台式计算机、智能语音交互设备、智能家电(例如,智能电视)、可穿戴设备、车载终端等具有数据处理功能的智能终端。应当理解,如图1所示的终端设备集群中的每个终端设备均可以安装有具备数据处理功能的应用,当应用运行于各终端设备中时,可以分别与上述图1所示的服务器10之间进行数据交互,如应用具体可以包括媒体识别应用、多媒体数据推送用等。其中,本申请实施例中的应用可以集成在某应用中,应用还可以为独立的应用(例如,新闻应用),本申请实施例不对应用的类型进行限定。为便于理解,本申请实施例可以在图1所示的多个终端设备中选择一个终端设备作为目标终端设备。例如,本申请实施例可以将图1所示的终端设备100a作为目标终端设备,目标终端设备中可以安装有具备数据处理功能的应用,此时,目标终端设备可以通过应用与服务器10之间实现数据交互。
其中,如图1所示,该服务器10可以为终端设备中的应用提供后台服务的设备。该服务器10是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN(Content Delivery Network,内容分发网络)、以及大数据和人工智能平台等基础云计算服务的云服务器。
应当理解,基于图1中的一种数据处理系统可以适用于多媒体数据推送场景,可以理解的是,本申请可以基于样本拼接媒体特征对初始识别模型进行模型训练,对初始识别模型训练完成后得到多任务识别模型,该多任务识别模型可以用于识别业务对象(如用户)针对待推送多媒体数据(如广告数据)在多个媒体识别任务下的多维识别交互标签,一个媒体识别任务对应一个识别交互标签。其中,媒体识别任务可以包括点击率识别任务、浅层转化率识别任务以及深层转化率识别任务等。多个媒体识别任务下的多维交互标签可以包括点击率识别任务下的点击率标签、浅层转化率识别任务下的浅层转化率标签、深层转化率识别任务下的深层转化率标签等。其中,浅层转化率是指表示对象点击多媒体数据后进行浅层操作的概率,如浅层转化率可以包括关注率、点赞率等。深层转化率是指表示对象点击多媒体数据后进行深层操作的概率,如深层转化率可以包括购买率、分享率等。这样,在一个模型中便可以识别出多维识别交互标签,同时多个媒体识别任务对应的数据可以共享,可以提高多任务识别的准确性和效率。进一步,可以基于多任务识别模型输出的多维识别交互标签向业务对象推送待推送多媒体数据,如可以根据点击率标签、购买率标签确定待推送多媒体数据的推送分值,将推送分值大于分值阈值的待推送多媒体数据推送业务对象,可以提高多媒体数据推送的效率和准确性。
其中,本申请实施例中的多媒体数据可以是指广告数据(如广告视频数据、广告音频数据、广告文本数据等),也可以是指新闻数据、游戏数据等。本申请实施例中的样本对象可以是指在历史时间段内被推送过多媒体数据的用户,样本多媒体数据可以是指当前需要进行N维交互标签识别的多媒体数据,如识别样本对象针对样本多媒体数据的点击率标签、转化率标签等,N为大于1的整数。其中,N维标注交互标签与N个媒体识别任务,一维标注交互标签对应一个媒体识别任务,N个媒体识别任务可以包括点击率识别任务、深层转化率识别任务、浅层转化率识别任务等。其中,N维交互标签(如标注交互标签、预测交互标签以及识别交互标签)可以包括点击率标签、浅层转化率标签、深层转化率标签等。样本多媒体数据的媒体属性特征可以包括标识类特征(如Sparse特征)和统计类特征(如Dense特征)。例如,样本多媒体数据为广告数据时,样本多媒体数据的媒体属性特征可以包括广告数据中的广告对象(如物品或者虚拟角色)的价格、用途、主题、外观等属性特征。如样本多媒体数据为新闻数据或者游戏数据时,样本多媒体数据的媒体属性特征可以包括内容主题、内容观看时长等属性特征。其中,以样本多媒体数据为广告数据为例,标识类特征可以包括对象标识、样本多媒体数据中的样本对象(如游戏道具、游戏角色等)的标识以及已推送多媒体数据的已推送对象(如游戏道具、游戏角色等)的标识等,统计类特征可以包括样本对象的价格、以及已推送对象的价格等。
同样的,样本对象的历史媒体交互特征也可以包括标识类特征和统计类特征。其中,样本对象的历史媒体交互特征可以包括样本对象针对已推送多媒体数据的历史交互特征,以及样本对象的对象属性特征,以及已推送多媒体数据的媒体属性特征。其中,已推送多媒体数据可以是指在历史时间段内向样本对象推送过的一个或者多个多媒体数据,样本对象针对已推送多媒体数据的历史交互特征可以包括样本对象针对已推送多媒体数据的交互行为,以及不同交互行为对应的次数,如样本对象是否点击了已推送多媒体数据以及点击行为的次数,样本对象点击了已推送多媒体数据后是否实施了购买行为以及购买行为的次数,样本对象点击了已推送多媒体数据后是否实施了评论行为以及评论行为的次数等。
其中,样本对象的对象属性特征可以包括样本对象的对象标识、对象年龄等,已推送多媒体数据的媒体属性特征可以包括已推送多媒体数据的媒体内容特征,如已推送多媒体数据为广告数据,已推送多媒体数据的媒体属性特征可以包括广告数据中的广告对象(如物品或者虚拟角色)的标识、价格、用途、主题、外观等属性特征。如已推送多媒体数据为新闻数据或者游戏数据时,已推送多媒体数据的媒体属性特征可以包括内容主题、内容观看时长等属性特征。其中,样本对象针对样本多媒体数据的N维标注交互标签可以是指分别在N个媒体识别任务下人工标注的交互标签,如人工标注在点击率识别任务下样本对象针对样本多媒体数据的标注点击率标签为100%,人工标注在购买率识别任务下样本对象针对样本多媒体数据的购买率标签为50%等。
具体的,本申请中的初始识别模型包括共享网络、专属网络以及识别网络等,其中,共享网络用于从样本拼接媒体特征中提取出与N个媒体识别任务相关联的共享媒体特征。可以理解的是,共享媒体特征可以用于N个媒体识别任务进行标签识别,共享媒体特征可以包括N个媒体识别任务进行标签识别所需要的媒体特征,以及媒体特征之间的关联特征等。换句话说,不同媒体识别任务之间可以相互共用特征,这样,可以提取到更多的特征,进而可以提高多任务识别的准确性。例如,以多媒体数据为广告数据为例,N个媒体识别任务包括点击率识别任务和购买率识别任务时,共享媒体特征可以为对象属性特征、样本多媒体数据的媒体属性特征、点击率识别任务所需要的点击特征、购买率识别任务所需要的购买特征,以及点击特征与购买特征之间的关联特征等特征的融合。其中,点击特征可以包括样本对象所点击过的已推送多媒体数据的媒体属性特征以及点击次数等,购买特征可以包括样本对象所点击过的已推送多媒体数据的媒体属性特征以及点击次数等。例如,当样本对象针对已推送多媒体数据实施了点击行为、购买行为以及分享行为等,则可以反映出样本对象针对已推送多媒体数据的兴趣度较高。
由此,可以给予兴趣度较高的已推送多媒体数据的媒体属性特征的特征权重,以便准确识别样本对象针对样本多媒体数据的点击率标签、购买率标签等。换句话说,通过共享媒体特征,不同媒体识别任务之间可以利用其它媒体识别任务的特征,进而增加特征的多样性。同时,以购买率识别任务时,不仅可以从共享媒体特征中获取到购买特征,也可以从共享媒体特征中获取到点击特征等。例如,当购买特征较少时,可以从点击特征中获取样本对象点击次数较多的已推送多媒体数据,点击次数较多说明样本对象的兴趣度较高,具有购买的可能性,可以点击次数较多的已推送多媒体数据进行购买率标签预测。这样,可以部分媒体识别任务的训练数据较少的问题。
可以理解的是,不同媒体识别任务之间可以共享上述共享网络中的网络参数,通过共享网络中的网络参数进行特征提取。同时,可以共享N个媒体识别任务分别对应的训练数据,提供出N个媒体识别任务分别对应的训练数据中的关联性。这样,可以避免一个媒体识别任务建立一个模型,同时也可以避免当媒体识别任务对应的训练数据不充足的情况下导致模型性能较差的问题,可以提高多任务识别的效率和准确率(即提高多维交互标签识别的效率和准确率)。
其中,初始识别模型中包括分别与N个媒体识别任务相关联的专属网络,一个媒体识别任务对应一个专属网络,通过每个媒体识别任务对应的专属网络,可以提取出与对应媒体识别任务相关联的专属媒体特征。例如,点击率识别任务对应的专属网络用于提取出反映样本对象是否点击样本多媒体数据的特征,购买率识别任务对应的专属网络用于提取出反映样本对象是否购买样本多媒体数据的特征等。由于共享网络中的网络参数是N个媒体识别任务共享的,共享网络中的网络参数会受到N个媒体识别任务的识别损失的影响,即训练完成后的共享网络可以提取出N个媒体识别任务所需要的特征,难免会出现训练完成后的共享网络在提取部分媒体识别任务的特征时达到了最优,在提取部分媒体识别任务的特征时没有达到最优共享网络。进而导致训练完成后的共享网络针对部分媒体识别任务提取到的特征较多,针对部分媒体识别任务提取到的特征较少,即出现跷跷板效应。
因此,本申请通过配置每个识别任务对应的专属网络,可以提取出与对应媒体识别任务直接关联的专属媒体特征,且该专属媒体特征只用于对应媒体识别任务,因此专属网络中的网络参数只受对应媒体识别任务的识别损失的影响,不会受其他媒体识别任务的识别损失的影响,进而可以有效解决跷跷板效应。例如,在点击率识别任务中,点击率识别任务对应的专属媒体特征可以只包括与点击率识别任务相关联的特征,如样本对象点击过的已推送多媒体数据的媒体属性特征、点击次数、样本对象的对象属性特征以及样本多媒体数据的媒体属性特征等。这样,通过每个媒体识别任务对应的专属网络,可以避免所有媒体识别任务共用共享网络时出现跷跷板效应的问题,该跷跷板效应是指部分媒体识别任务识别准确较高,部分媒体识别任务识别准确性较低的情况。
同时,初始识别模型中包括分别与N个媒体识别任务相关联的识别网络,一个媒体识别任务对应一个识别网络,通过每个媒体识别任务对应的识别网络,可以提取出与对应媒体识别任务的预测交互标签。例如,点击率识别任务对应的识别网络用于识别出样本对象针对样本多媒体数据的点击率标签,购买率识别任务对应的识别网络用于识别出样本对象针对样本多媒体数据的购买率标签等。由于每个媒体识别任务均具有对应的专属网络和识别网络,每个媒体识别任务对应的专属网络和识别网络中的网络参数的训练,不会受其他媒体识别任务的影响,因此可以削弱任务间的跷跷板效应,进而可以提高多任务识别的准确率,进而可以提高多媒体数据推送的准确率。
为便于理解,进一步地,请参见图2,图2是本申请实施例提供的一种数字处理的应用场景示意图。如图2所示的终端设备集群20a中的终端设备201a、终端设备202a、终端设备203a、终端设备204a等可以为上述图1所对应实施例中终端设备集群的终端设备,如图2所示的终端设备20c可以为上述图1所对应实施例中的终端设备100b,如图2所示的服务器20d可以为上述图1所对应实施例中的服务器10。终端设备集群20a中的终端设备和终端设备20c,分别与服务器20d之间建立有网络连接,可以通过该网络连接与服务器20d进行数据交互。可以理解的是,终端设备集群20a中的终端设备可以向服务器20d发送样本多媒体数据的媒体属性特征,以及样本对象的历史媒体交互特征。其中,以样本多媒体数据为广告数据为例,样本多媒体数据的媒体属性特征可以包括广告数据中的广告对象(如物品或者虚拟角色)的标识、价格、用途、主题、外观等属性特征。样本对象的历史媒体交互特征可以包括样本对象针对已推送多媒体数据的历史交互特征,以及样本对象的对象属性特征,以及已推送多媒体数据的媒体属性特征,具体可以参数上述历史媒体交互特征的描述。其中,已推送多媒体数据可以是指广告数据、新闻数据、游戏数据等,可以理解的是,已推送多媒体数据不仅包括与样本多媒体数据的类型相同的广告数据,还可以包括除广告数据之外的其他类型数据。
其中,管理对象20b可以通过终端设备20c人工输入样本对象针对样本多媒体数据的N维标注交互标签,如管理对象20b可以标注样本对象针对样本多媒体数据的点击率标签、标签样本对象针对样本多媒体数据的购买率标签等。终端设备20c获取到管理对象20b输入的样本对象针对样本多媒体数据的N维标注交互标签时,可以将样本对象针对样本多媒体数据的N维标注交互标签发送给服务器20d。进一步地,服务器20d接收到样本多媒体数据的媒体属性特征以及样本对象的历史媒体交互特征后,可以对进行样本多媒体数据的媒体属性特征以及样本对象的历史媒体交互特征进行特征拼接,得到样本拼接媒体特征。进一步,服务器20c可以将样本拼接媒体特征输入初始识别模型中,调用初始识别模型中的共享网络,对样本拼接媒体特征进行特征提取,从样本拼接媒体特征中提取出与N个媒体识别任务相关联的共享媒体特征。可以理解的是,N个媒体识别任务可以共享初始识别模型中的共享网络的网络参数和网络结构,通过共享网络可以提取出N个媒体识别任务均需要的共享媒体特征。同时,样本拼接媒体特征可以是基于与N个媒体识别任务关联的训练数据生成的,可以实现不同媒体识别任务之间的训练数据共享。这样,通过共享网络,可以避免当媒体识别任务对应的训练数据不充足的情况下导致模型性能较差的问题,可以提高多任务识别的效率和准确率(即提高多维交互标签识别的效率和准确率)。
同时,服务器20d可以调用初始识别模型中的专属网络i,对样本拼接媒体特征进行特征提取,从样本拼接媒体特征中提取出与媒体识别任务i相关联的专属媒体特征i。其中,初始识别模型中包括N个媒体识别任务对应的N个专属网络,每个媒体识别任务均配置有自己的专属网络(即一个媒体识别任务对应一个专属网络)。专属网络i是初始识别模型中的N个专属网络中,与媒体识别任务i相关联的专属网络。换句话说,专属网络i为媒体识别任务i专属配置的网络,仅用于提取与媒体识别任务i关联的媒体特征,不会受其他媒体识别任务的影响。这样,可以削弱N个媒体识别任务之间共用共享网络层所带来的跷跷板效应(如部分媒体识别任务的识别准确性较高,部分媒体识别任务的识别准确性较低,N个媒体识别任务之间无法共同达到最优的情况),进而可以提高媒体识别任务的识别准确性。
进一步地,服务器20d可以调用初始识别模型中媒体识别任务i对应的识别网络i,根据专属媒体特征i和共享媒体特征,识别样本对象针对样本多媒体数据的第i维预测交互标签。其中,初始识别模型中包括N个媒体识别任务对应的N个识别网络,每个媒体识别任务均配置有自己的识别网络(即一个媒体识别任务对应一个识别网络)。识别网络i是初始识别模型中的N个专属网络中,与媒体识别任务i相关联的识别网络,换句话说,识别网络i为媒体识别任务i专属配置的网络,仅用于识别与媒体识别任务i对应的交互标签,不会受其他媒体识别任务的影响。具体的,识别网络i包括门控机制,通过门控机制可以控制专属媒体特征i与共享媒体特征分别对应的重要程度,根据专属媒体特征i与共享媒体特征分别对应的重要程度,对专属媒体特征i与共享媒体特征进行特征融合,进而对融合后得到的业务融合媒体特征进行识别,得到样本对象针对样本多媒体数据的第i维预测交互标签。这样,通过门控机制,可以缓解不同媒体特征之间的特征冲突,同时较好的解决了N个媒体识别任务之间的跷跷板效应,可以提高多任务识别的准确性。
同样的,参考获取第i维预测交互标签的方式,服务器20d可以调用剩余媒体识别任务对应的专属网络,获取剩余媒体识别任务的专属媒体特征,剩余媒体识别任务是指N个媒体识别任务中除媒体识别任务之外的任务。进一步地,服务器20d可以调用剩余媒体识别任务对应的识别网络,根据剩余媒体识别任务的专属媒体特征和共享媒体特征,识别样本对象针对样本多媒体数据的N-1维预测交互标签,直到获取到N个媒体识别任务对应的N维预测交互标签。进一步地,服务器20d可以根据N维标注交互标签和N维预测交互标签,对初始识别模型进行训练,直到训练后的初始识别模型满足停止训练条件,得到多任务识别模型。可见,本申请实施例通过N个媒体识别任务共用共享网络中的网络参数和网络结构,可以实现N个媒体识别任务建立一个模型,避免N个媒体识别任务分别建模所带的问题,可以降低多任务识别的成本和效率。同时,通过共享网络,N个媒体识别任务之间可以共享训练数据,可以避免当媒体识别任务对应的训练数据(如购买率识别任务对应的训练数据较少)所导致模型训练不充分的问题,可以提高多任务识别模型的性能,进而可以提高多任务识别的准确性。同时,本申请实施例通过每个媒体识别任务专属的专属网络,可以同时较好的解决了N个媒体识别任务之间的跷跷板效应,可以提高多任务识别的准确性,进而可以提高多媒体数据推送的准确性。
进一步地,请参见图3,图3是本申请实施例提供的一种数据处理方法的流程示意图。如图3所示,该方法可由图1中的任意终端设备来执行,也可以由图1中的服务器10来执行,还可以由图1中的终端设备和服务器共同执行,本申请中用于执行该方法的设备可以统称为计算机设备。其中,该数据处理方法可以包括但不限于如下步骤:
S101,获取样本拼接媒体特征,以及样本对象针对样本多媒体数据的N维标注交互标签。
具体的,计算机设备可以获取样本拼接媒体特征,该样本拼接媒体特征是对样本多媒体数据的媒体属性特征,和样本对象的历史媒体交互特征进行拼接得到的。其中,样本多媒体数据可以是指需要初始识别模型进行N维交互标签识别的多媒体数据,样本对象可以是指在历史时间段内被推送过多媒体数据的用户,用于初始识别模型识别样本对象针对样本多媒体数据的N维交互标签,N为正整数。其中,N维标注交互标签与N个媒体识别任务对应,一维标注交互标签与一个媒体识别任务对应,如第i维标注交互标签与媒体识别任务i对应。N个媒体识别任务可以包括点击率识别任务、浅层转化率识别任务、深层转化率识别任务等。其中,浅层转化率可以是指表示对象点击多媒体数据后进行浅层操作的概率,如浅层转化率可以包括关注率、点赞率等,深层转化率是指表示对象点击多媒体数据后进行深层操作的概率,如深层转化率可以包括购买率、分享率等。N维标注交互标签可以包括标注点击率标签、标注浅层转化率标签、标注深层转化率标签。
其中,N维标注交互标签可以是指管理对象根据样本拼接媒体特征,在N个媒体识别任务下标注的N维标注交互标签。换句话说,N维标注交互标签为管理对象人工标注的N个媒体识别任务分别对应的交互标签。例如,管理对象根据样本拼接媒体特征,确定样本对象针对样本多媒体数据在点击率识别任务下的标注点击率标签为100%,样本对象针对样本多媒体数据在购买率识别任务下的标注购买率标签为50%等。
具体的,样本多媒体数据的媒体属性特征可以包括标识类特征(如Sparse特征)和统计类特征(如Dense特征),如样本多媒体数据为广告数据时,样本多媒体数据的媒体属性特征可以包括广告数据中的广告对象(如物品或者虚拟角色)的价格、用途、主题、外观等属性特征。如样本多媒体数据为新闻数据或者游戏数据时,样本多媒体数据的媒体属性特征可以包括内容主题、内容观看时长等属性特征。同样的,样本对象的历史媒体交互特征也可以包括标识类特征(如Sparse特征)和统计类特征(如Dense特征)。其中,样本对象的历史媒体交互特征可以包括样本对象针对已推送多媒体数据的历史交互特征,以及样本对象的对象属性特征,以及已推送多媒体数据的媒体属性特征。其中,已推送多媒体数据可以是指在历史时间段内向样本对象推送过的一个或者多个多媒体数据,样本对象针对已推送多媒体数据的历史交互特征可以包括样本对象针对已推送多媒体数据的交互行为,以及不同交互行为对应的次数,如样本对象是否点击了已推送多媒体数据以及点击行为的次数,样本对象点击了已推送多媒体数据后是否实施了购买行为以及购买行为的次数,样本对象点击了已推送多媒体数据后是否实施了评论行为以及评论行为的次数等。
其中,样本对象的对象属性特征可以包括样本对象的对象标识、对象年龄等,已推送多媒体数据的媒体属性特征可以包括已推送多媒体数据的媒体内容特征,如已推送多媒体数据为广告数据,已推送多媒体数据的媒体属性特征可以包括广告数据中的广告对象(如物品或者虚拟角色)的标识、价格、用途、主题、外观等属性特征。如已推送多媒体数据为新闻数据或者游戏数据时,已推送多媒体数据的媒体属性特征可以包括内容主题、内容观看时长等属性特征。
具体的,计算机设备可以从用户侧获取样本对象的历史媒体交互数据,如样本对象的对象属性数据以及样本对象针对已推送多媒体数据的交互数据等,同时,计算机设备可以多媒体数据推送侧(如广告侧)获取以及已推送多媒体数据的媒体属性数据,以及样本多媒体数据的媒体属性数据。进一步地,计算机设备可以通过初始识别模型中的向量转换网络,对历史媒体交互数据和样本多媒体数据的媒体属性数据进行向量转换,得到历史媒体交互特征和样本多媒体数据的媒体属性特征。具体的,计算机设备可以对历史媒体交互数据和样本多媒体数据的媒体属性数据的稀疏特征(如Sparse特征)中的每个key查询一个64维的embedding向量(即嵌入向量),并将各个key查询得到的向量进行拼接,进一步地与历史媒体交互数据和样本多媒体数据的媒体属性数据的统计特征(如Dense特征)进行拼接,得到样本拼接媒体特征。其中,样本对象的历史媒体交互数据可以包括与N个媒体识别任务关联的训练数据,如历史媒体交互数据可以包括与点击率识别任务关联的点击行为数据、与购买率识别任务关联的购买行为数据以及与关注率识别任务关联的关注行为数据等。
S102,调用初始识别模型中的共享网络,从样本拼接媒体特征中提取与N个媒体识别任务相关联的共享媒体特征。
具体的,初始识别模型可以用于对N个媒体识别任务识别,得到N个媒体识别任务的N维预测交互标签,如点击率识别任务下的点击率标签、购买率识别任务下的购买率标签等。具体的,初始识别模型中包括共享网络,计算机设备可以调用初始识别模型中的共享网络,从样本拼接媒体特征中提取与N个媒体识别任务相关联的共享媒体特征。可以理解的是,N个媒体识别任务之间可以共用共享网络中的网络参数以及网络结构,这样,通过一个初始识别模型便可以实现对N个媒体识别任务的识别,而不用一个媒体识别任务建立一个模型,可以降低多任务识别的效率和成本。同时,由于样本拼接媒体特征是基于与N个媒体识别任务关联的训练数据得到的,因此,N个媒体识别任务之间可以共享训练数据,如购买率识别任务的识别训练可以享用点击率识别任务对应的训练数据等。这样,可以避免某个媒体识别任务对应的训练数据较少(如分享率识别任务下的训练数据较少),导致模型训练不充分的问题,可以提高多任务识别的准确性。应当理解,共享网络中的网络参数是受N个媒体识别任务的识别损失的影响的,训练完成的共享网络可以提取出与N个媒体识别任务均需要的共享媒体特征。换句话说,共享网络提取得到的共享媒体特征是N个媒体识别任务共享的,各个媒体识别任务均可以利用共享媒体特征进行交互标签预测。
可选的,计算机设备调用初始识别模型中的共享网络,从样本拼接媒体特征中提取与N个媒体识别任务相关联的共享媒体特征的具体方式可以包括:若共享网络的数量为一个,则调用共享网络所包括的M个专家子网络,从样本拼接媒体特征中提取出与N个媒体识别任务相关联的M个专家媒体特征,M为正整数。将提取到的M个专家媒体特征,确定为与N个媒体识别任务相关联的共享媒体特征
具体的,初始识别模型中的共享网络的数量(即网络层数量)可以为一个或者多个,每个共享网络均可以包括M个专家子网络,当M为大于1的整数时,不同专家子网络中的网络参数不同,如M个专家子网络中的专家子网络z001与专家子网络z002分别对应的网络参数不同。由于不同专家子网络中的网络参数不同,因此,不同专家子网络可以用于提取在不同空间上的特征。换句话说,不同专家子网络都会有一个擅长的特征提取领域,通过M个专家子网络的网络结构,能够处理更加复杂的数据特征,进而可以提高模型性能。当共享网络的数量为一个时,计算机设备可以将样本拼接媒体特征分别输入共享网络中的M个专家子网络,调用共享网络包括的M个专家子网络,分别从样本拼接媒体特征中提取出与N个媒体识别任务相关联的M个专家媒体特征。
可以理解的是,一个专家子网络可以从样本拼接媒体特征中提取出与N个媒体识别任务相关联的一个专家媒体特征。具体的,M个专家子网络中的专家子网络z001,可以从样本拼接媒体特征中提取出与N个媒体识别任务相关联的专家媒体特征t001,M个专家子网络中的专家子网络z002,可以从样本拼接媒体特征中提取出与N个媒体识别任务相关联的专家媒体特征t002,直到获取到M个专家子网络提取到的专家媒体特征,得到M个专家媒体特征。计算机设备可以将提取到的M个专家媒体特征,确定为与N个媒体识别任务相关联的共享媒体特征。由于N个媒体识别任务共用共享媒体特征进行交互标签预测,并基于N个媒体识别任务的预测损失对共享网络中的网络参数进行调整,因此,共享网络中提取到的媒体特征与N个媒体识别任务相关联,即共享网络中提取到的媒体特征是N个媒体识别任务均需要的。
具体的,M个专家子网络中的每个专家子网络对应的初始网络参数不同,每个专家子网络中的网络结构可以相同,也可以不同。其中,每个专家子网络可以是指神经网络,网络结构可以包括全连接子网络和激活函数,全连接子网络用于对样本拼接媒体特征进行卷积处理,激活函数用于对全连接子网络输入的卷积媒体特征进行激活处理(如非线性特征转换)。可以理解的是,全连接子网络可以将从样本拼接媒体特征学习到的特征映射到样本标记空间,通过该样本标记空间进行分类识别。激活子网络可以将全连接子网络输入的低阶特征转化为高阶特征,以提取到更丰富的特征。其中,本申请实施例对每个专家子网络中的全连接子网络和激活函数的网络层数据不做限制。
可选的,若初始识别模型中的共享网络的数量为多个,多个共享网络之间具有上下层级关系。计算机设备调用初始识别模型中的共享网络,从样本拼接媒体特征中提取与N个媒体识别任务相关联的共享媒体特征的具体方式可以包括:若共享网络包括第一共享网络和第二共享网络,则调用第一共享网络包括的M个专家子网络,从样本拼接媒体特征中提取出与N个媒体识别任务相关联的M个专家媒体特征,M为正整数,如M为可以1,2,3…等。对N个初始专属媒体特征以及第一共享网络对应的M个专家媒体特征进行融合,得到第一融合媒体特征;N个初始专属媒体特征是由初始识别模型中的N个第一专属网络所提取得到的,N个第一专属网络与第一共享网络位于相同网络层。调用第二共享网络包括的M个专家子网络,从第一融合媒体特征中提取出与N个媒体识别任务相关联的共享媒体特征。
具体的,若初始识别模型中的共享网络包括第一共享网络和第二共享网络,第一共享网络和第二共享网络均包括M个专家子网络,第一共享网络的网络层级低于第二共享网络的网络层级,即第一共享网络输出的媒体特征可以作为第二共享网络的输入。计算机设备可以调用第一共享网络包括的M个专家子网络,从样本拼接媒体特征中提取出与N个媒体识别任务相关联的M个专家媒体特征。同样的,第一共享网络中的每个专家子网络均可以从样本拼接媒体特征中提取出一个专家媒体特征,直到第一共享网络包括的M个专家子网络分别提取到对应的专家媒体特征,以得到第一共享网络提取得到M个专家媒体特征。进一步地,计算机设备可以调用共享网络中的门控子网络,对N个初始专属媒体特征以及第一共享网络提取到的M个专家媒体特征进行融合,得到第一融合媒体特征。其中,N个初始专属媒体特征是由初始识别模型中的N个第一专属网络所提取得到的,N个第一专属网络与第一共享网络位于相同网络层。
其中,共享网络中的门控子网络可以是自注意力网络,通过共享网络中的门控子网络可以自动学习不同媒体识别任务之间的共性和特性,进而有效确定N个初始专属媒体特征以及第一共享网络提取到的M个专家媒体特征分别对应的融合权重,即一个特征对应一个融合权重。进一步地,计算机设备可以通过N个初始专属媒体特征以及第一共享网络提取到的M个专家媒体特征分别对应的融合权重,对N个初始专属媒体特征以及第一共享网络提取到的M个专家媒体特征进行融合,得到第一融合媒体特征。具体的,计算机设备可以调用共享网络中的门控子网络,根据每个初始专属媒体特征分别对应的融合权重,分别对每个初始专属媒体特征进行加权处理,得到M个加权专属媒体特征。计算机设备可以调用共享网络中的门控子网络,根据第一共享网络提取到的M个专家媒体特征分别对应的融合权重,分别对第一共享网络提取到的M个专家媒体特征进行加权处理,得到M个加权专家媒体特征。进一步地,计算机设备可以调用共享网络中的门控子网络,对M个加权专属媒体特征和M个加权专家媒体特征相加,得到第一融合媒体特征。这样,可以避免N个媒体识别任务之间的特征冲突,可以提高模型的性能,进而可以提高多任务识别的准确性。
其中,一个初始专属媒体特征是由初始识别模型中的一个第一专属网络,从样本拼接媒体特征中提取出的与对应媒体识别任务相关联的初始专属媒体特征,如N个初始专属媒体特征中的初始专属媒体特征i是由第一专属网络i,从样本拼接媒体特征中提取出的与媒体识别任务i相关联的初始专属媒体特征。进一步地,计算机设备可以将第一融合媒体特征分别输入第二共享网络包括的M个专家子网络,调用第二共享网络包括的M个专家子网络,从第一融合媒体特征中提取出与N个媒体识别任务相关联的M个专家媒体特征。进一步地,计算机设备可以将第二共享网络提取到的M个专家媒体特征确定为与N个媒体识别任务相关联的共享媒体特征。其中,第一共享网络包括的M个专家子网络和第二共享网络包括的M个专家子网络分别对应的网络参数不同,以及分别对应的网络结构可以相同,均可以包括全连接子网络和激活函数。其中,全连接子网络用于对媒体特征进行卷积处理,激活函数用于对全连接子网络输入的卷积媒体特征进行激活处理(如非线性特征转换)。
可选的,共享网络的数量为3个或者3个以上,当共享网络的数量为3个或者3个以上,可以参考第二共享网络的特征提取内容,第三共享网络的输入可以为第二共享网络的输出与N个第二专属网络的输出的融合,第四共享网络的输入可以为第三共享网络的输出与N个第三专属网络的输出的融合,以此类推,直到获取到最后一个共享网络的输出,将最后一个共享网络的输出作为与N个媒体识别任务相关联的共享媒体特征。
S103,调用初始识别模型中的专属网络i,从样本拼接媒体特征中提取与媒体识别任务i相关联的专属媒体特征i。
具体的,初始识别模型可以包括N个媒体识别任务中每个媒体识别任务对应的专属网络,每个媒体识别任务对应的专属网络的数量可以为1个,也可以为多个。计算机设备可以调用初始识别模型中的专属网络i,从样本拼接媒体特征中提取与媒体识别任务i相关联的专属媒体特征i,专属网络i为初始识别模型的N个专属网络中,与媒体识别任务i相关联的专属网络。换句话说,计算机设备可以将样本拼接媒体特征输入每个媒体识别任务对应的专属网络中,调用每个媒体识别任务对应的专属网络,从样本拼接媒体特征中提取与对应媒体识别任务相关联的专属媒体特征。例如,点击率识别任务对应的专属网络用于提取出反映样本对象是否点击样本多媒体数据的特征,购买率识别任务对应的专属网络用于提取出反映样本对象是否购买样本多媒体数据的特征等。这样,通过每个媒体识别任务对应的专属网络提取出对应媒体识别任务相关联的专属媒体特征,可以避免所有媒体识别任务共用共享网络时出现跷跷板效应的问题,可以提高多任务识别的准确性。该跷跷板效应是指部分媒体识别任务识别准确较高,部分媒体识别任务识别准确性较低的情况。
可选的,在每个媒体识别任务的专属网络的数量为1个时,计算机设备调用初始识别模型中的专属网络i,从样本拼接媒体特征中提取与媒体识别任务i相关联的专属媒体特征i的具体方式可以包括:若专属网络i的数量为一个,则调用专属网络i中的全连接子网络,从样本拼接媒体特征中,提取出与媒体识别任务i相关联的关联媒体特征。调用专属网络i中的激活子网络,对关联媒体特征进行非线性特征转换,得到与媒体识别任务i相关联的专属媒体特征i。
具体的,每个媒体识别任务对应的专属网络对应的网络结构可以包括全连接子网络和激活子网络,若媒体识别任务i对应的专属网络i的数量为一个,则计算机设备可以将样本拼接媒体特征输入专属网络i中的全连接子网络,调用专属网络i中的全连接子网络,从样本拼接媒体特征中提取出与媒体识别任务i相关联的关联媒体特征。例如,点击率识别任务对应的专属网络可以从样本拼接媒体特征中提取出用于反映样本对象是否点击样本多媒体数据的点击特征。可以理解的是,由于媒体识别任务i对应的专属网络i对应的网络参数,会受到媒体识别任务i的识别损失进行调整,因此,媒体识别任务i对应的专属网络i所提取的媒体特征为媒体识别任务i专属的。
进一步地,可以理解的是,专属网络i中的全连接子网络可以将从样本拼接媒体特征学习到的特征映射到样本标记空间,得到关联媒体特征。计算机设备可以将关联媒体特征输入专属网络i中的激活子网络中,调用专属网络i中的激活子网络,对关联媒体特征进行非线性特征转换,得到与媒体识别任务i相关联的专属媒体特征i。可以理解的是,由于,专属网络i中的全连接子网络输出的关联媒体特征为低阶特征,通过专属网络i中的激活子网络(即激活函数),可以将全连接子网络输入的低阶特征转化为高阶特征,以提取到更丰富的特征。可见,每个媒体识别任务均配置专属网络,通过专属网络可以提取到对应媒体识别任务相关联的专属媒体特征,这样,可以避免共享网络提取到的共享媒体特征偏向于部分媒体识别任务而出现跷跷板效应,可以提高模型的性能,以及提高多任务识别的准确性。
可以理解的是,在共享网络的数量为多个时,每个媒体识别任务对应的专属网络的数量也可以为多个,同时,共享网络的数量可以与专属网络的数量相同。在专属网络的数量为多个时,每个媒体识别任务对应的专属网络也可以为多个且数量相同,且每个媒体识别任务对应的多个专属网络之间具有上下层级关系。如N个媒体识别任务中的媒体识别任务R001包括3个专属网络层,即专属网络层C001、专属网络层C002以及专属网络层C003,3个专属网络层之间的上下层级关系可以为专属网络层C001->专属网络层C002->专属网络层C003,即专属网络层C001的网络层级低于专属网络层C002的网络层次,专属网络层C002的网络层次低于专属网络层C003的网络层级。同时,N个媒体识别任务中的媒体识别任务R002也包括3个专属网络层。
可选的,以媒体识别任务i对应的专属网络i为例,在专属网络i包括第一专属网络i和第二专属网络i时,计算机设备调用初始识别模型中的专属网络i,从样本拼接媒体特征中提取与媒体识别任务i相关联的专属媒体特征i的具体方式可以包括:若专属网络i包括第一专属网络i和第二专属网络i,调用第一专属网络i,从样本拼接媒体特征中提取出与媒体识别任务i相关联的初始专属媒体特征。对第一专属网络i提取到的初始专属媒体特征,以及第一共享网络提取到的M个专家媒体特征进行融合,得到第二融合媒体特征。调用第二专属网络i,从第二融合媒体特征中提取出与媒体识别任务i相关联的专属媒体特征i。
具体的,计算机设备可以将样本拼接媒体特征输入第一专属网络i,调用第一专属网络i,从样本拼接媒体特征中提取出与媒体识别任务i相关联的初始专属媒体特征。具体的,第一专属网络i也可以包括全连接子网络和激活子网络,计算机设备可以调用第一专属网络i中的全连接子网络对样本拼接媒体特征进行关联特征提取,得到与媒体识别任务i相关联的关联媒体特征。进一步调用第一专属网络i中的激活子网络,对第一专属网络i中的全连接子网络提取到的关联媒体特征进行非线性特征转换,得到与媒体识别任务i相关联的初始专属媒体特征。由于计算机设备将样本拼接媒体特征输入第一共享网络中,调用第一共享网络包括的M个专家子网络提取到M个专家媒体特征。
进一步地,计算机设备可以调用第一专属网络i对应的门控子网络,对第一专属网络i提取到的初始专属媒体特征,以及第一共享网络提取到的M个专家媒体特征进行融合,得到第二融合媒体特征。第一专属网络i对应的门控子网络可以自注意力网络,可以自动学习不同媒体识别任务之间共性和特性,根据不同媒体识别任务之间共性和特性,确定第一专属网络i提取到的初始专属媒体特征,以及第一共享网络提取到的M个专家媒体特征分别对应的融合权重。进一步地,计算机设备可以调用第一专属网络i对应的门控子网络,根据第一专属网络i提取到的初始专属媒体特征对应的融合权重,对第一专属网络i提取到的初始专属媒体特征进行加权处理,得到加权初始专属媒体特征。计算机设备可以调用第一专属网络i对应的门控子网络,第一共享网络提取到的M个专家媒体特征分别对应的融合权重,分别对第一共享网络提取到的M个专家媒体特征进行加权处理,得到M个加权专家媒体特征。进一步地,计算机设备可以调用第一专属网络i对应的门控子网络,对加权初始专属媒体特征和M个加权专家媒体特征相加,得到第二融合媒体特征。这样,可以避免N个媒体识别任务之间的特征冲突,可以提高模型的性能,进而可以提高多任务识别的准确性。
进一步地,计算机设备可以将第二融合媒体特征输入第二专属网络i中,调用第二专属网络i,从第二融合媒体特征中提取出与媒体识别任务i相关联的专属媒体特征i。同样的,第二专属网络i也可以包括全连接子网络和激活子网络,计算机设备可以调用第二专属网络i中的全连接子网络对第二融合媒体特征进行关联特征提取,得到与媒体识别任务i相关联的关联融合媒体特征。进一步调用第二专属网络i中的激活子网络,对第二专属网络i中的全连接子网络提取到的关联融合媒体特征进行非线性特征转换,得到与媒体识别任务i相关联的专属媒体特征i。
可选的,专属网络i的数量为3个或者3个以上,当专属网络i的数量为3个或者3个以上,可以参考第二专属网络i的特征提取内容,第三专属网络i的输入可以为第二专属网络i的输出与第二共享网络的输出的融合,第四专属网络i的输入可以为第三共享网络的输出与第三专属网络i的输出的融合。以此类推,直到获取到最后一个专属网络i的输出,将最后一个专属网络i的输出作为与媒体识别任务i相关联的专属媒体特征i。这样,通过多个专属网络,可以样本拼接媒体特征进行多维度提取,得到与媒体识别任务i相关联的专属媒体特征i,可以使专属媒体特征i更加丰富,进而可以提高媒体识别任务i的识别准确性。可选的,当专属网络i的数量为3个或者3个以上,第三专属网络i的输入可以为第二专属网络i的输出,第四专属网络i的输入可以为第三专属网络i的输出的融合。以此类推,直到获取到最后一个专属网络i的输出,将最后一个专属网络i的输出作为与媒体识别任务i相关联的专属媒体特征i。
S104,调用初始识别模型中媒体识别任务i对应的识别网络i,根据共享媒体特征以及专属媒体特征i,识别样本对象针对样本多媒体数据的第i维预测交互标签。
具体的,初始识别模型可以包括N个媒体识别任务分别对应的识别网络,一个媒体识别任务对应一个识别网络,即每个媒体识别任务均配置有其专属的识别网络,通过识别网络根据对应专属媒体特征以及共享媒体特征,识别出对应媒体识别任务下的预测交互标签。具体的,计算机设备可以将专属媒体特征i和共享媒体特征,输入初始识别模型中媒体识别任务i对应的识别网络i中,调用识别网络i,根据共享媒体特征以及专属媒体特征i,识别样本对象针对样本多媒体数据的第i维预测交互标签。其中,第i维预测交互标签与媒体识别任务i对应。例如,可以调用点击率识别任务对应的识别网络,可以根据点击率识别任务对应的专属媒体特征和共享媒体特征,识别出样本对象针对样本多媒体数据在点击率识别任务下的点击率标签。
可选的,计算机设备调用初始识别模型中的识别网络i,根据共享媒体特征以及专属媒体特征i,识别样本对象针对样本多媒体数据的第i维预测交互标签的具体方式可以包括:调用识别网络i包括的门控子网络,确定共享媒体特征以及专属媒体特征i分别对应的特征权重。调用识别网络i包括的门控子网络,根据共享媒体特征以及专属媒体特征i分别对应的特征权重,对共享媒体特征以及专属媒体特征i进行特征融合,得到与媒体识别任务i相关联的任务融合媒体特征。调用识别网络i包括的标签预测子网络,对任务融合媒体特征进行标签预测,得到样本对象针对样本多媒体数据的第i维预测交互标签。
具体的,计算机设备可以调用识别网络i包括的门控子网络,确定共享媒体特征以及专属媒体特征i分别对应的特征权重。具体的,识别网络i包括的门控子网络也可以为自注意力网络,通过识别网络i包括的门控子网络可以学习共享媒体特征与专属媒体特征i与媒体识别任务i之间的关联度。进一步根据共享媒体特征与专属媒体特征i与媒体识别任务i之间的关联度,确定共享媒体特征以及专属媒体特征i分别对应的特征权重。如关联度越高,所对应的特征权重越高;相反,关联度越低,所对应的特征权重越低。进一步地,计算机设备可以调用识别网络i对应的门控子网络,根据共享媒体特征对应的特征权重,对共享媒体特征进行加权处理,得到加权处理后的共享媒体特征。同时,计算机设备可以调用识别网络i对应的门控子网络,根据专属媒体特征i对应的特征权重对专属媒体特征i进行加权处理,得到加权处理后的专属媒体特征i。计算机设备可以对加权处理后的共享媒体特征和加权处理后的专属媒体特征i进行连接,得到与媒体识别任务i相关联的任务融合媒体特征。
进一步地,计算机设备可以调用识别网络i包括的标签预测子网络,对任务融合媒体特征进行标签预测,得到样本对象针对样本多媒体数据的第i维预测交互标签。可以理解的是,识别网络i包括的标签预测子网络相当于媒体识别任务i对应的专属tower(即专属塔),通过媒体识别任务i对应的专属tower可以对任务融合媒体特征进行特征分类,以得到样本对象针对样本多媒体数据的第i维预测交互标签。可见,通过每个媒体识别任务对应的识别网络,可以识别出样本对象针对样本多媒体数据在对应媒体识别任务下的预测交互标签。
可选的,计算机设备通过门控子网络,确定共享媒体特征以及专属媒体特征i分别对应的特征权重的具体方式可以包括:调用识别网络i包括的门控子网络,确定共享媒体特征与媒体识别任务i之间的第一关联度,以及确定专属媒体特征与媒体识别任务i之间的第二关联度。根据第一关联度,生成共享媒体特征对应的特征权重,根据第二关联度,生成专属媒体特征i对应的特征权重。
具体的,识别网络i包括的门控子网络也可以为自注意力网络,通过识别网络i包括的门控子网络,自动学习不同媒体识别任务之间的共性和特性,进而确定共享媒体特征与媒体识别任务i的第一关联度,以及确定专属媒体特征与媒体识别任务i之间的第二关联度。具体的,由于共享媒体特征包括M个专家媒体特征,识别网络i包括的门控子网络可以识别出每个专家媒体特征对应的关联度。进一步地,计算机设备可以调用识别网络i包括的门控子网络,根据共享媒体特征对应的第一关联度,生成共享媒体特征对应的特征权重,根据专属媒体特征i对应的第二关联度,生成专属媒体特征i对应的特征权重。具体的,在生成特征权重时,计算机设备可以对第一关联度和第二关联度进行求和,得到关联度和,将第一关联度与关联度和之间的比值,确定为共享媒体特征对应的特征权重,将第二关联度与关联度和之间的比值,确定为专属媒体特征i对应的特征权重。这样,通过识别网络i包括的门控子网络控制共享媒体特征与专属媒体特征i分别对应的重要程度,以实现缓解不同媒体识别任务之间的冲突问题,以解决N个媒体识别任务之间的跷跷板效应,提高模型的性能,进而可以提高多任务识别的准确性。其中,识别网络i还可以包括若干层全连接子网络,同若干层全连接子网络对业务融合媒体特征进行特征识别,输出样本对象针对样本多媒体数据在媒体识别任务i下的第i维预测交互标签。
S105,根据N维标注交互标签和N维预测交互标签对初始识别模型进行训练,直到训练后的初始识别模型满足停止训练条件,得到多任务识别模型。
具体的,计算机设备可以根据N维标注交互标签和N维预测交互标签对初始识别模型进行训练,直到训练后的初始识别模型满足停止训练条件,得到多任务识别模型。其中,停止训练条件可以是指初始识别模型的模型总损失小于损失阈值,或者,初始识别模型的训练次数达到目标次数。
可选的,计算机设备根据N维标注交互标签和N维预测交互标签对初始识别模型进行训练,直到训练后的初始识别模型满足停止训练条件,得到多任务识别模型的具体方式可以包括:根据媒体识别任务对应的第i维标注交互标签和第i维预测交互标签,确定关于媒体识别任务i的识别损失值i。获取识别损失值i针对初始识别模型的初始损失影响权重,根据N个媒体识别任务分别对应的识别损失值和初始损失影响权重,以及关于初始识别模型的总识别损失函数,确定关于初始识别模型的总识别损失值。根据总识别损失值以及N个媒体识别任务分别对应的识别损失值,对初始识别模型进行训练,直到训练后的初始识别模型满足停止训练条件,得到多任务识别模型。
具体的,计算机设备可以获取媒体识别任务i对应的第i维标注交互标签和第i维预测交互标签之间的差值,作为关于媒体识别任务i的识别损失值i。以此方式,计算机设备可以获取到N个媒体识别任务分别对应的识别损失值。进一步地,计算机设备可以获取识别损失值i针对初始识别模型的初始损失影响权重。具体的,计算机设备可以从损失影响权重区间中,随机确定一个损失影响权重,作为识别损失值i针对初始识别模型的初始损失影响权重,损失影响权重区间可以为大于0的区间。每个媒体识别任务对应的初始损失影响权重可以相同,也可以不同。进一步地,计算机设备可以根据N个媒体识别任务分别对应的识别损失值和初始损失影响权重,以及关于初始识别模型的总识别损失函数,确定关于初始识别模型的总识别损失值。
具体的,当N等2时,即N个媒体识别任务为第一媒体识别任务和第二媒体识别任务时,关于初始识别模型的总识别损失函数可以参见以下公式(1)。
其中,公式(1)中的σ1为第一媒体识别任务的识别损失函数的损失影响权重,σ2为第二媒体识别任务的识别损失函数的损失影响权重,L1(w)为第一媒体识别任务的识别损失函数,L2(w)为第一媒体识别任务的识别损失函数。其中,第一媒体识别任务的识别损失函数和第二媒体识别任务的识别损失函数可以是指交叉熵损失函数、均方误差损失函数、欧氏距离损失函数、欧氏距离损失函数、KL(Kullback-Leibler divergence)散度损失函数等中的任意一种或者多种组合。
进一步地,计算机设备可以根据总识别损失值以及N个媒体识别任务分别对应的识别损失值,对初始识别模型进行训练,直到训练后的初始识别模型满足停止训练条件,得到多任务识别模型。由于初始识别模型为多任务识别模型,因此不同媒体识别任务的识别损失值均会影响初始识别模型的最终结果,因此,通过设置不同媒体识别任务的识别损失值对应的损失影响权重,可以准确确定初始识别模型在训练过程中达到最优的状态,进而可以提高模型的性能。换句话说,通过设置不同媒体识别任务的识别损失值对应的损失影响权重,可以使初始识别模型在满足停止训练条件时的模型性能较高。
可选的,计算机设备根据总识别损失值以及N个媒体识别任务分别对应的识别损失值,对初始识别模型进行训练,直到训练后的初始识别模型满足停止训练条件,得到多任务识别模型的具体方式可以包括:若总识别损失值大于损失阈值,则对N个媒体识别任务分别对应的初始损失影响权重进行调整。根据N个媒体识别任务分别对应的识别损失值,对初始识别模型中的网络参数进行调整,得到训练后的初始识别模型。若训练后的初始识别模型的总识别损失值小于或等于损失阈值,则确定训练后的初始识别模型满足停止训练条件,将训练后的初始识别模型确定为多任务识别模型。
具体的,计算机设备获取到初始识别模型的总识别损失值后,可以将总识别损失值与损失阈值进行比较,若总识别损失值小于或者等于损失阈值,则可以确定初始识别模型满足停止训练条件,将初始识别模型确定为多任务识别模型。若总识别损失值大于损失阈值,说明初始识别模型不满足停止训练条件,则计算机设备可以对N个媒体识别任务分别对应的初始损失影响权重进行调整。具体的,计算机设备可以采用梯度下降算法,对N个媒体识别任务分别对应的初始损失影响权重进行调整。同时,计算机设备可以根据N个媒体识别任务分别对应的识别损失值,对初始识别模型中的网络参数进行调整,得到训练后的初始识别模型。
进一步地,计算机设备可以继续采用样本拼接媒体特征对训练后的初始识别模型进行训练,可以参考初始识别模型的训练方式,直到获取到训练后的初始识别模型的总识别损失值。计算机设备可以将训练后的初始识别模型的总识别损失值与损失阈值进行对比,若训练后的初始识别模型的总识别损失值大于损失阈值,则获取训练后的初始识别模型的训练次数。若训练后的初始识别模型的训练次数小于目标次数,说明训练后的初始识别模型未满足停止训练条件,则继续采用样本拼接媒体特征对训练后的初始识别模型进行训练。若训练后的初始识别模型的训练次数大于或者等于目标次数,说明训练后的初始识别模型满足停止训练条件,则将训练后的初始识别模型确定为多任务识别模型。其中,若训练后的初始识别模型的总识别损失值小于或者等于损失阈值,则确定训练后的初始识别模型满足停止训练条件,将训练后的初始识别模型确定为多任务识别模型。
可选的,计算机设备根据N个媒体识别任务分别对应的识别损失值,对初始识别模型中的网络参数进行调整,得到训练后的初始识别模型的具体方式可以包括:根据媒体识别任务i对应的识别损失值获取识别网络i的下降梯度,根据识别网络i的下降梯度对识别网络i中的网络参数进行调整。对识别网络i的下降梯度进行梯度回传,得到专属网络i的下降梯度,根据专属网络i的下降梯度,对专属网络i中的网络参数进行调整。对N个媒体识别任务分别对应的专属网络的下降梯度进行梯度回传,得到共享网络对应的下降梯度,根据共享网络对应的下降梯度,对共享网络中的网络参数进行调整,得到训练后的初始识别模型。
具体的,计算机设备可以根据媒体识别任务i对应的识别损失值,对识别网络i对应的损失函数进行求导,得到识别网络i对应的损失导数。进一步地,计算机设备可以根据识别网络i对应的损失导数以及识别网络i中的当前网络参数,确定识别网络i的下降梯度。计算机设备可以获取识别网络i的下降梯度与学习步长之间的乘积,得到识别网络i对应的参数调整阈值,进一步获取识别网络i中的当前网络参数,与识别网络i对应的参数调整阈值之间的差值,得到识别网络i对应的调整网络参数。计算机设备可以将识别网络i中的当前网络参数更新为识别网络i对应的调整网络参数。可见,识别网络i中的网络参数的调整只受媒体识别任务i的识别损失的影响,不会受其他媒体识别任务的识别损失的影响,可以使训练后的识别网络i准确识别关于媒体识别任务i的交互标签。
进一步地,由于识别网络i的输入为专属网络i的输出,因此计算机设备可以对识别网络i的下降梯度进行梯度回传,得到专属网络i的下降梯度。具体的,计算机设备可以根据识别网络i的识别损失值,确定专属网络i的识别损失值,进而根据专属网络i的识别损失值确定专属网络i的下降梯度。计算机设备可以获取专属网络i的下降梯度与学习步长之间的乘积,得到专属网络i对应的参数调整阈值。计算机设备可以获取专属网络i中的当前网络参数与专属网络i对应的参数调整阈值件的差值,得到专属网络i对应的调整网络参数,将专属网络i中的当前网络参数更新为专属网络i对应的调整网络参数。可见,由于识别网络i的输入为专属网络i的输出,在进行梯度方向传播时,专属网络i中的参数调整只受媒体识别任务i的识别损失的影响,不会受其他媒体识别任务的识别损失的影响,可以使训练后的专属网络i准确提取媒体识别任务i所需要的媒体特征。换句话说,专属网络i专属于媒体识别任务i,不会受其他媒体识别任务的影响,进而可以有效解决N个媒体识别任务之间的跷跷板效应,可以提高模型的性能,进而可以提高多任务识别的准确性。
进一步地,由于共享网络输出的共享媒体在会作为N个媒体识别任务对应的N个专属网络的输入,因此计算机设备可以对N个媒体识别任务分别对应的专属网络的下降梯度进行梯度回传,得到共享网络的下降梯度。具体的,计算机设备可以根据N个专属网络分别对应的识别损失值,确定共享网络的识别损失值,进而根据共享网络的识别损失值确定共享网络的下降梯度。进一步地,计算机设备可以获取共享网络的下降梯度与学习步长之间乘积,得到共享网络对应的参数调整阈值。计算机设备可以获取共享网络中的当前网络参数与共享网络对应的参数调整阈值之间的差值,得到共享网络对应的调整网络参数,将共享网络中的当前网络参数更新为共享网络对应的调整网络参数,得到训练后的初始识别模型。可见,由于共享网络中的网络参数基于N个媒体识别任务的识别损失进行调整,因此训练后的共享网络可以提取出与N个媒体识别任务相关联的共享媒体特征。这样,可以实现多个媒体识别任务建立一个模型,可以提高多任务识别的效率,同时,通过共享网络可以实现N个媒体识别任务共享样本数据(即训练数据),可以解决部分媒体识别任务的样本数据较少导致模型训练不充分的问题。
可选的,计算机设备对N个媒体识别任务分别对应的初始损失影响权重进行调整的具体方式可以包括:根据初始损失影响权重i,对总识别损失函数进行求导,得到关于初始损失影响权重i的损失导数。根据损失导数以及媒体识别任务i对应的识别损失值,获取关于初始损失影响权重i的下降梯度。获取初始损失影响权重i的下降梯度与学习步长之间的乘积,得到参数调整阈值,获取初始损失影响权重i对应的初始损失影响权重与参数调整阈值之间的差值,得到调整损失影响权重。将初始损失影响权重i对应的初始损失影响权重更新为调整损失影响权重。
具体的,计算机设备根据初始损失影响权重i,对总识别损失函数进行求导,得到关于初始损失影响权重i的损失导数,将媒体识别任务i对应的识别损失值带入关于初始损失影响权重i的损失导数中,得到关于初始损失影响权重i的下降梯度。进一步地,计算机设备可以获取初始损失影响权重i的下降梯度与学习步长之间的乘积,得到初始损失影响权重i对应的参数调整阈值。其中,学习步长可以根据具体情况具体调整,本申请对学习步长不做限制。进一步地,计算机设备可以初始损失影响权重i对应的初始损失影响权重与参数调整阈值之间的差值,得到调整损失影响权重,将初始损失影响权重i对应的初始损失影响权重更新为调整损失影响权重。可见,初始识别模型在最小化整体损失的过程中可以自动学习损失影响权重,使初始识别模型在训练完成达到最优的状态,可以提高多任务识别模型的性能,进而可以提高多任务识别的准确性。
如图4所示,图4是本申请实施例提供的一种初始识别模型的模型结构的示意图,如图4所示,计算机设备可以获取样本数据集合40a,该样本数据集合40a包括样本多媒体数据的媒体属性数据以及样本对象的历史媒体交互数据,该样本多媒体数据的媒体属性数据以及样本对象的历史媒体交互数据包括稀疏数据1、…稀疏数据r,以及统计数据。计算机设备可以对稀疏特征数据进行向量查询,得到稀疏特征1、…稀疏特征r,同时将统计数据进行向量转换得到统计特征。进一步计算机设备可以将对稀疏特征和统计特征输入特征拼接网络40b,对稀疏特征和统计特征进行特征拼接,得到样本拼接媒体特征。如图4所示,以共享网络的数量为一个,以及每个媒体识别任务的专属网络的数量也为一个,N个媒体识别任务为第一媒体识别任务和第二媒体识别任务为例,计算机设备可以将样本拼接特征输入初始识别模型中的共享网络40c,以及分别输入初始识别模型中每个媒体识别任务对应的专属网络。
具体的,计算机设备调用共享网络40c,从样本拼接媒体特征中提取与N个媒体识别任务(即第一媒体识别任务和第二媒体识别任务)相关联的共享媒体特征,其中,共享网络40c可以包括M个专家子网络,共享媒体特征的提取过程可以参见上述步骤S102的内容,本申请实施例在此不再赘述。同时,计算机设备可以调用第一媒体识别任务对应的专属网络40d,从样本拼接媒体特征中提取与第一媒体识别任务相关联的专属媒体特征,以及调用第二媒体识别任务对应的专属网络40e,从样本拼接媒体特征中提取与第二媒体识别任务相关联的专属媒体特征。其中,专属媒体特征的提取内容可以参见上述步骤S103的内容,
具体的,第一媒体识别任务对应的专属网络40d的特征提取逻辑可以参见以下公式(2)。
R1_FC=MatMul(W1,embedding) (2)
其中,公式(2)中的R1_FC表示第一媒体识别任务对应的专属网络40d,MatMul表示矩阵相乘,W1为第一媒体识别任务的专属网络40d中的网络参数,embedding为样本拼接媒体特征。
具体的,第二媒体识别任务对应的专属网络40e的特征提取逻辑,与第一媒体识别任务对应的专属网络40d的特征提取逻辑相似,可以参见以下公式(3)。
R2_FC=MatMul(W2,embedding) (3)
其中,公式(3)中的R2_FC表示第二媒体识别任务对应的专属网络40e,MatMul表示矩阵相乘,W2为第二媒体识别任务的专属网络40e中的网络参数,embedding为样本拼接媒体特征。
具体的,共享网络40c的特征提取逻辑可以参见以下公式(4)。
SHARE_FC=MatMul(W3,embedding) (4)
其中,公式(4)中的SHARE_FC表示共享网络40c,MatMul表示矩阵相乘,W3为共享网络40c中的网络参数,embedding为样本拼接媒体特征。
进一步地,计算机设备可以将样本拼接媒体特征输入第一媒体识别任务对应的门控子网络40f,调用第一媒体识别任务对应的门控子网络40f,确定第一媒体识别任务对应的专属媒体特征与共享媒体特征分别对应的特征权重。根据第一媒体识别任务对应的专属媒体特征与共享媒体特征分别对应的特征权重,对第一媒体识别任务对应的专属媒体特征与共享媒体特征进行融合,得到第一媒体识别任务的任务融合媒体特征。同样的,计算机设备可以将样本拼接媒体特征输入第二媒体识别任务对应的门控子网络40g,可以调用第二媒体识别任务对应的门控子网络40g,确定第二媒体识别任务对应的专属媒体特征与共享媒体特征分别对应的特征权重。根据第二媒体识别任务对应的专属媒体特征与共享媒体特征分别对应的特征权重,对第二媒体识别任务对应的专属媒体特征与共享媒体特征进行融合,得到第二媒体识别任务的任务融合媒体特征。
具体的,第一媒体识别任务对应的门控子网络40f的特征融合逻辑可以参见以下公式(5)。
MK1_FC=w1*R1_FC+w2*SHARE_FC (5)
其中,MK1_FC为第一媒体识别任务对应的门控子网络40f,R1_FC为第一媒体识别任务对应的专属媒体特征,w1为第一媒体识别任务对应的专属媒体特征的特征权重,SHRAE_FC为共享网络输入的共享媒体特征,w2为共享媒体特征的特征权重。其中,w1和w2等于softmax(MatMul(W4,embedding)),W4为第一媒体识别任务对应的门控子网络40f中的网络参数。
具体的,第二媒体识别任务对应的门控子网络40g的特征融合逻辑,与第一媒体识别任务对应的门控子网络40f的特征融合逻辑相似,可以参见以下公式(6)。
MK2_FC=w3*R1_FC+w4*SHARE_FC (6)
其中,MK2_FC为第二媒体识别任务对应的门控子网络40g,R2_FC为第二媒体识别任务对应的专属媒体特征,w3为第二媒体识别任务对应的专属媒体特征的特征权重,SHARE_FC为共享网络输出的共享媒体特征,w4为共享媒体特征的特征权重。其中,w3和w4等于softmax(MatMul(W5,embedding)),W5为第二媒体识别任务对应的门控子网络40g中的网络参数。
进一步地,计算机设备调用第一媒体识别任务对应的全连接网络40h和预测网络40i,基于第一媒体识别任务对应的业务融合媒体特征,识别样本对象针对样本多媒体数据在第一媒体识别任务下的预测交互标签。其中,第一媒体识别任务对应的识别网络包括门控子网络40f、全连接网络40h以及预测网络40i。例如,第一媒体识别任务可以是指点击率识别任务,调用点击率识别任务对应的识别网络,基于点击率识别任务对应的业务融合媒体特征,识别样本对象针对样本多媒体数据在点击率识别任务下的预测点击率标签。同样的,计算机设备调用第二媒体识别任务对应的全连接网络40k和预测网络40l,基于第二媒体识别任务对应的业务融合媒体特征,识别样本对象针对样本多媒体数据在第二媒体识别任务下的预测交互标签。其中,第二媒体识别任务对应的识别网络包括门控子网络40g、全连接网络40k以及预测网络40l。例如,第二媒体识别任务可以是指购买率识别任务,调用购买率识别任务对应的识别网络,基于购买率识别任务对应的业务融合媒体特征,识别样本对象针对样本多媒体数据在购买率识别任务下的预测购买率标签。
进一步地,计算机设备可以基于第一媒体识别任务对应的预测交互标签以及标注交互标签(可以为管理人员标注的),确定第一媒体识别任务对应的识别损失40j。同样的,计算机设备可以基于第二媒体识别任务对应的预测交互标签以及标注交互标签(可以为管理人员标注的),确定第二媒体识别任务对应的识别损失40m,进而基于第一媒体识别任务对应的识别损失和第二媒体识别任务对应的识别损失,对初始识别模型进行训练,得到多任务识别模型。
如图5所示,图5是本申请实施例提供的一种门控子网络的网络结构的示意图,如图5所示,门控子网络包括全连接层和归一化函数(如softmax函数。具体的,以第一媒体识别任务对应的门控子网络40f获取第一媒体识别任务对应的业务融合媒体特征为例,计算机设备可以将样本拼接媒体特征、第一媒体识别任务对应的专属媒体特征以及共享媒体特征输入门控子网络40f中,通过门控子网络40f中的全连接层,对样本拼接媒体特征进行特征提取,以学习不同媒体识别任务之间的共性和特性。进一步地,计算机设备可以将门控子网络40f中的全连接层输出的媒体特征,输入门控子网络40f中的归一化函数层,对全连接层输出的媒体特征进行归一化处理,输入第一媒体识别任务对应的专属媒体特征对应的特征权重w1,以及输出共享媒体特征对应的特征权重w2。进一步地,计算机设备可以调用门控子网络40f,获取专属媒体特征对应的特征权重w1与专属媒体特征之间的乘积,得到加权后的专属媒体特征,以及获取共享媒体特征对应的特征权重w2与共享媒体特征之间的乘积,得到加权后的共享媒体特征。对加权后的专属媒体特征和加权后的共享媒体特征进行融合,得到第一媒体识别任务对应的业务融合媒体特征。
如图6所示,图6是本申请实施例提供的一种初始识别模型的模型结构的示意图,如图6所示,相对于图4中的初始识别模型,图6中的初始识别模型中的每个媒体识别任务对应的专属网络的数量为两个,共享网络的数量也为两个。以N个媒体识别任务为第一媒体识别任务和第二媒体识别任务为例,计算机设备可以获取样本数据集合60a,该样本数据集合60a包括样本多媒体数据的媒体属性数据以及样本对象的历史媒体交互数据,该样本多媒体数据的媒体属性数据以及样本对象的历史媒体交互数据包括稀疏数据1、…稀疏数据r,以及统计数据。计算机设备可以对稀疏特征数据进行向量查询,得到稀疏特征1、…稀疏特征r,同时将统计数据进行向量转换得到统计特征。进一步计算机设备可以将稀疏特征和统计特征输入拼接网络60b,对稀疏特征和统计特征进行特征拼接,得到样本拼接媒体特征。
可以理解的是,第一共享网络60c与第二共享网络60i均包括M个专家子网络,计算机设备可以将样本拼接媒体特征输入第一共享网络60c,调用第一共享网络60c包括的M个专家子网络,从样本拼接媒体特征中提取与N个媒体识别任务相关联的M个专家媒体特征。其中,第一共享网络60c提取到的M个专家媒体特征的提取过程可以参见上述步骤S102的内容,本申请实施例在此不再赘述。同时,计算机设备可以将样本拼接媒体特征输入第一媒体识别任务对应的第一专属网络60d,调用第一专属网络60d,从样本拼接媒体特征中提取与第一媒体识别任务相关联的初始专属媒体特征。计算机设备可以将样本拼接媒体特征输入第二媒体识别任务对应的第一专属网络60d,调用第一专属网络60e,从样本拼接媒体特征中,提取与第二媒体识别任务相关联的初始专属媒体特征。其中,初始专属媒体特征的提取内容可以参见上述步骤S103的内容,
进一步地,计算机设备可以调用第一共享网络60c对应的门控子网络60g,对N个第一专属网络提取到的N个初始专属媒体特征,以及第一共享网络60c提取到的M个专家媒体特征进行融合,得到第一融合媒体特征。进一步计算机设备可以调用第二共享网络60i包括的M个专家子网络,从第一融合媒体特征中提取出与N个媒体识别任务相关联的共享媒体特征,具体可以参见上述步骤S102,本申请实施例在此不再赘述。
具体的,第一共享网络60c对应的门控子网络60g的特征提取逻辑可以参见如下公式(7)。
SHARE_MK=w5*R1_FC1+w6*SHARE_FC1+w7*R2_FC1 (7)
其中,公式(7)中的SHARE_MK为第一共享网络60c对应的门控子网络60g,R1_FC1为第一专属网络60d输出的初始专属媒体特征,R2_FC为第一专属网络60e输出的初始专属媒体特征,w5为第一专属网络60d输出的初始专属媒体特征对应的特征权重,w7为第一专属网络60e输出的初始专属媒体特征对应的特征权重,SHAER_FC1为第一共享网络60c提取到的M个专家媒体特征,w6为第一共享网络60c提取到的M个专家媒体特征的特征权重。其中,w5、w6以及w7等于softmax(MatMul(W6,embedding)),W6为门控子网络60g中的网络参数。
进一步地,计算机设备可以调用第一专属网络60d对应的门控子网络60f,对第一专属网络60d提取到的初始专属媒体特征,以及第一共享网络60c提取到的M个专家媒体特征进行融合,得到第二融合媒体特征。进一步计算机设备可以调用第一媒体识别任务的第二专属网络60j,从第二融合媒体特征中提取出与第一媒体识别任务相关联的专属媒体特征。同样的,计算机设备可以调用第一专属网络60e对应的门控子网络60h,对第一专属网络60e提取到的初始专属媒体特征,以及第一共享网络60c提取到的M个专家媒体特征进行融合,得到第三融合媒体特征。进一步计算机设备可以调用第二媒体识别任务的第二专属网络60k,从第三融合媒体特征中提取出与第二媒体识别任务相关联的专属媒体特征。其中,第一专属网络60d的特征提取逻辑、第二专属网络60j、第一专属网络60e以及第二专属网络60k分别对应的特征提取逻辑相似,可以参考上述公式(2)或者公式(3),本申请不再赘述。门控子网络60f和门控子网络60h分别对应的特征提取逻辑可以参考上述公式(5)或者公式(6),本申请不再赘述。
进一步地,计算机设备可以将门控子网络60f输出的第二融合媒体特征,输入门控子网络60l,调用门控子网络60l,对第二专属网络60j输出的专属媒体特征,以及第二共享网络60i输出的共享媒体特征进行融合,得到第一媒体识别任务对应的业务融合媒体特征。同样的,计算机设备可以将门控子网络60h输出的第二融合媒体特征,输入门控子网络60m,调用门控子网络60m,对第二专属网络60k输出的专属媒体特征,以及第二共享网络60i输出的共享媒体特征进行融合,得到第二媒体识别任务对应的业务融合媒体特征。
其中,门控子网络60l的特征融合逻辑可以参见如下公式(8)。
MK3_FC=w8*R1_FC2+w9*SHAER_FC2 (8)
其中,公式(8)中的MK3_FC为门控子网络60l,R1_FC2为第二专属网络60j输出的专属媒体特征,w8为第二专属网络60j输出的专属媒体特征的特征权重,SHAER_FC2为第二共享网络60i输出的共享媒体特征,w9为共享媒体特征的特征权重。其中,w8和w9等于softmax(MatMul(W7,embedding)),W7为门控子网络60l中的网络参数。其中,门控子网络60m的特征融合逻辑与门控子网络60l的特征融合逻辑相似,本申请在此不再赘述。
进一步地,计算机设备调用第一媒体识别任务对应的全连接网络60n和预测网络60p,基于第一媒体识别任务对应的业务融合媒体特征,识别样本对象针对样本多媒体数据在第一媒体识别任务下的预测交互标签。例如,第一媒体识别任务可以是指点击率识别任务,调用点击率识别任务对应的识别网络,基于点击率识别任务对应的业务融合媒体特征,识别样本对象针对样本多媒体数据在点击率识别任务下的预测点击率标签。同样的,计算机设备调用第二媒体识别任务对应的全连接网络60o和预测网络60q,基于第二媒体识别任务对应的业务融合媒体特征,识别样本对象针对样本多媒体数据在第二媒体识别任务下的预测交互标签。例如,第二媒体识别任务可以是指购买率识别任务,调用购买率识别任务对应的识别网络,基于购买率识别任务对应的业务融合媒体特征,识别样本对象针对样本多媒体数据在购买率识别任务下的预测购买率标签。进一步地,计算机设备可以基于第一媒体识别任务对应的预测交互标签以及标注交互标签(可以为管理人员标注的),确定第一媒体识别任务对应的识别损失60r。同样的,计算机设备可以基于第二媒体识别任务对应的预测交互标签以及标注交互标签(可以为管理人员标注的),确定第二媒体识别任务对应的识别损失60s,进而基于第一媒体识别任务对应的识别损失和第二媒体识别任务对应的识别损失,对初始识别模型进行训练,得到多任务识别模型。
在本申请实施例中,通过基于样本拼接媒体特征构建一个多任务识别模型,即该多任务识别模型能够用于识别对象针对多媒体数据的多维交互标签,一维交互标签对应一个媒体识别任务,也即该多任务识别模型能够用于处理多个媒体识别任务,不需要为每个媒体识别任务单独构建媒体识别模型,降低多任务识别模型训练时所需要的资源开销,提高多任务识别模型的训练效率。同时,在多任务识别模型的训练过程中,首先,构建包括共享网络、多个专属网络以及多个识别网络的初始识别模型,一个专属网络、一个识别网络均与一个媒体识别任务相对应。在识别媒体识别任务i下的第i维预测交互标签时,通过初始识别模型中的识别网络i结合共享媒体特征和媒体识别任务i关联的专属媒体特征i,识别样本对象针对多媒体数据的第i维预测交互标签,根据N维标注交互标签和N维预测交互标签对初始识别模型进行训练,得到多任务识别模型。此处的共享媒体特征是由初始识别模型的共享网络从样本拼接媒体特征中所提取到的,专属媒体特征i是由初始识别模型中与媒体识别任务i关联的专属网络从样本拼接媒体特征中提取得到的。换言之,在识别媒体识别任务i下的第i维预测交互标签时,不仅结合了与媒体识别任务i直接关联的专属媒体特征i,还结合了与媒体识别任务i间接关联的共享媒体特征,为识别媒体识别任务i下的第i维预测交互标签提供更多信息量。即不同媒体识别任务之间能够共用共享媒体特征,即为针对不同媒体识别任务的训练过程提供更多训练数据,这样能够避免由于训练数据具有稀疏性,造成训练后的初始识别模型(即任务识别模型)的媒体识别准确度比较低问题,提高训练后的初始识别模型的媒体识别准确度,进而提高多媒体数据的推送准确性。另外,本申请通过设置不同媒体识别任务的损失函数的损失影响权重,可以提高多任务识别模型的识别准确性。
进一步地,请参见图7,图7是本申请实施例提供的一种数据处理方法的流程示意图。如图7所示,该方法可由图1中的任意终端设备来执行,也可以由图1中的服务器10来执行,还可以由图1中的终端设备和服务器共同执行,本申请中用于执行该方法的设备可以统称为计算机设备。其中,该数据处理方法可以包括但不限于如下步骤:
S201,获取业务拼接媒体特征。
具体的,当需要向业务对象推送待推送对象时,计算机设备可以生成待推送对象对应的待推送多媒体数据,例如,在游戏场景中,若研发出新的游戏道具,则可以生成关于新的游戏道具对应的待推送广告数据,将该待推送广告数据准确推送给业务对象,以实现对新的游戏道具的推广。具体的,在对初始识别模型训练完成得到多任务识别模型后,计算机设备可以利用多任务识别模型识别业务对象针对待推送多媒体数据的N维识别交互标签,N维识别交互标签与N个媒体识别任务对应。其中,N个媒体识别任务可以包括点击率识别任务、浅层转化率识别任务以及深层转化率识别任务等,N维识别交互标签可以包括在点击率识别任务下的点击率标签、浅层转化率识别任务下的浅层转化率标签以及深层转化率识别任务下的深层转化率标签等。具体的,计算机设备可以获取当前需要进行多媒体数据推送的业务对象的历史媒体交互特征,以及待推送多媒体数据的媒体属性特征。其中,业务对象的历史媒体交互特征可以包括在历史时间段内(如前一周、前一个月等)向业务对象推送过的已推送多媒体数据的媒体属性特征、业务对象针对已推送多媒体数据的历史交互特征以及业务对象的对象属性特征。计算机设备可以对业务对象的历史媒体交互特征以及待推送多媒体数据的媒体属性特征进行特征拼接,得到业务拼接媒体特征,进而调用多任务识别模型基于业务拼接媒体特征业务对象针对待推送多媒体数据的N维识别交互标签。
具体的,待推送多媒体数据的媒体属性特征可以包括标识类特征(如Sparse特征)和统计类特征(如Dense特征),如待推送多媒体数据为广告数据时,待推送多媒体数据的媒体属性特征可以包括广告数据中的广告对象(如物品或者虚拟角色)的价格、用途、主题、外观等属性特征。如待推送多媒体数据为新闻数据或者游戏数据时,待推送多媒体数据的媒体属性特征可以包括内容主题、内容观看时长等属性特征。同样的,业务对象的历史媒体交互特征也可以包括标识类特征(如Sparse特征)和统计类特征(如Dense特征),业务对象针对已推送多媒体数据的历史交互特征可以包括业务对象针对已推送多媒体数据的交互行为,以及不同交互行为对应的次数。例如,业务对象是否点击了已推送多媒体数据以及点击行为的次数,业务对象点击了已推送多媒体数据后是否实施了购买行为以及购买行为的次数,业务对象点击了已推送多媒体数据后是否实施了评论行为以及评论行为的次数等。其中,业务对象的对象属性特征可以包括业务对象的对象标识、对象年龄等,已推送多媒体数据的媒体属性特征可以包括已推送多媒体数据的媒体内容特征,如已推送多媒体数据为广告数据,已推送多媒体数据的媒体属性特征可以包括广告数据中的广告对象(如物品或者虚拟角色)的标识、价格、用途、主题、外观等属性特征。如已推送多媒体数据为新闻数据或者游戏数据时,已推送多媒体数据的媒体属性特征可以包括内容主题、内容观看时长等属性特征。
S202,调用多任务识别模型中的共享网络,从业务拼接媒体特征中提取出与N个媒体识别任务相关联的业务共享媒体特征。
具体的,计算机设备将业务拼接媒体特征输入多任务识别模型,调用多任务识别模型中的共享网络,从业务拼接媒体特征中提取出与N个媒体识别任务相关联的业务共享媒体特征。具体的,共享网络的数量可以为一个或者多个,同时共享网络可以包括M个专家子网络,计算机设备可以调用一个或者多个共享网络包括的M个专家子网络,从业务拼接媒体特征中提取出与N个媒体识别任务相关联的业务共享媒体特征。多任务识别模型中的共享网络与初始识别模型中的共享网络对应的特征提取方式相同,业务共享媒体特征的获取可以参考上述步骤S102中关于共享媒体特征的获取,本申请实施例在此不再赘述。可以理解的是,不同媒体识别任务之间可以共享上述多任务识别模型中的共享网络的网络参数,通过共享网络中的网络参数进行特征提取。同时,由于多任务识别模型中的共享网络的网络参数是基于N个媒体识别任务共同训练得到,因此,多任务识别模型中的共享网络所提到的业务共享媒体特征为N个媒体识别任务所需要的。
S203,调用多任务识别模型中的专属网络i,从业务拼接媒体特征中提取与媒体识别任务i相关联的业务专属媒体特征i。
具体的,计算机设备将业务拼接媒体特征输入多任务识别模型,调用多任务识别模型中的专属网络i,从业务拼接媒体特征中提取与媒体识别任务i相关联的业务专属媒体特征i。以此方式,计算机设备可以调用多任务识别模型中的N个专属网络,从业务拼接媒体特征中提取与N个媒体识别任务相关联的N个业务专属媒体特征。这样,通过每个媒体识别任务对应的专属网络提取出对应媒体识别任务相关联的业务专属媒体特征,可以避免所有媒体识别任务共用共享网络时出现跷跷板效应的问题,可以提高多任务识别的准确性。其中,业务专属媒体特征i的提取内容可以参考上述步骤S103中关于专属媒体特征i的提取内容,本申请实施例在此不再赘述。
S204,调用多任务识别模型中关于媒体识别任务i的识别网络i,根据业务共享媒体特征以及业务专属媒体特征i,识别业务对象针对待推送多媒体数据的第i维识别交互标签。
具体的,计算机设备可以将业务专属媒体特征i输入多任务识别模型中关于媒体识别任务i的识别网络i,调用识别网络i中的门控子网络,确定业务共享媒体特征以及业务专属媒体特征i分别对应的特征权重。根据业务共享媒体特征以及业务专属媒体特征i分别对应的特征权重,对业务共享媒体特征以及业务专属媒体特征i进行特征融合,得到业务融合媒体特征。这样,通过门控机制可以控制业务共享媒体特征以及业务专属媒体特征i分别对应的重要程度,可以有效缓解N个媒体识别任务之间的特征冲突问题。进一步地,计算机设备可以通过识别网络i中的标签预测子网络,对业务融合媒体特征进行标签预测,得到业务对象针对待推送多媒体数据的第i维识别交互标签,该第i维识别交互标签与媒体识别任务i对应,即第i维识别交互标签为业务对象针对待推送多媒体数据在媒体识别任务i下的交互标签。其中,第i维识别交互标签的识别内容可以参考上述步骤S104的内容,本申请实施例在此不再赘述。
S205,根据N维识别交互标签,向业务对象推送待推送多媒体数据。
具体的,N维识别交互标签可以包括点击率标签、浅层转化率标签以及深层转化率标签等,计算机设备可以根据N维识别交互标签,向业务对象推送待推送多媒体数据。这样,可以提高多媒体数据的推送准确性和效率。
可选的,计算机设备根据N维识别交互标签向业务对象推送待推送多媒体数据的具体方式可以包括:根据N维识别交互标签,确定待推送多媒体数据的推送分值。将推荐分值大于分值阈值的待推送多媒体数据推送给业务对象。
计算机设备可以根据N维识别交互标签确定待推送多媒体数据的推送分值。其中,计算机设备可以N维识别交互标签进行加权求和,得到总交互标签,将总交互标签确定为待推送多媒体数据的推送分值。进一步地,计算机设备可以将推荐分值大于分值阈值的待推送多媒体数据推送给业务对象,该分值阈值可以根据具体情况具体设置。
在本申请实施例中,在获取到业务拼接媒体特征后,可以将业务拼接媒体特征输入多任务识别模型中,调用多任务识别模型中的共享网络,从业务拼接媒体特征中提取出与N个媒体识别任务相关联的业务共享媒体特征。进一步调用多任务识别模型中的专属网络i,从业务拼接媒体特征中提取与媒体识别任务i相关联的业务专属媒体特征i,调用多任务识别模型中关于媒体识别任务i的识别网络i,根据业务共享媒体特征以及业务专属媒体特征i,识别业务对象针对待推送多媒体数据的第i维识别交互标签。根据N维识别交互标签,向业务对象推送待推送多媒体数据。这样,通过识别准确性较高的多任务识别模型识别到的N维识别交互标签,向业务对象推送待推送多媒体数据,可以提高多媒体数据推送的准确性。
进一步地,请参见图8,图8是本申请实施例提供的一种数据处理装置的结构示意图,该数据处理装置可以包括:第一获取模块11、第一提取模块12、第二提取模块13、第一识别模块14、训练模块15、第二获取模块16、第三提取模块17、第四提取模块18、第二识别模块19以及推送模块20。
第一获取模块11,用于获取样本拼接媒体特征,以及样本对象针对样本多媒体数据的N维标注交互标签;样本拼接媒体特征是对样本多媒体数据的媒体属性特征,和样本对象的历史媒体交互特征进行拼接得到的;N维标注交互标签与N个媒体识别任务对应;N为大于1的整数;
第一提取模块12,用于调用初始识别模型中的共享网络,从样本拼接媒体特征中提取与N个媒体识别任务相关联的共享媒体特征;
第二提取模块13,用于调用初始识别模型中的专属网络i,从样本拼接媒体特征中提取与媒体识别任务i相关联的专属媒体特征i;专属网络i为初始识别模型的N个专属网络中,与媒体识别任务i相关联的专属网络,i为小于或等于N的正整数;
第一识别模块14,用于调用初始识别模型中关于媒体识别任务i的识别网络i,根据共享媒体特征以及专属媒体特征i,识别样本对象针对样本多媒体数据的第i维预测交互标签;
训练模块15,用于根据N维标注交互标签和N维预测交互标签对初始识别模型进行训练,直到训练后的初始识别模型满足停止训练条件,得到多任务识别模型。
其中,第一提取模块12包括:第一提取单元1201和第一确定单元1202。
第一提取单元1201,用于若共享网络的数量为一个,则调用共享网络所包括的M个专家子网络,从样本拼接媒体特征中提取出与N个媒体识别任务相关联的M个专家媒体特征,M为正整数;
第一确定单元1202,用于将提取到的M个专家媒体特征,确定为与N个媒体识别任务相关联的共享媒体特征。
其中,第二提取模块13包括:第二提取单元1301和特征转换单元1302。
第二提取单元1301,用于若专属网络i的数量为一个,则调用专属网络i中的全连接子网络,从样本拼接媒体特征中,提取出与媒体识别任务i相关联的关联媒体特征;
特征转换单元1302,用于调用专属网络i中的激活子网络,对关联媒体特征进行非线性特征转换,得到与媒体识别任务i相关联的专属媒体特征i。
其中,第一提取模块12还包括:第三提取单元1203、第一融合单元1204以及第四提取单元1205。
第三提取单元1203,用于若共享网络包括第一共享网络和第二共享网络,则调用第一共享网络包括的M个专家子网络,从样本拼接媒体特征中提取出与N个媒体识别任务相关联的M个专家媒体特征,M为正整数;
第一融合单元1204,用于对N个初始专属媒体特征以及第一共享网络提取到的M个专家媒体特征进行融合,得到第一融合媒体特征;N个初始专属媒体特征是由初始识别模型中的N个第一专属网络所提取得到的,N个第一专属网络与第一共享网络位于相同网络层;
第四提取单元1205,用于调用第二共享网络包括的M个专家子网络,从第一融合媒体特征中提取出与N个媒体识别任务相关联的共享媒体特征。
其中,第二提取模块13还包括:第五提取单元1303、第二融合单元1304以及第六提取单元1305。
第五提取单元1303,用于若专属网络i包括第一专属网络i和第二专属网络i,调用第一专属网络i,从样本拼接媒体特征中提取出与媒体识别任务i相关联的初始专属媒体特征;
第二融合单元1304,用于对第一专属网络i提取到的初始专属媒体特征,以及第一共享网络提取到的M个专家媒体特征进行融合,得到第二融合媒体特征;
第六提取单元1305,用于调用第二专属网络i,从第二融合媒体特征中提取出与媒体识别任务i相关联的专属媒体特征i。
其中,初始识别模型中关于媒体识别任务i的识别网络i包括门控子网络和标签预测子网络;第一识别模块14包括:第二确定单元1401、第三融合单元1402以及标签预测单元1403。
第二确定单元1401,用于调用识别网络i包括的门控子网络,确定共享媒体特征以及专属媒体特征i分别对应的特征权重;
第三融合单元1402,用于调用识别网络i包括的门控子网络,根据共享媒体特征以及专属媒体特征i分别对应的特征权重,对共享媒体特征以及专属媒体特征i进行特征融合,得到与媒体识别任务i相关联的任务融合媒体特征;
标签预测单元1403,用于调用识别网络i包括的标签预测子网络,对任务融合媒体特征进行标签预测,得到样本对象针对样本多媒体数据的第i维预测交互标签。
其中,第二确定单元1401具体用于:
调用识别网络i包括的门控子网络,确定共享媒体特征与媒体识别任务i之间的第一关联度,以及确定专属媒体特征与媒体识别任务i之间的第二关联度;
根据第一关联度,生成共享媒体特征对应的特征权重;
根据第二关联度,生成专属媒体特征i对应的特征权重。
其中,训练模块15包括:第三确定单元1501、获取单元1502、第四确定单元1503以及训练单元1504。
第三确定单元1501,用于根据媒体识别任务i对应的第i维标注交互标签和第i维预测交互标签,确定关于媒体识别任务i的识别损失值i;
获取单元1502,用于获取识别损失值i针对初始识别模型的初始损失影响权重i;
第四确定单元1503,用于根据N个媒体识别任务分别对应的识别损失值和初始损失影响权重,以及关于初始识别模型的总识别损失函数,确定关于初始识别模型的总识别损失值;
训练单元1504,用于根据总识别损失值以及N个媒体识别任务分别对应的识别损失值,对初始识别模型进行训练,直到训练后的初始识别模型满足停止训练条件,得到多任务识别模型。
其中,训练单元1504具体用于:
若总识别损失值大于损失阈值,则对N个媒体识别任务分别对应的初始损失影响权重进行调整;
根据N个媒体识别任务分别对应的识别损失值,对初始识别模型中的网络参数进行调整,得到训练后的初始识别模型;
若训练后的初始识别模型的总识别损失值小于或等于损失阈值,则确定训练后的初始识别模型满足停止训练条件;
将训练后的初始识别模型确定为多任务识别模型。
其中,根据N个媒体识别任务分别对应的识别损失值,对初始识别模型中的网络参数进行调整,得到训练后的初始识别模型,包括:
根据媒体识别任务i对应的识别损失值获取识别网络i的下降梯度,根据识别网络i的下降梯度对识别网络i中的网络参数进行调整;
对识别网络i的下降梯度进行梯度回传,得到专属网络i的下降梯度,根据专属网络i的下降梯度,对专属网络i中的网络参数进行调整;
对N个媒体识别任务分别对应的专属网络的下降梯度进行梯度回传,得到共享网络的下降梯度,根据共享网络对应的下降梯度,对共享网络中的网络参数进行调整,得到训练后的初始识别模型。
其中,对N个媒体识别任务分别对应的初始损失影响权重进行调整,包括:
根据初始损失影响权重i,对总识别损失函数进行求导,得到关于初始损失影响权重i的损失导数;
根据损失导数以及媒体识别任务i对应的识别损失值,获取关于初始损失影响权重i的下降梯度;
获取初始损失影响权重i的下降梯度与学习步长之间的乘积,得到参数调整阈值,获取初始损失影响权重i对应的初始损失影响权重与参数调整阈值之间的差值,得到调整损失影响权重;
将初始损失影响权重i对应的初始损失影响权重更新为调整损失影响权重。
其中,数据处理装置还包括:
第二获取模块16,用于获取业务拼接媒体特征;业务拼接媒体特征是对待推送多媒体数据的媒体属性特征,和业务对象的历史媒体交互特征进行拼接得到的;
第三提取模块17,用于调用多任务识别模型中的共享网络,从业务拼接媒体特征中提取出与N个媒体识别任务相关联的业务共享媒体特征;
第四提取模块18,用于调用多任务识别模型中的专属网络i,从业务拼接媒体特征中提取与媒体识别任务i相关联的业务专属媒体特征i;
第二识别模块19,用于调用多任务识别模型中关于媒体识别任务i的识别网络i,根据业务共享媒体特征以及业务专属媒体特征i,识别业务对象针对待推送多媒体数据的第i维识别交互标签;
推送模块20,用于根据N维识别交互标签,向业务对象推送待推送多媒体数据。
其中,推送模块20包括:
第五确定单元2001,用于根据N维识别交互标签,确定待推送多媒体数据的推送分值;
推送单元2002,用于将推荐分值大于分值阈值的待推送多媒体数据推送给业务对象。
根据本申请的一个实施例,图8所示的数据处理装置中的各个模块可以分别或全部合并为一个或若干个单元来构成,或者其中的某个(些)单元还可以再拆分为功能上更小的至少两个子单元,可以实现同样的操作,而不影响本申请的实施例的技术效果的实现。上述模块是基于逻辑功能划分的,在实际应用中,一个模块的功能也可以由至少两个单元来实现,或者至少两个模块的功能由一个单元实现。在本申请的其它实施例中,数据处理装置也可以包括其它单元,在实际应用中,这些功能也可以由其它单元协助实现,并且可以由至少两个单元协作实现。
根据本申请的一个实施例,可以通过在包括中央处理单元(CPU)、随机存取存储介质(RAM)、只读存储介质(ROM)等处理元件和存储元件的例如计算机的通用计算机设备上运行能够执行如图3中所示的相应方法所涉及的各步骤的计算机程序(包括程序代码),来构造如图8中所示的数据处理装置,以及来实现本申请实施例的数据处理方法。上述计算机程序可以记载于例如计算机可读记录介质上,并通过计算机可读记录介质装载于上述计算机设备中,并在其中运行。
在本申请实施例中,通过基于样本拼接媒体特征构建一个多任务识别模型,即该多任务识别模型能够用于识别对象针对多媒体数据的多维交互标签,一维交互标签对应一个媒体识别任务,也即该多任务识别模型能够用于处理多个媒体识别任务,不需要为每个媒体识别任务单独构建媒体识别模型,降低多任务识别模型训练时所需要的资源开销,提高多任务识别模型的训练效率。同时,在多任务识别模型的训练过程中,首先,构建包括共享网络、多个专属网络以及多个识别网络的初始识别模型,一个专属网络、一个识别网络均与一个媒体识别任务相对应。在识别媒体识别任务i下的第i维预测交互标签时,通过初始识别模型中的识别网络i结合共享媒体特征和媒体识别任务i关联的专属媒体特征i,识别样本对象针对多媒体数据的第i维预测交互标签,根据N维标注交互标签和N维预测交互标签对初始识别模型进行训练,得到多任务识别模型。此处的共享媒体特征是由初始识别模型的共享网络从样本拼接媒体特征中所提取到的,专属媒体特征i是由初始识别模型中与媒体识别任务i关联的专属网络从样本拼接媒体特征中提取得到的。换言之,在识别媒体识别任务i下的第i维预测交互标签时,不仅结合了与媒体识别任务i直接关联的专属媒体特征i,还结合了与媒体识别任务i间接关联的共享媒体特征,为识别媒体识别任务i下的第i维预测交互标签提供更多信息量。即不同媒体识别任务之间能够共用共享媒体特征,即为针对不同媒体识别任务的训练过程提供更多训练数据,这样能够避免由于训练数据具有稀疏性,造成训练后的初始识别模型(即任务识别模型)的媒体识别准确度比较低问题,提高训练后的初始识别模型的媒体识别准确度,进而提高多媒体数据的推送准确性。另外,本申请通过设置不同媒体识别任务的损失函数的损失影响权重,可以提高多任务识别模型的识别准确性。
进一步地,请参见图9,图9是本申请实施例提供的一种计算机设备的结构示意图,该计算机设备可以是终端设备或服务器。如图9所示,该计算机设备1000可以包括:处理器1001,网络接口1004和存储器1005,此外,上述计算机设备1000还可以包括:用户接口1003,和至少一个通信总线1002。其中,通信总线1002用于实现这些组件之间的连接通信。其中,在一些实施例中,用户接口1003可以包括显示屏(Display)、键盘(Keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。可选的,网络接口1004可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器,也可以是非不稳定的存储器(non-volatile memory),例如至少一个磁盘存储器。可选的,存储器1005还可以是至少一个位于远离前述处理器1001的存储装置。如图9所示,作为一种计算机可读存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及设备控制应用程序。
在如图9所示的计算机设备1000中,网络接口1004可提供网络通讯功能;而用户接口1003主要用于为用户提供输入的接口;而处理器1001可以用于调用存储器1005中存储的设备控制应用程序,以实现:
获取样本拼接媒体特征,以及样本对象针对样本多媒体数据的N维标注交互标签;样本拼接媒体特征是对样本多媒体数据的媒体属性特征,和样本对象的历史媒体交互特征进行拼接得到的;N维标注交互标签与N个媒体识别任务对应;N为大于1的整数;
调用初始识别模型中的共享网络,从样本拼接媒体特征中提取与N个媒体识别任务相关联的共享媒体特征;
调用初始识别模型中的专属网络i,从样本拼接媒体特征中提取与媒体识别任务i相关联的专属媒体特征i;专属网络i为初始识别模型的N个专属网络中,与媒体识别任务i相关联的专属网络,i为小于或等于N的正整数;
调用初始识别模型中关于媒体识别任务i的识别网络i,根据共享媒体特征以及专属媒体特征i,识别样本对象针对样本多媒体数据的第i维预测交互标签;
根据N维标注交互标签和N维预测交互标签对初始识别模型进行训练,直到训练后的初始识别模型满足停止训练条件,得到多任务识别模型。
应当理解,本申请实施例中所描述的计算机设备1000可执行前文图7所对应实施例中对数据处理方法的描述,也可执行前文图8所对应实施例中对数据处理装置的描述,在此不再赘述。另外,对采用相同方法的有益效果描述,也不再进行赘述。
此外,这里需要指出的是:本申请实施例还提供了一种计算机可读存储介质,且计算机可读存储介质中存储有前文提及的数据处理装置所执行的计算机程序,当处理器执行计算机程序时,能够执行前文图3或图7所对应实施例中对数据处理方法的描述,因此,这里将不再进行赘述。另外,对采用相同方法的有益效果描述,也不再进行赘述。对于本申请所涉及的计算机可读存储介质实施例中未披露的技术细节,请参照本申请方法实施例的描述。
此外,需要说明的是:本申请实施例还提供了一种计算机程序产品,该计算机程序产品可以包括计算机程序,该计算机程序可以存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机程序,处理器可以执行该计算机程序,使得该计算机设备执行前文图3或图7所对应实施例中对数据处理方法的描述,因此,这里将不再进行赘述。另外,对采用相同方法的有益效果描述,也不再进行赘述。对于本申请所涉及的计算机程序产品实施例中未披露的技术细节,请参照本申请方法实施例的描述。
需要说明的是,本申请书中相关数据收集处理在实例应用时应该严格根据相关国家法律法规的要求,获取个人信息主体的知情同意或单独同意(或具备合法性基础),并在法律法规及个人信息主体的授权范围内,开展后续数据使用及处理行为。例如,本申请在获取业务对象或者样本对象的历史媒体交互特征时需要获得业务对象或者样本对象的知情同意或单独同意。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,计算机程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(Random Access Memory,RAM)等。
以上所揭露的仅为本申请较佳实施例而已,当然不能以此来限定本申请之权利范围,因此依本申请权利要求所作的等同变化,仍属本申请所涵盖的范围。

Claims (17)

1.一种数据处理方法,其特征在于,包括:
获取样本拼接媒体特征,以及样本对象针对样本多媒体数据的N维标注交互标签;所述样本拼接媒体特征是对所述样本多媒体数据的媒体属性特征,和所述样本对象的历史媒体交互特征进行拼接得到的;所述N维标注交互标签与N个媒体识别任务对应;N为大于1的整数;
调用初始识别模型中的共享网络,从所述样本拼接媒体特征中提取与所述N个媒体识别任务相关联的共享媒体特征;
调用所述初始识别模型中的专属网络i,从所述样本拼接媒体特征中提取与媒体识别任务i相关联的专属媒体特征i;所述专属网络i为所述初始识别模型的N个专属网络中,与所述媒体识别任务i相关联的专属网络,i为小于或等于N的正整数;
调用所述初始识别模型中关于所述媒体识别任务i的识别网络i,根据所述共享媒体特征以及所述专属媒体特征i,识别所述样本对象针对所述样本多媒体数据的第i维预测交互标签;
根据所述N维标注交互标签和N维预测交互标签对所述初始识别模型进行训练,直到训练后的初始识别模型满足停止训练条件,得到多任务识别模型。
2.根据权利要求1所述的方法,其特征在于,所述调用初始识别模型中的共享网络,从所述样本拼接媒体特征中提取与所述N个媒体识别任务相关联的共享媒体特征,包括:
若所述共享网络的数量为一个,则调用所述共享网络所包括的M个专家子网络,从所述样本拼接媒体特征中提取出与所述N个媒体识别任务相关联的M个专家媒体特征,M为正整数;
将提取到的M个专家媒体特征,确定为与所述N个媒体识别任务相关联的共享媒体特征。
3.根据权利要求1所述的方法,其特征在于,所述调用所述初始识别模型中的专属网络i,从所述样本拼接媒体特征中提取与所述媒体识别任务i相关联的专属媒体特征i,包括:
若所述专属网络i的数量为一个,则调用所述专属网络i中的全连接子网络,从所述样本拼接媒体特征中,提取出与所述媒体识别任务i相关联的关联媒体特征;
调用所述专属网络i中的激活子网络,对所述关联媒体特征进行非线性特征转换,得到与所述媒体识别任务i相关联的专属媒体特征i。
4.根据权利要求1所述的方法,其特征在于,所述调用初始识别模型中的共享网络,从所述样本拼接媒体特征中提取与所述N个媒体识别任务相关联的共享媒体特征,包括:
若所述共享网络包括第一共享网络和第二共享网络,则调用所述第一共享网络包括的M个专家子网络,从所述样本拼接媒体特征中提取出与所述N个媒体识别任务相关联的M个专家媒体特征,M为正整数;
对N个初始专属媒体特征以及所述第一共享网络提取到的M个专家媒体特征进行融合,得到第一融合媒体特征;所述N个初始专属媒体特征是由所述初始识别模型中的N个第一专属网络所提取得到的,所述N个第一专属网络与所述第一共享网络位于相同网络层;
调用所述第二共享网络包括的M个专家子网络,从所述第一融合媒体特征中提取出与所述N个媒体识别任务相关联的共享媒体特征。
5.根据权利要求4所述的方法,其特征在于,所述调用所述初始识别模型中的专属网络i,从所述样本拼接媒体特征中提取与所述媒体识别任务i相关联的专属媒体特征i,包括:
若所述专属网络i包括第一专属网络i和第二专属网络i,调用所述第一专属网络i,从所述样本拼接媒体特征中提取出与所述媒体识别任务i相关联的初始专属媒体特征;
对所述第一专属网络i提取到的初始专属媒体特征,以及所述第一共享网络提取到的M个专家媒体特征进行融合,得到第二融合媒体特征;
调用所述第二专属网络i,从所述第二融合媒体特征中提取出与所述媒体识别任务i相关联的专属媒体特征i。
6.根据权利要求1所述的方法,其特征在于,所述初始识别模型中关于所述媒体识别任务i的识别网络i包括门控子网络和标签预测子网络;
所述调用所述初始识别模型中的识别网络i,根据所述共享媒体特征以及所述专属媒体特征i,识别所述样本对象针对所述样本多媒体数据的第i维预测交互标签,包括:
调用所述识别网络i包括的门控子网络,确定所述共享媒体特征以及所述专属媒体特征i分别对应的特征权重;
调用所述识别网络i包括的门控子网络,根据所述共享媒体特征以及所述专属媒体特征i分别对应的特征权重,对所述共享媒体特征以及所述专属媒体特征i进行特征融合,得到与所述媒体识别任务i相关联的任务融合媒体特征;
调用所述识别网络i包括的标签预测子网络,对所述任务融合媒体特征进行标签预测,得到所述样本对象针对所述样本多媒体数据的第i维预测交互标签。
7.根据权利要求6所述的方法,其特征在于,所述通过所述门控子网络,确定所述共享媒体特征以及所述专属媒体特征i分别对应的特征权重,包括:
调用所述识别网络i包括的门控子网络,确定所述共享媒体特征与所述媒体识别任务i之间的第一关联度,以及确定所述专属媒体特征与所述媒体识别任务i之间的第二关联度;
根据所述第一关联度,生成所述共享媒体特征对应的特征权重;
根据所述第二关联度,生成所述专属媒体特征i对应的特征权重。
8.根据权利要求1所述的方法,其特征在于,所述根据所述N维标注交互标签和N维预测交互标签对所述初始识别模型进行训练,直到训练后的初始识别模型满足停止训练条件,得到多任务识别模型,包括:
根据所述媒体识别任务i对应的第i维标注交互标签和第i维预测交互标签,确定关于所述媒体识别任务i的识别损失值i;
获取所述识别损失值i针对所述初始识别模型的初始损失影响权重i;
根据所述N个媒体识别任务分别对应的识别损失值和初始损失影响权重,以及关于所述初始识别模型的总识别损失函数,确定关于所述初始识别模型的总识别损失值;
根据所述总识别损失值以及所述N个媒体识别任务分别对应的识别损失值,对所述初始识别模型进行训练,直到训练后的初始识别模型满足停止训练条件,得到多任务识别模型。
9.根据权利要求8所述的方法,其特征在于,所述根据所述总识别损失值以及所述N个媒体识别任务分别对应的识别损失值,对所述初始识别模型进行训练,直到训练后的初始识别模型满足停止训练条件,得到多任务识别模型,包括:
若所述总识别损失值大于损失阈值,则对所述N个媒体识别任务分别对应的初始损失影响权重进行调整;
根据所述N个媒体识别任务分别对应的识别损失值,对所述初始识别模型中的网络参数进行调整,得到训练后的初始识别模型;
若所述训练后的初始识别模型的总识别损失值小于或等于所述损失阈值,则确定所述训练后的初始识别模型满足停止训练条件;
将所述训练后的初始识别模型确定为多任务识别模型。
10.根据权利要求9所述的方法,其特征在于,所述根据所述N个媒体识别任务分别对应的识别损失值,对所述初始识别模型中的网络参数进行调整,得到训练后的初始识别模型,包括:
根据所述媒体识别任务i对应的识别损失值获取所述识别网络i的下降梯度,根据所述识别网络i的下降梯度对所述识别网络i中的网络参数进行调整;
对所述识别网络i的下降梯度进行梯度回传,得到所述专属网络i的下降梯度,根据所述专属网络i的下降梯度,对所述专属网络i中的网络参数进行调整;
对所述N个媒体识别任务分别对应的专属网络的下降梯度进行梯度回传,得到所述共享网络的下降梯度,根据所述共享网络对应的下降梯度,对所述共享网络中的网络参数进行调整,得到训练后的初始识别模型。
11.根据权利要求9所述的方法,其特征在于,所述对所述N个媒体识别任务分别对应的初始损失影响权重进行调整,包括:
根据所述初始损失影响权重i,对所述总识别损失函数进行求导,得到关于所述初始损失影响权重i的损失导数;
根据所述损失导数以及所述媒体识别任务i对应的识别损失值,获取关于所述初始损失影响权重i的下降梯度;
获取所述初始损失影响权重i的下降梯度与学习步长之间的乘积,得到参数调整阈值,获取所述初始损失影响权重i对应的初始损失影响权重与所述参数调整阈值之间的差值,得到调整损失影响权重;
将所述初始损失影响权重i对应的初始损失影响权重更新为所述调整损失影响权重。
12.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取业务拼接媒体特征;所述业务拼接媒体特征是对待推送多媒体数据的媒体属性特征,和业务对象的历史媒体交互特征进行拼接得到的;
调用所述多任务识别模型中的共享网络,从所述业务拼接媒体特征中提取出与所述N个媒体识别任务相关联的业务共享媒体特征;
调用所述多任务识别模型中的专属网络i,从所述业务拼接媒体特征中提取与所述媒体识别任务i相关联的业务专属媒体特征i;
调用所述多任务识别模型中关于所述媒体识别任务i的识别网络i,根据所述业务共享媒体特征以及所述业务专属媒体特征i,识别所述业务对象针对所述待推送多媒体数据的第i维识别交互标签;
根据N维识别交互标签,向所述业务对象推送所述待推送多媒体数据。
13.根据权利要求12所述的方法,其特征在于,所述根据N维识别交互标签,向所述业务对象推送所述待推送多媒体数据,包括:
根据所述N维识别交互标签,确定所述待推送多媒体数据的推送分值;
将推荐分值大于分值阈值的待推送多媒体数据推送给所述业务对象。
14.一种数据处理装置,其特征在于,包括:
第一获取模块,用于获取样本拼接媒体特征,以及样本对象针对样本多媒体数据的N维标注交互标签;所述样本拼接媒体特征是对所述样本多媒体数据的媒体属性特征,和所述样本对象的历史媒体交互特征进行拼接得到的;所述N维标注交互标签与N个媒体识别任务对应;N为大于1的整数;
第一提取模块,用于调用初始识别模型中的共享网络,从所述样本拼接媒体特征中提取与所述N个媒体识别任务相关联的共享媒体特征;
第二提取模块,用于调用所述初始识别模型中的专属网络i,从所述样本拼接媒体特征中提取与媒体识别任务i相关联的专属媒体特征i;所述专属网络i为所述初始识别模型的N个专属网络中,与所述媒体识别任务i相关联的专属网络,i为小于或等于N的正整数;
第一识别模块,用于调用所述初始识别模型中关于所述媒体识别任务i的识别网络i,根据所述共享媒体特征以及所述专属媒体特征i,识别所述样本对象针对所述样本多媒体数据的第i维预测交互标签;
训练模块,用于根据所述N维标注交互标签和N维预测交互标签对所述初始识别模型进行训练,直到训练后的初始识别模型满足停止训练条件,得到多任务识别模型。
15.一种计算机设备,其特征在于,包括:处理器和存储器;
所述处理器与所述存储器相连,其中,所述存储器用于存储计算机程序,所述处理器用于调用所述计算机程序,以使得所述计算机设备执行权利要求1-13任一项所述的方法。
16.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机程序,该计算机程序适于由处理器加载并执行,以使得具有所述处理器的计算机设备执行权利要求1-13任一项所述的方法。
17.一种计算机程序产品,其特征在于,所述计算机程序产品包括计算机程序,该计算机程序存储在计算机可读存储介质中,且适于由处理器读取并执行,以使得具有所述处理器的计算机设备执行权利要求1-13任一项所述的方法。
CN202310912482.7A 2023-07-21 2023-07-21 一种数据处理方法、装置、计算机设备以及可读存储介质 Pending CN117093769A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310912482.7A CN117093769A (zh) 2023-07-21 2023-07-21 一种数据处理方法、装置、计算机设备以及可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310912482.7A CN117093769A (zh) 2023-07-21 2023-07-21 一种数据处理方法、装置、计算机设备以及可读存储介质

Publications (1)

Publication Number Publication Date
CN117093769A true CN117093769A (zh) 2023-11-21

Family

ID=88768889

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310912482.7A Pending CN117093769A (zh) 2023-07-21 2023-07-21 一种数据处理方法、装置、计算机设备以及可读存储介质

Country Status (1)

Country Link
CN (1) CN117093769A (zh)

Similar Documents

Publication Publication Date Title
CN110569377B (zh) 一种媒体文件的处理方法和装置
CN111026858B (zh) 基于项目推荐模型的项目信息处理方法及装置
CN113688951B (zh) 视频数据处理方法以及装置
CN112883257A (zh) 行为序列数据处理方法、装置、电子设备及存储介质
CN116861258B (zh) 模型处理方法、装置、设备及存储介质
CN112765481B (zh) 一种数据处理方法、装置、计算机及可读存储介质
CN113822127A (zh) 视频处理方法、装置、视频处理设备及存储介质
CN116955591A (zh) 用于内容推荐的推荐语生成方法、相关装置和介质
CN116956183A (zh) 多媒体资源推荐方法、模型训练方法、装置及存储介质
CN116976353A (zh) 一种数据处理方法、装置、设备以及可读存储介质
CN117093769A (zh) 一种数据处理方法、装置、计算机设备以及可读存储介质
CN111615178B (zh) 识别无线网络类型及模型训练的方法、装置及电子设备
CN115329183A (zh) 数据处理方法、装置、存储介质及设备
CN113705071A (zh) 设备识别方法、装置、设备及存储介质
CN114417944B (zh) 识别模型训练方法及装置、用户异常行为识别方法及装置
CN112417260A (zh) 本地化推荐方法、装置及存储介质
CN116628236B (zh) 多媒体信息的投放方法、装置、电子设备及存储介质
CN113254597B (zh) 模型训练方法、查询处理方法及相关设备
CN113495989B (zh) 一种对象推荐方法、装置、计算设备及存储介质
CN118035800A (zh) 模型训练方法、装置、设备及存储介质
CN118094016A (zh) 推荐方法、装置、设备、计算机可读存储介质及程序产品
CN117033757A (zh) 信息选取方法、装置、电子设备及存储介质
CN116167798A (zh) 一种数据处理方法、计算机设备以及可读存储介质
CN118230224A (zh) 标签打分方法、标签打分模型训练方法和装置
CN117009556A (zh) 一种基于评估模型的内容推荐方法及相关装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication