CN113220997A - 数据处理方法、装置、电子设备及存储介质 - Google Patents

数据处理方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN113220997A
CN113220997A CN202110523892.3A CN202110523892A CN113220997A CN 113220997 A CN113220997 A CN 113220997A CN 202110523892 A CN202110523892 A CN 202110523892A CN 113220997 A CN113220997 A CN 113220997A
Authority
CN
China
Prior art keywords
platform
data
various
processed
processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110523892.3A
Other languages
English (en)
Other versions
CN113220997B (zh
Inventor
刘伟
张博
林赛群
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN202110523892.3A priority Critical patent/CN113220997B/zh
Publication of CN113220997A publication Critical patent/CN113220997A/zh
Application granted granted Critical
Publication of CN113220997B publication Critical patent/CN113220997B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本公开提供了一种数据处理方法、装置、电子设备及存储介质,涉及计算机技术领域,尤其涉及深度学习、智能推荐、大数据处理等人工智能技术领域。具体实现方案为:获取生产主体的多种待处理数据;确定与多种待处理数据分别对应的多种维度的参考特征;采用多种维度的参考特征处理对应的多种待处理数据,以得到与多种维度分别对应的多种维度处理结果;以及根据多种维度处理结果,生成与生产主体对应的目标处理结果。由此,能够有效提升针对生产主体的数据处理效果,使得数据的处理结果更为准确,有效地提升处理结果的可参考性。

Description

数据处理方法、装置、电子设备及存储介质
技术领域
本公开涉及计算机技术领域,尤其涉及深度学习、智能推荐、大数据处理等人工智能技术领域,具体涉及一种数据处理方法、装置、电子设备及存储介质。
背景技术
人工智能是研究使计算机来模拟人的某些思维过程和智能行为(如学习、推理、思考、规划等)的学科,既有硬件层面的技术也有软件层面的技术。人工智能硬件技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理等技术;人工智能软件技术主要包括计算机视觉技术、语音识别技术、自然语言处理技术以及机器学习/深度学习、大数据处理技术、知识图谱技术等几大方向。
相关技术中,在对生产主体相关的数据进行处理时,通常是依据该数据对应的消费用户的反馈特征。
发明内容
本公开提供了一种数据处理方法、装置、电子设备、存储介质以及计算机程序产品。
根据本公开的第一方面,提供了一种数据处理方法,包括:获取生产主体的多种待处理数据;确定与所述多种待处理数据分别对应的多种维度的参考特征;采用所述多种维度的参考特征处理对应的所述多种待处理数据,以得到与所述多种维度分别对应的多种维度处理结果;以及根据所述多种维度处理结果,生成与所述生产主体对应的目标处理结果。
根据本公开的第二方面,提供了一种数据处理装置,包括:获取模块,用于获取生产主体的多种待处理数据;确定模块,用于确定与所述多种待处理数据分别对应的多种维度的参考特征;处理模块,用于采用所述多种维度的参考特征处理对应的所述多种待处理数据,以得到与所述多种维度分别对应的多种维度处理结果;以及生成模块,用于根据所述多种维度处理结果,生成与所述生产主体对应的目标处理结果。
根据本公开的第三方面,提供了一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本公开实施例的数据处理方法。
据本公开的第四方面,提出了一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行本公开实施例公开的数据处理方法。
根据本公开的第五方面,提出了一种计算机程序产品,包括计算机程序,当所述计算机程序由处理器执行时实现本公开实施例公开的数据处理方法。
应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
附图用于更好地理解本方案,不构成对本公开的限定。其中:
图1是根据本公开第一实施例的示意图;
图2是本公开实施例中的分发关系示意图;
图3是根据本公开第二实施例的示意图;
图4是根据本公开第三实施例的示意图;
图5是根据本公开第四实施例的示意图;
图6示出了可以用来实施本公开的实施例的数据处理方法的示例电子设备的示意性框图。
具体实施方式
以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
图1是根据本公开第一实施例的示意图。
其中,需要说明的是,本实施例的数据处理方法的执行主体为数据处理装置,该装置可以由软件和/或硬件的方式实现,该装置可以配置在电子设备中,电子设备可以包括但不限于终端、服务器端等。
本公开实施例涉及深度学习、智能推荐、大数据处理等人工智能技术领域。
其中,人工智能(Artificial Intelligence),英文缩写为AI。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。
深度学习是学习样本数据的内在规律和表示层次,这些学习过程中获得的信息对诸如文字,图像和声音等数据的解释有很大的帮助。深度学习的最终目标是让机器能够像人一样具有分析学习能力,能够识别文字、图像和声音等数据。
智能推荐,即通过对用户行为及业务特征的深入挖掘,针对不同场景提供实时、精准的推荐服务,快速提升用户活跃度及点击转化率。
而大数据处理,是指采用人工智能的方式对规模巨大的数据进行分析以及处理的过程,而大数据可以概括为5个V,数据量大(Volume)、速度快(Velocity)、类型多(Variety)、价值(Value)、真实性(Veracity)。
如图1所示,该数据处理方法包括:
S101:获取生产主体的多种待处理数据。
其中,生产数据的主体,可以被称为生产主体,数据可以例如文章,则生产文章的机构、作者等可以被称为生产主体。
也即是说,本公开实施例的应用场景可以例如为:对生产文章的机构、作者等所发表创作的一篇或者多篇的文章进行处理,以获得处理结果,该处理结果可以被用于描述生产主体的价值、可参考性、生产能力等。
本公开实施例下述的描述说明可以上述应用场景进行示例,另外,本公开实施例也可以应用在其它任意可能的数据处理应用场景中,对此不做限制。
其中,生产主体所生产的一种或者多种的数据,可以被称为待处理数据,不同的待处理数据可以具有不同的类型,例如,假设待处理数据是文章,则多种待处理数据可以是文章A、文章B、文章C等,该文章A、文章B、文章C可以是均由该生产主体创作得到,文章A、文章B、文章C可以具有不同的文章内容或者文章类型等。
一些实施例中,在获取生产主体的多种待处理数据时,可以是从数据池之中获取与该生产主体对应的多种数据并作为待处理数据,该数据池可以是预先构建的,其中包括多种数据,和各种数据所属生产主体的候选标识,则可以确定生产主体的目标标识,将数据池之中与目标标识相匹配的候选标识所对应的多种数据作为多种待处理数据,或者,也可以采用其它任意可能的方式来获取生产主体的多种待处理数据。
另外一些实施例中,还可以从多个分发平台之中获取与该生产主体对应的待处理数据,其中,分发平台可以是用于展示该生产主体所发表创作的数据的平台,例如文章A在分发平台A中展示,文章B在分发平台A、B、C中展示,则在获取生产主体的多种待处理数据时,可以具体确定该生产主体授权展示的一个或者多个的分发平台,而后,从该一个或者多个的分发平台之中确定与该生产主体对应的一篇或者多篇文章,作为待处理数据。
S102:确定与多种待处理数据分别对应的多种维度的参考特征。
其中,该参考特征可以具体是与待处理数据对应的展示类特征,假设待处理数据是文章A,则文章A的展示类特征例如为展示时长、对应展示的分发平台的数量,展示后的用户反馈特征等,对此不做限制。
也即是说,本公开实施例中,在获取生产主体的多种待处理数据之后,可以确定与每种待处理数据分别对应的展示类特征,而后,辅助后续基于该展示类特征来处理待处理数据,以评价生产主体的价值、可参考性、生产能力等,对此不做限制。
而本公开实施例中,若该生产主体对应的待处理数据是预先分发至一个或者多个分发平台之中以进行展示,则多种维度的参考特征,还可以是多种平台维度的参考特征,该平台维度的参考特征,即是待处理数据对应于分发平台之中的一些展示时长、展示后的用户反馈特征等,对此不做限制。
一些实施例中,确定与多种待处理数据分别对应的多种维度的参考特征,可以是确定与多种待处理数据分别对应的多个分发平台,并确定多种待处理数据在对应的多个分发平台之中的多种平台交互特征,并将多种平台交互特征作为多种维度的参考特征,从而实现基于分发平台的维度来解析得到与待处理数据对应的参考特征,实现结合与生产主体相关的平台维度的参考特征来处理待处理数据,并实现对多个分发平台中的参考特征进行聚合,使得数据的处理结果更为客观准确,能够有效提升对生产主体整体的数据处理效果。
其中,平台交互特征可以例如为,待处理数据对应于分发平台之中的一些交互反馈特征,例如,点赞数量、转发数量等,或者,也可以是该分发平台将待处理数据推送至其它分发平台,该其它分发平台的数量等,对此不做限制。
如图2所示,图2是本公开实施例中的分发关系示意图,包括:生产主体A、生产主体B、生产主体C、生产主体D、生产主体E,生产主体A、生产主体B、生产主体C、生产主体D、生产主体E相应地创作了文章A、文章B、文章C、文章D、文章E、文章F、文章G,不同的文章分发至不同或者相同的分发平台,分发平台包括:分发平台A、分发平台B、分发平台C、分发平台D、分发平台E,其中,生产主体和文章之间的箭头指示了创作关系,文章与分发平台之间的箭头指示了分发关系,对此不做限制。
则相应的,文章在相应的分发平台中所展示,得到的点赞数量、转发数量等,即可以被称为该相应的分发平台的平台交互特征,从而当一篇文章在多个分发平台对应分发时,可以得到与多个分发平台分别对应的多种平台交互特征,对此不做限制。
S103:采用多种维度的参考特征处理对应的多种待处理数据,以得到与多种维度分别对应的多种维度处理结果。
上述在获取生产主体的多种待处理数据,并确定与多种待处理数据分别对应的多种维度的参考特征之后,可以采用多种维度的参考特征处理对应的多种待处理数据,以得到与多种维度分别对应的多种维度处理结果。
举例而言,生产主体A的多种待处理数据是文章A、文章B、文章C,与文章A、文章B、文章C分别对应的参考特征是参考特征A、参考特征B、参考特征C,而后,可以将文章A和参考特征A输入至预训练的数据处理模型之中,得到与A维度对应的数据处理结果(数据处理结果例如,采用参考特征A评价文章A的价值,得到的价值结果),该与A维度对应的数据处理结果,即可以被称为一种维度处理结果;将文章B和参考特征B输入至预训练的数据处理模型之中,得到与B维度对应的数据处理结果(数据处理结果例如,采用参考特征B评价文章B的价值,得到的价值结果),该与B维度对应的数据处理结果,即可以被称为另一种维度处理结果;将文章C和参考特征C输入至预训练的数据处理模型之中,得到与C维度对应的数据处理结果(数据处理结果例如,采用参考特征C评价文章C的价值,得到的价值结果),该与C维度对应的数据处理结果,即可以被称为又一种维度处理结果,对此不做限制。
上述的维度处理结果,可以具体以评分的形式呈现,多种维度处理结果例如,A维度的评分、B维度的评分、C维度的评分,当维度是平台维度时,则多种维度处理结果可以解释为A平台维度的评分、B平台维度的评分、C平台维度的评分,相应平台维度的评分,可以是对分发至的分发平台中的展示情况打分得到的,具体可以参见后续实施例。
S104:根据多种维度处理结果,生成与生产主体对应的目标处理结果。
上述采用多种维度的参考特征处理对应的多种待处理数据,以得到与多种维度分别对应的多种维度处理结果之后,根据多种维度处理结果,生成与生产主体对应的目标处理结果。
举例而言,可以将上述A平台维度的评分、B平台维度的评分、C平台维度的评分进行加权融合,将融合得到的评分作为与生产主体对应的目标处理结果。
本实施例中,通过获取生产主体的多种待处理数据,确定与多种待处理数据分别对应的多种维度的参考特征,并采用多种维度的参考特征处理对应的多种待处理数据,以得到与多种维度分别对应的多种维度处理结果,以及根据多种维度处理结果,生成与生产主体对应的目标处理结果,由于是参考多种维度的参考特征来处理生产主体的待处理数据,能够有效提升针对生产主体的数据处理效果,使得数据的处理结果更为准确,有效地提升处理结果的可参考性。
图3是根据本公开第二实施例的示意图。
如图3所示,针对本实施例的描述,可以一并结合上述图1和图2所示,该数据处理方法包括:
S301:获取生产主体的多种待处理数据。
S301的举例说明可以具体参见上述实施例,在此不再赘述。
S302:确定与多种待处理数据分别对应的多个分发平台。
举例而言,可以确定该生产主体授权展示的一个或者多个分发平台,而后,从一个或者多个分发平台之中拉取待处理数据,在确定与多种待处理数据分别对应的多个分发平台时,将待处理数据相应展示的分发平台,作为对应的分发平台。
其中,每种待处理数据可以对应一个或者多个的分发平台,对此不做限制。
S303:确定多种待处理数据在对应的多个分发平台之中的多种用户交互特征。
本公开实施例中,在确定与多种待处理数据分别对应的多个分发平台之后,可以确定多种待处理数据在对应的多个分发平台之中的多种用户交互特征。
其中,用户交互特征可以例如,当将文章A在分发平台A中展示时,与该文章A对应的用户交互维度的特征,例如,阅读数、点击数、播放数、评论数、点赞数、点灭数、点踩数、收藏数、分享数、转发数、回答数等,对此不做限制。
S304:确定与多种用户交互特征分别对应的多种交互描述信息。
其中,交互描述信息,可以例如为与用户交互特征对应的权重值,不同的用户交互特征可以对应不同或者相同的交互描述信息,例如,上述的阅读数、点击数、播放数、评论数、点赞数、点灭数、点踩数、收藏数、分享数、转发数、回答数等,分别具有不同或者相同的权重值。
用户交互特征还可以具体被划分为交互量特征和正向属性特征,即多种用户交互特征,可以是由多种交互量特征和多种正向属性特征构成,针对每种交互量特征和正向属性特征,分别具有相应的权重值,该权重值即为与用户交互特征对应的交互描述信息。
S305:根据多种交互描述信息分别处理对应的分发平台之中的多种用户交互特征,以得到与多个分发平台分别对应的多种平台交互特征,并将多种平台交互特征作为多种维度的参考特征。
上述在确定多种待处理数据在对应的多个分发平台之中的多种用户交互特征,并确定与多种用户交互特征分别对应的多种交互描述信息之后,可以参考交互描述信息,对多种用户交互特征进行数据融合,将数据融合得到的特征作为相应的平台交互特征。
举例而言,文章A对应分发平台A和分发平台B,文章A在分发平台A中的用户交互特征A1,用户交互特征A2,用户交互特征A3,文章B在分发平台B中的用户交互特征B1,用户交互特征B2,用户交互特征B3,而用户交互特征A1,用户交互特征A2,用户交互特征A3分别对应的权重值(交互描述信息)是权重A1、权重A2、权重A3,则与分发平台A对应的平台交互特征A,可以是参考权重A1、权重A2、权重A3,对用户交互特征A1,用户交互特征A2,用户交互特征A3进行数据融合得到的,数据融合的方式可以是基于预设数学公式,针对与分发平台B对应的平台交互特征B的确定方式,可以以此类推,对此不做限制。
从而本实施例中,通过确定多种待处理数据在对应的多个分发平台之中的多种用户交互特征,并确定与多种用户交互特征分别对应的多种交互描述信息,以及根据多种交互描述信息分别处理对应的分发平台之中的多种用户交互特征,以得到与多个分发平台分别对应的多种平台交互特征,由于用户交互维度的特征,能够用于表明待处理数据在用户群中的反响,从而采用用户交互维度的特征来聚合得到平台维度的交互特征,并参考平台维度的交互特征辅助处理待处理数据,能够客观准确地表达出待处理数据的价值。
可选地,一些实施例中,可以根据多种交互描述信息分别对对应的分发平台之中的多种用户交互特征进行加权求和处理,以得到与多个分发平台分别对应的多种加权求和处理结果,并将多种加权求和处理结果分别作为对应的多种平台交互特征,从而实现对不同维度的用户交互特征进行加权融合以得到平台维度的交互特征,实现对不同维度的用户交互特征进行聚合,有效地辅助提升平台维度的交互特征的可参考性。
举例而言,参考权重A1、权重A2、权重A3,对用户交互特征A1,用户交互特征A2,用户交互特征A3进行数据融合得到的平台交互特征A,数据融合的方式可以是加权求和处理,对此不做限制。
举例而言,假设多种用户交互特征,可以是由多种交互量特征和多种正向属性特征构成,针对每种交互量特征和正向属性特征,分别具有相应的权重值,与交互量特征(interact_info)对应的权重值可以用w_interact表示,与正向属性特征(pos_info)对应的权重值可以用w_pos表示,则对对应的分发平台之中的多种用户交互特征进行加权求和处理,可以得到平台交互特征(假设此时平台交互特征,可以以评分的形式呈现,表示为content_score),则加权融合可以如下公式所示:
content_score=∑(w_interact*interact_info+w_pos*pos_info)。
S306:确定与多个分发平台分别对应的多个平台描述信息。
其中,平台描述信息,可以例如对应分发平台的权重值,该平台描述信息,能够在聚合各个分发平台的平台交互特征时,作为聚合权重参考。
平台描述信息,可以是预先配置的,或者也可以是自适应调整,对此不做限制。
举例而言,分发平台A和分发平台B,则分发平台A对应平台描述信息A,分发平台B对应平台描述信息B,平台描述信息A和平台描述信息B,可以被用于在聚合各个分发平台的平台交互特征时,作为聚合权重参考。
可选地,一些实施例中,确定与多个分发平台分别对应的多个平台描述信息,可以是根据与分发平台之中的多种用户交互特征分别对应的多种交互描述信息,生成与分发平台对应的平台描述信息,从而实现对不同维度的交互描述信息进行融合以得到平台维度的平台描述信息,有效地辅助提升平台维度的平台描述信息的客观性和可参考性,从而保障数据处理的准确性。
也即是说,本公开实施例支持根据与分发平台之中的多种用户交互特征分别对应的多种交互描述信息,确定与该分发平台的平台描述信息。
举例而言,分发平台A中的用户交互特征A1,用户交互特征A2,用户交互特征A3,而用户交互特征A1,用户交互特征A2,用户交互特征A3分别对应的权重值(交互描述信息)是权重A1、权重A2、权重A3,则确定分发平台的权重值时,可以对该分发平台中的用户交互特征A1,用户交互特征A2,用户交互特征A3,基于权重A1、权重A2、权重A3,进行加权求平均,并将加权求平均的结果值作为与分发平台对应的平台描述信息,对此不做限制。
S307:采用多种维度的参考特征处理对应的多种待处理数据,以得到与多种维度分别对应的多种维度处理结果。
S307的举例说明可以具体参见上述实施例,在此不再赘述。
S308:根据多个平台描述信息处理对应的多种维度处理结果,以得到与生产主体对应的目标处理结果。
上述在确定与多个分发平台分别对应的多个平台描述信息之后,可以根据多个平台描述信息处理对应的多种维度处理结果,以得到与生产主体对应的目标处理结果,从而实现对多个平台维度的维度处理结果进行聚合,并且在聚合过程中还参考了各个分发平台的平台描述信息,从而能够有效提升聚合的合理性,有效提升聚合得到的目标处理结果针对生产主体价值、可参考性、生产能力等的表达能力。
可选地,一些实施例中,根据多个平台描述信息处理对应的多种维度处理结果,以得到与生产主体对应的目标处理结果,可以根据多个平台描述信息对对应的多种维度处理结果进行加权求和,以得到加权求和结果,并对加权求和结果进行归一化处理,并将归一化处理的结果作为与生产主体对应的目标处理结果,从而实现对待处理数据对应的后验特征(即将该待处理数据分发后获得的一些反馈特征)进行多维度的聚合,有效提升待处理数据对应的后验特征的召回准确性,辅助后续在参考针对生产主体的目标处理结果进行数据推荐时,能够有效提升数据推荐的准确性和适配性。
举例而言,假设生产主体对应的待处理数据是文章A和文章B,文章A对应的平台维度A的维度处理结果是content_score1、文章A对应的平台维度B的维度处理结果是content_score2、文章B对应的平台维度A的维度处理结果是content_score3、文章B对应的平台维度B的维度处理结果是content_score4、相应的,平台维度A的分发平台A对应平台描述信息A,平台维度B的分发平台B对应平台描述信息B,则对对应的多种维度处理结果进行加权求和,以得到加权求和结果,并对加权求和结果进行归一化处理,可以如下述公式所示:
与生产主体对应的目标处理结果producer_score=sigmoid(∑log(w*content_score));
其中,w指示对应的平台描述信息,w*content_score可以等于平台描述信息A*content_score1+平台描述信息A*content_score2+平台描述信息B*content_score3+平台描述信息B*content_score4,而sigmoid函数则是指相关技术中的归一化处理的激活函数。
本实施例中,通过获取生产主体的多种待处理数据,确定与多种待处理数据分别对应的多种维度的参考特征,并采用多种维度的参考特征处理对应的多种待处理数据,以得到与多种维度分别对应的多种维度处理结果,以及根据多种维度处理结果,生成与生产主体对应的目标处理结果,由于是参考多种维度的参考特征来处理生产主体的待处理数据,能够有效提升针对生产主体的数据处理效果,使得数据的处理结果更为准确,有效地提升处理结果的可参考性。通过确定多种待处理数据在对应的多个分发平台之中的多种用户交互特征,并确定与多种用户交互特征分别对应的多种交互描述信息,以及根据多种交互描述信息分别处理对应的分发平台之中的多种用户交互特征,以得到与多个分发平台分别对应的多种平台交互特征,由于用户交互维度的特征,能够用于表明待处理数据在用户群中的反响,从而采用用户交互维度的特征来聚合得到平台维度的交互特征,并参考平台维度的交互特征辅助处理待处理数据,能够客观准确地表达出待处理数据的价值。在确定与多个分发平台分别对应的多个平台描述信息之后,可以根据多个平台描述信息处理对应的多种维度处理结果,以得到与生产主体对应的目标处理结果,从而实现对多个平台维度的维度处理结果进行聚合,并且在聚合过程中还参考了各个分发平台的平台描述信息,从而能够有效提升聚合的合理性,有效提升聚合得到的目标处理结果针对生产主体价值、可参考性、生产能力等的表达能力。
图4是根据本公开第三实施例的示意图。
如图4所示,该数据处理装置40,包括:
获取模块401,用于获取生产主体的多种待处理数据;
确定模块402,用于确定与多种待处理数据分别对应的多种维度的参考特征;
处理模块403,用于采用多种维度的参考特征处理对应的多种待处理数据,以得到与多种维度分别对应的多种维度处理结果;以及
生成模块404,用于根据多种维度处理结果,生成与生产主体对应的目标处理结果。
在本公开的一些实施例中,如图5所示,图5是根据本公开第四实施例的示意图,该数据处理装置50,包括:获取模块501、确定模块502、处理模块503、生成模块504,其中,确定模块502,包括:
第一确定子模块5021,用于确定与多种待处理数据分别对应的多个分发平台;
第二确定子模块5022,用于确定多种待处理数据在对应的多个分发平台之中的多种平台交互特征,并将多种平台交互特征作为多种维度的参考特征。
在本公开的一些实施例中,其中,第二确定子模块5022,具体用于:
确定多种待处理数据在对应的多个分发平台之中的多种用户交互特征;
确定与多种用户交互特征分别对应的多种交互描述信息;
根据多种交互描述信息分别处理对应的分发平台之中的多种用户交互特征,以得到与多个分发平台分别对应的多种平台交互特征。
在本公开的一些实施例中,其中,确定模块502,还包括:
第三确定子模块5023,用于确定与多个分发平台分别对应的多个平台描述信息;
生成模块504,具体用于:
根据多个平台描述信息处理对应的多种维度处理结果,以得到与生产主体对应的目标处理结果。
在本公开的一些实施例中,其中,第三确定子模块5023,具体用于:
根据与分发平台之中的多种用户交互特征分别对应的多种交互描述信息,生成与分发平台对应的平台描述信息。
在本公开的一些实施例中,其中,第二确定子模块5022,具体用于:
根据多种交互描述信息分别对对应的分发平台之中的多种用户交互特征进行加权求和处理,以得到与多个分发平台分别对应的多种加权求和处理结果;
将多种加权求和处理结果分别作为对应的多种平台交互特征。
在本公开的一些实施例中,其中,生成模块504,具体用于:
根据多个平台描述信息对对应的多种维度处理结果进行加权求和,以得到加权求和结果;
对加权求和结果进行归一化处理,并将归一化处理的结果作为与生产主体对应的目标处理结果。
可以理解的是,本实施例附图5中的数据处理装置50与上述实施例中的数据处理装置40,获取模块501与上述实施例中的获取模块401,确定模块502与上述实施例中的确定模块402,处理模块503与上述实施例中的处理模块403,生成模块504与上述实施例中的生成模块404,可以具有相同的功能和结构。
需要说明的是,前述对数据处理方法的解释说明也适用于本实施例的数据处理装置,此处不再赘述。
本实施例中,通过获取生产主体的多种待处理数据,确定与多种待处理数据分别对应的多种维度的参考特征,并采用多种维度的参考特征处理对应的多种待处理数据,以得到与多种维度分别对应的多种维度处理结果,以及根据多种维度处理结果,生成与生产主体对应的目标处理结果,由于是参考多种维度的参考特征来处理生产主体的待处理数据,能够有效提升针对生产主体的数据处理效果,使得数据的处理结果更为准确,有效地提升处理结果的可参考性。
根据本公开的实施例,本公开还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。
图6示出了可以用来实施本公开的实施例的数据处理方法的示例电子设备的示意性框图。
电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本公开的实现。
如图6所示,电子设备600包括计算单元601,其可以根据存储在只读存储器(ROM)602中的计算机程序或者从存储单元608加载到随机访问存储器(RAM)603中的计算机程序,来执行各种适当的动作和处理。在RAM 603中,还可存储电子设备600操作所需的各种程序和数据。计算单元601、ROM 602以及RAM 603通过总线604彼此相连。输入/输出(I/O)接口605也连接至总线604。
电子设备600中的多个部件连接至I/O接口605,包括:输入单元606,例如键盘、鼠标等;输出单元607,例如各种类型的显示器、扬声器等;存储单元608,例如磁盘、光盘等;以及通信单元609,例如网卡、调制解调器、无线通信收发机等。通信单元609允许电子设备600通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
计算单元601可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元601的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元601执行上文所描述的各个方法和处理,例如数据处理方法。例如,在一些实施例中,数据处理方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元608。在一些实施例中,计算机程序的部分或者全部可以经由ROM 602和/或通信单元609而被载入和/或安装到电子设备600上。当计算机程序加载到RAM 603并由计算单元601执行时,可以执行上文描述的数据处理方法的一个或多个步骤。备选地,在其他实施例中,计算单元601可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行数据处理方法。
本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)、互联网及区块链网络。
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,又称为云计算服务器或云主机,是云计算服务体系中的一项主机产品,以解决了传统物理主机与VPS服务("Virtual Private Server",或简称"VPS")中,存在的管理难度大,业务扩展性弱的缺陷。服务器也可以为分布式系统的服务器,或者是结合了区块链的服务器。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本公开公开的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本公开保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等,均应包含在本公开保护范围之内。

Claims (17)

1.一种数据处理方法,包括:
获取生产主体的多种待处理数据;
确定与所述多种待处理数据分别对应的多种维度的参考特征;
采用所述多种维度的参考特征处理对应的所述多种待处理数据,以得到与所述多种维度分别对应的多种维度处理结果;以及
根据所述多种维度处理结果,生成与所述生产主体对应的目标处理结果。
2.根据权利要求1所述的方法,其中,所述确定与所述多种待处理数据分别对应的多种维度的参考特征,包括:
确定与所述多种待处理数据分别对应的多个分发平台;
确定所述多种待处理数据在对应的多个分发平台之中的多种平台交互特征,并将所述多种平台交互特征作为所述多种维度的参考特征。
3.根据权利要求2所述的方法,其中,所述确定所述多种待处理数据在对应的多个分发平台之中的多种平台交互特征,包括:
确定所述多种待处理数据在对应的多个分发平台之中的多种用户交互特征;
确定与所述多种用户交互特征分别对应的多种交互描述信息;
根据所述多种交互描述信息分别处理对应的所述分发平台之中的多种用户交互特征,以得到与所述多个分发平台分别对应的多种平台交互特征。
4.根据权利要求3所述的方法,在所述确定与所述多种待处理数据分别对应的多个分发平台之后,还包括:
确定与所述多个分发平台分别对应的多个平台描述信息;
则所述根据所述多种维度处理结果,生成与所述生产主体对应的目标处理结果,包括:
根据所述多个平台描述信息处理对应的所述多种维度处理结果,以得到与所述生产主体对应的目标处理结果。
5.根据权利要求4所述的方法,其中,所述确定与所述多个分发平台分别对应的多个平台描述信息,包括:
根据与所述分发平台之中的多种用户交互特征分别对应的多种交互描述信息,生成与所述分发平台对应的平台描述信息。
6.根据权利要求3所述的方法,其中,所述根据所述多种交互描述信息分别处理对应的所述分发平台之中的多种用户交互特征,以得到与所述多个分发平台分别对应的多种平台交互特征,包括:
根据所述多种交互描述信息分别对对应的所述分发平台之中的多种用户交互特征进行加权求和处理,以得到与所述多个分发平台分别对应的多种加权求和处理结果;
将所述多种加权求和处理结果分别作为对应的所述多种平台交互特征。
7.根据权利要求4所述的方法,其中,所述根据所述多个平台描述信息处理对应的所述多种维度处理结果,以得到与所述生产主体对应的目标处理结果,包括:
根据所述多个平台描述信息对对应的所述多种维度处理结果进行加权求和,以得到加权求和结果;
对所述加权求和结果进行归一化处理,并将归一化处理的结果作为与所述生产主体对应的目标处理结果。
8.一种数据处理装置,包括:
获取模块,用于获取生产主体的多种待处理数据;
确定模块,用于确定与所述多种待处理数据分别对应的多种维度的参考特征;
处理模块,用于采用所述多种维度的参考特征处理对应的所述多种待处理数据,以得到与所述多种维度分别对应的多种维度处理结果;以及
生成模块,用于根据所述多种维度处理结果,生成与所述生产主体对应的目标处理结果。
9.根据权利要求8所述装置,其中,所述确定模块,包括:
第一确定子模块,用于确定与所述多种待处理数据分别对应的多个分发平台;
第二确定子模块,用于确定所述多种待处理数据在对应的多个分发平台之中的多种平台交互特征,并将所述多种平台交互特征作为所述多种维度的参考特征。
10.根据权利要求9所述装置,其中,所述第二确定子模块,具体用于:
确定所述多种待处理数据在对应的多个分发平台之中的多种用户交互特征;
确定与所述多种用户交互特征分别对应的多种交互描述信息;
根据所述多种交互描述信息分别处理对应的所述分发平台之中的多种用户交互特征,以得到与所述多个分发平台分别对应的多种平台交互特征。
11.根据权利要求10所述装置,其中,所述确定模块,还包括:
第三确定子模块,用于确定与所述多个分发平台分别对应的多个平台描述信息;
所述生成模块,具体用于根据所述多个平台描述信息处理对应的所述多种维度处理结果,以得到与所述生产主体对应的目标处理结果。
12.根据权利要求11所述装置,其中,所述第三确定子模块,具体用于:
根据与所述分发平台之中的多种用户交互特征分别对应的多种交互描述信息,生成与所述分发平台对应的平台描述信息。
13.根据权利要求10所述装置,其中,所述第二确定子模块,具体用于;
根据所述多种交互描述信息分别对对应的所述分发平台之中的多种用户交互特征进行加权求和处理,以得到与所述多个分发平台分别对应的多种加权求和处理结果;
将所述多种加权求和处理结果分别作为对应的所述多种平台交互特征。
14.根据权利要求11所述装置,其中,所述生成模块,具体用于:
根据所述多个平台描述信息对对应的所述多种维度处理结果进行加权求和,以得到加权求和结果;
对所述加权求和结果进行归一化处理,并将归一化处理的结果作为与所述生产主体对应的目标处理结果。
15.一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-7中任一项所述的方法。
16.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据权利要求1-7中任一项所述的方法。
17.一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现根据权利要求1-7中任一项所述的方法。
CN202110523892.3A 2021-05-13 2021-05-13 数据处理方法、装置、电子设备及存储介质 Active CN113220997B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110523892.3A CN113220997B (zh) 2021-05-13 2021-05-13 数据处理方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110523892.3A CN113220997B (zh) 2021-05-13 2021-05-13 数据处理方法、装置、电子设备及存储介质

Publications (2)

Publication Number Publication Date
CN113220997A true CN113220997A (zh) 2021-08-06
CN113220997B CN113220997B (zh) 2023-07-25

Family

ID=77095583

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110523892.3A Active CN113220997B (zh) 2021-05-13 2021-05-13 数据处理方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN113220997B (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103516805A (zh) * 2013-10-10 2014-01-15 贝壳网际(北京)安全技术有限公司 应用分发平台、方法及系统
US20170140060A1 (en) * 2015-11-17 2017-05-18 Spotify Ab System, methods and computer products for determining affinity to a content creator
CN110795658A (zh) * 2019-09-25 2020-02-14 北京三快在线科技有限公司 用户评分方法、装置、电子设备及计算机存储介质
CN110909176A (zh) * 2019-11-20 2020-03-24 腾讯科技(深圳)有限公司 数据推荐方法、装置、计算机设备以及存储介质
CN112560461A (zh) * 2020-12-11 2021-03-26 北京百度网讯科技有限公司 新闻线索的生成方法、装置、电子设备及存储介质
KR20210040316A (ko) * 2020-09-30 2021-04-13 베이징 바이두 넷컴 사이언스 앤 테크놀로지 코., 엘티디. 사용자 상호작용 정보 처리모델 생성방법, 사용자 상호작용 정보 처리방법 및 프로그램

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103516805A (zh) * 2013-10-10 2014-01-15 贝壳网际(北京)安全技术有限公司 应用分发平台、方法及系统
US20170140060A1 (en) * 2015-11-17 2017-05-18 Spotify Ab System, methods and computer products for determining affinity to a content creator
CN110795658A (zh) * 2019-09-25 2020-02-14 北京三快在线科技有限公司 用户评分方法、装置、电子设备及计算机存储介质
CN110909176A (zh) * 2019-11-20 2020-03-24 腾讯科技(深圳)有限公司 数据推荐方法、装置、计算机设备以及存储介质
KR20210040316A (ko) * 2020-09-30 2021-04-13 베이징 바이두 넷컴 사이언스 앤 테크놀로지 코., 엘티디. 사용자 상호작용 정보 처리모델 생성방법, 사용자 상호작용 정보 처리방법 및 프로그램
CN112560461A (zh) * 2020-12-11 2021-03-26 北京百度网讯科技有限公司 新闻线索的生成方法、装置、电子设备及存储介质

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
QIUSHI TIAN: "Random Feature Based Attribute-weighed Kernel Fuzzy Clustering for Non-linear Data", 2019 INTERNATIONAL CONFERENCE ON SECURITY, PATTERN ANALYSIS, AND CYBERNETICS (SPAC) *
卢志刚;孙亚丹;: "基于社会化媒体情境的多维协同智能推荐", 计算机应用, no. 03 *
孙四虎;张国圆;: "基于AI的广电大数据处理平台建设", 广播电视信息, no. 08 *
李家华;: "基于大数据的人工智能跨境电商导购平台信息个性化推荐算法", 科学技术与工程, no. 14 *

Also Published As

Publication number Publication date
CN113220997B (zh) 2023-07-25

Similar Documents

Publication Publication Date Title
CN112487173B (zh) 人机对话方法、设备和存储介质
CN112507040A (zh) 多元关系生成模型的训练方法、装置、电子设备及介质
CN112541122A (zh) 推荐模型的训练方法、装置、电子设备及存储介质
CN111371767B (zh) 恶意账号识别方法、恶意账号识别装置、介质及电子设备
CN113407850B (zh) 一种虚拟形象的确定和获取方法、装置以及电子设备
CN113590776A (zh) 基于知识图谱的文本处理方法、装置、电子设备及介质
CN113360711B (zh) 视频理解任务的模型训练和执行方法、装置、设备及介质
CN112560461A (zh) 新闻线索的生成方法、装置、电子设备及存储介质
CN112818227A (zh) 内容推荐方法、装置、电子设备及存储介质
CN112580666A (zh) 图像特征的提取方法、训练方法、装置、电子设备及介质
CN112926308A (zh) 匹配正文的方法、装置、设备、存储介质以及程序产品
CN113704256B (zh) 数据识别方法、装置、电子设备及存储介质
CN113360672B (zh) 用于生成知识图谱的方法、装置、设备、介质和产品
CN115840867A (zh) 数学解题模型的生成方法、装置、电子设备和存储介质
CN113220997A (zh) 数据处理方法、装置、电子设备及存储介质
CN114118937A (zh) 基于任务的信息推荐方法、装置、电子设备及存储介质
CN113886543A (zh) 生成意图识别模型的方法、装置、介质及程序产品
CN113963011A (zh) 图像识别方法、装置、电子设备及存储介质
CN112817463A (zh) 输入法获取音频数据的方法、设备和存储介质
CN116069914B (zh) 训练数据的生成方法、模型训练方法以及装置
CN115292467B (zh) 信息处理与模型训练方法、装置、设备、介质及程序产品
CN114281981B (zh) 新闻简报的生成方法、装置和电子设备
CN114863215A (zh) 基于深度学习框架生成静态图模型的方法及装置
CN117421681A (zh) 一种异常用户检测方法、装置、电子设备以及存储介质
CN113836418A (zh) 数据的推送方法、装置、电子设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant