CN110309114A

CN110309114A - 媒体信息的处理方法、装置、存储介质和电子装置

Info

Publication number: CN110309114A
Application number: CN201810169261.4A
Authority: CN
Inventors: 谢奕; 汪媛; 江进; 朱若瑜; 徐澜
Original assignee: Tencent Technology Shenzhen Co Ltd
Current assignee: Tencent Technology Shenzhen Co Ltd
Priority date: 2018-02-28
Filing date: 2018-02-28
Publication date: 2019-10-08
Anticipated expiration: 2038-02-28
Also published as: CN110309114B

Abstract

本发明公开了一种媒体信息的处理方法、装置、存储介质和电子装置。其中，该方法包括：获取搜索请求，其中，搜索请求中携带有第一关键词；通过第一目标模型、第一关键词和第一对象的画像数据，确定出多个目标类型下的第一媒体信息，其中，第一目标模型是通过多个类型下的第二媒体信息、第二媒体信息的第二关键词、第二对象的画像数据和第一操作信息对预定模型训练得到的，第一操作信息用于指示第二媒体信息被第二对象执行的目标操作，第一媒体信息在与第一关键词相关联的媒体信息中被第一对象执行目标操作的概率最大；显示多个目标类型下的第一媒体信息。本发明解决了相关技术中媒体信息处理的效率低的技术问题。

Description

媒体信息的处理方法、装置、存储介质和电子装置

技术领域

本发明涉及计算机领域，具体而言，涉及一种媒体信息的处理方法、装置、存储介质和电子装置。

背景技术

目前，文案制作工具只是简单地实现了产品和关键词上的媒体信息的搜搜，比如，实现优秀案例搜索，可以在文案制作工具中加入智能改写的功能，根据媒体信息的标题卖点，通过简单地增加感召体、后悔体文案来实现媒体信息的优化。

上述方法虽然可以实现媒体信息搜索，但是缺乏对媒体信息的行业标题文案在不同维度下的词库、句式、优秀案例等的推荐，比如，缺乏卖点和撰写技巧细分下的词库、句式、优秀案例等的推荐，同时也缺乏对媒体信息的标题文案效果的评价和有针对性的修改建议，存在对媒体信息处理的效率低的问题。

针对上述的媒体信息处理的效率低的问题，目前尚未提出有效的解决方案。

发明内容

本发明实施例提供了一种媒体信息的处理方法、装置、存储介质和电子装置，以至少解决相关技术中媒体信息处理的效率低的技术问题。

根据本发明实施例的一个方面，提供了一种媒体信息的处理方法。该方法包括：获取搜索请求，其中，搜索请求中携带有第一关键词；通过第一目标模型、第一关键词和第一对象的画像数据，确定出多个目标类型下的第一媒体信息，其中，第一目标模型是通过多个类型下的第二媒体信息、第二媒体信息的第二关键词、第二对象的画像数据和第一操作信息对预定模型训练得到的，第一操作信息用于指示第二媒体信息被第二对象执行的目标操作，第一媒体信息在与第一关键词相关联的媒体信息中被第一对象执行目标操作的概率最大；显示多个目标类型下的第一媒体信息。

根据本发明实施例的另一方面，还提供了一种媒体信息的处理装置。该装置包括：获取单元，用于获取搜索请求，其中，搜索请求中携带有第一关键词；确定单元，用于通过第一目标模型、第一关键词和第一对象的画像数据，确定出多个目标类型下的第一媒体信息，其中，第一目标模型是通过多个类型下的第二媒体信息、第二媒体信息的第二关键词、第二对象的画像数据和第一操作信息对预定模型训练得到的，第一操作信息用于指示第二媒体信息被第二对象执行的目标操作，第一媒体信息在与第一关键词相关联的媒体信息中被第一对象执行目标操作的概率最大；显示单元，用于显示多个目标类型下的第一媒体信息。

根据本发明实施例的另一方面，还提供了一种存储介质。该存储介质中存储有计算机程序，其中，计算机程序被设置为运行时执行本发明实施例的媒体信息的处理方法。

根据本发明实施例的另一方面，还提供了一种电子装置，包括存储器和处理器，其特征在于，存储器中存储有计算机程序，处理器被设置为通过计算机程序执行本发明实施例的媒体信息的处理方法。

在本发明实施例中，获取搜索请求，其中，搜索请求中携带有第一关键词；通过第一目标模型、第一关键词和第一对象的画像数据，确定出多个目标类型下的第一媒体信息，其中，第一目标模型是通过多个类型下的第二媒体信息、第二媒体信息的第二关键词、第二对象的画像数据和第一操作信息对预定模型训练得到的，第一操作信息用于指示第二媒体信息被第二对象执行的目标操作，第一媒体信息在与第一关键词相关联的媒体信息中被第一对象执行目标操作的概率最大；显示多个目标类型下的第一媒体信息。由于通过细分的多个类型下的第二媒体信息、第二媒体信息的第二关键词、第二对象的画像数据和第一操作信息对预定模型训练得到第一目标模型，通过第一目标模型有针对性地根据搜索请求携带的行业核心的第一关键词和第一对象的画像数据确定出多个目标类型下的第一媒体信息，达到了快速通过搜索方式找到优秀的第二媒体信息的目的，从而实现了提高媒体信息处理的效率的技术效果，进而解决了相关技术中媒体信息处理的效率低的技术问题。

附图说明

此处所说明的附图用来提供对本发明的进一步理解，构成本申请的一部分，本发明的示意性实施例及其说明用于解释本发明，并不构成对本发明的不当限定。在附图中：

图1是根据本发明实施例的媒体信息的处理方法的硬件环境的示意图；

图2是根据本发明实施例的一种媒体信息的处理方法的流程图；

图3是根据本发明实施例的一种对营销文案的关键词进行提取的方法的流程图；

图4是根据本发明实施例的一种营销文案优化服务的示意图；

图5是根据本发明实施例的营销文案关键词扩散与生成的方法流程示意图；

图6是根据本发明实施例的一种效果词库的产品逻辑的示意图；

图7是根据本发明实施例的一种扩散、推荐模型的示意图；

图8是根据本发明实施例的一种日化行业共词矩阵语义网络的示意图；

图9是根据本发明实施例的一种行业、卖点、目标定向信息选择的示意图；

图10是根据本发明实施例的一种搜索关键词的示意图；

图11是根据本发明实施例的一种优秀广告案例复用编辑的示意图；

图12是根据本发明实施例的一种对维度信息进行选择的示意图；

图13是根据本发明实施例的一种词库和句式工具优化推荐的示意图；

图14是根据本发明实施例的一种媒体信息的处理装置的示意图；以及

图15是根据本发明实施例的一种电子装置的结构框图。

具体实施方式

为了使本技术领域的人员更好地理解本发明方案，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分的实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都应当属于本发明保护的范围。

需要说明的是，本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

根据本发明实施例的一个方面，提供了一种媒体信息的处理方法的实施例。

可选地，在本实施例中，上述媒体信息的处理方法可以应用于如图1所示的由服务器102和终端104所构成的硬件环境中。图1是根据本发明实施例的媒体信息的处理方法的硬件环境的示意图。如图1所示，服务器102通过网络与终端104进行连接，上述网络包括但不限于：广域网、城域网或局域网，终端104并不限定于PC、手机、平板电脑等。本发明实施例的媒体信息的处理方法可以由服务器102来执行，也可以由终端104来执行，还可以是由服务器102和终端104共同执行。其中，终端104执行本发明实施例的媒体信息的处理方法也可以是由安装在其上的客户端来执行。

图2是根据本发明实施例的一种媒体信息的处理方法的流程图。如图2所示，该方法可以包括以下步骤：

步骤S202，获取搜索请求，其中，搜索请求中携带有第一关键词。

在本申请上述步骤S202提供的技术方案中，搜索请求中携带有第一关键词，用于搜索与第一关键词相关联的媒体信息，该媒体信息可以为广告文案，该第一关键词可以为营销文案关键词。该实施例的搜索请求可以为在线服务的用户请求，可以携带有第一关键词。可选地，在文案制作工具的搜索框中，当用户输入第一关键词中，则发起携带有第一关键词的搜索请求。

步骤S204，通过第一目标模型、第一关键词和第一对象的画像数据，确定出多个目标类型下的第一媒体信息。

在本申请上述步骤S204提供的技术方案中，通过第一目标模型、第一关键词和第一对象的画像数据，确定出多个目标类型下的第一媒体信息，其中，第一目标模型是通过多个类型下的第二媒体信息、第二媒体信息的第二关键词、第二对象的画像数据和第一操作信息对预定模型训练得到的，第一操作信息用于指示第二媒体信息被第二对象执行的目标操作，第一媒体信息在与第一关键词相关联的媒体信息中被第一对象执行目标操作的概率最大。

在该实施例中，第一目标模型通过机器学习训练得到，通过多个类型的第二媒体信息、第二媒体信息的第二关键词、第二对象的画像数据和第一操作信息对预定模型进行训练得到，其中，多个类型可以为第二媒体信息的多个维度，比如，为营销文案的多个维度，可以为产品卖点、行业分类、话术技巧、心理诉求、撰写技巧等，还可以为属性，比如，为用户、行业等属性；第二媒体信息的第二关键词可以为预先准备的广告文案关键词，第二对象也即用户，可以专指广告主、广告代理商、广告创意相关人员等，第二对象的画像数据是指用于表征第二对象特征的数据，可以为提前准备的第二对象的画像数据，可以包含第二对象的一些设备信息、第二对象的性别、第二对象的年龄、第二对象的地理位置信息、第二对象的兴趣等，将第二对象的画像数据存储在集群分布式文件系统(HDFS)上，其中，设备信息可以为安卓、IOS等操作系统信息；第一操作信息可以为对第二媒体信息进行点击操作的信息，可以为点击流日志(log)，比如，服饰行业某文案广告被某些用户点击等，经过开源、分布式、高容错的实时计算系统(Storm)来实时数据处理存储在集群HDFS上；预定模型可以为初始建立的检测模型，可以为初始神经网络模型，该初始神经网络模型是以神经元的数学模型为基础来描述的，而该神经元是通过一开始采集的媒体信息、媒体信息的关键词、对象的信息和操作信息建立起来的。

可选地，该实施例在对预定模型进行训练得到第一目标模型时，通过机器学习来解析多个类型的第二媒体信息、第二媒体信息的第二关键词、第二对象的画像数据和第一操作信息，从中学习来对预定模型进行训练。可选地，该实施例应用分布式计算框架，比如，采用内存迭代式计算的分布式机器学习训练框架(Spark)来对预定模型进行训练。其中，在通过机器学习来解析多个类型的第二媒体信息、第二媒体信息的第二关键词、第二对象的画像数据和第一操作信息时，可以对多个类型的第二媒体信息、第二媒体信息的第二关键词、第二对象的画像数据和第一操作信息按照分布一致性算法、去噪、采样等算法进行预处理，再从预处理后的数据中进行特征提取、特征变换、特征归一、特征组合等得到用于训练预定模型的特征，进一步通过优化算法、假设函数、损失函数、决策边界、收敛速度、迭代策略等对特征进行处理，得到第一目标模型。最后还可以对第一目标模型进行交叉验证、评估目标、过拟合、欠拟合等评价，从而确定出训练好的第一目标模型。

在通过多个类型下的第二媒体信息、第二媒体信息的第二关键词、第二对象的画像数据和第一操作信息对预定模型训练得到第一目标模型之后，通过第一目标模型、第一关键词和第一对象的画像数据，确定出多个目标类型下的第一媒体信息，其中，第一对象也即用户，可以专指广告主、广告代理商、广告创意相关人员等，第一对象的画像数据是指用于表征第一对象特征的数据，可以包含第一对象的一些设备信息、第一对象的性别、第一对象的年龄、第一对象的地理位置信息、第一对象的兴趣等，第一关键词、第一对象的画像数据可以为第一目标模型的输入，第一媒体信息可以为第一目标模型的输出，该第一目标模型的输出还可以包括第一媒体信息的操作信息，比如，预估第一媒体信息被执行点击操作的点击概率，也即，点击率预估，该第一目标模型可以为点击率预估模型。

该实施例的第一媒体信息可以属于多个目标类型，该多个目标类型可以为第一媒体信息的多个维度，可以为产品卖点、行业分类、话术技巧、心理诉求、撰写技巧等，此处不做任何限制。第一媒体信息在与第一关键词相关联的媒体信息中被第一对象执行目标操作的概率最大，也即，第一媒体信息为在与第一关键词相关联的媒体信息中，最有可能被第一对象执行目标操作的媒体信息，可以为最有可能被点击的广告文案。

该实施例可以提取媒体信息的特征，包括提取广告图片的特征，来对预定模型进行训练，得到训练后的第一目标模型，这样可以发现媒体信息与媒体信息被执行点击操作的点击率之间的关系，从而指导媒体信息的设计，使得媒体信息达到最优效果。

可选地，深度学习属于机器学习，为用于建立、模拟人脑进行分析学习的神经网络，可以模仿人脑的机制来解释数据，比如，图像、声音和文本等，属于无监督学习的一种。该实施例还可以采用深度学习(wide&deep)模型来分析媒体信息的特征与被执行目标操作的概率之间的关系，比如，分析营销文案特征与点击率的关系，考虑更多更复杂的文案信息，考虑更多更复杂的媒体信息，比如，通过媒体信息中的图片信息来对预定模型进行训练，从而得到训练后的第一目标模型。

步骤S206，显示多个目标类型下的第一媒体信息。

在本申请上述步骤S206提供的技术方案中，在通过第一目标模型、第一关键词和第一对象的画像数据，确定出多个目标类型下的第一媒体信息之后，显示多个目标类型下的第一媒体信息，可以在文案制作工具的目标区域显示多个目标类型下的第一媒体信息，使得用户可以直观地看到通过第一目标模型、第一关键词和第一对象的画像数据，确定出的第一媒体信息。该第一媒体信息可以显示在文案制作工具的界面辨识度比较高的区域内，比如，显示在与第一关键词相关联的媒体信息的最前面。

通过上述步骤S202至步骤S206，获取搜索请求，其中，搜索请求中携带有第一关键词；通过第一目标模型、第一关键词和第一对象的画像数据，确定出多个目标类型下的第一媒体信息，其中，第一目标模型是通过多个类型下的第二媒体信息、第二媒体信息的第二关键词、第二对象的画像数据和第一操作信息对预定模型训练得到的，第一操作信息用于指示第二媒体信息被第二对象执行的目标操作，第一媒体信息在与第一关键词相关联的媒体信息中被第一对象执行目标操作的概率最大；显示多个目标类型下的第一媒体信息由于通过细分的多个类型下的第二媒体信息、第二媒体信息的第二关键词、第二对象的画像数据和第一操作信息对预定模型训练得到第一目标模型，通过第一目标模型有针对性地根据搜索请求携带的行业核心的第一关键词和第一对象的画像数据确定出多个目标类型下的第一媒体信息，达到了快速通过搜索方式找到优秀的第二媒体信息的目的，从而实现了提高媒体信息处理的效率的技术效果，进而解决了相关技术中媒体信息处理的效率低的技术问题。

作为一种可选的实施方式，步骤S204，通过第一目标模型、第一关键词和第一对象的画像数据，确定出多个目标类型下的第一媒体信息包括：响应由目标操作产生的目标操作指令，获取多个目标类型；通过第一目标模型、第一关键词和第一对象的画像数据，确定出多个目标类型下的第一媒体信息。

在该实施例中，第一媒体信息可以属于多个目标类型，该多个目标类型可以为第一媒体信息的多个维度，可以为产品卖点、行业分类、话术技巧、心理诉求、撰写技巧等，此处不做任何限制。该实施例的目标操作可以为用户在文案制作工具中进行的单击操作、双击操作、在目标区域停留预设时间所触发的操作等，此处不做任何限制，目标操作会产生目标操作指令，该目标操作指令用于触发在文案制作工具上选择多个目标类型。

可选地，该实施例通过目标操作对文案制作工具上的众多维度进行选择，确定出第一媒体信息的多个维度，比如，对多个维度进行选择，当文案制作工具的目标界面上显示的某个维度前显示出“√”记号时，可以指示出该某个维度被选中，从而实现获取第一媒体信息所属的多个目标类型。在响应由目标操作产生的目标操作指令，获取第一媒体信息所属的多个目标类型之后，通过第一目标模型、第一关键词和第一对象的画像数据，确定出多个目标类型下的第一媒体信息，也即，该第一媒体信息限定在多个目标类型下，从而实现对行业和产品颗粒度上的维度细分。

作为一种可选的实施方式，在步骤S206，显示多个目标类型下的第一媒体信息之前，该方法还包括：显示多个目标类型下的预先定义的媒体信息，其中，预先定义的媒体信息用于对第一媒体信息进行更新。

在该实施例中，可以在文案工具的目标区域中显示多个目标类型下的预先定义的媒体信息，该预先定义的媒体信息可以为预先设定的优秀的广告案例，可以作为对第一媒体信息涉及的词库、句式等进行进一步优化的参考案例，比如，现有的广告文案缺乏互动性，可以从参与感和认同感层面出发，通过参考案例来对第一媒体信息涉及的词库、句式等进行进一步设计，使得第一媒体信息得到更新，从而提高了对媒体信息进行处理的效率。

作为一种可选的实施方式，在获取搜索请求之后或在获取搜索请求之前，该方法还包括：获取目标指标，其中，目标指标用于指示第一目标模型确定出多个目标类型下的第一媒体信息所消耗的时间；通过目标指标调整第一目标模型的参数，得到第二目标模型，其中，第二目标模型确定出多个目标类型下的第一媒体信息所消耗的时间小于第一目标模型确定出多个目标类型下的第一媒体信息所消耗的时间；通过第一目标模型、第一关键词和第一对象的画像数据，确定出多个目标类型下的第一媒体信息包括：通过第二目标模型、第一关键词和第一对象的画像数据，确定出多个目标类型下的第一媒体信息。

在该实施例中，目标指标可以为模型评价指标，可以为服务效果数据，包括媒体信息的点击率数据，第一目标模型的AUC等，该目标指标作为一个量化的指标用来衡量第一目标模型的性能，也即，衡量第一目标模型的优劣，可以用于指示第一目标模型确定出多个目标类型下的第一媒体信息所消耗的时间。通过目标指标调整第一目标模型的参数，比如，调整第一目标模型的正则化系数、学习率等参数，可以进一步调整整广告文案(包含广告图片文案)的关键词特征与用户的属性等特征的组合关系，以优化第一目标模型的性能，得到第二目标模型。可选地，第二目标模型确定出多个目标类型下的第一媒体信息所消耗的时间小于第一目标模型确定出多个目标类型下的第一媒体信息所消耗的时间，通过更优的第二目标模型，以及第一关键词和第一对象的画像数据，确定出多个目标类型下的第一媒体信息，使得确定出的第一媒体信息的质量更优，提高了对媒体信息的处理效率。

作为一种可选的实施方式，在通过第二目标模型、第一关键词和第一对象的画像数据，确定出多个目标类型下的第一媒体信息之后，该方法还包括：获取由第二目标模型指示的第一媒体信息的偏好数据、与第一媒体信息的类型相关联的目标词语，其中，偏好数据用于指示第一媒体信息的类型与第一媒体信息之间的匹配度；通过偏好数据、目标词语调整第一媒体信息，得到调整后的第一媒体信息，其中，调整后的第一媒体信息被执行目标操作的概率高于调整前的第一媒体信息被执行目标操作的概率。

在该实施例中，第二目标模型可以用于指示第一媒体信息的偏好数据、与第一媒体信息的类型相关联的目标词语，其中，第一媒体信息的偏好数据用于指示第一媒体信息的类型与第一媒体信息之间的匹配度，比如，用于指示第一媒体信息的类型对第一媒体信息的偏好关系，可选地，该偏好数据用于指示用户、行业等属性与广告文案的偏好关系，当目标词语为效果词汇时，还可以用于指示与各个属性相关的效果词汇。在获取由第二目标模型指示的第一媒体信息的偏好数据、与第一媒体信息的类型相关联的目标词语之后，通过偏好数据、目标词语调整第一媒体信息，得到调整后的第一媒体信息，从而实现通过第一媒体信息的偏好数据、与第一媒体信息的类型相关联的目标词语，进一步指导第一媒体信息的设计的目的。

该实施例的调整后的第一媒体信息被执行目标操作的概率高于调整前的第一媒体信息被执行目标操作的概率，比如，对于服饰行业，打折品牌的第一媒体信息采用效果词“便宜”比“限量”要好，将第一媒体信息中的效果词“限量”调整为“便宜”，这样采用效果词“便宜”的第一媒体信息被执行点击操作的概率要高于采用效果词“限量”的第一媒体信息被执行点击操作的概率。

作为一种可选的实施方式，在步骤S204，通过第一目标模型、第一关键词和第一对象的画像数据，确定出多个目标类型下的第一媒体信息之前，该方法还包括：对第二媒体信息中的文字进行分词，得到第一数量的单词；对第一数量的单词按照词性进行过滤，得到第二数量的单词，其中，第二数量不大于第一数量；从第二数量的单词中提取出第二关键词。

在该实施例中，在通过第一目标模型、第一关键词和第一对象的画像数据，确定出多个目标类型下的第一媒体信息之前，通过多个类型下的第二媒体信息、第二媒体信息的第二关键词、第二对象的画像数据和第一操作信息对预定模型训练得到第一目标模型，可以对第二媒体信息中的文字进行分词，得到第一数量的单词，可以采用分词工具(Jieba)对第二媒体信息中的文字进行分词，可选地，第二媒体信息为广告文案，采用分词工具对广告文案逐个切分成第一数量的单词。在对第二媒体信息中的文字进行分词，得到第一数量的单词之后，可以对第一数量的单词按照词性进行过滤，主要用来删除频繁无用词、停用词等，可以保留名词类、动词类、形容词以及英文词等，从而得到第二数量的单词，该第二数量不大于第一数量。

该实施例在对第一数量的单词按照词性进行过滤，得到第二数量的单词之后，从第二数量的单词中提取出第二关键词，可以根据第二媒体信息中的词频以及文档频，根据用于信息检索与数据挖掘的常用加权技术(TermFequency–Inverse Document Frequency，简称为TF-IDF)等提取关键词的算法，从第二媒体信息中提取出第二关键词，比如，进一步根据在当前所有广告文案中的词频以及文档频，根据类似TF-IDF关键词算法等提取得到当前广告文案的关键词。在从第二媒体信息中提取出第二关键词之后，通过多个类型下的第二媒体信息、第二媒体信息的第二关键词、第二对象的画像数据和第一操作信息对预定模型训练得到第一目标模型，进而通过第一目标模型、第一关键词和第一对象的画像数据，确定出多个目标类型下的第一媒体信息，并显示多个目标类型下的第一媒体信息，从而提高了对媒体信息进行处理的效率。

可选地，该实施例采用卷积神经网络从第二数量的单词中提取出第二关键词，比如，采用卷积神经网络来抽取抽象的文案关键词特征，还可以采用循环神经网络来抽取隐含的媒体信息的上下文关系，其中，卷积神经网络是一种前馈神经网络，人工神经元可以响应周围单元，可以用于从第二数量的单词中提取出第二关键词，循环神经网络是一种节点定向连接成环的人工神经网络，这种网络的内部状态可以展示动态时序行为，不同于前馈神经网络的是，循环神经网络可以利用它内部的记忆来处理任意时序的输入序列，这让它可以更容易抽取隐含的媒体信息的上下文关系。

作为一种可选的实施方式，对第二媒体信息中的文字进行分词，得到第一数量的单词包括：对第二媒体信息包括的目标文本和目标图片中的文字进行分词，得到第一数量的单词。

在该实施例中，第二媒体信息可以包括目标文本和目标图片，该目标图片可以包含文字，可以通过图像识别算法识别出目标图片中的文字。将目标文本和目标图片中包含的文字进行拼接，对拼接后的文字进行分词，从而得到第一数量的单词。可选地，第二媒体信息为营销文案，营销文案通常包括文本与图片，其中，图片中通常包含文字，首先需要通过图像识别算法识别得到其中的文字，然后将营销文案的文本与营销文案的图片中的文字拼接构成需要进行分词的文案，以得到第一数量的单词，进而按照词性进行过滤，得到第二数量的单词，从第二数量的单词中提取出第二关键词，进而实现通过多个类型下的第二媒体信息、第二媒体信息的第二关键词、第二对象的画像数据和第一操作信息对预定模型训练得到第一目标模型的目的，通过第一目标模型、第一关键词和第一对象的画像数据，确定出多个目标类型下的第一媒体信息，并显示多个目标类型下的第一媒体信息，提高了对媒体信息进行处理的效率。

作为一种可选的实施方式，对第二媒体信息包括的目标文本和目标图片中的文字进行分词，得到第一数量的单词包括：通过目标分词词典对第二媒体信息包括的目标文本和目标图片中的文字进行分词，得到第一数量的单词。

在该实施例中，在对第二媒体信息包括的目标文本和目标图片中的文字进行分词，得到第一数量的单词时，可以预先加载目标分词词典，通过目标分词词典对第二媒体信息包括的目标文本和目标图片中的文字进行分词，得到第一数量的单词，该目标分词词典可以包含广告常见术语，比如，包括“看过来”、“包邮”、“会呼吸”等，保证分词的准确性，从而防止错误分词，比如，防止将“包邮”分成“包”和“邮”这样的错误分词。

需要说明的是，该实施例的媒体信息中除了包括文字、图片之外，还可以包括除了图片和文字之外的语音，比如，包括将文字转成语音形式的文案也在本发明实施例的范围之内。

作为一种可选的实施方式，在从第二数量的单词中提取出第二关键词之后，该方法还包括：对第二关键词进行编码，得到编码后的第二关键词，其中，编码后的第二关键词为离散的关键词；使用多个类型下的第二媒体信息、编码后的第二关键词、第二对象的画像数据和第一操作信息对预定模型进行训练，得到训练好的第一目标模型。

在该实施例中，在从第二数量的单词中提取出第二关键词之后，对第二关键词进行编码，得到编码后的第二关键词，其中，编码后的第二关键词为离散的关键词；使用多个类型下的第二媒体信息、编码后的第二关键词、第二对象的画像数据和第一操作信息对预定模型进行训练，得到训练好的第一目标模型。

在从第二数量的单词中提取出第二关键词之后，可以对第二关键词进行编码，编码后的第二关键词为离散的关键词，也即，对第二关键词进行离散化编码，以方便对预定模型进行训练得到第一目标模型，比如，将第二关键词“包邮”编码为100，第二关键词“看过来”编码为101，进而使用多个类型下的第二媒体信息、编码后的第二关键词、第二对象的画像数据和第一操作信息对预定模型进行训练，得到训练好的第一目标模型，通过第一目标模型、第一关键词和第一对象的画像数据，确定出多个目标类型下的第一媒体信息，并显示多个目标类型下的第一媒体信息，从而提高对第一媒体信息进行处理的效率。

作为一种可选的实施方式，在从第二数量的单词中提取出第二关键词之后，该方法还包括：获取第二关键词的高维稀疏向量；获取与高维稀疏向量对应的稠密向量；对稠密向量中的关键词进行扩散，得到第三关键词，其中，第三关键词的数量大于第二关键词的数量；通过第三关键词生成第三媒体信息，其中，第三媒体信息与第一媒体信息之间的相似度在第一目标阈值内。

该实施例可以针对各个行业的属性，对第二关键词进行扩散，以得到更多的媒体信息。在从第二数量的单词中提取出第二关键词之后，获取第二关键词的高维稀疏向量，可以根据营销文案关键词得到每个广告的文案关键词的高维稀疏向量，构成高维稀疏向量的原因在于，通常媒体信息的文字个数都会比较少，比如，每个广告文案(包含广告图片文案)的文字个数都会比较少，提取得到的关键词可能只有各位数，然而所有广告文案的关键词集合可能会到上万级别，因此针对每一个广告文案的关键词是高维稀疏向量。在获取第二关键词的高维稀疏向量之后，获取与高维稀疏向量对应的稠密向量，可以对第二关键词的高维稀疏向量通过词向量模型Word2Vec模型来实现将高维稀疏向量压缩成低维度的稠密向量，比如，可以将10000个第二关键词构成的稀疏向量(每个文案若存在该关键词，则当前值为1)，通过词向量模型压缩成300维左右的稠密向量(每个数值为double型的数)，从而达到降维的目的。其中，Word2vec模型为用于将字词转化为计算机可以应用的稠密向量的模型。

该实施例的稠密向量包括优秀的关键词，在获取与高维稀疏向量对应的稠密向量之后，对稠密向量中的关键词进行扩散，得到第三关键词，该第三关键词的数量大于第二关键词的数量，也即，通过对稠密向量中的关键词进行扩散，得到更多的关键词，通过第三关键词自动生成第三媒体信息，该第三媒体信息与第一媒体信息之间的相似度在第一目标阈值内，该第一目标阈值为用于衡量第三媒体信息与第一媒体信息之间的相似度的阈值，该第三媒体信息为第一媒体信息的类似媒体信息，可以提供给产品侧的用户进行进一步筛选。

可选地，该实施例采用类似协同过滤、聚类等其它算法来优化关键词扩散算法的效果，从而为媒体信息设计的产品和广告主提供思路和创意，其中，协同过滤可以用于分辨某类特定用户可能感兴趣的媒体信息，这些结论来自于对其他相似用户对哪些媒体信息感兴趣的分析，以对媒体信息中的关键词进行扩散，聚类可以为用于将媒体信息的关键词的集合分成由类似的媒体信息的关键词组成的多个类的过程，从而实现对媒体信息的关键词进行扩散。

可选地，该实施例通过模型训练营销文案关键词向量，得到词向量矩阵，从而进一步扩散得到相关文案关键词，可以实现从行业维度/卖点等维度上的优秀标题文案的搜索，并且经过文案自动生成、句式优化，给出参考的广告文案，提高了对媒体信息进行处理的效率。

作为一种可选的实施方式，对稠密向量中的关键词进行扩散，得到第三关键词包括：对稠密向量中的关键词进行扩散，得到与第二关键词的相似度在第二目标阈值内的第三关键词，其中，第三关键词的数量由第二目标阈值确定。

在该实施例中，在对稠密向量中的关键词进行扩散，得到第三关键词时，对稠密向量中的关键词进行扩散，得到与第二关键词的相似度在第二目标阈值内的第三关键词，该第二目标阈值为关键词相似度阈值，该第三关键词的数量由第二目标阈值确定，可以通过调节第二目标阈值通过第一稠密向量中的关键词进行扩散得到的第三关键词的数量，进而可以调整由第三关键词生成的第三媒体信息的数量，提高了对媒体信息进行处理的效率。

作为一种可选的实施方式，通过第三关键词生成第三媒体信息包括：在第三关键词有效的情况下，通过第三关键词生成第三媒体信息。

在该实施例中，可以验证扩散的第三关键词是否有效，比如，通过营销文案服务进一步验证扩散的第三关键词是否有效，该营销文案服务可以为在线服务，用于表示提供的营销文案优化服务。在第三关键词有效的情况下，通过第三关键词生成第三媒体信息。

该实施例的媒体信息可以为广告文案，可以通过提取得到广告文案的关键词，到和用户、行业等属性相关的效果词，根据现有各个属性相关的效果词进一步扩散得到词库，通过文案自动生成、句式优化，提供广告文案创意，来进一步指导文案设计，从而提升对广告文案的设计效果。

该实施例可以通过综合广告文本和图像的文案，整体考虑广告文案的内容，通过第一目标模型和广告文案营销服务，得到文案关键词的重要性程度以及用户、行业等属性与文案关键词的偏好程度，通过关键词扩散，得到更多的优秀关键词，可以提供给产品侧和广告主进行筛选，并且通过在线服务进行验证扩散的关键词是否有效，提高了对广告文案的处理效率。

需要说明的是，对于前述的各方法实施例，为了简单描述，故将其都表述为一系列的动作组合，但是本领域技术人员应该知悉，本发明并不受所描述的动作顺序的限制，因为依据本发明，某些步骤可以采用其他顺序或者同时进行。其次，本领域技术人员也应该知悉，说明书中所描述的实施例均属于优选实施例，所涉及的动作和模块并不一定是本发明所必须的。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端设备(可以是手机，计算机，服务器，或者网络设备等)执行本发明各个实施例所述的方法。

下面结合优选的实施例对本发明的技术方案进行说明，具体以媒体信息为广告文案进行举例说明。

下面对本发明实施例的营销文案关键词提取进行介绍。

该实施例的优化营销文案首先对营销文案的关键词进行提取，并经过识别、离散化之后进一步为后面的点击率预估模型以及关键词扩散模型服务。

图3是根据本发明实施例的一种对营销文案的关键词进行提取的方法的流程图。如图3所示，该方法包括以下步骤：

步骤S301，对营销文案中的文本和营销文案中的图片的文字进行拼接。

在该实施例中，营销文案两种主要形式包括文本与图片。其中，图片可以为广告图像，通常包含文字，需要通过图像识别算法对图片中的文字进行识别字。然后将营销文案中的文字和图片中的文字拼接构成当前广告的文案。

步骤S302，对拼接后的广告文案进行分词处理，得到多个单词。

在对营销文案中的文本和营销文案中的图片的文字进行拼接之后，对拼接后的广告文案进行分词处理，得到多个单词。可以采用Jieba等分词工具将广告文案进行切分成逐个单词。可选地，需要预先加载一个自定义分词字典，该字典主要包含广告常见术语，比如，包括“看过来”、“包邮”、“会呼吸”等，加载自定义字典的作用在于保证分词的准确性否则例如“包邮”可能会被分成“包”和“邮”，从而防止错误分词。

步骤S303，对多个单词进行词性过滤，得到过滤后的单词。

该实施例针对分词之后的广告文案的多个单词进行词性过滤，得到过滤后的单词，以删除频繁无用词、停用词等，一般需要保留名词类、动词类、形容词以及英文词。

步骤S304，从过滤后的单词中提取出关键词。

在对多个单词进行词性过滤，得到过滤后的单词之后，从过滤后的单词中提取出关键词，可以进一步根据在当前所有广告文案中的词频以及文档频，根据类似TF-IDF关键词算法等提取得到当前广告文案的关键词。

步骤S305，对提取出的关键词进行离散化编码。

在从过滤后的单词中提取出关键词之后，对提取出的关键词进行离散化编码。在该实施例中，营销文案中的文字和图片中的文字拼接在一起的广告文案将保留其最重要的关键词，需要对其关键词进行离散化编码，从而方便后续进一步模型训练。

该实施例通过上面的营销文案关键词提取，可以将广告中的图像和文字文案提取出关键词并进行离散化编码，从而为下一步的模型训练做准备。

下面对本发明实施例的营销文案优化服务进行介绍。

在该实施例中，通过信息流营销文案服务可以进一步发现广告文案与点击率的关系，从而得到各个用户属性、行业属性等相关的效果词库。

图4是根据本发明实施例的一种营销文案优化服务的示意图。如图4所示，该营销文案优化服务可以将编码后的关键词存储在HDFS上。该实施例在模型更新侧，需要提前根据上述的营销文案关键词提取得到营销文案的所属行业、产品类别信息等，并将编码后的关键词存储在集群HDFS上。

将用户的画像数据存储在HDFS上。该实施例在模型更新侧，需要提前准备用户的画像数据，主要包含广告用户的一些设备信息(比如，安卓还是IOS)、用户性别、用户地理位置信息等，将画像数据存储在集群HDFS上。

将广告点击流日志经过Storm实时数据处理存储在分布式文件系统HDFS上。该实施例在模型更新侧，将实时的广告点击流日志log(比如，服饰行业某文案广告被某些用户点击等)经过实时计算系统Storm实时数据处理存储在集群HDFS上。

该实施例的应用分布式计算框架(Spark)根据HDFS集群上的文案编码、用户画像数据以及文案点击数据训练得到目标模型。该实施例在模型更新侧，可以应用分布式计算框架，根据HDFS集群上的文案编码、用户画像数据以及文案点击数据(比如，哪些文案被哪些用户点击)，训练得到模型，可以将用户与广告文案(包含广告图片文字)以及是否点击解析成样本，进而通过样本训练模型得到模型参数。

当有客户端请求服务时，根据当前用户的画像数据以及当前的文案数据(文案A、文案B)，计算得到最有可能点击的广告文案，并且生成对应的广告文案，实现用户交互体验，进而将最有可能点击的广告文案的实际点击数据记录为广告点击流日志。

该实施例在在线服务侧，当有用户请求服务时，可以根据当前用户的画像数据以及当前的文案数据，计算得到最有可能点击的广告文案，并且生成对应的广告文案，进而返回给用户。

根据当前模型和在线服务侧的服务效果数据，进一步迭代优化模型，得到用户、行业等属性与文案的偏好关系，得到各个属性相关的效果词汇，从而进一步指导广告文案设计

该实施例的服务效果数据一般可以为广告的点击率数据，模型的AUC等，作为一个量化的指标可以用来衡量模型的性能，根据当前模型和在线服务侧的服务效果数据，进一步迭代优化模型，比如，调整广告文案(包含广告图片文案)的关键词特征与用户的属性等特征的组合关系，调整模型的参数，比如，调整正则化系数、学习率等参数，优化模型的性能，得到用户、行业等属性与文案的偏好关系，得到各个属性相关的效果词汇，比如，服饰行业，打折品牌采用效果词“便宜”比“限量”要好，从而进一步指导广告文案设计。

该实施例的营销文案优化服务充分提取文案的特征，并经过信息流广告用户的点击流反馈日志训练得到模型，从而进一步优秀文案的形式以及文案与用户、行业等属性特征的偏好关系，得到各个用户属性、行业属性等相关的效果词库，进而用来指导文案设计与投放。

下面对本发明实施例的营销文案关键词扩散与生成进行介绍。

该实施例通过扩散模型，针对各个行业等属性，得到更多的营销文案，并经过营销文案优化服务来验证扩散的关键词是否有效。

图5是根据本发明实施例的营销文案关键词扩散与生成的方法流程示意图。如图5所示，该方法包括以下步骤：

步骤S501，根据营销文案关键词提取得到每个广告的文案关键词高维稀疏向量。

在该实施例中，构成高维稀疏向量的原因在于，通常每个广告文案(包含广告图片文案)的文字个数都会比较少，提取得到的关键词可能只有各位数，然而所有文案的关键词集合可能会到上万级别，因此针对每一个文案的关键词是高维的稀疏向量。

步骤S502，根据文案关键词高维稀疏向量，训练词生成模型Word2Vec，取得词向量矩阵，作为当前关键词的特征。

该实施例的扩散模型可以为模型Word2Vec。

步骤S503，获取每个广告的文案关键词稠密向量。

该实施例通过Word2Vec模型，可以实现将高维稀疏向量压缩成低维度的稠密向量。通常可以将10000个关键词构成的稀疏向量(每个文案若存在该关键词，则当前值为1)，通过模型压缩成300维左右的稠密向量(每个数值为double类型的数)，从而达到降维的目的。

步骤S504，针对营销服务中得到的优秀关键词，根据文案关键词稠密向量进行关键词扩散，得到更多的关键词。

该实施例可以通过调节关键词相似度阈值来调整扩散得到的文案数量。

步骤S505，根据扩散得到关键词，自动生成类似文案。

该实施例通过自动生成类似文案可以提供给产品侧和广告主进行筛选，并且通过营销文案服务进一步验证扩散的关键词是否有效。

该实施例通过模型训练营销文案关键词向量，得到词向量矩阵，从而进一步扩散得到相关文案关键词。因而可以实现从行业维度/卖点等维度上的优秀标题文案的搜索，并且经过文案自动生成、句式优化，给出广告文案参考。

该实施例通过营销文案关键词提取、营销文案优化服务和营销文案关键词扩散与文案自动生成三个重要环节，通过如下步骤：提取得到文案的关键词；通过服务得到和用户、行业等属性相关的效果词；根据现有各个属性相关的效果词进一步扩散得到词库；通过文案自动生成、句式优化，提供广告文案创意，指导文案设计，从而提升了文案效果。

本发明实施例的应用环境可以但不限于参照上述实施例中的应用环境，本实施例中对此不再赘述。本发明实施例提供了用于实施上述媒体信息的处理方法的一种可选的具体应用。

下面对本发明实施例的效果词词库的产品逻辑进行介绍。

图6是根据本发明实施例的一种效果词库的产品逻辑的示意图。如图6所示，广告主、广告代理商、广告创意相关人员等产生用户创意，该用户创意可以有效的广告创意(top创意)，对广告创意对应的广告文案进行分词处理，得到多个单词，从多个单词中提取出关键词，多提取出的关键词进行效果归因，可以对关键词进行因果解释和推论以实现效果归因，从而得到效果词汇。

表1效果词词库表

表1是根据本发明实施例的效果词词库表，具体以服饰行业信息流广告进行举例。

下面对本发明实施例的扩散、推荐模型的产品逻辑进行介绍。

图7是根据本发明实施例的一种扩散、推荐模型的示意图。如图7所示，广告主、广告代理商、广告创意相关人员等产生用户创意，对用户创意对应的广告文案进行分词处理，得到多个单词，从多个单词中提取出关键词，可以通过行特征词、行特征矩阵，生成语义句式扩散库。

下面以日化行业信息流广告为例，通过分词和关键词提取，既可以实现从行业维度/卖点等维度上的优秀标题文案的搜索，也可以在现有标题基础上实现句式和词汇扩散。

图8是根据本发明实施例的一种日化行业共词矩阵语义网络的示意图。如图8所示，以“黑头”、“脱发”、“方法”进行句式和词汇扩散，比如，由“黑头”可以扩散为“毛孔”、“粗大”、“清理”、“顽固”、“鼻子”等词汇，以“脱发”扩散为“男人”、“头发”、“告别”、“轻松”、“问题”等词汇，“方法”可以扩散为上述以及图8所涉及的词汇。该实施例的日化行业共词矩阵语义网络还可以扩展为其它的词汇，此处不再一一举例说明。

下面对本发明实施例的方案在产品中的应用实践进行介绍。

该实施例的方法可以适用于在用户的标题文案撰写过程中、完成阶段、广告订单的投放阶段对其标题优化的意见和建议，能够被所有的广告营销创意类制作工具、广告投放平台所使用。

下面对本发明实施例的标题优秀案例查询工具进行介绍、

图9是根据本发明实施例的一种行业、卖点、目标定向信息选择的示意图。如图9所示，对产品信息、产品卖点、定向信息、目标受众进行选择，比如，所属行业为服装鞋帽，产品卖点选择全部、穿戴效果好、定制、人气旺、新品上市、潮流款式、搭配攻略、正品、大品牌、服务好、便宜、其他等，还可以对定向信息中的用户意图、目标受众进行选择，比如，用户意图中的长期兴趣选择不限，意图词选择不限，对目标受众中的性别选择全部、选择男、选择女，对年龄选择全部、选择<18、18-24、25-34、35-44、>44，学历选择全部、大学及以上、高中及以下、大专。

图10是根据本发明实施例的一种搜索关键词的示意图。如图10所示，在文案制作工具的搜索框中搜索关键词，比如，该关键词为“内衣”，从而在文案制作工具的目标区域中显示174条结果，该174条结果与关键词“内衣”相关联，可以包括关键词“内衣”。

图11是根据本发明实施例的一种优秀广告案例复用编辑的示意图。如图11所示，可以将需要复用编辑的文案拖拽到暂存区域或者创作区进行复用编辑，同时显示将需要复用编辑的文案拖拽到暂存区域或者创作区进行复用编辑的提示信息，以对广告案例进行复用编辑。

下面对本发明实施例的优秀案例查询工具进行介绍。

图12是根据本发明实施例的一种对维度信息进行选择的示意图。如图12所示，可以对行业分类、推广目的、话术分类、心理诉求等维度信息进行选择，其中，行业分类、推广目的、话术分类中包括属于各维度下的细小的分类，可以进一步进行选择。

图13是根据本发明实施例的一种词库和句式工具优化推荐的示意图。如图13所示，现有文案缺乏互动性，该实施例可以从参与感、认同感层面出发，并通过参考的文案来对广告文案涉及的词库和句式等进行设计。

该实施例可以对广告标题文案进行语义分析机器训练和通过语义网络扩散对其质量进行计算和评估，并给出有行业针对性的建议和更好的文案推荐方案，这样一方面可以帮助用户在前期形成有效的营销卖点，另一方面也可以在已有标题文案制作上提供更好的解决方案，从而提升标题质量和效果。

该实施例分析标题文案依赖于多项基础技术支撑，需要结合中文分词、核心关键词提取、词频计算、语义网络分析、推荐算法等前沿技术；同时实时在线服务能力对算法性能也提出了更高的要求，既需要优化算法减少计算开销，同时也需要具备鲁棒性的系统服务框架。

该实施例利用中文语义分析技术手段，结合广告标题文案本身的特点，深入分析并将其应用到创意智能文案的领域，其中，包括：基于行业和标题核心关键词的标题文案搜索模块，通过行业和产品颗粒度上的维度细分，结合标题行核心关键词分析，使得用户能更快通过搜索方式找到优秀文案；效果词模型，基于已投放的文案标题语义、词性分析和素材点击率的影响，形成现有文案的效果词词库；扩散、推荐模块，通过基于已投放文案标题的语义网络分析，结合文案质量和卖点分析，给出类似的词库和句式。

根据本发明实施例的另一方面，还提供了一种用于实施上述媒体信息的处理方法的媒体信息的处理装置。图14是根据本发明实施例的一种媒体信息的处理装置的示意图。如图14所示，该媒体信息的处理装置1400可以包括：获取单元10、确定单元20和显示单元30。

获取单元10，用于获取搜索请求，其中，搜索请求中携带有第一关键词。

确定单元20，用于通过第一目标模型、第一关键词和第一对象的画像数据，确定出多个目标类型下的第一媒体信息，其中，第一目标模型是通过多个类型下的第二媒体信息、第二媒体信息的第二关键词、第二对象的画像数据和第一操作信息对预定模型训练得到的，第一操作信息用于指示第二媒体信息被第二对象执行的目标操作，第一媒体信息在与第一关键词相关联的媒体信息中被第一对象执行目标操作的概率最大。

显示单元30，用于显示多个目标类型下的第一媒体信息。

需要说明的是，该实施例中的获取单元10可以用于执行本申请实施例中的步骤S202，该实施例中的确定单元20可以用于执行本申请实施例中的步骤S204，该实施例中的显示单元30可以用于执行本申请实施例中的步骤S206。

该实施例通过获取单元10获取搜索请求，其中，搜索请求中携带有第一关键词，确定单元20通过第一目标模型、第一关键词和第一对象的画像数据，确定出多个目标类型下的第一媒体信息，其中，第一目标模型是通过多个类型下的第二媒体信息、第二媒体信息的第二关键词、第二对象的画像数据和第一操作信息对预定模型训练得到的，第一操作信息用于指示第二媒体信息被第二对象执行的目标操作，第一媒体信息在与第一关键词相关联的媒体信息中被第一对象执行目标操作的概率最大，通过显示单元30显示多个目标类型下的第一媒体信息由于通过细分的多个类型下的第二媒体信息、第二媒体信息的第二关键词、第二对象的画像数据和第一操作信息对预定模型训练得到第一目标模型，通过第一目标模型有针对性地根据搜索请求携带的行业核心的第一关键词和第一对象的画像数据确定出多个目标类型下的第一媒体信息，达到了快速通过搜索方式找到优秀的第二媒体信息的目的，从而实现了提高媒体信息处理的效率的技术效果，进而解决了相关技术中媒体信息处理的效率低的技术问题。

此处需要说明的是，上述单元与对应的步骤所实现的示例和应用场景相同，但不限于上述实施例所公开的内容。需要说明的是，上述单元作为装置的一部分可以运行在如图1所示的硬件环境中，可以通过软件实现，也可以通过硬件实现，其中，硬件环境包括网络环境。

根据本发明实施例的又一方面，还提供了一种用于实施上述媒体信息的处理方法的电子装置。

图15是根据本发明实施例的一种电子装置的结构框图。如图15所示，该的电子装置可以包括：包括存储器151和处理器153，该存储器151中存储有计算机程序，该处理器153被设置为通过计算机程序执行上述任一项方法实施例中的步骤。可选地，如图15所示，该电子装置还可以包括传输装置155和输入输出设备157。

可选地，在本实施例中，上述电子装置可以位于计算机网络的多个网络设备中的至少一个网络设备。

可选地，在本实施例中，上述处理器153可以被设置为通过计算机程序执行以下步骤：

获取搜索请求，其中，搜索请求中携带有第一关键词；

通过第一目标模型、第一关键词和第一对象的画像数据，确定出多个目标类型下的第一媒体信息，其中，第一目标模型是通过多个类型下的第二媒体信息、第二媒体信息的第二关键词、第二对象的画像数据和第一操作信息对预定模型训练得到的，第一操作信息用于指示第二媒体信息被第二对象执行的目标操作，第一媒体信息在与第一关键词相关联的媒体信息中被第一对象执行目标操作的概率最大；

显示多个目标类型下的第一媒体信息。

处理器153还用于执行下述步骤：响应由目标操作产生的目标操作指令，获取多个目标类型；通过第一目标模型、第一关键词和第一对象的画像数据，确定出多个目标类型下的第一媒体信息。

处理器153还用于执行下述步骤：在显示多个目标类型下的第一媒体信息之前，显示多个目标类型下的预先定义的媒体信息，其中，预先定义的媒体信息用于对第一媒体信息进行更新。

处理器153还用于执行下述步骤：在获取搜索请求之后或在获取搜索请求之前，获取目标指标，其中，目标指标用于指示第一目标模型确定出多个目标类型下的第一媒体信息所消耗的时间；通过目标指标调整第一目标模型的参数，得到第二目标模型，其中，第二目标模型确定出多个目标类型下的第一媒体信息所消耗的时间小于第一目标模型确定出多个目标类型下的第一媒体信息所消耗的时间；通过第一目标模型、第一关键词和第一对象的画像数据，确定出多个目标类型下的第一媒体信息包括：通过第二目标模型、第一关键词和第一对象的画像数据，确定出多个目标类型下的第一媒体信息。

处理器153还用于执行下述步骤：在通过第二目标模型、第一关键词和第一对象的画像数据，确定出多个目标类型下的第一媒体信息之后，获取由第二目标模型指示的第一媒体信息的偏好数据、与第一媒体信息的类型相关联的目标词语，其中，偏好数据用于指示第一媒体信息的类型与第一媒体信息之间的匹配度；通过偏好数据、目标词语调整第一媒体信息，得到调整后的第一媒体信息，其中，调整后的第一媒体信息被执行目标操作的概率高于调整前的第一媒体信息被执行目标操作的概率。

处理器153还用于执行下述步骤：在通过第一目标模型、第一关键词和第一对象的画像数据，确定出多个目标类型下的第一媒体信息之前，对第二媒体信息中的文字进行分词，得到第一数量的单词；对第一数量的单词按照词性进行过滤，得到第二数量的单词，其中，第二数量不大于第一数量；从第二数量的单词中提取出第二关键词。

处理器153还用于执行下述步骤：对第二媒体信息包括的目标文本和目标图片中的文字进行分词，得到第一数量的单词。

处理器153还用于执行下述步骤：通过目标分词词典对第二媒体信息包括的目标文本和目标图片中的文字进行分词，得到第一数量的单词。

处理器153还用于执行下述步骤：在从第二数量的单词中提取出第二关键词之后，对第二关键词进行编码，得到编码后的第二关键词，其中，编码后的第二关键词为离散的关键词；使用多个类型下的第二媒体信息、编码后的第二关键词、第二对象的画像数据和第一操作信息对预定模型进行训练，得到训练好的第一目标模型。

处理器153还用于执行下述步骤：在从第二数量的单词中提取出第二关键词之后，获取第二关键词的高维稀疏向量；获取与高维稀疏向量对应的稠密向量；对稠密向量中的关键词进行扩散，得到第三关键词，其中，第三关键词的数量大于第二关键词的数量；通过第三关键词生成第三媒体信息，其中，第三媒体信息与第一媒体信息之间的相似度在第一目标阈值内。

处理器153还用于执行下述步骤：对稠密向量中的关键词进行扩散，得到与第二关键词的相似度在第二目标阈值内的第三关键词，其中，第三关键词的数量由第二目标阈值确定。

处理器153还用于执行下述步骤：在第三关键词有效的情况下，通过第三关键词生成第三媒体信息。

可选地，本领域普通技术人员可以理解，图15所示的结构仅为示意，电子装置也可以是智能手机(如AndroID手机、iOS手机等)、平板电脑、掌上电脑以及移动互联网设备(Mobile Internet Devices，MID)、PAD等终端设备。图15其并不对上述电子装置的结构造成限定。例如，电子装置还可包括比图15中所示更多或者更少的组件(如网络接口、显示装置等)，或者具有与图15所示不同的配置。

其中，存储器151可用于存储软件程序以及模块，如本发明实施例中的媒体信息的处理方法和装置对应的程序指令/模块，处理器153通过运行存储在存储器151内的软件程序以及模块，从而执行各种功能应用以及数据处理，即实现上述的媒体信息的处理方法。存储器151可包括高速随机存储器，还可以包括非易失性存储器，如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中，存储器151可进一步包括相对于处理器153远程设置的存储器，这些远程存储器可以通过网络连接至终端。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

上述的传输装置155用于经由一个网络接收或者发送数据。上述的网络具体实例可包括有线网络及无线网络。在一个实例中，传输装置155包括一个网络适配器(NetworkInterface Controller，NIC)，其可通过网线与其他网络设备与路由器相连从而可与互联网或局域网进行通讯。在一个实例中，传输装置155为射频(Radio Frequency，RF)模块，其用于通过无线方式与互联网进行通讯。

其中，具体地，存储器151用于存储应用程序。

采用本发明实施例，提供了一种媒体信息的处理方法。通过获取搜索请求，其中，搜索请求中携带有第一关键词；通过第一目标模型、第一关键词和第一对象的画像数据，确定出多个目标类型下的第一媒体信息，其中，第一目标模型是通过多个类型下的第二媒体信息、第二媒体信息的第二关键词、第二对象的画像数据和第一操作信息对预定模型训练得到的，第一操作信息用于指示第二媒体信息被第二对象执行的目标操作，第一媒体信息在与第一关键词相关联的媒体信息中被第一对象执行目标操作的概率最大；显示多个目标类型下的第一媒体信息。由于通过细分的多个类型下的第二媒体信息、第二媒体信息的第二关键词、第二对象的画像数据和第一操作信息对预定模型训练得到第一目标模型，通过第一目标模型有针对性地根据搜索请求携带的行业核心的第一关键词和第一对象的画像数据确定出多个目标类型下的第一媒体信息，达到了快速通过搜索方式找到优秀的第二媒体信息的目的，从而实现了提高媒体信息处理的效率的技术效果，进而解决了相关技术中媒体信息处理的效率低的技术问题。

本发明的实施例还提供了一种存储介质，该存储介质中存储有计算机程序，其中，该计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。

可选地，在本实施例中，上述存储介质可以被设置为存储用于执行以下步骤的计算机程序：

获取搜索请求，其中，搜索请求中携带有第一关键词；

显示多个目标类型下的第一媒体信息。

可选地，存储介质还被设置为存储用于执行以下步骤的程序代码：响应由目标操作产生的目标操作指令，获取多个目标类型；通过第一目标模型、第一关键词和第一对象的画像数据，确定出多个目标类型下的第一媒体信息。

可选地，存储介质还被设置为存储用于执行以下步骤的程序代码：在显示多个目标类型下的第一媒体信息之前，显示多个目标类型下的预先定义的媒体信息，其中，预先定义的媒体信息用于对第一媒体信息进行更新。

可选地，存储介质还被设置为存储用于执行以下步骤的程序代码：在获取搜索请求之后或在获取搜索请求之前，获取目标指标，其中，目标指标用于指示第一目标模型确定出多个目标类型下的第一媒体信息所消耗的时间；通过目标指标调整第一目标模型的参数，得到第二目标模型，其中，第二目标模型确定出多个目标类型下的第一媒体信息所消耗的时间小于第一目标模型确定出多个目标类型下的第一媒体信息所消耗的时间；通过第一目标模型、第一关键词和第一对象的画像数据，确定出多个目标类型下的第一媒体信息包括：通过第二目标模型、第一关键词和第一对象的画像数据，确定出多个目标类型下的第一媒体信息。

可选地，存储介质还被设置为存储用于执行以下步骤的程序代码：在通过第二目标模型、第一关键词和第一对象的画像数据，确定出多个目标类型下的第一媒体信息之后，获取由第二目标模型指示的第一媒体信息的偏好数据、与第一媒体信息的类型相关联的目标词语，其中，偏好数据用于指示第一媒体信息的类型与第一媒体信息之间的匹配度；通过偏好数据、目标词语调整第一媒体信息，得到调整后的第一媒体信息，其中，调整后的第一媒体信息被执行目标操作的概率高于调整前的第一媒体信息被执行目标操作的概率。

可选地，存储介质还被设置为存储用于执行以下步骤的程序代码：在通过第一目标模型、第一关键词和第一对象的画像数据，确定出多个目标类型下的第一媒体信息之前，对第二媒体信息中的文字进行分词，得到第一数量的单词；对第一数量的单词按照词性进行过滤，得到第二数量的单词，其中，第二数量不大于第一数量；从第二数量的单词中提取出第二关键词。

可选地，存储介质还被设置为存储用于执行以下步骤的程序代码：对第二媒体信息包括的目标文本和目标图片中的文字进行分词，得到第一数量的单词。

可选地，存储介质还被设置为存储用于执行以下步骤的程序代码：通过目标分词词典对第二媒体信息包括的目标文本和目标图片中的文字进行分词，得到第一数量的单词。

可选地，存储介质还被设置为存储用于执行以下步骤的程序代码：在从第二数量的单词中提取出第二关键词之后，对第二关键词进行编码，得到编码后的第二关键词，其中，编码后的第二关键词为离散的关键词；使用多个类型下的第二媒体信息、编码后的第二关键词、第二对象的画像数据和第一操作信息对预定模型进行训练，得到训练好的第一目标模型。

可选地，存储介质还被设置为存储用于执行以下步骤的程序代码：在从第二数量的单词中提取出第二关键词之后，获取第二关键词的高维稀疏向量；获取与高维稀疏向量对应的稠密向量；对稠密向量中的关键词进行扩散，得到第三关键词，其中，第三关键词的数量大于第二关键词的数量；通过第三关键词生成第三媒体信息，其中，第三媒体信息与第一媒体信息之间的相似度在第一目标阈值内。

可选地，存储介质还被设置为存储用于执行以下步骤的程序代码：对稠密向量中的关键词进行扩散，得到与第二关键词的相似度在第二目标阈值内的第三关键词，其中，第三关键词的数量由第二目标阈值确定。

可选地，存储介质还被设置为存储用于执行以下步骤的程序代码：在第三关键词有效的情况下，通过第三关键词生成第三媒体信息。

可选地，存储介质还被设置为存储用于执行上述实施例中的方法中所包括的步骤的计算机程序，本实施例中对此不再赘述。

可选地，在本实施例中，本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令终端设备相关的硬件来完成，该程序可以存储于一计算机可读存储介质中，存储介质可以包括：闪存盘、只读存储器(Read-Only Memory，ROM)、随机存取器(Random Access Memory，RAM)、磁盘或光盘等。

上述本发明实施例序号仅仅为了描述，不代表实施例的优劣。

上述实施例中的集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在上述计算机可读取的存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在存储介质中，包括若干指令用以使得一台或多台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。

在本发明的上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述的部分，可以参见其他实施例的相关描述。

在本申请所提供的几个实施例中，应该理解到，所揭露的客户端，可通过其它的方式实现。其中，以上所描述的装置实施例仅仅是示意性的，例如所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，单元或模块的间接耦合或通信连接，可以是电性或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本发明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

以上所述仅是本发明的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本发明的保护范围。

Claims

1.一种媒体信息的处理方法，其特征在于，包括：

获取搜索请求，其中，所述搜索请求中携带有第一关键词；

通过第一目标模型、所述第一关键词和第一对象的画像数据，确定出多个目标类型下的第一媒体信息，其中，所述第一目标模型是通过多个类型下的第二媒体信息、所述第二媒体信息的第二关键词、第二对象的画像数据和第一操作信息对预定模型训练得到的，所述第一操作信息用于指示所述第二媒体信息被所述第二对象执行的目标操作，所述第一媒体信息在与所述第一关键词相关联的媒体信息中被所述第一对象执行所述目标操作的概率最大；

显示所述多个目标类型下的所述第一媒体信息。

2.根据权利要求1所述的方法，其特征在于，通过所述第一目标模型、所述第一关键词和所述第一对象的画像数据，确定出所述多个目标类型下的所述第一媒体信息包括：

响应由目标操作产生的目标操作指令，获取所述多个目标类型；

通过所述第一目标模型、所述第一关键词和所述第一对象的画像数据，确定出所述多个目标类型下的所述第一媒体信息。

3.根据权利要求2所述的方法，其特征在于，在显示所述多个目标类型下的所述第一媒体信息之前，所述方法还包括：

显示所述多个目标类型下的预先定义的媒体信息，其中，所述预先定义的媒体信息用于对所述第一媒体信息进行更新。

4.根据权利要求1所述的方法，其特征在于，

在获取所述搜索请求之后或在获取所述搜索请求之前，所述方法还包括：获取目标指标，其中，所述目标指标用于指示所述第一目标模型确定出所述多个目标类型下的所述第一媒体信息所消耗的时间；通过所述目标指标调整所述第一目标模型的参数，得到第二目标模型，其中，所述第二目标模型确定出所述多个目标类型下的所述第一媒体信息所消耗的时间小于所述第一目标模型确定出所述多个目标类型下的所述第一媒体信息所消耗的时间；

通过所述第一目标模型、所述第一关键词和所述第一对象的画像数据，确定出所述多个目标类型下的所述第一媒体信息包括：通过所述第二目标模型、所述第一关键词和所述第一对象的画像数据，确定出所述多个目标类型下的所述第一媒体信息。

5.根据权利要求4所述的方法，其特征在于，在通过所述第二目标模型、所述第一关键词和所述第一对象的画像数据，确定出所述多个目标类型下的所述第一媒体信息之后，所述方法还包括：

获取由所述第二目标模型指示的所述第一媒体信息的偏好数据、与所述第一媒体信息的类型相关联的目标词语，其中，所述偏好数据用于指示所述第一媒体信息的类型与所述第一媒体信息之间的匹配度；

通过所述偏好数据、所述目标词语调整所述第一媒体信息，得到调整后的所述第一媒体信息，其中，调整后的所述第一媒体信息被执行所述目标操作的概率高于调整前的所述第一媒体信息被执行所述目标操作的概率。

6.根据权利要求1所述的方法，其特征在于，在通过所述第一目标模型、所述第一关键词和第一对象的画像数据，确定出所述多个目标类型下的所述第一媒体信息之前，所述方法还包括：

对所述第二媒体信息中的文字进行分词，得到第一数量的单词；

对所述第一数量的单词按照词性进行过滤，得到第二数量的单词，其中，所述第二数量不大于所述第一数量；

从所述第二数量的单词中提取出所述第二关键词。

7.根据权利要求6所述的方法，其特征在于，对所述第二媒体信息中的文字进行分词，得到所述第一数量的单词包括：

对所述第二媒体信息包括的目标文本和目标图片中的文字进行分词，得到所述第一数量的单词。

8.根据权利要求7所述的方法，其特征在于，对所述第二媒体信息包括的所述目标文本和所述目标图片中的文字进行分词，得到所述第一数量的单词包括：

通过目标分词词典对所述第二媒体信息包括的所述目标文本和所述目标图片中的文字进行分词，得到所述第一数量的单词。

9.根据权利要求6所述的方法，其特征在于，

在从所述第二数量的单词中提取出所述第二关键词之后，所述方法还包括：对所述第二关键词进行编码，得到编码后的所述第二关键词，其中，编码后的所述第二关键词为离散的关键词；

使用所述多个类型下的第二媒体信息、编码后的所述第二关键词、所述第二对象的画像数据和所述第一操作信息对所述预定模型进行训练，得到训练好的所述第一目标模型。

10.根据权利要求6所述的方法，其特征在于，在从所述第二数量的单词中提取出所述第二关键词之后，所述方法还包括：

获取所述第二关键词的高维稀疏向量；

获取与所述高维稀疏向量对应的稠密向量；

对所述稠密向量中的关键词进行扩散，得到第三关键词，其中，所述第三关键词的数量大于所述第二关键词的数量；

通过所述第三关键词生成第三媒体信息，其中，所述第三媒体信息与所述第一媒体信息之间的相似度在第一目标阈值内。

11.根据权利要求10所述的方法，其特征在于，对所述稠密向量中的关键词进行扩散，得到所述第三关键词包括：

对所述稠密向量中的关键词进行扩散，得到与所述第二关键词的相似度在第二目标阈值内的所述第三关键词，其中，所述第三关键词的数量由所述第二目标阈值确定。

12.根据权利要求10所述的方法，其特征在于，通过所述第三关键词生成所述第三媒体信息包括：

在所述第三关键词有效的情况下，通过所述第三关键词生成所述第三媒体信息。

13.一种媒体信息的处理装置，其特征在于，包括：

获取单元，用于获取搜索请求，其中，所述搜索请求中携带有第一关键词；

确定单元，用于通过第一目标模型、所述第一关键词和第一对象的画像数据，确定出多个目标类型下的第一媒体信息，其中，所述第一目标模型是通过多个类型下的第二媒体信息、所述第二媒体信息的第二关键词、第二对象的画像数据和第一操作信息对预定模型训练得到的，所述第一操作信息用于指示所述第二媒体信息被所述第二对象执行的目标操作，所述第一媒体信息在与所述第一关键词相关联的媒体信息中被所述第一对象执行所述目标操作的概率最大；

显示单元，用于显示所述多个目标类型下的所述第一媒体信息。

14.一种存储介质，其特征在于，所述存储介质中存储有计算机程序，其中，所述计算机程序被设置为运行时执行所述权利要求1至12任一项中所述的媒体信息的处理方法。

15.一种电子装置，包括存储器和处理器，其特征在于，所述存储器中存储有计算机程序，所述处理器被设置为通过所述计算机程序执行所述权利要求1至12任一项中所述的媒体信息的处理方法。