CN103971268A

CN103971268A - 推广信息的处理方法及装置

Info

Publication number: CN103971268A
Application number: CN201410148989.0A
Authority: CN
Inventors: 由清圳
Original assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Current assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Priority date: 2014-04-14
Filing date: 2014-04-14
Publication date: 2014-08-06
Anticipated expiration: 2034-04-14
Also published as: CN103971268B

Abstract

本发明提供一种推广信息的处理方法及装置。本发明实施例通过获取多媒体文件的字幕内容，进而根据所述字幕内容，获得与所述字幕内容匹配的候选推广信息，以作为目标推广信息，使得能够在所述多媒体文件的播放过程中，进行所述目标推广信息的推送，由于目标推广信息为与多媒体文件的字幕内容匹配的推广信息，因此，在所述多媒体文件的播放过程中进行所述目标推广信息的推送，会引起视频文件的观看者的兴趣以对推广信息进行进一步操作行为，例如，点击、注册和购买等操作行为，能够保证推广信息的精准推送，从而提高了推广信息的转化率。

Description

推广信息的处理方法及装置

【技术领域】

本发明涉及推送技术，尤其涉及一种推广信息的处理方法及装置。

【背景技术】

近年来，随着互联网技术的发展，逐渐兴起了推广信息的推送服务，例如，广告推送、游戏推送或应用推送等。在播放多媒体文件的过程中，例如，接收开始播放的指令之后，或者接收暂停播放或停止播放的指令之后，等，可以随机向用户推送推广信息。

然而，由于推广信息是随机推送的，从而导致了推广信息的转化率的降低。

【发明内容】

本发明的多个方面提供一种推广信息的处理方法及装置，用以提高推广信息的转化率。

本发明的一方面，提供一种推广信息的处理方法，包括：

获取多媒体文件的字幕内容；

根据所述字幕内容，获得与所述字幕内容匹配的候选推广信息，以作为目标推广信息，以供在所述多媒体文件的播放过程中，进行所述目标推广信息的推送。

如上所述的方面和任一可能的实现方式，进一步提供一种实现方式，所述根据所述字幕内容，获得与所述字幕内容匹配的候选推广信息，以作为目标推广信息，以供在所述多媒体文件的播放过程中，进行所述目标推广信息的推送，包括：

对所述字幕内容进行特征提取，以获得第一特征信息；

对待推送的至少一个候选推广信息的文本信息进行特征提取，以获得至少一个第二特征信息；

根据所述第一特征信息和所述至少一个第二特征信息，选择至少一个候选推广信息，以作为所述目标推广信息，以供在所述多媒体文件的播放过程中，进行所述目标推广信息的推送。

如上所述的方面和任一可能的实现方式，进一步提供一种实现方式，所述根据所述第一特征信息和所述至少一个第二特征信息，选择至少一个候选推广信息，以作为所述目标推广信息，包括：

计算所述第一特征信息与所述至少一个第二特征信息中每个第二特征信息之间的距离；

选择最小的至少一个距离所对应的第二特征信息所属的至少一个候选推广信息，以作为所述目标推广信息；或者选择小于或等于预先配置的距离阈值的距离所对应的第二特征信息所属的至少一个候选推广信息，以作为所述目标推广信息。

如上所述的方面和任一可能的实现方式，进一步提供一种实现方式，所述对所述字幕内容进行特征提取，以获得第一特征信息，包括：

利用LDA算法，对所述字幕内容进行特征提取，以获得所述第一特征信息。

如上所述的方面和任一可能的实现方式，进一步提供一种实现方式，所述对待推送的至少一个候选推广信息的文本信息进行特征提取，以获得至少一个第二特征信息，包括：

利用LDA算法，对待推送的至少一个候选推广信息的文本信息进行特征提取，以获得所述至少一个第二特征信息。

本发明的另一方面，提供一种推广信息的处理装置，包括：

获取单元，用于获取多媒体文件的字幕内容；

匹配单元，用于根据所述字幕内容，获得与所述字幕内容匹配的候选推广信息，以作为目标推广信息，以供在所述多媒体文件的播放过程中，进行所述目标推广信息的推送。

如上所述的方面和任一可能的实现方式，进一步提供一种实现方式，所述匹配单元，具体用于

对所述字幕内容进行特征提取，以获得第一特征信息；

对待推送的至少一个候选推广信息的文本信息进行特征提取，以获得至少一个第二特征信息；以及

计算所述第一特征信息与所述至少一个第二特征信息中每个第二特征信息之间的距离；以及

由上述技术方案可知，本发明实施例通过获取多媒体文件的字幕内容，进而根据所述字幕内容，获得与所述字幕内容匹配的候选推广信息，以作为目标推广信息，使得能够在所述多媒体文件的播放过程中，进行所述目标推广信息的推送，由于目标推广信息为与多媒体文件的字幕内容匹配的推广信息，因此，在所述多媒体文件的播放过程中进行所述目标推广信息的推送，会引起视频文件的观看者的兴趣以对推广信息进行进一步操作行为，例如，点击、注册和购买等操作行为，能够保证推广信息的精准推送，从而提高了推广信息的转化率。

另外，采用本发明提供的技术方案，由于目标推广信息为与多媒体文件的字幕内容匹配的推广信息，因此，在所述多媒体文件的播放过程中进行所述目标推广信息的推送，会符合视频文件的观看者的情绪波动，能够有效提高推广信息的满意度和相关性。

另外，采用本发明提供的技术方案，无需人工参与，即能实现推广信息的自动推送，因此，能够有效提高推广信息的推送成本。

【附图说明】

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1为本发明一实施例提供的推广信息的处理方法的流程示意图；

图2为本发明另一实施例提供的推广信息的处理装置的结构示意图。

【具体实施方式】

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的全部其他实施例，都属于本发明保护的范围。

需要说明的是，本发明实施例中所涉及的终端可以包括但不限于手机、个人数字助理（Personal Digital Assistant，PDA）、无线手持装置、无线上网本、个人电脑（Personal Computer，PC）、便携电脑、MP3播放器、MP4播放器等。

另外，本文中术语“和/或”，仅仅是一种描述关联对象的关联关系，表示可以存在三种关系，例如，A和/或B，可以表示：单独存在A，同时存在A和B，单独存在B这三种情况。另外，本文中字符“/”，一般表示前后关联对象是一种“或”的关系。

图1为本发明一实施例提供的推广信息的处理方法的流程示意图，如图1所示。

101、获取多媒体文件的字幕内容。

其中，多媒体文件可以包括但不限于音频文件和视频文件中的至少一项，本实施例对此不进行特别限定。

102、根据所述字幕内容，获得与所述字幕内容匹配的候选推广信息，以作为目标推广信息，以供在所述多媒体文件的播放过程中，进行所述目标推广信息的推送。

需要说明的是，101和102的执行主体可以是推送装置，可以位于本地的应用中，或者还可以位于网络侧的服务器中，或者也可以部分功能位于应用中，部分功能位于服务器中，本实施例对此不进行限定。

可以理解的是，所述应用可以是终端上所安装的应用程序，或者还可以是终端上所安装的浏览器的一个网页，只要能够实现推广信息的匹配，以提供推广信息的客观存在形式都可以，本实施例对此不进行特别限定。

这样，通过获取多媒体文件的字幕内容，进而根据所述字幕内容，获得与所述字幕内容匹配的候选推广信息，以作为目标推广信息，使得能够在所述多媒体文件的播放过程中，进行所述目标推广信息的推送，由于目标推广信息为与多媒体文件的字幕内容匹配的推广信息，因此，在所述多媒体文件的播放过程中进行所述目标推广信息的推送，会引起视频文件的观看者的兴趣以对推广信息进行进一步操作行为，例如，点击、注册和购买等操作行为，能够保证推广信息的精准推送，从而提高了推广信息的转化率。

可选地，在本实施例的一个可能的实现方式中，在101中，推送装置具体可以获取多媒体文件在指定时间范围之内的内幕信息，或者还可以获取多媒体文件在全部时间范围之内的内幕信息，本实施例对此不进行特别限定。

一般来说，多媒体文件的字幕内容可以存储在字幕文件中，该字幕文件中包含字幕时间和字幕内容，例如，字幕文件可以包含如下内容：

00:00:36,136→00:00:36,731

What must it be like not to be crippled by fear and self-loathing？；

其中，“00:00:36,136→00:00:36,731”为字幕时间，“What must it belike not to be crippled by fear and self-loathing？”为字幕内容。

具体地，推送装置具体可以对字幕文件进行规格化处理，以提取出该字幕文件中所包含的字幕内容。

还有些时候，多媒体文件的字幕内容并不是单独存储在字幕文件中，而其就是多媒体文件的内容的一部分。那么，所述推送装置还可以进一步利用现有技术中的字幕提取技术，从多媒体文件中提取出字幕内容。其中，字幕提取技术的详细描述可以参见现有技术中的相关内容，此处不再赘述。

可选地，在本实施例的一个可能的实现方式中，在102中，推送装置具体可以对所述字幕内容进行特征提取，以获得第一特征信息，以及对待推送的至少一个候选推广信息的文本信息进行特征提取，以获得至少一个第二特征信息。然后，所述推送装置则可以根据所述第一特征信息和所述至少一个第二特征信息，选择至少一个候选推广信息，以作为所述目标推广信息，以供在所述多媒体文件的播放过程中，进行所述目标推广信息的推送。

这样，通过对多媒体文件的字幕内容的挖掘，进而匹配出对应的候选推广信息，以作为目标推广信息，使得能够在多媒体文件的播放过程中进行推送，能够有效保证推广信息的精准推送，从而提高了推广信息的转化率。

具体地，所述推送装置具体可以计算所述第一特征信息与所述至少一个第二特征信息中每个第二特征信息之间的距离。

然后，所述推送装置则可以选择最小的至少一个距离所对应的第二特征信息所属的至少一个候选推广信息，以作为所述目标推广信息。例如，可以按照距离从小到大的顺序，对至少一个候选推广信息进行排序，排序结果中排名靠前的一个或多个候选推广信息就是“最小的至少一个距离所对应的第二特征信息所属的至少一个候选推广信息”。

或者，所述推送装置还可以选择小于或等于预先配置的距离阈值的距离所对应的第二特征信息所属的至少一个候选推广信息，以作为所述目标推广信息，本实施例对此不进行特别限定。

其中，所述候选推广信息的文本信息，可以为候选推广信息的属性信息，可以包括但不限于类型；领域；关键词；标签；以及描述中的至少一项，本实施例对此不进行特别限定。

具体地，推送装置可以采用现有技术中的任一特征提取算法，对所述字幕内容或候选推广信息的文本信息进行特征提取，本实施例对此不进行特别限定。

例如，推送装置可以利用主题模型（Latent Dirichlet Allocation，LDA）算法，对所述字幕内容进行特征提取，以获得所述第一特征信息即特征向量A（a1,a2,a3,……,an）；以及利用LDA算法，对待推送的至少一个候选推广信息的文本信息进行特征提取，以获得所述至少一个第二特征信息即特征向量B（b1,b2,b3,……,bn）。进而，所述推送装置则可以计算特征向量A（a1,a2,a3,……,an）与特征向量B（b1,b2,b3,……,bn）之间的距离。其中，LDA算法的详细描述可以参见现有技术中的相关内容，此处不再赘述。

本实施例中，通过获取多媒体文件的字幕内容，进而根据所述字幕内容，获得与所述字幕内容匹配的候选推广信息，以作为目标推广信息，使得能够在所述多媒体文件的播放过程中，进行所述目标推广信息的推送，由于目标推广信息为与多媒体文件的字幕内容匹配的推广信息，因此，在所述多媒体文件的播放过程中进行所述目标推广信息的推送，会引起视频文件的观看者的兴趣以对推广信息进行进一步操作行为，例如，点击、注册和购买等操作行为，能够保证推广信息的精准推送，从而提高了推广信息的转化率。

另外，采用本发明提供的技术方案，无需人工参与，即能实现推广信息的自动推送，操作简单，因此，能够有效提高推广信息的推送效率。

需要说明的是，对于前述的各方法实施例，为了简单描述，故将其都表述为一系列的动作组合，但是本领域技术人员应该知悉，本发明并不受所描述的动作顺序的限制，因为依据本发明，某些步骤可以采用其他顺序或者同时进行。其次，本领域技术人员也应该知悉，说明书中所描述的实施例均属于优选实施例，所涉及的动作和模块并不一定是本发明所必须的。

在上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述的部分，可以参见其他实施例的相关描述。

图2为本发明另一实施例提供的推广信息的处理装置的结构示意图，如图2所示。本实施例的推广信息的处理装置可以包括获取单元21和匹配单元22。其中，

获取单元21，用于获取多媒体文件的字幕内容。

匹配单元22，用于根据所述字幕内容，获得与所述字幕内容匹配的候选推广信息，以作为目标推广信息，以供在所述多媒体文件的播放过程中，进行所述目标推广信息的推送。

需要说明的是，本实施例所提供的推广信息的处理装置可以是一推送装置，可以位于本地的应用中，或者还可以位于网络侧的服务器中，或者也可以部分功能位于应用中，部分功能位于服务器中，本实施例对此不进行限定。

这样，通过获取单元获取多媒体文件的字幕内容，进而由匹配单元根据所述字幕内容，获得与所述字幕内容匹配的候选推广信息，以作为目标推广信息，使得能够在所述多媒体文件的播放过程中，进行所述目标推广信息的推送，由于目标推广信息为与多媒体文件的字幕内容匹配的推广信息，因此，在所述多媒体文件的播放过程中进行所述目标推广信息的推送，会引起视频文件的观看者的兴趣以对推广信息进行进一步操作行为，例如，点击、注册和购买等操作行为，能够保证推广信息的精准推送，从而提高了推广信息的转化率。

可选地，在本实施例的一个可能的实现方式中，所述获取单元21，具体可以获取多媒体文件在指定时间范围之内的内幕信息，或者还可以获取多媒体文件在全部时间范围之内的内幕信息，本实施例对此不进行特别限定。

00:00:36,136→00:00:36,731

What must it be like not to be crippled by fear and self-loathing？；

具体地，所述获取单元21具体可以对字幕文件进行规格化处理，以提取出该字幕文件中所包含的字幕内容。

还有些时候，多媒体文件的字幕内容并不是单独存储在字幕文件中，而其就是多媒体文件的内容的一部分。那么，所述获取单元21还可以进一步利用现有技术中的字幕提取技术，从多媒体文件中提取出字幕内容。其中，字幕提取技术的详细描述可以参见现有技术中的相关内容，此处不再赘述。

可选地，在本实施例的一个可能的实现方式中，所述匹配单元22，具体可以用于对所述字幕内容进行特征提取，以获得第一特征信息；对待推送的至少一个候选推广信息的文本信息进行特征提取，以获得至少一个第二特征信息；以及根据所述第一特征信息和所述至少一个第二特征信息，选择至少一个候选推广信息，以作为所述目标推广信息，以供在所述多媒体文件的播放过程中，进行所述目标推广信息的推送。

具体地，所述匹配单元22，具体可以用于计算所述第一特征信息与所述至少一个第二特征信息中每个第二特征信息之间的距离；以及选择最小的至少一个距离所对应的第二特征信息所属的至少一个候选推广信息，以作为所述目标推广信息。例如，可以按照距离从小到大的顺序，对至少一个候选推广信息进行排序，排序结果中排名靠前的一个或多个候选推广信息就是“最小的至少一个距离所对应的第二特征信息所属的至少一个候选推广信息”。

具体地，所述匹配单元22，具体可以用于计算所述第一特征信息与所述至少一个第二特征信息中每个第二特征信息之间的距离；以及选择小于或等于预先配置的距离阈值的距离所对应的第二特征信息所属的至少一个候选推广信息，以作为所述目标推广信息。

具体地，所述匹配单元22可以采用现有技术中的任一特征提取算法，对所述字幕内容或候选推广信息的文本信息进行特征提取，本实施例对此不进行特别限定。

例如，所述匹配单元22可以利用LDA算法，对所述字幕内容进行特征提取，以获得所述第一特征信息即特征向量A（a1,a2,a3,……,an）；以及利用LDA算法，对待推送的至少一个候选推广信息的文本信息进行特征提取，以获得所述至少一个第二特征信息即特征向量B（b1,b2,b3,……,bn）。进而，则可以计算特征向量A（a1,a2,a3,……,an）与特征向量B（b1,b2,b3,……,bn）之间的距离。其中，LDA算法的详细描述可以参见现有技术中的相关内容，此处不再赘述。

本实施例中，通过获取单元获取多媒体文件的字幕内容，进而由匹配单元根据所述字幕内容，获得与所述字幕内容匹配的候选推广信息，以作为目标推广信息，使得能够在所述多媒体文件的播放过程中，进行所述目标推广信息的推送，由于目标推广信息为与多媒体文件的字幕内容匹配的推广信息，因此，在所述多媒体文件的播放过程中进行所述目标推广信息的推送，会引起视频文件的观看者的兴趣以对推广信息进行进一步操作行为，例如，点击、注册和购买等操作行为，能够保证推广信息的精准推送，从而提高了推广信息的转化率。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统，装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

在本发明所提供的几个实施例中，应该理解到，所揭露的系统，装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本发明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用硬件加软件功能单元的形式实现。

上述以软件功能单元的形式实现的集成的单元，可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中，包括若干指令用以使得一台计算机装置（可以是个人计算机，服务器，或者网络装置等）或处理器（processor）执行本发明各个实施例所述方法的部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器（Read-Only Memory，ROM）、随机存取存储器（Random Access Memory，RAM）、磁碟或者光盘等各种可以存储程序代码的介质。

最后应说明的是：以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims

1.一种推广信息的处理方法，其特征在于，包括：

获取多媒体文件的字幕内容；

2.根据权利要求1所述的方法，其特征在于，所述根据所述字幕内容，获得与所述字幕内容匹配的候选推广信息，以作为目标推广信息，以供在所述多媒体文件的播放过程中，进行所述目标推广信息的推送，包括：

对所述字幕内容进行特征提取，以获得第一特征信息；

3.根据权利要求2所述的方法，其特征在于，所述根据所述第一特征信息和所述至少一个第二特征信息，选择至少一个候选推广信息，以作为所述目标推广信息，包括：

4.根据权利要求2或3所述的方法，其特征在于，所述对所述字幕内容进行特征提取，以获得第一特征信息，包括：

5.根据权利要求2或3所述的方法，其特征在于，所述对待推送的至少一个候选推广信息的文本信息进行特征提取，以获得至少一个第二特征信息，包括：

6.一种推广信息的处理装置，其特征在于，包括：

获取单元，用于获取多媒体文件的字幕内容；

7.根据权利要求6所述的装置，其特征在于，所述匹配单元，具体用于

对所述字幕内容进行特征提取，以获得第一特征信息；

8.根据权利要求7所述的装置，其特征在于，所述匹配单元，具体用于

9.根据权利要求7或8所述的装置，其特征在于，所述匹配单元，具体用于

10.根据权利要求7或8所述的装置，其特征在于，所述匹配单元，具体用于