CN116778388A

CN116778388A - 话题识别方法、装置、电子设备及存储介质

Info

Publication number: CN116778388A
Application number: CN202310778528.0A
Authority: CN
Inventors: 龚云荷
Original assignee: Beijing Dajia Internet Information Technology Co Ltd
Current assignee: Beijing Dajia Internet Information Technology Co Ltd
Priority date: 2023-06-28
Filing date: 2023-06-28
Publication date: 2023-09-19

Abstract

本公开提供了一种话题识别方法、装置、电子设备及存储介质。所述话题识别方法包括：获取多个视频话题及每个视频话题的视频，其中，每个视频话题的视频包括已发布且属于所述视频话题的视频；获取各个所述视频在至少一个内容维度下的视频元素；根据各个所述视频话题的话题文本及对应的视频的视频元素，确定所述多个视频话题的重合指标信息，其中，所述重合指标信息用于表征所述多个视频话题中两两视频话题之间的重合程度；基于所述重合指标信息，确定所述多个视频话题中针对同一事件的相似视频话题。

Description

话题识别方法、装置、电子设备及存储介质

技术领域

本公开总体说来涉及数据处理技术领域，更具体地讲，涉及一种话题识别方法、装置、电子设备及存储介质。

背景技术

随着视频(例如，短视频)行业不断发展，视频的消费与创作成为大众的日常，视频话题作为视频重要的作品信息元素，在作品的生产和消费场景中都发挥着重要价值，例如，对于视频平台内的推荐等生态具有重要作用，同时话题标签页，也为作品聚合提供便捷的路径，满足用户针对某类内容高频消费的诉求。

然而，受限于视频话题大多由用户自由编辑的特点，对于同一个事件或玩法，往往针对其描述的话题较多，不利于话题下作品的累计以及后续的传播。

发明内容

本公开的示例性实施例在于提供一种话题识别方法、装置、电子设备及存储介质，其能够准确识别出针对同一事件的多个相似视频话题。

根据本公开实施例的第一方面，提供一种话题识别方法，所述话题识别方法包括：获取多个视频话题及每个视频话题的视频，其中，每个视频话题的视频包括已发布且属于所述视频话题的视频；获取各个所述视频在至少一个内容维度下的视频元素；根据各个所述视频话题的话题文本及对应的视频的视频元素，确定所述多个视频话题的重合指标信息，其中，所述重合指标信息用于表征所述多个视频话题中两两视频话题之间的重合程度；基于所述重合指标信息，确定所述多个视频话题中针对同一事件的相似视频话题。

可选地，所述根据各个所述视频话题的话题文本及对应的视频的视频元素，确定所述多个视频话题的重合指标信息的步骤包括：基于第一视频话题的话题文本及对应的视频的文本、第二视频话题的话题文本及对应的视频的文本，确定所述第一视频话题与所述第二视频话题之间的文本维度重合度，其中，所述第一视频话题和所述第二视频话题为所述多个视频话题中的任意两个视频话题；基于所述第一视频话题的视频的音频信息、所述第二视频话题的视频的音频信息，确定所述第一视频话题与所述第二视频话题之间的音频维度重合度；基于同时属于所述第一视频话题和所述第二视频话题的视频的数量、所述第一视频话题的视频的总数量、所述第二视频话题的视频的总数量，确定所述第一视频话题与所述第二视频话题之间的作品维度重合度；基于所述第一视频话题与所述第二视频话题之间的文本维度重合度、音频维度重合度、作品维度重合度中的至少一项，得到所述多个视频话题的重合指标信息。

可选地，所述基于第一视频话题的话题文本及对应的视频的文本、第二视频话题的话题文本及对应的视频的文本，确定所述第一视频话题与所述第二视频话题之间的文本维度重合度的步骤包括：确定所述第一视频话题的话题文本与所述第二视频话题的话题文本之间的第一重合度；确定所述第一视频话题的视频的文本与所述第二视频话题的视频的文本之间的第二重合度；基于所述第一重合度和所述第二重合度，确定所述第一视频话题与所述第二视频话题之间的文本维度重合度。

可选地，所述基于所述第一视频话题的视频的音频信息、所述第二视频话题的视频的音频信息，确定所述第一视频话题与所述第二视频话题之间的音频维度重合度的步骤包括：识别所述第一视频话题的视频之中，使用的音乐与所述第二视频话题的视频相同的视频的第一数量，并确定所述第一数量与所述第一视频话题的视频的总数量之间的第一比值；识别所述第二视频话题的视频之中，使用的音乐与所述第一视频话题的视频相同的视频的第二数量，并确定所述第二数量与所述第二视频话题的视频的总数量之间的第二比值；基于所述第一比值和所述第二比值，确定所述第一视频话题与所述第二视频话题之间的音频维度重合度。

可选地，所述基于同时属于所述第一视频话题和所述第二视频话题的视频的数量、所述第一视频话题的视频的总数量、所述第二视频话题的视频的总数量，确定所述第一视频话题与所述第二视频话题之间的作品维度重合度的步骤包括：识别所述第一视频话题的视频之中，同时属于所述第二视频话题的视频的第三数量，并确定所述第三数量与所述第一视频话题的视频的总数量之间的第三比值；识别所述第二视频话题的视频之中，同时属于所述第一视频话题的视频的第四数量，并确定所述第四数量与所述第二视频话题的视频的总数量之间的第四比值；基于所述第三比值和所述第四比值，确定所述第一视频话题与所述第二视频话题之间的作品维度重合度。

可选地，在所述重合指标信息包括文本维度重合度、音频维度重合度和作品维度重合度的情况下，所述基于所述重合指标信息，确定所述多个视频话题中针对同一事件的相似视频话题的步骤包括：在所述第一视频话题与所述第二视频话题之间的文本维度重合度、音频维度重合度以及作品维度重合度的加权和大于第一预设阈值的情况下，确定所述第一视频话题与所述第二视频话题是针对同一事件的相似视频话题；或者，在所述第一视频话题与所述第二视频话题之间的文本维度重合度、音频维度重合度以及作品维度重合度之中的最大值大于第二预设阈值的情况下，确定所述第一视频话题与所述第二视频话题是针对同一事件的相似视频话题。

可选地，所述确定所述第一视频话题的话题文本与所述第二视频话题的话题文本之间的第一重合度的步骤包括：确定所述第一视频话题的话题文本与所述第二视频话题的话题文本重合的文本部分，基于所述重合的文本部分占所述第一视频话题的话题文本的比例和所述重合的文本部分占所述第二视频话题的话题文本的比例，确定所述第一重合度；和/或，基于所述第一视频话题的话题文本的特征向量与所述第二视频话题的话题文本的特征向量之间的相似度，确定所述第一重合度；其中，所述确定所述第一视频话题的视频的文本与所述第二视频话题的视频的文本之间的第二重合度的步骤包括：确定所述第一视频话题的视频的文本与所述第二视频话题的视频的文本重合的文本部分，基于所述重合的文本部分占所述第一视频话题的视频的文本的比例、所述重合的文本部分占所述第二视频话题的视频的文本的比例，确定所述第二重合度；和/或，基于所述第一视频话题的视频的文本的特征向量与所述第二视频话题的视频的文本的特征向量之间的相似度，确定所述第二重合度。

可选地，所述话题识别方法还包括：在每个视频话题的标签页内，显示属于所述视频话题的视频以及属于与所述视频话题针对同一事件的相似视频话题的视频；和/或，针对每个视频，基于所述视频所属的视频话题以及与所述视频话题针对同一事件的相似视频话题，向用户推荐所述视频。

根据本公开实施例的第二方面，提供一种话题识别装置，所述话题识别装置包括：获取单元，被配置为获取多个视频话题及每个视频话题的视频，其中，每个视频话题的视频包括已发布且属于所述视频话题的视频；视频元素获取单元，被配置为获取各个所述视频在至少一个内容维度下的视频元素；信息确定单元，被配置为根据各个所述视频话题的话题文本及对应的视频的视频元素，确定所述多个视频话题的重合指标信息，其中，所述重合指标信息用于表征所述多个视频话题中两两视频话题之间的重合程度；确定单元，被配置为基于所述重合指标信息，确定所述多个视频话题中针对同一事件的相似视频话题。

可选地，所述信息确定单元被配置为：基于第一视频话题的话题文本及对应的视频的文本、第二视频话题的话题文本及对应的视频的文本，确定所述第一视频话题与所述第二视频话题之间的文本维度重合度，其中，所述第一视频话题和所述第二视频话题为所述多个视频话题中的任意两个视频话题；基于所述第一视频话题的视频的音频信息、所述第二视频话题的视频的音频信息，确定所述第一视频话题与所述第二视频话题之间的音频维度重合度；基于同时属于所述第一视频话题和所述第二视频话题的视频的数量、所述第一视频话题的视频的总数量、所述第二视频话题的视频的总数量，确定所述第一视频话题与所述第二视频话题之间的作品维度重合度；基于所述第一视频话题与所述第二视频话题之间的文本维度重合度、音频维度重合度、作品维度重合度中的至少一项，得到所述多个视频话题的重合指标信息。

可选地，所述信息确定单元被配置为：确定所述第一视频话题的话题文本与所述第二视频话题的话题文本之间的第一重合度；确定所述第一视频话题的视频的文本与所述第二视频话题的视频的文本之间的第二重合度；基于所述第一重合度和所述第二重合度，确定所述第一视频话题与所述第二视频话题之间的文本维度重合度。

可选地，所述信息确定单元被配置为：识别所述第一视频话题的视频之中，使用的音乐与所述第二视频话题的视频相同的视频的第一数量，并确定所述第一数量与所述第一视频话题的视频的总数量之间的第一比值；识别所述第二视频话题的视频之中，使用的音乐与所述第一视频话题的视频相同的视频的第二数量，并确定所述第二数量与所述第二视频话题的视频的总数量之间的第二比值；基于所述第一比值和所述第二比值，确定所述第一视频话题与所述第二视频话题之间的音频维度重合度。

可选地，所述信息确定单元被配置为：识别所述第一视频话题的视频之中，同时属于所述第二视频话题的视频的第三数量，并确定所述第三数量与所述第一视频话题的视频的总数量之间的第三比值；识别所述第二视频话题的视频之中，同时属于所述第一视频话题的视频的第四数量，并确定所述第四数量与所述第二视频话题的视频的总数量之间的第四比值；基于所述第三比值和所述第四比值，确定所述第一视频话题与所述第二视频话题之间的作品维度重合度。

可选地，在所述重合指标信息包括文本维度重合度、音频维度重合度和作品维度重合度的情况下，所述确定单元被配置为：在所述第一视频话题与所述第二视频话题之间的文本维度重合度、音频维度重合度以及作品维度重合度的加权和大于第一预设阈值的情况下，确定所述第一视频话题与所述第二视频话题是针对同一事件的相似视频话题；或者，在所述第一视频话题与所述第二视频话题之间的文本维度重合度、音频维度重合度以及作品维度重合度之中的最大值大于第二预设阈值的情况下，确定所述第一视频话题与所述第二视频话题是针对同一事件的相似视频话题。

可选地，所述信息确定单元被配置为：确定所述第一视频话题的话题文本与所述第二视频话题的话题文本重合的文本部分，基于所述重合的文本部分占所述第一视频话题的话题文本的比例和所述重合的文本部分占所述第二视频话题的话题文本的比例，确定所述第一重合度；和/或，基于所述第一视频话题的话题文本的特征向量与所述第二视频话题的话题文本的特征向量之间的相似度，确定所述第一重合度；所述信息确定单元被配置为：确定所述第一视频话题的视频的文本与所述第二视频话题的视频的文本重合的文本部分，基于所述重合的文本部分占所述第一视频话题的视频的文本的比例、所述重合的文本部分占所述第二视频话题的视频的文本的比例，确定所述第二重合度；和/或，基于所述第一视频话题的视频的文本的特征向量与所述第二视频话题的视频的文本的特征向量之间的相似度，确定所述第二重合度。

可选地，所述话题识别装置还包括：标签页提供单元，被配置为在每个视频话题的标签页内，显示属于所述视频话题的视频以及属于与所述视频话题针对同一事件的相似视频话题的视频；和/或，推荐单元，被配置为针对每个视频，基于所述视频所属的视频话题以及与所述视频话题针对同一事件的相似视频话题，向用户推荐所述视频。

根据本公开实施例的第三方面，提供一种电子设备，包括：至少一个处理器；至少一个存储计算机可执行指令的存储器，其中，所述计算机可执行指令在被所述至少一个处理器运行时，促使所述至少一个处理器执行如上所述的话题识别方法。

根据本公开实施例的第四方面，提供一种计算机可读存储介质，当述计算机可读存储介质中的指令被至少一个处理器运行时，促使所述至少一个处理器执行如上所述的话题识别方法。

根据本公开实施例的第五方面，提供一种计算机程序产品，包括计算机指令，所述计算机指令被至少一个处理器执行时实现如上所述的话题识别方法。

根据本公开示例性实施例的话题识别方法、装置、电子设备及存储介质，不仅基于视频话题本身的话题文本，还基于视频话题下的视频的信息来识别针对同一事件的多个相似视频话题，从而提高视频话题识别的准确性。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本公开。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本公开的实施例，并与说明书一起用于解释本公开的原理，并不构成对本公开的不当限定。

图1示出根据本公开示例性实施例的话题识别方法的流程图；

图2示出根据本公开示例性实施例的确定多个视频话题的重合指标信息的方法的流程图；

图3示出根据本公开示例性实施例的确定任意两个视频话题的文本维度重合度的方法的流程图；

图4示出根据本公开示例性实施例的确定任意两个视频话题的音频维度重合度的方法的流程图；

图5示出根据本公开示例性实施例的确定任意两个视频话题的作品维度重合度的方法的流程图；

图6示出根据本公开示例性实施例的话题识别方法的示例；

图7示出根据本公开示例性实施例的话题识别装置的结构框图；

图8示出根据本公开示例性实施例的电子设备的结构框图。

具体实施方式

为了使本领域普通人员更好地理解本公开的技术方案，下面将结合附图，对本公开实施例中的技术方案进行清楚、完整地描述。

需要说明的是，本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。

在此需要说明的是，在本公开中出现的“若干项之中的至少一项”均表示包含“该若干项中的任意一项”、“该若干项中的任意多项的组合”、“该若干项的全体”这三类并列的情况。例如“包括A和B之中的至少一个”即包括如下三种并列的情况：(1)包括A；(2)包括B；(3)包括A和B。又例如“执行步骤一和步骤二之中的至少一个”，即表示如下三种并列的情况：(1)执行步骤一；(2)执行步骤二；(3)执行步骤一和步骤二。

需要说明的是，本公开所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于展示的数据、分析的数据等)，均为经用户授权或者经过各方充分授权的信息和数据。

图1示出根据本公开示例性实施例的话题识别方法的流程图。

参照图1，在步骤S101，获取多个视频话题及每个视频话题的视频。

每个视频话题的视频包括已发布且属于该视频话题的视频。

作为示例，上述视频话题可为短视频话题，上述视频的类型可为短视频。应该理解，也可为其他类型的视频话题和视频，本公开对此不作限制。

作为示例，可获取最近预设时长内发布的被标记属于至少一个视频话题的视频；然后，将获取的视频所属的视频话题，作为所述多个视频话题；并基于获取的视频，确定每个视频话题的视频。例如，可针对每个视频话题，从属于该视频话题的视频中选取一定数量的视频，作为该视频话题的视频，用于后续执行步骤S102。应该理解的是，当同一个视频被标记了多个视频话题时，该视频同时属于这多个视频话题，即，分别在这多个视频话题下。

例如，用户可根据将发布的视频的内容，为该视频标记其所涉及的一个或多个视频话题(即，所属的视频话题)，从而在该视频被发布后，可被关联到所标记的视频话题下。例如，可在其所属的视频话题的标签页，显示该视频。例如，可根据其所属的视频话题，向其他用户推荐该视频。

在步骤S102，获取各个视频在至少一个内容维度下的视频元素。

作为示例，所述至少一个内容维度可包括但不限于以下项之中的至少一项：文本维度、音频维度。相应地，视频元素可包括但不限于以下项之中的至少一项：文本、音频信息。应该理解，也可包括其他的内容维度和视频元素，本公开对此不作限制。

作为示例，视频的音频信息可包括：视频所使用的音乐的信息。例如，视频的音频信息可包括：视频所使用的音乐(例如，背景音乐)的标识信息或特征信息。应该理解，也可包括其他类型的音频信息，本公开对此不作限制。

作为示例，视频的音频信息可包括：通过音频指纹技术(Audio fingerprintingtechnology)从视频的音频中提取出来的信息。例如，音频指纹技术是指通过特定的算法将一段音频中独一无二的数字特征以标识符的形式提取出来，可用于识别海量的声音样本或跟踪定位样本在数据库中的位置。在原声作品(用户剪辑完成的作品)中，可以识别出作品配乐是哪一首音乐。

作为示例，视频的文本可包括但不限于以下项之中的至少一项：视频的文案、从视频的图像中识别出的文本、视频的语音被转化成的文本。应该理解，也可包括其他类型的文本，本公开对此不作限定。

作为示例，可使用OCR(optical character recognition)文字识别从视频的图像中识别出文本。例如，可对视频的封面帧、关键帧等视频帧进行画面的OCR识别，以提取出视频画面内容中的文字。

作为示例，可使用ASR(Automatic Speech Recognition)自动语音识别技术将视频的语音转化成文本，以提取出视频语音内容。

作为示例，视频的文案可包括视频的标题、视频的描述性文本等。

在步骤S103，根据各个视频话题的话题文本及对应的视频的视频元素，确定所述多个视频话题的重合指标信息。

重合指标信息用于表征所述多个视频话题中两两视频话题之间的重合程度。

作为示例，重合指标信息可包括但不限于以下项之中的至少一项：文本维度重合度、音频维度重合度和作品维度重合度。

文本维度重合度用于表征两两视频话题之间的文本重合程度，这里的文本包括：视频话题本身的文本及视频话题下的视频的文本。

音频维度重合度用于表征两两视频话题之间的音频重合程度，这里的音频包括：视频话题下的视频的音频信息。

作品维度重合度用于表征两两视频话题之间的视频重合程度。

可使用各种适当的方式来实现步骤S103，下面将会结合图2来描述步骤S103的示例性实施例。

在步骤S104，基于所述重合指标信息，确定所述多个视频话题中针对同一事件的相似视频话题。

根据本公开的示例性实施例，基于视频话题与视频话题下的视频之间的关联关系，扩展使用视频话题本身文本之外的信息(即，视频话题下的视频的多模态视频元素信息等)来识别针对同一事件的相似视频话题，提高了视频话题识别的准确性。

此外，作为示例，根据本公开示例性实施例的话题识别方法还可包括：在每个视频话题的标签页内，显示属于该视频话题的视频以及属于与该视频话题针对同一事件的相似视频话题的视频。从而，用户在视频话题标签页内，能够看到更多所需的视频。

此外，作为示例，根据本公开示例性实施例的话题识别方法还可包括：针对每个视频，基于该视频所属的视频话题以及与该视频话题针对同一事件的相似视频话题，向用户推荐该视频。从而，能够向用户推荐更符合其需求的视频。

根据本公开示例性实施例的话题识别方法，通过准确识别出同一事件/玩法下的多个视频话题，可以了解某个事件/玩法的真实热度，便于挑选出优质的话题进行运营。从用户体验角度，通过准确识别出同一事件/玩法下的多个视频话题，用户能被推荐到更优质的视频话题和更符合其需求的视频，同时用户在视频话题标签页内，看到的视频更多。

图2示出根据本公开示例性实施例的确定多个视频话题的重合指标信息的方法的流程图。

参照图2，在步骤S201，基于第一视频话题的话题文本及对应的视频的文本、第二视频话题的话题文本及对应的视频的文本，确定第一视频话题与第二视频话题之间的文本维度重合度。

第一视频话题和第二视频话题为所述多个视频话题中的任意两个视频话题。

下面将会结合图3来描述步骤S201的示例性实施例。应该理解，也可使用其他适当的方式来确定文本维度重合度。

在步骤S202，基于第一视频话题的视频的音频信息、第二视频话题的视频的音频信息，确定第一视频话题与第二视频话题之间的音频维度重合度。

下面将会结合图4来描述步骤S202的示例性实施例。应该理解，也可使用其他适当的方式来确定音频维度重合度。

在步骤S203，基于同时属于第一视频话题和第二视频话题的视频的数量、第一视频话题的视频的总数量、第二视频话题的视频的总数量，确定第一视频话题与第二视频话题之间的作品维度重合度。

下面将会结合图5来描述步骤S203的示例性实施例。应该理解，也可使用其他适当的方式来确定作品维度重合度。

在步骤S204，基于第一视频话题与第二视频话题之间的文本维度重合度、音频维度重合度、作品维度重合度中的至少一项，得到所述多个视频话题的重合指标信息。

根据本公开的示例性实施例，能够合理、有效地确定多个视频话题的重合指标信息。

作为示例，步骤S104可包括：基于第一视频话题与第二视频话题之间的文本维度重合度、音频维度重合度、作品维度重合度，确定第一视频话题与第二视频话题是否是针对同一事件的相似视频话题。

作为示例，可在第一视频话题与第二视频话题之间的文本维度重合度、音频维度重合度以及作品维度重合度的加权和大于第一预设阈值的情况下，确定第一视频话题与第二视频话题是针对同一事件的相似视频话题。例如，各项的权重可为1/3，即在第一视频话题与第二视频话题之间的文本维度重合度、音频维度重合度以及作品维度重合度的平均值大于第一预设阈值的情况下，确定第一视频话题与第二视频话题是针对同一事件的相似视频话题。

作为另一示例，可在第一视频话题与第二视频话题之间的文本维度重合度、音频维度重合度以及作品维度重合度之中的最大值大于第二预设阈值的情况下，确定第一视频话题与第二视频话题是针对同一事件的相似视频话题。

作为示例，可在视频话题A和视频话题B是针对同一事件的相似视频话题，且视频话题A和视频话题C是针对同一事件的相似视频话题的情况下，确定视频话题A、视频话题B、视频话题C三者是针对同一事件的相似视频话题。

根据本公开的示例性实施例，通过利用视频话题下的视频的多模态信息，能够便捷、有效地确定针对同一事件的相似视频话题。

图3示出根据本公开示例性实施例的确定任意两个视频话题的文本维度重合度的方法的流程图。所述任意两个视频话题包括第一视频话题和第二视频话题。

参照图3，在步骤S301，确定第一视频话题的话题文本与第二视频话题的话题文本之间的第一重合度。

作为示例，步骤S301可包括：确定第一视频话题的话题文本与第二视频话题的话题文本重合的文本部分，基于所述重合的文本部分占第一视频话题的话题文本的比例和所述重合的文本部分占第二视频话题的话题文本的比例，确定第一重合度；和/或，基于第一视频话题的话题文本的特征向量与第二视频话题的话题文本的特征向量之间的相似度，确定第一重合度。

应该理解，也可通过其他适当的方式来确定第一视频话题的话题文本与第二视频话题的话题文本之间的重合度。

例如，可将所述重合的文本部分占第一视频话题的话题文本的比例和所述重合的文本部分占第二视频话题的话题文本的比例的加权和、或最大值，作为第一重合度。

例如，可直接将第一视频话题的话题文本的特征向量与第二视频话题的话题文本的特征向量之间的相似度，作为第一重合度。例如，话题文本的特征向量可为话题文本的embedding(嵌入)向量。作为示例，特征向量之间的相似度的类型可为余弦相似度。

例如，也可将通过上述两种方式确定的重合度进行加权求和，作为最终的第一重合度。

作为示例，可通过文本拆分、词性分析、语义分析、特征提取等方式，来确定重合的文本部分。例如，重合的文本部分可包括：完全相同的文本部分、或内容较为相似的文本部分。

在步骤S302，确定第一视频话题的视频的文本与第二视频话题的视频的文本之间的第二重合度。

作为示例，步骤S302可包括：确定第一视频话题下的视频的文本与第二视频话题下的视频的文本重合的文本部分，基于所述重合的文本部分占第一视频话题下的视频的文本的比例、所述重合的文本部分占第二视频话题下的视频的文本的比例，确定第二重合度；和/或，基于第一视频话题下的视频的文本的特征向量与第二视频话题下的视频的文本的特征向量之间的相似度，确定第二重合度。

在一个实施例中，可将第一视频话题下的所有视频的所有类型的文本汇总到一起作为第一文本，并将第二视频话题下的所有视频的所有类型的文本汇总到一起作为第二文本，然后对第一文本和第二文本进行比较，以确定第二重合度。

在另一个实施例中，可分别将每个视频话题下的所有视频的每种类型的文本汇总到一起，针对这种类型的文本进行第一视频话题和第二视频话题之间的比较，例如，针对视频的文案这一类型的文本，进行第一视频话题和第二视频话题之间的比较得到文案重合度，针对从视频的图像中识别出的文本这一类型的文本，进行第一视频话题和第二视频话题之间的比较得到图像文本重合度，针对视频的语音被转化成的文本这一类型的文本，进行第一视频话题和第二视频话题之间的比较得到语音文本重合度；然后，取上述三种重合度的加权和、或者最大值作为最终的第二重合度。

作为示例，文本的特征向量可为文本的embedding(嵌入)向量。作为示例，特征向量之间的相似度的类型可为余弦相似度。

此外，可根据上述确定第一重合度的方法示例来确定第二重合度，在此不再赘述。

根据本公开的示例性实施例，能够便捷、有效地确定文本重合度。

在步骤S303，基于第一重合度和第二重合度，确定第一视频话题与第二视频话题之间的文本维度重合度。

作为示例，可将第一重合度和第二重合度的加权和、或最大值，作为第一视频话题与第二视频话题之间的文本维度重合度。

根据本公开的示例性实施例，通过利用视频话题下的视频的多模态信息，能够准确、全面地确定任意两个视频话题的文本维度重合度。

图4示出根据本公开示例性实施例的确定任意两个视频话题的音频维度重合度的方法的流程图。所述任意两个视频话题包括第一视频话题和第二视频话题。

参照图4，在步骤S401，识别第一视频话题下的视频之中，使用的音乐与第二视频话题下的视频相同的视频的第一数量，并确定第一数量与第一视频话题下的视频的总数量之间的第一比值。

作为示例，可针对第一视频话题下的每个视频，识别第二视频话题下是否有任意一个视频与其使用同一首音乐，如果有，则将其确定为使用的音乐与第二视频话题下的视频相同的视频。

在步骤S402，识别第二视频话题下的视频之中，使用的音乐与第一视频话题下的视频相同的视频的第二数量，并确定第二数量与第二视频话题下的视频的总数量之间的第二比值。

作为示例，可针对第二视频话题下的每个视频，识别第一视频话题下是否有任意一个视频与其使用同一首音乐，如果有，则将其确定为使用的音乐与第一视频话题下的视频相同的视频。

在步骤S403，基于第一比值和第二比值，确定第一视频话题与第二视频话题之间的音频维度重合度，也即得到音乐重合度。

作为示例，可将第一比值和第二比值的加权和、或最大值，作为第一视频话题与第二视频话题之间的音频维度重合度。

根据本公开的示例性实施例，通过利用视频话题下的视频的多模态信息，能够准确、全面地确定任意两个视频话题的音频维度重合度。

图5示出根据本公开示例性实施例的确定任意两个视频话题的作品维度重合度的方法的流程图。所述任意两个视频话题包括第一视频话题和第二视频话题。

参照图5，在步骤S501，识别第一视频话题下的视频之中，同时属于第二视频话题的视频的第三数量，并确定第三数量与所述第一视频话题下的视频的总数量之间的第三比值。

在步骤S502，识别第二视频话题下的视频之中，同时属于第一视频话题的视频的第四数量，并确定第四数量与第二视频话题下的视频的总数量之间的第四比值。

在步骤S503，基于第三比值和第四比值，确定第一视频话题与第二视频话题之间的作品维度重合度。

作为示例，可将第三比值和第四比值的加权和、或最大值，作为第一视频话题与第二视频话题之间的作品维度重合度。

根据本公开的示例性实施例，能够准确地确定任意两个视频话题的作品维度重合度。

图6示出根据本公开示例性实施例的话题识别方法的示例。

如图6所示，基于一定周期内的用户发布视频，确定多个视频话题。在话题文本维度、音频指纹维度以及视频文本维度对视频话题进行聚合，即，通过数据统计和挖掘，从文本、音乐、作品等三个维度进行重合度的计算，并最终汇总得出任意两个视频话题之间的相似度，并通过阈值判定任意两个视频话题是否是相似视频话题(即，针对同一事件/玩法的视频话题)，最终输出判断结果。

文本维度重合度计算：对于视频话题下的视频的文本(例如，包括各视频的文案、从各视频的图像中识别出的文本、各视频的语音被转化成的文本)，以及话题本身的文本，可通过以下两种方式计算文本维度重合度：1、计算重合/相似文字占比整体文本比值的方式计算重合度，2、通过文本的embedding计算余弦相似度。

音乐维度重合度计算：通过音频指纹技术的识别，可以识别视频话题下视频的原声是哪首音乐，通过计算两个话题下使用同一首歌的作品，占比全部作品的比值，得到音乐重合度。

作品维度重合度计算：对于两个视频话题，通过计算同时带了这两个话题的作品的数量，占比话题下全部作品的比值，得到作品的重合度。

最终重合度计算以及阈值判断：最终的重合度可采用两种方式计算，一种是各个来源的重合度取均值，另一种是对各个来源的重合度取最大值，并通过阈值(例如：大于80％可认为是针对同一事件的相似话题)来判断是否是针对同一事件的相似话题。例如，最终判断出视频话题1和视频话题2为针对同一事件的相似视频话题。

图7示出根据本公开示例性实施例的话题识别装置的结构框图。

如图7所示，根据本公开示例性实施例的话题识别装置10包括：获取单元101、视频元素获取单元102、信息确定单元103、确定单元104。

具体说来，获取单元101被配置为获取多个视频话题及每个视频话题的视频，其中，每个视频话题的视频包括已发布且属于所述视频话题的视频。

视频元素获取单元102被配置为获取各个所述视频在至少一个内容维度下的视频元素。

信息确定单元103被配置为根据各个所述视频话题的话题文本及对应的视频的视频元素，确定所述多个视频话题的重合指标信息，其中，所述重合指标信息用于表征所述多个视频话题中两两视频话题之间的重合程度。

确定单元104被配置为基于所述重合指标信息，确定所述多个视频话题中针对同一事件的相似视频话题。

作为示例，信息确定单元103可被配置为：基于第一视频话题的话题文本及对应的视频的文本、第二视频话题的话题文本及对应的视频的文本，确定所述第一视频话题与所述第二视频话题之间的文本维度重合度，其中，所述第一视频话题和所述第二视频话题为所述多个视频话题中的任意两个视频话题；基于所述第一视频话题的视频的音频信息、所述第二视频话题的视频的音频信息，确定所述第一视频话题与所述第二视频话题之间的音频维度重合度；基于同时属于所述第一视频话题和所述第二视频话题的视频的数量、所述第一视频话题的视频的总数量、所述第二视频话题的视频的总数量，确定所述第一视频话题与所述第二视频话题之间的作品维度重合度；基于所述第一视频话题与所述第二视频话题之间的文本维度重合度、音频维度重合度、作品维度重合度中的至少一项，得到所述多个视频话题的重合指标信息。

作为示例，信息确定单元103可被配置为：确定所述第一视频话题的话题文本与所述第二视频话题的话题文本之间的第一重合度；确定所述第一视频话题的视频的文本与所述第二视频话题的视频的文本之间的第二重合度；基于所述第一重合度和所述第二重合度，确定所述第一视频话题与所述第二视频话题之间的文本维度重合度。

作为示例，信息确定单元103可被配置为：识别所述第一视频话题的视频之中，使用的音乐与所述第二视频话题的视频相同的视频的第一数量，并确定所述第一数量与所述第一视频话题的视频的总数量之间的第一比值；识别所述第二视频话题的视频之中，使用的音乐与所述第一视频话题的视频相同的视频的第二数量，并确定所述第二数量与所述第二视频话题的视频的总数量之间的第二比值；基于所述第一比值和所述第二比值，确定所述第一视频话题与所述第二视频话题之间的音频维度重合度。

作为示例，信息确定单元103可被配置为：识别所述第一视频话题的视频之中，同时属于所述第二视频话题的视频的第三数量，并确定所述第三数量与所述第一视频话题的视频的总数量之间的第三比值；识别所述第二视频话题的视频之中，同时属于所述第一视频话题的视频的第四数量，并确定所述第四数量与所述第二视频话题的视频的总数量之间的第四比值；基于所述第三比值和所述第四比值，确定所述第一视频话题与所述第二视频话题之间的作品维度重合度。

作为示例，在所述重合指标信息包括文本维度重合度、音频维度重合度和作品维度重合度的情况下，确定单元104可被配置为：在所述第一视频话题与所述第二视频话题之间的文本维度重合度、音频维度重合度以及作品维度重合度的加权和大于第一预设阈值的情况下，确定所述第一视频话题与所述第二视频话题是针对同一事件的相似视频话题；或者，在所述第一视频话题与所述第二视频话题之间的文本维度重合度、音频维度重合度以及作品维度重合度之中的最大值大于第二预设阈值的情况下，确定所述第一视频话题与所述第二视频话题是针对同一事件的相似视频话题。

作为示例，信息确定单元103可被配置为：确定所述第一视频话题的话题文本与所述第二视频话题的话题文本重合的文本部分，基于所述重合的文本部分占所述第一视频话题的话题文本的比例和所述重合的文本部分占所述第二视频话题的话题文本的比例，确定所述第一重合度；和/或，基于所述第一视频话题的话题文本的特征向量与所述第二视频话题的话题文本的特征向量之间的相似度，确定所述第一重合度。

作为示例，信息确定单元103可被配置为：确定所述第一视频话题的视频的文本与所述第二视频话题的视频的文本重合的文本部分，基于所述重合的文本部分占所述第一视频话题的视频的文本的比例、所述重合的文本部分占所述第二视频话题的视频的文本的比例，确定所述第二重合度；和/或，基于所述第一视频话题的视频的文本的特征向量与所述第二视频话题的视频的文本的特征向量之间的相似度，确定所述第二重合度。

作为示例，话题识别装置10还可包括：标签页提供单元(未示出)和/或推荐单元(未示出)，标签页提供单元被配置为在每个视频话题的标签页内，显示属于所述视频话题的视频以及属于与所述视频话题针对同一事件的相似视频话题的视频；推荐单元，被配置为针对每个视频，基于所述视频所属的视频话题以及与所述视频话题针对同一事件的相似视频话题，向用户推荐所述视频。

关于上述实施例中的话题识别装置10，其中各个单元执行操作的具体方式已经在有关该方法的实施例中进行了详细描述，此处将不做详细阐述说明。

此外，应该理解，根据本公开示例性实施例的话题识别装置10中的各个单元可被实现硬件组件和/或软件组件。本领域技术人员根据限定的各个单元所执行的处理，可以例如使用现场可编程门阵列(FPGA)或专用集成电路(ASIC)来实现各个单元。

图8示出根据本公开示例性实施例的电子设备的结构框图。参照图8，该电子设备20包括：至少一个存储器201和至少一个处理器202，所述至少一个存储器201中存储有计算机可执行指令集合，当计算机可执行指令集合被至少一个处理器202执行时，执行如上述示例性实施例所述的话题识别方法。

作为示例，电子设备20可以是PC计算机、平板装置、个人数字助理、智能手机、或其他能够执行上述指令集合的装置。这里，电子设备20并非必须是单个的电子设备，还可以是任何能够单独或联合执行上述指令(或指令集)的装置或电路的集合体。电子设备20还可以是集成控制系统或系统管理器的一部分，或者可被配置为与本地或远程(例如，经由无线传输)以接口互联的便携式电子设备。

在电子设备20中，处理器202可包括中央处理器(CPU)、图形处理器(GPU)、可编程逻辑装置、专用处理器系统、微控制器或微处理器。作为示例而非限制，处理器202还可包括模拟处理器、数字处理器、微处理器、多核处理器、处理器阵列、网络处理器等。

处理器202可运行存储在存储器201中的指令或代码，其中，存储器201还可以存储数据。指令和数据还可经由网络接口装置而通过网络被发送和接收，其中，网络接口装置可采用任何已知的传输协议。

存储器201可与处理器202集成为一体，例如，将RAM或闪存布置在集成电路微处理器等之内。此外，存储器201可包括独立的装置，诸如，外部盘驱动、存储阵列或任何数据库系统可使用的其他存储装置。存储器301和处理器202可在操作上进行耦合，或者可例如通过I/O端口、网络连接等互相通信，使得处理器202能够读取存储在存储器中的文件。

此外，电子设备20还可包括视频显示器(诸如，液晶显示器)和用户交互接口(诸如，键盘、鼠标、触摸输入装置等)。电子设备20的所有组件可经由总线和/或网络而彼此连接。

根据本公开的示例性实施例，还可提供一种存储指令的计算机可读存储介质，其中，当指令被至少一个处理器运行时，促使至少一个处理器执行如上述示例性实施例所述的话题识别方法。这里的计算机可读存储介质的示例包括：只读存储器(ROM)、随机存取可编程只读存储器(PROM)、电可擦除可编程只读存储器(EEPROM)、随机存取存储器(RAM)、动态随机存取存储器(DRAM)、静态随机存取存储器(SRAM)、闪存、非易失性存储器、CD-ROM、CD-R、CD+R、CD-RW、CD+RW、DVD-ROM、DVD-R、DVD+R、DVD-RW、DVD+RW、DVD-RAM、BD-ROM、BD-R、BD-R LTH、BD-RE、蓝光或光盘存储器、硬盘驱动器(HDD)、固态硬盘(SSD)、卡式存储器(诸如，多媒体卡、安全数字(SD)卡或极速数字(XD)卡)、磁带、软盘、磁光数据存储装置、光学数据存储装置、硬盘、固态盘以及任何其他装置，所述任何其他装置被配置为以非暂时性方式存储计算机程序以及任何相关联的数据、数据文件和数据结构并将所述计算机程序以及任何相关联的数据、数据文件和数据结构提供给处理器或计算机使得处理器或计算机能执行所述计算机程序。上述计算机可读存储介质中的计算机程序可在诸如客户端、主机、代理装置、服务器等计算机设备中部署的环境中运行，此外，在一个示例中，计算机程序以及任何相关联的数据、数据文件和数据结构分布在联网的计算机系统上，使得计算机程序以及任何相关联的数据、数据文件和数据结构通过一个或多个处理器或计算机以分布式方式存储、访问和执行。

根据本公开的示例性实施例，还可提供一种计算机程序产品，该计算机程序产品中的指令可由至少一个处理器执行以完成如上述示例性实施例所述的话题识别方法。

本领域技术人员在考虑说明书及实践这里公开的发明后，将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本公开的真正范围和精神由下面的权利要求指出。

应当理解的是，本公开并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

Claims

1.一种话题识别方法，其特征在于，所述话题识别方法包括：

获取多个视频话题及每个视频话题的视频，其中，每个视频话题的视频包括已发布且属于所述视频话题的视频；

获取各个所述视频在至少一个内容维度下的视频元素；

根据各个所述视频话题的话题文本及对应的视频的视频元素，确定所述多个视频话题的重合指标信息，其中，所述重合指标信息用于表征所述多个视频话题中两两视频话题之间的重合程度；

基于所述重合指标信息，确定所述多个视频话题中针对同一事件的相似视频话题。

2.根据权利要求1所述的话题识别方法，其特征在于，所述根据各个所述视频话题的话题文本及对应的视频的视频元素，确定所述多个视频话题的重合指标信息的步骤包括：

基于第一视频话题的话题文本及对应的视频的文本、第二视频话题的话题文本及对应的视频的文本，确定所述第一视频话题与所述第二视频话题之间的文本维度重合度，其中，所述第一视频话题和所述第二视频话题为所述多个视频话题中的任意两个视频话题；

基于所述第一视频话题的视频的音频信息、所述第二视频话题的视频的音频信息，确定所述第一视频话题与所述第二视频话题之间的音频维度重合度；

基于同时属于所述第一视频话题和所述第二视频话题的视频的数量、所述第一视频话题的视频的总数量、所述第二视频话题的视频的总数量，确定所述第一视频话题与所述第二视频话题之间的作品维度重合度；

基于所述第一视频话题与所述第二视频话题之间的文本维度重合度、音频维度重合度、作品维度重合度中的至少一项，得到所述多个视频话题的重合指标信息。

3.根据权利要求2所述的话题识别方法，其特征在于，所述基于第一视频话题的话题文本及对应的视频的文本、第二视频话题的话题文本及对应的视频的文本，确定所述第一视频话题与所述第二视频话题之间的文本维度重合度的步骤包括：

确定所述第一视频话题的话题文本与所述第二视频话题的话题文本之间的第一重合度；

确定所述第一视频话题的视频的文本与所述第二视频话题的视频的文本之间的第二重合度；

基于所述第一重合度和所述第二重合度，确定所述第一视频话题与所述第二视频话题之间的文本维度重合度。

4.根据权利要求2所述的话题识别方法，其特征在于，所述基于所述第一视频话题的视频的音频信息、所述第二视频话题的视频的音频信息，确定所述第一视频话题与所述第二视频话题之间的音频维度重合度的步骤包括：

识别所述第一视频话题的视频之中，使用的音乐与所述第二视频话题的视频相同的视频的第一数量，并确定所述第一数量与所述第一视频话题的视频的总数量之间的第一比值；

识别所述第二视频话题的视频之中，使用的音乐与所述第一视频话题的视频相同的视频的第二数量，并确定所述第二数量与所述第二视频话题的视频的总数量之间的第二比值；

基于所述第一比值和所述第二比值，确定所述第一视频话题与所述第二视频话题之间的音频维度重合度。

5.根据权利要求2所述的话题识别方法，其特征在于，所述基于同时属于所述第一视频话题和所述第二视频话题的视频的数量、所述第一视频话题的视频的总数量、所述第二视频话题的视频的总数量，确定所述第一视频话题与所述第二视频话题之间的作品维度重合度的步骤包括：

识别所述第一视频话题的视频之中，同时属于所述第二视频话题的视频的第三数量，并确定所述第三数量与所述第一视频话题的视频的总数量之间的第三比值；

识别所述第二视频话题的视频之中，同时属于所述第一视频话题的视频的第四数量，并确定所述第四数量与所述第二视频话题的视频的总数量之间的第四比值；

基于所述第三比值和所述第四比值，确定所述第一视频话题与所述第二视频话题之间的作品维度重合度。

6.根据权利要求2所述的话题识别方法，其特征在于，在所述重合指标信息包括文本维度重合度、音频维度重合度和作品维度重合度的情况下，所述基于所述重合指标信息，确定所述多个视频话题中针对同一事件的相似视频话题的步骤包括：

在所述第一视频话题与所述第二视频话题之间的文本维度重合度、音频维度重合度以及作品维度重合度的加权和大于第一预设阈值的情况下，确定所述第一视频话题与所述第二视频话题是针对同一事件的相似视频话题；

或者，在所述第一视频话题与所述第二视频话题之间的文本维度重合度、音频维度重合度以及作品维度重合度之中的最大值大于第二预设阈值的情况下，确定所述第一视频话题与所述第二视频话题是针对同一事件的相似视频话题。

7.根据权利要求3所述的话题识别方法，其特征在于，所述确定所述第一视频话题的话题文本与所述第二视频话题的话题文本之间的第一重合度的步骤包括：

确定所述第一视频话题的话题文本与所述第二视频话题的话题文本重合的文本部分，基于所述重合的文本部分占所述第一视频话题的话题文本的比例和所述重合的文本部分占所述第二视频话题的话题文本的比例，确定所述第一重合度；和/或，基于所述第一视频话题的话题文本的特征向量与所述第二视频话题的话题文本的特征向量之间的相似度，确定所述第一重合度；

其中，所述确定所述第一视频话题的视频的文本与所述第二视频话题的视频的文本之间的第二重合度的步骤包括：

确定所述第一视频话题的视频的文本与所述第二视频话题的视频的文本重合的文本部分，基于所述重合的文本部分占所述第一视频话题的视频的文本的比例、所述重合的文本部分占所述第二视频话题的视频的文本的比例，确定所述第二重合度；和/或，基于所述第一视频话题的视频的文本的特征向量与所述第二视频话题的视频的文本的特征向量之间的相似度，确定所述第二重合度。

8.根据权利要求1所述的话题识别方法，其特征在于，所述话题识别方法还包括：

在每个视频话题的标签页内，显示属于所述视频话题的视频以及属于与所述视频话题针对同一事件的相似视频话题的视频；

和/或，针对每个视频，基于所述视频所属的视频话题以及与所述视频话题针对同一事件的相似视频话题，向用户推荐所述视频。

9.一种话题识别装置，其特征在于，所述话题识别装置包括：

获取单元，被配置为获取多个视频话题及每个视频话题的视频，其中，每个视频话题的视频包括已发布且属于所述视频话题的视频；

视频元素获取单元，被配置为获取各个所述视频在至少一个内容维度下的视频元素；

信息确定单元，被配置为根据各个所述视频话题的话题文本及对应的视频的视频元素，确定所述多个视频话题的重合指标信息，其中，所述重合指标信息用于表征所述多个视频话题中两两视频话题之间的重合程度；

确定单元，被配置为基于所述重合指标信息，确定所述多个视频话题中针对同一事件的相似视频话题。

10.一种电子设备，其特征在于，包括：

至少一个处理器；

至少一个存储计算机可执行指令的存储器，

其中，所述计算机可执行指令在被所述至少一个处理器运行时，促使所述至少一个处理器执行如权利要求1至8中任一项所述的话题识别方法。

11.一种计算机可读存储介质，其特征在于，当述计算机可读存储介质中的指令被至少一个处理器运行时，促使所述至少一个处理器执行如权利要求1至8中任一项所述的话题识别方法。