WO2022111392A1

WO2022111392A1 - 一种视频处理方法、装置、设备及存储介质

Info

Publication number: WO2022111392A1
Application number: PCT/CN2021/131772
Authority: WO
Inventors: 何彦; 谭志远; 麦汉鑫; 玉绍祖; 曹堃
Original assignee: 北京字跳网络技术有限公司
Priority date: 2020-11-24
Filing date: 2021-11-19
Publication date: 2022-06-02
Also published as: CN117750112A; US11871072B2; US20230308710A1; JP2023550187A; US20240098328A1; CN112468864A; EP4240020A1

Abstract

本公开提供了一种视频处理方法、装置、设备及存储介质，所述方法包括：当检测到待处理视频的编辑参考轨道移出视频编辑窗口时，在所述视频编辑窗口的底部区域显示蒙层；所述编辑参考轨道包括视频轨道和/或音频轨道。然后，基于所述视频编辑窗口上的时间轴，在所述蒙层上显示所述待处理视频的编辑参考轨道；其中，在所述蒙层上显示的所述编辑参考轨道用于辅助用户在所述视频编辑窗口中对所述待处理视频进行编辑。可见，本公开实施例提供的视频处理方法，能够在编辑参考轨道移出视频编辑窗口时，以蒙层的形式重新显示编辑参考轨道，降低对用户处理视频的影响，提高用户体验。

Description

一种视频处理方法、装置、设备及存储介质

本申请要求于2020年11月24日提交中国专利局、申请号为202011329694.5、申请名称为“一种视频处理方法、装置、设备及存储介质”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本公开涉及数据处理领域，尤其涉及一种视频处理方法、装置、设备及存储介质。

背景技术

随着视频处理技术的不断发展，对视频处理的功能也更加多样化。例如，对视频的剪辑不仅为用户提供添加音乐、特效等声音的功能，还为用户提供了在视频画面中添加贴纸、文本等的功能，丰富了用户处理视频的体验。

但是，随着视频处理功能的多样化，视频处理界面上的交互功能越来越繁杂，导致用户在视频处理过程中的操作不便，进而影响了用户的视频处理体验。

发明内容

为了解决上述技术问题或者至少部分地解决上述技术问题，本公开提供了一种视频处理方法、装置、设备及存储介质，在编辑参考轨道移出视频编辑窗口时，以蒙层的形式重新显示编辑参考轨道，降低对用户处理视频的影响，提高用户体验。

第一方面，本公开提供了一种视频处理方法，所述方法包括：

当检测到待处理视频的编辑参考轨道移出视频编辑窗口时，在所述视频编辑窗口的底部区域显示蒙层；所述编辑参考轨道包括视频轨道和/或音频轨道；

基于所述视频编辑窗口上的时间轴，在所述蒙层上显示所述待处理视频的编辑参考轨道；其中，在所述蒙层上显示的所述编辑参考轨道用于辅助用户在所述视频编辑窗口中对所述待处理视频进行编辑。

一种可能的实施方式中，所述方法还包括：

当检测到移出所述视频编辑窗口的所述编辑参考轨道重新移入到所述视频编辑窗口时，隐藏所述蒙层以及所述蒙层上显示的所述编辑参考轨道。

一种可能的实施方式中，所述基于所述视频编辑窗口上的时间轴，在所述蒙层上显示所述待处理视频的编辑参考轨道，包括：

基于所述视频编辑窗口上的时间轴，在所述蒙层上以预设形式显示所述待处理视频的音频轨道。

一种可能的实施方式中，所述基于所述视频编辑窗口上的时间轴，在所述蒙层上以预设形式显示所述待处理视频的音频轨道之前，还包括：

确定所述待处理视频的音频轨道上存在目标音频数据的时间点；所述目标音频数据包括音乐类型的音频数据或音效类型的音频数据；

基于所述存在目标音频数据的时间点，为所述待处理视频的音频轨道生成目标音频可视线；其中，所述目标音频可视线用于可视化所述目标音频数据在所述待处理视频中的播放位置；

相应的，所述基于所述视频编辑窗口上的时间轴，在所述蒙层上以预设形式显示所述待处理视频的音频轨道，包括：

基于所述视频编辑窗口上的时间轴，在所述蒙层上显示所述目标音频可视线。

一种可能的实施方式中，所述待处理视频的音频轨道包括第一音频轨道和第二音频轨道，所述确定所述待处理视频的音频轨道中存在目标音频数据的时间点，包括：

分别确定所述第一音频轨道上存在目标音频数据的时间点和所述第二音频轨道上存在目标音频数据的时间点；

将所述第一音频轨道上存在目标音频数据的时间点和所述第二音频轨道上存在目标音频数据的时间点合并，得到合并后时间点；

相应的，所述基于所述存在目标音频数据的时间点，为所述待处理视频的音频轨道生成目标音频可视线，包括：

基于所述合并后时间点，为所述待处理视频生成目标音频可视线。

一种可能的实施方式中，所述目标音频数据包括音乐类型的音频数据；所述基于所述视频编辑窗口上的时间轴，在所述蒙层上显示目标音频可视线之前，还包括：

在所述目标音频可视线上标记音乐踩点。

一种可能的实施方式中，所述目标音频数据包括音效类型的音频数据。

第二方面，本公开提供了一种视频处理装置，所述装置包括：

第一显示模块，用于在检测到待处理视频的视频轨道移出视频编辑窗口时，在所述视频编辑窗口的底部区域显示蒙层；

第二显示模块，用于基于所述视频编辑窗口上的时间轴，在所述蒙层上显示所述待处理视频的编辑参考轨道；其中，所述编辑参考轨道包括视频轨道和/或音频轨道，所述编辑参考轨道用于辅助用户在所述视频编辑窗口中对所述待处理视频进行编辑。

第三方面，本公开提供了一种计算机可读存储介质，所述计算机可读存储介质中存储有指令，当所述指令在终端设备上运行时，使得所述终端设备实现上述的方法。

第四方面，本公开提供了一种设备，包括：存储器，处理器，及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时，实现上述的方法。

本公开实施例提供的技术方案与现有技术相比具有如下优点：

本公开实施例提供了一种视频处理方法，当检测到待处理视频的编辑参考轨道移出视频编辑窗口时，在该视频编辑窗口的底部区域显示蒙层；其中，编辑参考轨道包括视频轨道和/或音频轨道。然后，基于视频编辑窗口上的时间轴，在蒙层上显示待处理视频的编辑参考轨道；其中，在该蒙层上显示的编辑参考轨道用于辅助用户在视频编辑窗口中对待处理视频进行编辑。可见，本公开实施例提供的视频处理方法，能够在编辑参考轨道移出视频编辑窗口时，以蒙层的形式重新显示编辑参考轨道，降低对用户处理视频的影响，提高用户体验。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本公开的实施例，并与说明书一起用于解释本公开的原理。

为了更清楚地说明本公开实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，对于本领域普通技术人员而言，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1为本公开实施例提供的一种视频处理方法的流程图；

图2为本公开实施例提供的一种视频编辑窗口的效果示意图；

图3为本公开实施例提供的一种多条音频轨道上的目标音频数据叠合并的示意图；

图4为本公开实施例提供的另一种视频编辑窗口的效果示意图；

图5为本公开实施例提供的一种视频处理装置的结构示意图；

图6为本公开实施例提供的一种视频处理设备的结构示意图。

具体实施方式

为了能够更清楚地理解本公开的上述目的、特征和优点，下面将对本公开的方案进行进一步描述。需要说明的是，在不冲突的情况下，本公开的实施例及实施例中的特征可以相互组合。

在下面的描述中阐述了很多具体细节以便于充分理解本公开，但本公开还可以采用其他不同于在此描述的方式来实施；显然，说明书中的实施例只是本公开的一部分实施例，而不是全部的实施例。

随着视频处理功能的多样化，视频编辑窗口上的编辑功能越来越繁杂，用户在视频处理过程中可能存在操作不便等情况，影响了用户的使用体验。

实际应用场景中，视频编辑窗口可以通过滚动条的方式显示越来越多的视频编辑功能，但是，基于滚动条的滚动可能导致视频轨道或者音频轨道等用于辅助用户进行视频编辑的轨道，不再显示于视频编辑窗口中，从而影响了用户的视频编辑体验。

为此，本公开提供了一种视频处理方法，具体的，当检测到待处理视频的编辑参考轨道移出视频编辑窗口时，在该视频编辑窗口的底部区域显示蒙层；其中，编辑参考轨道包括视频轨道和/或音频轨道。然后，基于视频编辑窗口上的时间轴，在蒙层上显示待处理视频的编辑参考轨道；其中，在该蒙层上显示的编辑参考轨道用于辅助用户在视频编辑窗口中对该待处理视频进行编辑。

可见，本公开实施例提供的视频处理方法，能够在编辑参考轨道移出视频编辑窗口时，以蒙层的形式重新显示编辑参考轨道，降低对用户处理视频的影响，提升用户体验。

基于此，本公开实施例提供了一种视频处理方法，参考图1，为本公开实施例提供的一种视频处理方法的流程图，该方法包括：

S101：当检测到待处理视频的编辑参考轨道移出视频编辑窗口时，在该视频编辑窗口的底部区域显示蒙层。其中，编辑参考轨道包括视频轨道和/或音频轨道。

本公开实施例提供的视频处理方法可以应用于视频剪辑等功能中。

实际应用中，视频轨道和音频轨道在用户视频处理的过程中起到一定的辅助作用，因此，在用户对待处理视频进行处理的过程中，在视频编辑窗口上应该尽量显示有待处理视频的视频轨道和音频轨道，以提升用户的视频处理体验。

为此，本公开实施例在检测到待处理视频的编辑参考轨道移出视频编辑窗口时，以蒙层的形式对移出视频编辑窗口的编辑参考轨道进行显示，以降低对用户视频处理的影响。

一种可能的实施方式中，用户在对视频进行处理的过程中，可能需要对视频编辑窗口进行上下滚动，而在上下滚动的过程中，可能导致视频编辑窗口中的编辑参考轨道移出视频编辑窗口，即不再显示于视频编辑窗口中。为了降低对用户视频处理的影响，本公开实施例在视频编辑窗口的底部区域显示蒙层，并在蒙层上重新显示编辑参考轨道。

其中，视频编辑窗口的底部区域可以为基于视频编辑窗口的底部边界确定的显示区域。在底部区域显示的蒙层具有一定的透明度，在蒙层上显示编辑参考轨道的同时，不影响被蒙层覆盖的下层区域的内容显示以及操作控制。例如，被蒙层覆盖的下层区域会随着视频编辑窗口的上下滚动而更新显示内容。

一种可能的实施方式中，当检测到待处理视频的视频轨道移出视频编辑窗口时，在该视频编辑窗口的底部区域显示蒙层。或者，当检测到待处理视频的音频轨道移出视频编辑窗口时，在该视频编辑窗口的底部区域显示蒙层。或者，当检测到待处理视频的视频轨道和音频轨道均移出视频编辑窗口时，在该视频编辑窗口的底部区域显示蒙层。其中，视频轨道可以包括主视频轨道，或者视频轨道可以包括主视频轨道和画中画轨道。

S102：基于视频编辑窗口上的时间轴，在蒙层上显示待处理视频的编辑参考轨道。其中，在蒙层上显示的编辑参考轨道用于辅助用户在视频编辑窗口中对待处理视频进行编辑。

本公开实施例中，视频编辑窗口上显示有时间轴，基于该时间轴在蒙层上显示待处理视频的编辑参考轨道，使得蒙层上显示的编辑参考轨道与视频编辑窗口中显示的时间轴一致，便于用户对待处理视频进行编辑。

一种可能的实施方式中，在编辑参考轨道移出视频编辑窗口之后，位于视频编辑窗口底部区域的蒙层上始终显示有编辑参考轨道，以便于用户对视频的编辑。而在检测到移出视频编辑窗口的编辑参考轨道重新移入到视频编辑窗口时，可以隐藏蒙层以及蒙层上显示的编辑参考轨道，避免对编辑参考轨道的冗余显示。此时，用户可以基于重新移入视频编辑窗口的编辑参考轨道，对待处理视频进行编辑。

本公开实施例提供的视频处理方法中，当检测到待处理视频的编辑参考轨道移出视频编辑窗口时，在该视频编辑窗口的底部区域显示蒙层；其中，编辑参考轨道包括视频轨道和/或音频轨道。然后，基于视频编辑窗口上的时间轴，在蒙层上显示待处理视频的编辑参考轨道；其中，在该蒙层上显示的编辑参考轨道用于辅助用户在视频编辑窗口中对待处理视频进行编辑。可见，本公开实施例提供的视频处理方法，能够在编辑参考轨道移出视频编辑窗口时，以蒙层的形式重新显示编辑参考轨道，降低对用户处理视频的影响，提高用户体验。

实际应用中，对于编辑参考轨道包括音频轨道的情况，在蒙层上可以以预设形式显示待处理视频的音频轨道。

一种可能的实施方式中，可以以可视线的形式显示待处理视频的音频轨道。具体的，首先确定待处理视频的音频轨道中存在目标音频数据的时间点，然后，基于该存在目标音频数据的时间点，为该待处理视频的音频轨道生成目标音频可视线。其中，该目标音频可视线用于可视化该待处理视频中该目标音频数据的播放位置。也就是说，通过目标音频可视线可以确定待处理视频中哪些位置存在目标音频数据，例如确定待处理视频中背景音乐的播放位置。

如图2所示，为本公开实施例提供的一种视频编辑窗口的效果示意图，其中，在视频编辑窗口的底部区域显示有蒙层，在蒙层上同时显示有视频轨道和目标音频可视线。其中，目标音频可视线可以包括至少一条线段，而视频轨道可以包括主视频轨道和画中画轨道。

当然，在一些实施方式中，在视频编辑窗口的底部区域的蒙层上可以仅显示视频轨道，也可以仅显示目标音频可视线，对于此本公开实施例不做限制。

另外，本公开实施例中的目标音频数据可以包括音乐类型的音频数据，和/或，音效类型的音频数据。

具体的，音乐类型的音频数据通常为电子音乐，如歌曲、轻音乐等，本公开实施例中的确定待处理视频的音频轨道中存在目标音频数据的时间点，可以包括确定待处理视频的音频轨道中存在音乐类型的音频数据的时间点。其中，音频轨道可以包括至少一条音乐类型的音频轨道。

而音效类型的音频数据通常为特效音频、配音、文本朗读等，如类似猫叫的特效音频“喵～”。本公开实施例中的确定待处理视频的音频轨道中存在目标音频数据的时间点，可以包括确定待处理视频的音频轨道中存在音效类型的音频数据的时间点。其中，音频轨道可以包括至少一条音效类型的音频轨道。

一种可能的实施方式中，如果待处理视频中存在目标音频数据的音频轨道仅有一条，则将该音频轨道上存在目标音频数据的时间点确定为待处理视频的音频轨道中存在目标音频数据的时间点即可。

另一种可能的实施方式中，如果待处理视频中存在目标音频数据的音频轨道包括至少两条音频轨道，以下以第一音频轨道和第二音频轨道为例，则确定该待处理视频的音频轨道中存在目标音频数据的时间点，具体包括：

首先，分别确定第一音频轨道中存在目标音频数据的时间点和第二音频轨道中存在目标音频数据的时间点；然后，将该第一音频轨道中存在目标音频数据的时间点和该第二音频轨道上存在目标音频数据的时间点合并，得到合并后时间点，最终基于合并后时间点，为该待处理视频生成目标音频可视线。

如图3所示，为本公开实施例提供的一种多条音频轨道上存在目标音频数据的时间点合并的示意图，其中，第一音频轨道包括音频数据A和音频数据B，第二音频轨道包括音频数据C，基于时间轴将音频数据A、音频数据B和音频数据C分别对应的时间点进行合并后，得到合并后时间点，即存在音频数据A、音频数据B或音频数据C的时间点。其中，对音频数据A、音频数据B和音频数据C分别对应的时间点进行合并，具体是将待处理视频中存在音频数据A、音频数据B和音频数据C中至少一个的时间点保留，用于构成目标音频可视线。

一种可能的实施方式中，目标音频数据可以包括音乐类型的音频数据和音效类型的音频数据，因此，本公开实施例可以分别为音乐类型的音频数据和音效类型的音频数据生成对应的可视线。具体的，基于待处理视频的音频轨道上存在音乐类型的音频数据的时间点，生成音乐音频可视线，同时，基于待处理视频的音频轨道上存在音效类型的音频数据的时间点，生成音效音频可视线。

如图4所示，为本公开实施例提供的另一种视频编辑窗口的效果示意图。其中，在视频编辑窗口的蒙层上，基于同一时间轴显示有主视频轨道、画中画轨道、音乐类型的音频可视线L1和音效类型的音频可视线L2。

本公开实施例提供的视频处理方法，能够以可视线的形式为用户展示音频轨道中存在目标音频数据的时间点，在不影响视频处理的前提下，优化视频编辑窗口的显示效果，便于用户操作，提升用户使用体验。

实际应用中，对视频进行处理的过程中，音乐踩点是其中的一个重要参考因素，因此，本公开实施例在基于视频编辑窗口上的时间轴，在蒙层上显示目标音频可视线之前，还需要确定待处理视频的音乐踩点，然后对音乐踩点进行展示，便于用户对视频的处理，提升用户体验。

具体的，目标音频数据为音乐类型的音频数据时，从待处理视频的音频轨道上存在目标音频数据的时间点中确定音乐踩点，然后，在音乐类型的音频可视线上标记音乐踩点。

其中，音乐踩点用于标识音乐中的节奏、旋律等。音乐踩点可以为预先自动生成的，也可以为用户手动确定的，在此不做限定。

一种可能的实施方式中，如果待处理视频中存在音乐类型的音频数据的音频轨道仅有一条，则将该音频轨道上的音乐踩点，确定为待处理视频的音乐踩点。

另一种可能的实施方式中，如果待处理视频中存在音乐类型的音频数据的音频轨道包括至少两条音频轨道，以下以第三音频轨道和第四音频轨道为例，则可以基于时间轴将第三音频轨道和第四音频轨道上的音乐踩点进行叠加，确定待处理视频中的音乐踩点。如图4所示，音乐类型的音频轨道上已标记出音乐踩点。

本公开实施例提供的视频处理方法中，在蒙层上不仅为用户展示目标音频可视线，还为用户展示音乐踩点，能够在不影响视频处理的前提下，优化视频编辑窗口的显示效果，便于用户操作，提升用户使用体验。

与上述方法实施例基于同一个发明构思，本公开还提供了一种视频处理装置，参考图5，为本公开实施例提供的一种视频处理装置的结构示意图，该装置包括：

第一显示模块501，用于在检测到待处理视频的视频轨道移出视频编辑窗口时，在该视频编辑窗口的底部区域显示蒙层；

第二显示模块502，用于基于该视频编辑窗口上的时间轴，在该蒙层上显示该待处理视频的编辑参考轨道；其中，该编辑参考轨道包括视频轨道和/或音频轨道，该编辑参考轨道用于辅助用户在该视频编辑窗口中对该待处理视频进行编辑。

一种可能的实施方式中，上述装置还包括：

隐藏模块，用于在检测到移出视频编辑窗口的编辑参考轨道重新移入到该视频编辑窗口时，隐藏蒙层以及该蒙层上显示的编辑参考轨道。

一种可能的实施方式中，上述第二显示模块502，具体用于：

基于视频编辑窗口上的时间轴，在蒙层上以预设形式显示待处理视频的音频轨道。

一种可能的实施方式中，上述装置还包括：

第一确定模块，用于确定待处理视频的音频轨道上存在目标音频数据的时间点；该目标音频数据包括音乐类型的音频数据或音效类型的音频数据；

生成模块，用于基于存在目标音频数据的时间点，为待处理视频的音频轨道生成目标音频可视线；其中，该目标音频可视线用于可视化该目标音频数据在该待处理视频中的播放位置；

相应的，上述第二显示模块502，具体用于：

基于视频编辑窗口上的时间轴，在蒙层上显示上述目标音频可视线。

一种可能的实施方式中，上述待处理视频的音频轨道包括第一音频轨道和第二音频轨道，上述第一确定模块，包括：

第一确定子模块，用于分别确定该第一音频轨道和该第二音频轨道上存在目标音频数据的时间点；

合并子模块，用于将该第一音频轨道和该第二音频轨道上存在目标音频数据的时间点合并，得到合并后时间点；

相应的，上述生成模块，具体用于：

基于上述合并后时间点，为待处理视频生成目标音频可视线。

一种可能的实施方式中，上述目标音频数据包括音乐类型的音频数据；上述装置还包括：

标记模块，用于在上述目标音频可视线上标记音乐踩点。

一种可能的实施方式中，上述目标音频数据包括音效类型的音频数据。

本公开实施例提供的视频处理装置中，当检测到待处理视频的编辑参考轨道移出视频编辑窗口时，在该视频编辑窗口的底部区域显示蒙层；其中，编辑参考轨道包括视频轨道和/或音频轨道。然后，基于该视频编辑窗口上的时间轴，在该蒙层上显示该待处理视频的编辑参考轨道；其中，在该蒙层上显示的编辑参考轨道用于辅助用户在视频编辑窗口中对待处理视频进行编辑。可见，本公开实施例提供的视频处理装置，能够在编辑参考轨道移出视频编辑窗口时，以蒙层的形式重新显示编辑参考轨道，降低对用户处理视频的影响，提高用户体验。

除了上述方法和装置以外，本公开实施例还提供了一种计算机可读存储介质，计算机可读存储介质中存储有指令，当该指令在终端设备上运行时，使得该终端设备实现本公开实施例提供的视频处理方法的任一实施方式。

另外，本公开实施例还提供了一种视频处理设备，参见图6所示，可以包括：

处理器601、存储器602、输入装置603和输出装置604。视频处理设备中的处理器601的数量可以一个或多个，图6中以一个处理器为例。在本公开的一些实施例中，处理器601、存储器602、输入装置603和输出装置604可通过总线或其它方式连接，其中，图6中以通过总线连接为例。

存储器602可用于存储软件程序以及模块，处理器601通过运行存储在存储器602的软件程序以及模块，从而执行视频处理设备的各种功能应用以及数据处理。存储器602可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需的应用程序等。此外，存储器602可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。输入装置603可用于接收输入的数字或字符信息，以及产生与视频处理设备的用户设置以及功能控制有关的信号输入。

具体在本实施例中，处理器601会按照如下的指令，将一个或一个以上的应用程序的进程对应的可执行文件加载到存储器602中，并由处理器601来运行存储在存储器602中的应用程序，从而实现上述视频处理设备的各种功能。

需要说明的是，在本文中，诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

以上所述仅是本公开的具体实施方式，使本领域技术人员能够理解或实现本公开。对这些实施例的多种修改对本领域的技术人员来说将是显而易见的，本文中所定义的一般原理可以在不脱离本公开的精神或范围的情况下，在其它实施例中实现。因此，本公开将不会被限制于本文所述的这些实施例，而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims

一种视频处理方法，其特征在于，所述方法包括：

当检测到待处理视频的编辑参考轨道移出视频编辑窗口时，在所述视频编辑窗口的底部区域显示蒙层；所述编辑参考轨道包括视频轨道和/或音频轨道；

基于所述视频编辑窗口上的时间轴，在所述蒙层上显示所述待处理视频的编辑参考轨道；其中，在所述蒙层上显示的所述编辑参考轨道用于辅助用户在所述视频编辑窗口中对所述待处理视频进行编辑。
根据权利要求1所述的方法，其特征在于，所述方法还包括：

当检测到移出所述视频编辑窗口的所述编辑参考轨道重新移入到所述视频编辑窗口时，隐藏所述蒙层以及所述蒙层上显示的所述编辑参考轨道。
根据权利要求1所述的方法，其特征在于，所述基于所述视频编辑窗口上的时间轴，在所述蒙层上显示所述待处理视频的编辑参考轨道，包括：

基于所述视频编辑窗口上的时间轴，在所述蒙层上以预设形式显示所述待处理视频的音频轨道。
根据权利要求3所述的方法，其特征在于，所述基于所述视频编辑窗口上的时间轴，在所述蒙层上以预设形式显示所述待处理视频的音频轨道之前，还包括：

确定所述待处理视频的音频轨道上存在目标音频数据的时间点；所述目标音频数据包括音乐类型的音频数据或音效类型的音频数据；

基于所述存在目标音频数据的时间点，为所述待处理视频的音频轨道生成目标音频可视线；其中，所述目标音频可视线用于可视化所述目标音频数据在所述待处理视频中的播放位置；

所述基于所述视频编辑窗口上的时间轴，在所述蒙层上以预设形式显示所述待处理视频的音频轨道，包括：

基于所述视频编辑窗口上的时间轴，在所述蒙层上显示所述目标音频可视线。
根据权利要求4所述的方法，其特征在于，所述待处理视频的音频轨道包括第一音频轨道和第二音频轨道，所述确定所述待处理视频的音频轨道中存在目标音频数据的时间点，包括：

分别确定所述第一音频轨道上存在目标音频数据的时间点和所述第二音频轨道上存在目标音频数据的时间点；

将所述第一音频轨道上存在目标音频数据的时间点和所述第二音频轨道上存在目标音频数据的时间点合并，得到合并后时间点；

所述基于所述存在目标音频数据的时间点，为所述待处理视频的音频轨道生成目标音频可视线，包括：

基于所述合并后时间点，为所述待处理视频生成目标音频可视线。
根据权利要求4或5所述的方法，其特征在于，所述目标音频数据包括音乐类型的音频数据；所述基于所述视频编辑窗口上的时间轴，在所述蒙层上显示目标音频可视线之前，还包括：

在所述目标音频可视线上标记音乐踩点。
根据权利要求4或5所述的方法，其特征在于，所述目标音频数据包括音效类型的音频数据。
一种视频处理装置，其特征在于，所述装置包括：

第一显示模块，用于在检测到待处理视频的视频轨道移出视频编辑窗口时，在所述视频编辑窗口的底部区域显示蒙层；

第二显示模块，用于基于所述视频编辑窗口上的时间轴，在所述蒙层上显示所述待处理视频的编辑参考轨道；其中，所述编辑参考轨道包括视频轨道和/或音频轨道，所述编辑参考轨道用于辅助用户在所述视频编辑窗口中对所述待处理视频进行编辑。
一种计算机可读存储介质，其特征在于，所述计算机可读存储介质中存储有指令，当所述指令在终端设备上运行时，使得所述终端设备实现如权利要求1-7任一项所述的方法。
一种设备，其特征在于，包括：存储器，处理器，及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时，实现如权利要求1-7任一项所述的方法。