CN111901534B - 一种音视频分割的交互方法、装置、设备及存储介质 - Google Patents

一种音视频分割的交互方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN111901534B
CN111901534B CN202010718080.XA CN202010718080A CN111901534B CN 111901534 B CN111901534 B CN 111901534B CN 202010718080 A CN202010718080 A CN 202010718080A CN 111901534 B CN111901534 B CN 111901534B
Authority
CN
China
Prior art keywords
video
target audio
selected segment
pointer
segmentation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010718080.XA
Other languages
English (en)
Other versions
CN111901534A (zh
Inventor
林兆钦
郑起凡
曾衍
付平非
赵晨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing ByteDance Network Technology Co Ltd
Original Assignee
Beijing ByteDance Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing ByteDance Network Technology Co Ltd filed Critical Beijing ByteDance Network Technology Co Ltd
Priority to CN202010718080.XA priority Critical patent/CN111901534B/zh
Publication of CN111901534A publication Critical patent/CN111901534A/zh
Priority to JP2023504034A priority patent/JP7471507B2/ja
Priority to PCT/CN2021/107367 priority patent/WO2022017382A1/zh
Priority to EP21847150.6A priority patent/EP4171016A4/en
Application granted granted Critical
Publication of CN111901534B publication Critical patent/CN111901534B/zh
Priority to US18/069,839 priority patent/US20230185438A1/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/222Studio circuitry; Studio devices; Studio equipment
    • H04N5/262Studio circuits, e.g. for mixing, switching-over, change of character of image, other special effects ; Cameras specially adapted for the electronic generation of special effects
    • H04N5/265Mixing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/222Studio circuitry; Studio devices; Studio equipment
    • H04N5/262Studio circuits, e.g. for mixing, switching-over, change of character of image, other special effects ; Cameras specially adapted for the electronic generation of special effects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0484Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object, an image or a displayed text element, setting a parameter value or selecting a range
    • G06F3/04842Selection of displayed objects or displayed text elements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/431Generation of visual interfaces for content selection or interaction; Content or additional data rendering
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/44008Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics in the video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/472End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content
    • H04N21/47205End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content for manipulating displayed content, e.g. interacting with MPEG-4 objects, editing locally
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/485End-user interface for client configuration
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/81Monomedia components thereof
    • H04N21/8106Monomedia components thereof involving special audio data, e.g. different tracks for different languages
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/845Structuring of content, e.g. decomposing content into time segments
    • H04N21/8456Structuring of content, e.g. decomposing content into time segments by decomposing the content in the time domain, e.g. in time segments

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Human Computer Interaction (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • User Interface Of Digital Computer (AREA)
  • Studio Circuits (AREA)

Abstract

本公开提供了一种音视频分割的交互方法、装置、设备及存储介质,所述方法包括:检测目标音视频中是否存在被选中片段;如果确定所述目标音视频中存在所述被选中片段,则在检测到所述目标音视频的轨道上的指针位于所述被选中片段时,显示分割按钮;响应于针对所述分割按钮的触发操作,基于所述指针与所述被选中片段的相交位置,对所述被选中片段进行分割。与分割按钮常驻于轨道的指针的交互方式相比,本公开能够最大程度上减少音视频分割的误操作,一定程度上提高了用户的使用体验。

Description

一种音视频分割的交互方法、装置、设备及存储介质
技术领域
本公开涉及音视频剪辑处理领域,尤其涉及一种音视频分割的交互方法、装置、设备及存储介质。
背景技术
音视频分割是音视频剪辑工具的常用功能,是指通过将目标音视频分割为多个音视频片段,实现对音视频的剪辑。
目前,在对音视频进行分割的交互过程中,轨道的指针上始终显示有分割按钮,如“剪刀”图案的按钮,用于触发基于指针定位的分割点对音视频进行分割的操作。
但是,由于分割按钮常驻于轨道的指针上,即使在用户不存在对音视频进行分割需求的情况下,也可能因为用户的误触发,导致对音视频进行分割的误操作的发生,一定程度上影响了用户的使用体验。
发明内容
为了解决上述技术问题或者至少部分地解决上述技术问题,本公开提供了一种音视频分割的交互方法、装置、设备及存储介质,能够减少对音视频进行分割的误操作的发生,进而提高用户的使用体验。
第一方面,本公开提供了一种音视频分割的交互方法,所述方法包括:
检测目标音视频中是否存在被选中片段;
如果确定所述目标音视频中存在所述被选中片段,则在检测到所述目标音视频的轨道上的指针位于所述被选中片段时,显示分割按钮;
响应于针对所述分割按钮的触发操作,基于所述指针与所述被选中片段的相交位置,对所述被选中片段进行分割。
一种可选的实施方式中,所述方法还包括:
如果确定所述目标音视频中不存在所述被选中片段,则在检测到鼠标移动到所述指针与所述目标音视频的相交位置时,显示所述分割按钮;
响应于针对所述分割按钮的触发操作,基于所述指针与所述目标音视频的相交位置,对所述目标音视频进行分割。
一种可选的实施方式中,所述在检测到所述目标音视频的轨道上的指针位于所述被选中片段时,显示分割按钮,包括:
在检测到所述目标音视频的轨道上的指针位于所述被选中片段时,在所述指针与所述被选中片段的相交位置显示分割按钮。
一种可选的实施方式中,所述响应于针对所述分割按钮的触发操作,基于所述指针与所述被选中片段的相交位置,对所述被选中片段进行分割之前,还包括:
当检测到鼠标移动到所述分割按钮的位置时,对所述指针与所述被选中片段的相交位置进行高亮显示。
一种可选的实施方式中,所述在检测到鼠标移动到所述指针与所述目标音视频的相交位置时,显示所述分割按钮,包括:
在检测到鼠标移动到所述指针与所述目标音视频的相交位置时,在所述指针与所述目标音视频的相交位置显示所述分割按钮。
一种可选的实施方式中,所述响应于针对所述分割按钮的触发操作,基于所述指针与所述目标音视频的相交位置,对所述目标音视频进行分割之前,还包括:
当检测到鼠标移动到所述分割按钮的位置时,对所述指针与所述目标音视频的相交位置进行高亮显示。
一种可选的实施方式中,所述确定所述目标音视频中不存在所述被选中片段之后,且在所述响应于针对所述分割按钮的触发操作,基于所述指针与所述目标音视频的相交位置,对所述目标音视频进行分割之前,还包括:
在检测到鼠标移动到所述指针与所述目标音视频对应的字幕的相交位置时,触发执行所述显示所述分割按钮的步骤。
第二方面,本公开提供了一种音视频分割的交互装置,所述装置包括:
第一检测模块,用于检测目标音视频中是否存在被选中片段;
第一显示模块,用于在确定所述目标音视频中存在所述被选中片段,且在检测到所述目标音视频的轨道上的指针位于所述被选中片段时,显示分割按钮;
第一分割模块,用于响应于针对所述分割按钮的触发操作,基于所述指针与所述被选中片段的相交位置,对所述被选中片段进行分割。
一种可选的实施方式中,所述装置还包括:
第二显示模块,用于在确定所述目标音视频中不存在所述被选中片段,且在检测到鼠标移动到所述指针与所述目标音视频的相交位置时,显示所述分割按钮;
第二分割模块,用于响应于针对所述分割按钮的触发操作,基于所述指针与所述目标音视频的相交位置,对所述目标音视频进行分割。
第三方面,本公开提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当所述指令在终端设备上运行时,使得所述终端设备实现上述的方法。
第四方面,本公开提供了一种设备,包括:存储器,处理器,及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时,实现上述的方法。
本公开实施例提供的技术方案与现有技术相比具有如下优点:
本公开实施例提供了一种音视频分割的交互方法,首先检测目标音视频中是否存在被选中片段,如果存在,则进入对被选中片段进行分割的模式,具体的,在检测到目标音视频的轨道上的指针位于被选中片段时,显示分割按钮,并在接收到针对该分割按钮的触发操作时,基于指针与被选中片段的相交位置,对被选中片段进行分割。与分割按钮常驻于轨道的指针的交互方式相比,本公开实施例在检测到指针位于被选中片段时对分割按钮进行显示,由于指针移动到被选中片段说明用户当前存在音视频分割需求,此时触发分割按钮的显示,便于用户对被选中片段的分割触发操作。另外,在用户存在音视频分割需求时才显示分割按钮,能够最大程度上减少音视频分割的误操作,一定程度上提高了用户的使用体验。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。
为了更清楚地说明本公开实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本公开实施例提供的一种音视频分割的交互方法的流程图;
图2为本公开实施例提供的一种音视频分割的交互界面示意图;
图3为本公开实施例提供的另一种音视频分割的交互界面示意图;
图4为本公开实施例提供的另一种音视频分割的交互方法的流程图;
图5为本公开实施例提供的另一种音视频分割的交互界面示意图;
图6为本公开实施例提供的一种音视频分割的交互装置的结构示意图;
图7为本公开实施例提供的另一种音视频分割的交互装置的结构示意图;
图8为本公开实施例提供的一种音视频分割的交互设备结构示意图。
具体实施方式
为了能够更清楚地理解本公开的上述目的、特征和优点,下面将对本公开的方案进行进一步描述。需要说明的是,在不冲突的情况下,本公开的实施例及实施例中的特征可以相互组合。
在下面的描述中阐述了很多具体细节以便于充分理解本公开,但本公开还可以采用其他不同于在此描述的方式来实施;显然,说明书中的实施例只是本公开的一部分实施例,而不是全部的实施例。
目前,在对音视频进行分割的交互过程中,音视频的轨道上的指针始终显示有分割按钮,用于触发基于指针定位的分割点对音视频进行分割的操作。但是,因为用户的误触发等原因,可能导致对音视频进行分割的误操作的发生,一定程度上影响了用户的使用体验。
为此,本公开提供了一种音视频分割的交互方法,具体的,首先检测目标音视频中是否存在被选中片段,如果存在,则进入对被选中片段进行分割的模式,具体的,在检测到目标音视频的轨道上的指针位于被选中片段时,显示分割按钮,并在接收到针对该分割按钮的触发操作时,基于指针与被选中片段的相交位置,对被选中片段进行分割。与分割按钮常驻于轨道的指针的交互方式相比,本公开实施例在检测到指针位于被选中片段时对分割按钮进行显示,由于指针移动到被选中片段说明用户当前存在音视频分割需求,此时触发分割按钮的显示,便于用户对被选中片段的分割触发操作。另外,在用户存在音视频分割需求时才显示分割按钮,能够最大程度上减少音视频分割的误操作,一定程度上提高了用户的使用体验。
另外,如果确定目标音视频中不存在被选中片段,则进入对目标音视频进行分割的模式,具体的,在检测到鼠标移动到指针与目标音视频的相交位置时,显示分割按钮,并在接收到针对该分割按钮的触发操作时,基于指针与目标音视频的相交位置,对目标音视频进行分割。与分割按钮常驻于轨道的指针的交互方式相比,本公开实施例在目标音视频中不存在被选中片段且检测到鼠标移动到指针与目标音视频的相交位置时对分割按钮进行显示,由于鼠标移动到指针与目标音视频的相交位置说明用户当前存在音视频分割需求,此时触发分割按钮的显示,便于用户对目标音视频的分割触发操作。另外,在用户存在音视频分割需求时才显示分割按钮,能够最大程度上减少音视频分割的误操作,一定程度上提高了用户的使用体验。
基于此,本公开实施例提供了一种音视频分割的交互方法,参考图1,为本公开实施例提供的一种音视频分割的交互方法的流程图,该方法包括:
S101:检测目标音视频中是否存在被选中片段。
本公开实施例中,目标音视频可以为音频文件,也可以为视频文件,本公开实施例可以在对音频文件或视频文件剪辑的过程中,实现对视频或音频的分割。具体的,可以对音视频进行整体分割,也可以针对音视频中的某个片段进行分割。
实际应用中,当用户存在针对目标音视频中的某个片段进行分割的需求时,首先从目标音视频中确定至少一个片段,作为被选中片段。如果用户存在对目标音视频进行整体分割的需求,则无需确定被选中片段。
一种可选的实施方式中,可以通过在目标音视频的轨道上拖动鼠标的操作确定被选中片段。其中,从拖动鼠标的操作的起始位置到结束位置对应的音视频帧组成被选中片段。
由于针对目标音视频进行整体分割和针对被选中片段进行分割分别对应不同的交互方式,因此,本公开实施例在确定交互方式之前,首先检测目标音视频中是否存在被选中片段。
一种可选的实施方式中,被选中片段的起始位置和结束位置可以记录在目标音视频对应的参数中,检测目标音视频中是否存在被选中片段,具体可以为检测目标音视频对应的参数中是否记录有被选中片段的起始位置和结束位置,如果参数中记录有被选中片段的起始位置和结束位置,则说明当前存在被选中片段,如果参数中记录有0或者为空,则说明当前不存在被选中片段。
S102:如果确定所述目标音视频中存在所述被选中片段,则在检测到所述目标音视频的轨道上的指针位于所述被选中片段时,显示分割按钮。
本公开实施例中,如果检测到目标音视频中存在被选中片段,则进入针对被选中片段进行分割的模式,具体的,在检测到目标音视频的轨道上的指针位于被选中片段时,显示分割按钮。
如图2所述,为本公开实施例提供的一种音视频分割的交互界面示意图,其中,轨道的指针位于目标音视频中的被选中片段,相应的,在交互界面上显示分割按钮。为了突出本次分割的处理对象,图2中对除被选中片段之前的其他片段进行蒙灰显示,此时无法对其他片段进行分割。
一种可选的实施方式中,当检测到目标音视频的轨道上的指针位于被选中片段时,可以在交互界面上的预设位置显示分割按钮,例如交互界面的右上角。
为了提高音视频分割的交互过程的流畅性,从而提高用户的使用体验,本公开实施例可以在指针与被选中片段的相交位置显示分割按钮,如图2所示,指针与被选中片段的相交位置显示有“剪刀”图案的切割按钮。实际应用中,用户在将指针移动到被选中片段后,可以直接点击显示于指针与被选中片段的相交位置的分割按钮,触发针对被选中片段的分割,无需再增加寻找位于交互界面的其他位置的分割按钮的交互时间。
本公开实施例中,在未检测到目标音视频的轨道上的指针位于被选中片段时,不显示分割按钮,以避免由于用户误触发导致对音视频分割的误操作。
实际应用中,用户在被选中片段中拖动指针以确定分割点的过程中,在指针与被选中片段的相交位置始终显示分割按钮。
另一种可选的实施方式中,为了更直观的将分割点的位置提示给用户,在用户将鼠标移动到分割按钮的位置时,对指针与被选中片段的相交位置进行高亮显示,以便在用户点击分割按钮之前明确获知分割点的位置。
如图3所示,为本公开实施例提供的另一种音视频分割的交互界面示意图,其中,黑色粗线位置用于高亮显示,用于更直观的提示用户分割点的位置。
S103:响应于针对所述分割按钮的触发操作,基于所述指针与所述被选中片段的相交位置,对所述被选中片段进行分割。
本公开实施例中,在接收到针对分割按钮的触发操作时,对被选中片段进行分割。具体的,基于指针与被选中片段的相交位置,将被选中片段分割为两个片段。
本公开实施例提供的音视频分割的交互方法中,首先检测目标音视频中是否存在被选中片段,如果存在,则进入对被选中片段进行分割的模式,具体的,在检测到目标音视频的轨道上的指针位于被选中片段时,显示分割按钮,并在接收到针对该分割按钮的触发操作时,基于指针与被选中片段的相交位置,对被选中片段进行分割。与分割按钮常驻于轨道的指针的交互方式相比,本公开实施例在检测到指针位于被选中片段时对分割按钮进行显示,由于指针移动到被选中片段说明用户当前存在音视频分割需求,此时触发分割按钮的显示,便于用户对被选中片段的分割触发操作。另外,在用户存在音视频分割需求时才显示分割按钮,能够最大程度上减少音视频分割的误操作,一定程度上提高了用户的使用体验。
为了进一步的丰富音视频分割的交互功能,本公开实施例还提供了一种音视频分割的交互方法,参考图4,为本公开实施例提供的一种音视频分割的交互方法流程图,该方法包括:
S401:检测目标音视频中是否存在被选中片段。
S402:如果确定所述目标音视频中存在所述被选中片段,则在检测到所述目标音视频的轨道上的指针位于所述被选中片段时,显示分割按钮。
S403:响应于针对所述分割按钮的触发操作,基于所述指针与所述被选中片段的相交位置,对所述被选中片段进行分割。
本公开实施例中的S401-S403可参照上述实施例中的S101-S103的描述进行理解,在此不再赘述。
S404:如果确定所述目标音视频中不存在所述被选中片段,则在检测到鼠标移动到所述指针与所述目标音视频的相交位置时,显示所述分割按钮。
本公开实施例中,如果检测到目标音视频中不存在被选中片段,则进入针对目标音视频进行整体分割的模式,具体的,在检测到鼠标移动到指针与目标音视频的相交位置时,显示分割按钮。
一种可选的实施方式中,目标音视频的轨道上方还可能显示有字幕,本公开实施例在检测到鼠标移动到指针与目标音视频对应的字幕的相交位置时,也可以触发执行显示分割按钮的步骤。
如图5所示,为本公开实施例提供的另一种音视频分割的交互界面示意图。其中,交互界面上展示了指针和鼠标位于交互界面上的不同位置时的交互处理。针对交互界面上指针的第一个位置,由于鼠标还未移动到指针与目标音视频的相交位置,因此不显示分割按钮;针对交互界面上指针的第二个位置,由于鼠标只是移动到了目标音视频的显示区域,并未移动到指针的位置,因此不显示分割按钮;针对交互界面上指针的第三个位置,由于鼠标移动到指针与字幕的相交位置,因此显示分割按钮;针对交互界面上指针的第四个位置,由于鼠标移动到了指针与目标音视频的相交位置,因此显示分割按钮。
为了提高音视频分割的交互过程的流畅性,从而提高用户的使用体验,本公开实施例可以在指针与目标音视频的相交位置显示分割按钮,如图5中指针的第四个位置所示,在指针与目标音视频的相交位置显示有“剪刀”图案的分割按钮。实际应用中,用户可以通过移动鼠标到指针与目标音视频的相交位置并点击鼠标,直接完成对目标音视频的切割,交互过程较流畅。
本公开实施例中,在未检测到鼠标移动到指针与目标音视频的相交位置时,不显示分割按钮,以避免由于用户误触发导致对音视频分割的误操作。
另一种可选的实施方式中,为了更直观的将分割点的位置提示给用户,在用户将鼠标移动到分割按钮的位置时,对指针与目标音视频的相交位置进行高亮显示,以便在用户点击分割按钮之前明确获知分割点的位置。
如图5中指针的第四个位置所示,黑色粗线位置用于高亮显示,用于更直观的提示用户分割点的位置。
S405:响应于针对所述分割按钮的触发操作,基于所述指针与所述目标音视频的相交位置,对所述目标音视频进行分割。
本公开实施例中,在接收到针对分割按钮的触发操作时,对目标音视频进行整体分割。具体的,基于指针与目标音视频的相交位置,将目标音视频分割为两个片段。
本公开实施例中,如果确定目标音视频中不存在被选中片段,则进入对目标音视频进行分割的模式,具体的,在检测到鼠标移动到指针与目标音视频的相交位置时,显示分割按钮,并在接收到针对该分割按钮的触发操作时,基于指针与目标音视频的相交位置,对目标音视频进行分割。与分割按钮常驻于轨道的指针的交互方式相比,本公开实施例在目标音视频中不存在被选中片段且检测到鼠标移动到指针与目标音视频的相交位置时对分割按钮进行显示,由于鼠标移动到指针与目标音视频的相交位置说明用户当前存在音视频分割需求,此时触发分割按钮的显示,便于用户对目标音视频的分割触发操作。另外,在用户存在音视频分割需求时才显示分割按钮,能够最大程度上减少音视频分割的误操作,一定程度上提高了用户的使用体验。
与上述方法实施例属于同一个发明构思,本公开实施例还提供了一种音视频分割的交互装置,参考图6,为本公开实施例提供的一种音视频分割的交互装置的结构示意图,所述装置包括:
第一检测模块601,用于检测目标音视频中是否存在被选中片段;
第一显示模块602,用于在确定所述目标音视频中存在所述被选中片段,且在检测到所述目标音视频的轨道上的指针位于所述被选中片段时,显示分割按钮;
第一分割模块603,用于响应于针对所述分割按钮的触发操作,基于所述指针与所述被选中片段的相交位置,对所述被选中片段进行分割。
另外,本公开实施例还提供了一种音视频分割的交互装置,参考图7,为本公开实施例提供的另一种音视频分割的交互装置的结构示意图,在图6的基础上,所述装置还包括:
第二显示模块701,用于在确定所述目标音视频中不存在所述被选中片段,且在检测到鼠标移动到所述指针与所述目标音视频的相交位置时,显示所述分割按钮;
第二分割模块702,用于响应于针对所述分割按钮的触发操作,基于所述指针与所述目标音视频的相交位置,对所述目标音视频进行分割。
一种可选的实施方式中,所述第一显示模块,具体用于:
在检测到所述目标音视频的轨道上的指针位于所述被选中片段时,在所述指针与所述被选中片段的相交位置显示分割按钮。
一种可选的实施方式中,所述装置还包括:
第一高亮显示模块,用于在检测到鼠标移动到所述分割按钮的位置时,对所述指针与所述被选中片段的相交位置进行高亮显示。
一种可选的实施方式中,所述第二显示模块,具体用于:
在检测到鼠标移动到所述指针与所述目标音视频的相交位置时,在所述指针与所述目标音视频的相交位置显示所述分割按钮。
一种可选的实施方式中,所述装置还包括:
第二高亮显示模块,用于在检测到鼠标移动到所述分割按钮的位置时,对所述指针与所述目标音视频的相交位置进行高亮显示。
一种可选的实施方式中,所述装置还包括:
第三显示模块,用于在检测到鼠标移动到所述指针与所述目标音视频对应的字幕的相交位置时,显示所述分割按钮。
与分割按钮常驻于轨道的指针的交互方式相比,本公开实施例提供的音视频分割的交互装置中,在目标音视频中不存在被选中片段且检测到鼠标移动到指针与目标音视频的相交位置时对分割按钮进行显示,或者在目标音视频中存在被选中片段且检测到指针位于被选中片段时对分割按钮进行显示,上述显示分割按钮的时机能够说明用户当前存在音视频分割需求,此时触发分割按钮的显示,便于用户触发分割操作。另外,在用户存在音视频分割需求时才显示分割按钮,能够最大程度上减少音视频分割的误操作,一定程度上提高了用户的使用体验。
另外,本公开实施例还提供了一种音视频分割的交互设备,参见图8所示,可以包括:
处理器801、存储器802、输入装置803和输出装置804。音视频分割的交互设备中的处理器801的数量可以一个或多个,图8中以一个处理器为例。在本发明的一些实施例中,处理器801、存储器802、输入装置803和输出装置804可通过总线或其它方式连接,其中,图8中以通过总线连接为例。
存储器802可用于存储软件程序以及模块,处理器801通过运行存储在存储器802的软件程序以及模块,从而执行音视频分割的交互设备的各种功能应用以及数据处理。存储器802可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序等。此外,存储器802可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。输入装置803可用于接收输入的数字或字符信息,以及产生与音视频分割的交互设备的用户设置以及功能控制有关的信号输入。
具体在本实施例中,处理器801会按照如下的指令,将一个或一个以上的应用程序的进程对应的可执行文件加载到存储器802中,并由处理器801来运行存储在存储器802中的应用程序,从而实现上述音视频分割的交互设备的各种功能。
需要说明的是,在本文中,诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上所述仅是本公开的具体实施方式,使本领域技术人员能够理解或实现本公开。对这些实施例的多种修改对本领域的技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本公开的精神或范围的情况下,在其它实施例中实现。因此,本公开将不会被限制于本文所述的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (8)

1.一种音视频分割的交互方法,其特征在于,所述方法包括:
检测目标音视频中是否存在被选中片段;其中,所述被选中片段由在所述目标音视频的轨道上拖动鼠标的操作确定,所述被选中片段包括从所述拖动鼠标的操作的起始位置到结束位置对应的音视频帧;
如果确定所述目标音视频中存在所述被选中片段,则进入对所述被选中片段进行分割的模式,所述对所述被选中片段进行分割的模式包括:
在检测到所述目标音视频的轨道上的指针位于所述被选中片段时,在所述指针与所述被选中片段的相交位置显示分割按钮;
响应于针对所述分割按钮的触发操作,基于所述指针与所述被选中片段的相交位置,对所述被选中片段进行分割;
如果确定所述目标音视频中不存在所述被选中片段,则进入针对所述目标音视频进行整体分割的模式,所述针对所述目标音视频进行整体分割的模式包括:
在检测到鼠标移动到所述指针与所述目标音视频的相交位置时,显示所述分割按钮;
响应于针对所述分割按钮的触发操作,基于所述指针与所述目标音视频的相交位置,对所述目标音视频进行分割。
2.根据权利要求1所述的方法,其特征在于,所述响应于针对所述分割按钮的触发操作,基于所述指针与所述被选中片段的相交位置,对所述被选中片段进行分割之前,还包括:
当检测到鼠标移动到所述分割按钮的位置时,对所述指针与所述被选中片段的相交位置进行高亮显示。
3.根据权利要求1所述的方法,其特征在于,所述在检测到鼠标移动到所述指针与所述目标音视频的相交位置时,显示所述分割按钮,包括:
在检测到鼠标移动到所述指针与所述目标音视频的相交位置时,在所述指针与所述目标音视频的相交位置显示所述分割按钮。
4.根据权利要求1所述的方法,其特征在于,所述响应于针对所述分割按钮的触发操作,基于所述指针与所述目标音视频的相交位置,对所述目标音视频进行分割之前,还包括:
当检测到鼠标移动到所述分割按钮的位置时,对所述指针与所述目标音视频的相交位置进行高亮显示。
5.根据权利要求1所述的方法,其特征在于,所述确定所述目标音视频中不存在所述被选中片段之后,且在所述响应于针对所述分割按钮的触发操作,基于所述指针与所述目标音视频的相交位置,对所述目标音视频进行分割之前,还包括:
在检测到鼠标移动到所述指针与所述目标音视频对应的字幕的相交位置时,触发执行所述显示所述分割按钮的步骤。
6.一种音视频分割的交互装置,其特征在于,所述装置包括:
第一检测模块,用于检测目标音视频中是否存在被选中片段;其中,所述被选中片段由在所述目标音视频的轨道上拖动鼠标的操作确定,所述被选中片段包括从所述拖动鼠标的操作的起始位置到结束位置对应的音视频帧;
第一显示模块,用于在确定所述目标音视频中存在所述被选中片段时,进入对所述被选中片段进行分割的模式,并在对所述被选中片段进行分割的模式下,在检测到所述目标音视频的轨道上的指针位于所述被选中片段时,在所述指针与所述被选中片段的相交位置显示分割按钮;
第一分割模块,用于响应于针对所述分割按钮的触发操作,基于所述指针与所述被选中片段的相交位置,对所述被选中片段进行分割;
第二显示模块,用于在确定所述目标音视频中不存在所述被选中片段时,进入针对所述目标音视频进行整体分割的模式,并在针对所述目标音视频进行整体分割的模式下,在检测到鼠标移动到所述指针与所述目标音视频的相交位置时,显示所述分割按钮;
第二分割模块,用于响应于针对所述分割按钮的触发操作,基于所述指针与所述目标音视频的相交位置,对所述目标音视频进行分割。
7.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有指令,当所述指令在终端设备上运行时,使得所述终端设备实现如权利要求1-5任一项所述的方法。
8.一种音视频分割的交互设备,其特征在于,包括:存储器,处理器,及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时,实现如权利要求1-5任一项所述的方法。
CN202010718080.XA 2020-07-23 2020-07-23 一种音视频分割的交互方法、装置、设备及存储介质 Active CN111901534B (zh)

Priority Applications (5)

Application Number Priority Date Filing Date Title
CN202010718080.XA CN111901534B (zh) 2020-07-23 2020-07-23 一种音视频分割的交互方法、装置、设备及存储介质
JP2023504034A JP7471507B2 (ja) 2020-07-23 2021-07-20 オーディオビデオ分割のインタラクション方法、装置、設備、及び記憶媒体
PCT/CN2021/107367 WO2022017382A1 (zh) 2020-07-23 2021-07-20 音视频分割的交互方法、装置、设备及存储介质
EP21847150.6A EP4171016A4 (en) 2020-07-23 2021-07-20 AUDIO/VIDEO SEGMENTATION INTERACTION METHOD AND APPARATUS, DEVICE, AND STORAGE MEDIUM
US18/069,839 US20230185438A1 (en) 2020-07-23 2022-12-21 Interaction method of audio-video segmentation, apparatus, device and storage medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010718080.XA CN111901534B (zh) 2020-07-23 2020-07-23 一种音视频分割的交互方法、装置、设备及存储介质

Publications (2)

Publication Number Publication Date
CN111901534A CN111901534A (zh) 2020-11-06
CN111901534B true CN111901534B (zh) 2022-03-29

Family

ID=73189746

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010718080.XA Active CN111901534B (zh) 2020-07-23 2020-07-23 一种音视频分割的交互方法、装置、设备及存储介质

Country Status (5)

Country Link
US (1) US20230185438A1 (zh)
EP (1) EP4171016A4 (zh)
JP (1) JP7471507B2 (zh)
CN (1) CN111901534B (zh)
WO (1) WO2022017382A1 (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111901534B (zh) * 2020-07-23 2022-03-29 北京字节跳动网络技术有限公司 一种音视频分割的交互方法、装置、设备及存储介质
CN113986083A (zh) * 2021-10-29 2022-01-28 维沃移动通信有限公司 文件处理的方法和电子设备

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1185256A (zh) * 1995-02-23 1998-06-17 阿卫德技术公司 合成编辑系统和数字动态画面录制系统

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8418082B2 (en) 2009-05-01 2013-04-09 Apple Inc. Cross-track edit indicators and edit selections
US8244103B1 (en) * 2011-03-29 2012-08-14 Capshore, Llc User interface for method for creating a custom track
US9111579B2 (en) * 2011-11-14 2015-08-18 Apple Inc. Media editing with multi-camera media clips
CN108156407A (zh) * 2017-12-13 2018-06-12 深圳市金立通信设备有限公司 一种视频剪辑方法及终端
CN109213400A (zh) * 2018-08-23 2019-01-15 Oppo广东移动通信有限公司 多媒体对象的处理方法、装置、终端及存储介质
CN110971957B (zh) * 2018-09-30 2022-04-15 阿里巴巴集团控股有限公司 一种视频编辑方法、装置以及移动终端
CN305492138S (zh) * 2019-03-15 2019-12-13
CN110166652A (zh) * 2019-05-28 2019-08-23 成都依能科技股份有限公司 多轨道音视频同步编辑方法
CN111901534B (zh) * 2020-07-23 2022-03-29 北京字节跳动网络技术有限公司 一种音视频分割的交互方法、装置、设备及存储介质

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1185256A (zh) * 1995-02-23 1998-06-17 阿卫德技术公司 合成编辑系统和数字动态画面录制系统

Also Published As

Publication number Publication date
JP2023534069A (ja) 2023-08-07
EP4171016A4 (en) 2023-12-06
EP4171016A1 (en) 2023-04-26
JP7471507B2 (ja) 2024-04-19
CN111901534A (zh) 2020-11-06
WO2022017382A1 (zh) 2022-01-27
US20230185438A1 (en) 2023-06-15

Similar Documents

Publication Publication Date Title
US20230185438A1 (en) Interaction method of audio-video segmentation, apparatus, device and storage medium
US9317403B2 (en) Method for creating a label
US8134538B2 (en) Touch panel input device and processing execution method
CN106415472B (zh) 一种手势控制方法、装置、终端设备和存储介质
KR20140102762A (ko) 포인터 제어장치
CN108829314B (zh) 截图选区界面选择方法、装置、设备及存储介质
US20160345049A1 (en) Method and device for switching channel
US10303349B2 (en) Image-based application automation
CN110780783B (zh) 一种界面元素的移动方法、系统、车辆及存储介质
CN104035702A (zh) 一种防止智能终端误操作的方法和智能终端
WO2023241105A1 (zh) 振动控制方法、装置、计算机设备及存储介质
CN114661219A (zh) 设备控制方法、装置、存储介质及电子设备
CN115698930A (zh) 设备控制方法、装置、存储介质及电子设备
US20160345059A1 (en) Method and device for switching channel
KR20180123574A (ko) 제어명령 식별방법, 장치 및 기억매체
CN103377000A (zh) 文件夹切换的方法及装置
CN107807785B (zh) 一种在触摸屏上选择对象的方法及系统
CN115623274A (zh) 一种视频处理方法、装置、设备及存储介质
US9846494B2 (en) Information processing device and information input control program combining stylus and finger input
CN115079911A (zh) 一种数据处理方法、装置、设备及存储介质
CN117666907A (zh) 屏幕交互方法、装置及电子设备
CN110879783B (zh) 一种程序测试方法、装置、设备及存储介质
CN114594889A (zh) 一种控制方法以及装置
CN117724637A (zh) 系统桌面的交互方法及装置、电子设备、存储介质
CN117193574A (zh) 分屏控制方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant