CN112307252A - 文件处理方法、装置及电子设备 - Google Patents

文件处理方法、装置及电子设备 Download PDF

Info

Publication number
CN112307252A
CN112307252A CN202011187809.1A CN202011187809A CN112307252A CN 112307252 A CN112307252 A CN 112307252A CN 202011187809 A CN202011187809 A CN 202011187809A CN 112307252 A CN112307252 A CN 112307252A
Authority
CN
China
Prior art keywords
keyword
file
target
files
splicing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011187809.1A
Other languages
English (en)
Inventor
魏学
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Vivo Mobile Communication Co Ltd
Original Assignee
Vivo Mobile Communication Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Vivo Mobile Communication Co Ltd filed Critical Vivo Mobile Communication Co Ltd
Priority to CN202011187809.1A priority Critical patent/CN112307252A/zh
Publication of CN112307252A publication Critical patent/CN112307252A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/68Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/783Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/7834Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using audio features

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Library & Information Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Television Signal Processing For Recording (AREA)

Abstract

本申请公开了一种文件处理方法、装置及电子设备,属于通信技术领域。所述文件处理方法包括:获取至少两个目标文件;其中,所述至少两个目标文件均为音频文件或包括音频信息的视频文件;识别每个所述目标文件中的音频信息包括的第一关键词;其中,所述第一关键词用于表示所述至少两个目标文件的拼接合成顺序;按照每个所述第一关键词表示的拼接合成顺序,对所述至少两个目标文件进行拼接合成处理。本申请实施例提供的技术方案,能够在一定程度上解决现有技术中,在拼接合成音频文件或视频文件时,存在难以确定每个音频文件或视频文件的拼接合成顺序的问题。

Description

文件处理方法、装置及电子设备
技术领域
本申请属于通信技术领域,具体涉及一种文件处理方法、装置及电子设备。
背景技术
随着多媒体技术的发展,如短视频技术,用户对视频编辑、音频编辑等的需求越来越高。
一般,一个视频文件或一个音频文件,往往是由多个视频片段或多个音频片段合成得到的。例如,当用户想制作一段短视频或者长视频的时候,往往需要构思设计几个分场景,然后针对几个分场景分别拍摄,最后再通过视频剪辑软件将针对几个分场景拍摄的视频片段进行合成处理,得到最终需求的视频。
但过多的视频片段或音频片段会导致文件数量倍增,用户可能无法清晰的记住每个音、视频片段在合成视频或合成音频中的顺序,还需要打开各个视频片段或音频片段确定具体内容后再进行确定,给后期剪辑增加了困难。
发明内容
本申请实施例的目的是提供一种文件处理方法、装置及电子设备,能够在一定程度上解决现有技术中,在拼接合成音频文件或视频文件时,存在难以确定每个音频文件或视频文件的拼接合成顺序的问题。
为了解决上述技术问题,本申请是这样实现的:
第一方面,本申请实施例提供了一种文件处理方法,所述文件处理方法包括:
获取至少两个目标文件;其中,所述至少两个目标文件均为音频文件或包括音频信息的视频文件;
识别每个所述目标文件中的音频信息包括的第一关键词;其中,所述第一关键词用于表示所述至少两个目标文件的拼接合成顺序;
按照每个所述第一关键词表示的拼接合成顺序,对所述至少两个目标文件进行拼接合成处理。
第二方面,本申请实施例提供了一种文件处理装置,所述文件处理装置包括:
获取模块,用于获取至少两个目标文件;其中,所述至少两个目标文件均为音频文件或包括音频信息的视频文件;
第一识别模块,用于识别每个所述目标文件中的音频信息包括的第一关键词;其中,所述第一关键词用于表示所述至少两个目标文件的拼接合成顺序;
第一处理模块,用于按照每个所述第一关键词表示的拼接合成顺序,对所述至少两个目标文件进行拼接合成处理。
第三方面,本申请实施例提供了一种电子设备,包括:处理器、存储器及存储在所述存储器上并可在所述处理器上运行的程序或指令,所述程序或指令被所述处理器执行时实现如第一方面所述的文件处理方法中的步骤。
第四方面,本申请实施例提供了一种可读存储介质,所述可读存储介质上存储程序或指令,所述程序或指令被处理器执行时实现如第一方面所述的文件处理方法的步骤。
第五方面,本申请实施例提供了一种芯片,所述芯片包括处理器和通信接口,所述通信接口和所述处理器耦合,所述处理器用于运行程序或指令,实现如第一方面所述的文件处理方法。
本申请实施例中,在对至少两个目标文件(即音频文件或包括音频信息的视频文件)进行拼接合成处理时,按照每一目标文件中的音频信息包括的第一关键词表示的拼接合成顺序,自动对所有目标文件进行拼接合成处理。由于在音视频文件剪辑过程中,不再需要用户确定每个目标文件的拼接合成顺序,省去用户了整理目标文件顺序的过程,因此可以提高音视频文件拼接合成处理的效率,也更方便了用户对音视频文件的剪辑处理。
附图说明
图1是本申请实施例提供的文件处理方法的流程示意图;
图2是本申请实施例提供的示例的示意图之一;
图3是本申请实施例提供的示例的示意图之二;
图4是本申请实施例提供的示例的示意图之三;
图5是本申请实施例提供的文件处理装置的示意框图;
图6是本申请实施例提供的电子设备的示意框图之一;
图7是本申请实施例提供的电子设备的示意框图之二。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请的说明书和权利要求书中的术语“第一”、“第二”等是用于区别类似的对象,而不用于描述特定的顺序或先后次序。应该理解这样使用的术语在适当情况下可以互换,以便本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施,且“第一”、“第二”等所区分的对象通常为一类,并不限定对象的个数,例如第一对象可以是一个,也可以是多个。此外,说明书以及权利要求中“和/或”表示所连接对象的至少其中之一,字符“/”,一般表示前后关联对象是一种“或”的关系。
下面结合附图,通过具体的实施例及其应用场景对本申请实施例提供的文件处理方法进行详细地说明。
图1是本申请实施例提供的一种文件处理方法的流程示意图,该文件处理方法应用于电子设备。
如图1所示,该文件处理方法可以包括:
步骤101:获取至少两个目标文件。
这里所述的至少两个目标文件为同一类型的文件,可以均为音频文件,也可以均为具有音频信息的视频文件。
本申请实施例中,获取的至少两个目标文件用于进行拼接合成处理。其中,用户可以将目标文件导入对应的剪辑软件中进行拼接合成处理,例如:将至少两个音频文件导入音频剪辑软件中,再例如:将至少两个视频文件导入视频剪辑软件中。
步骤102:识别每个目标文件中的音频信息包括的第一关键词。
这里所述的第一关键词用于表示至少两个目标文件的拼接合成顺序。
本申请实施例中,在获取目标文件后,识别每个目标文件中的音频信息包括的第一关键词。其中,每个目标文件中包括的第一关键词表示的拼接合成顺序互不相同。
由于排列顺序可以通过数字进行表示,因此该第一关键词可以是数字。例如,数字“1”表示拼接合成顺序第一位,数字“2”表示拼接合成顺序第二位,数字“3”表示拼接合成顺序第三位,以此依次类推。
步骤103:按照每个第一关键词表示的拼接合成顺序,对至少两个目标文件进行拼接合成处理。
在识别到每个目标文件中的音频信息包括的第一关键词之后,按照每个第一关键词表示的拼接合成顺序,对至少两个目标文件进行排序,并按照排序后的顺序,对至少两个目标文件进行拼接合成处理。
本申请实施例中,在对至少两个目标文件(即音频文件或包括音频信息的视频文件)进行拼接合成处理时,按照每一目标文件中的音频信息包括的第一关键词表示的拼接合成顺序,自动对所有目标文件进行拼接合成处理,得到拼接合成之后的音频文件或视频文件。由于在音视频文件剪辑过程中,不再需要用户确定每个目标文件的拼接合成顺序,省去用户了整理目标文件顺序的过程,因此可以提高音视频文件拼接合成处理的效率,也更方便了用户对音视频文件的剪辑处理。
可选地,由于第一关键词的音频内容通常不是用户所需的音频内容,因此对于第一关键词,可以是在完成拼接合成处理之后,由用户手动将包括第一关键词的一段文件内容裁剪掉,以避免第一关键词的音频内容对合成文件整体效果的影响。当然也可以在确定每个目标文件的拼接顺序之后以及拼接合成处理之前,自动将包括第一关键词的一段文件内容裁剪掉,然后再进行拼接合成处理。其中,在目标文件为音频文件时,将包括第一关键词的一段音频内容裁剪掉;在目标文件为包括音频信息的视频文件时,将包括第一关键词的一段音频内容以及该段音频内容对应的视频内容(该视频内容与该段音频内容在目标文件中对应的时间段相同)裁剪掉。
可选地,本申请实施例中,前文所述的第一关键词以及下文将要描述的第二关键词至第六关键词,均可以是在生成目标文件的过程中(如录制视频或录制音频的过程中)由用户语音录入,以便对目标文件的处理可以根据用户的需求进行。
可选地,在步骤103:按照每个第一关键词表示的拼接合成顺序,对至少两个目标文件进行拼接合成处理之前,该文件处理方法还可以包括:
识别每个目标文件中的音频信息包括的第二关键词和第三关键词。
其中,第二关键词用于标记目标文件的开头,第三关键词用于标记目标文件的结尾。
在前述识别第二关键词和第三关键词的基础上,步骤103:按照每个第一关键词表示的拼接合成顺序,对至少两个目标文件进行拼接合成处理,可以包括:
按照每个第一关键词表示的拼接合成顺序,以及第二关键词标记的开头和第三关键词标记的结尾,对至少两个目标文件进行首尾拼接合成处理。
本申请实施例中,还可以在每个目标文件的音频信息中设置用于标记目标文件开头位置的第二关键词(如“开始”)和用于标记目标文件结尾位置的第二关键词(如“结束”),这样,在对至少两个目标文件进行拼接合成处理时,除了可以按照第一关键词表示的拼接合成顺序进行拼接合成处理外,还可以依据第二关键词和第三关键词保证相邻两个目标文件之间为首尾拼接,即前一目标文件的结尾与后一目标文件的开头进行拼接处理。
为了更好地理解上述技术方案,下面以目标文件为包括音频信息的视频文件为例,进行进一步地解释说明。
首先,在每个视频文件的录制开始时,由拍摄者或被拍摄者语音录入“第n段开始”。在每个视频文件的录制结束时,由拍摄者或被拍摄者语音录入“第n段结束”。这里所述的“n”为第一关键词,用于标记每个视频文件的拼接合成顺序,其中,n为大于0的整数。这里所述的“开始”为第二关键词,用于标记每个视频文件的开头位置。这里所述的“结束”为第三关键词,用于标记每个视频文件的结尾位置。
然后,完成每个视频文件的录制之后,将录制的视频文件导入视频剪辑软件。视频剪辑软件可以通过自然语言处理技术识别每个视频文件开头和结尾处的关键词,并依据识别到的关键词,分别将包括“第n段结束”与“第n+1段开始”关键词的两个视频文件自动进行首尾拼接,即将包括“第n段结束”关键词的视频文件的结尾与包括“第n+1段开始”关键词的视频文件的开头进行首尾拼接处理,如图2所示,示意了三段视频201、202以及203的拼接合成效果。
可选地,由前述示例可知,第一关键词可以分别与第二关键词和第三关键词组合出现,即以类似“第n段开始”、“第n段结束”的组合形式出现。当然可以理解的是,第一关键词也可以单独出现,具体情况可根据实际需求设置。
可选地,由于第二关键词和第三关键词的音频内容通常不是用户所需的音频内容,因此对于第二关键词和第三关键词,可以参照前述关于第一关键词的裁剪处理方式,将包括第二关键词和第三关键词的文件内容裁剪掉。
可选地,在步骤103:按照每个第一关键词表示的拼接合成顺序,对至少两个目标文件进行拼接合成处理之前,该文件处理方法还可以包括:
在识别到第一文件中的音频信息包括第四关键词和第五关键词的情况下,对第一文件进行裁剪处理,保留第四关键词和第五关键词对应的时间点之间的文件内容。
其中,这里所述的第一文件为前述至少两个目标文件中的其中一个目标文件。这里所述的第四关键词和第五关键词为用于对目标文件进行裁剪处理的关键词。
在前述识别第四关键词和第五关键词的基础上,步骤103:按照每个第一关键词表示的拼接合成顺序,对至少两个目标文件进行拼接合成处理,可以包括:
按照每个第一关键词表示的拼接合成顺序,对裁剪处理之后的至少两个目标文件进行拼接合成处理。
用户录制的整个视频内容或音频内容,往往并非用户全部需要的,因此,在视频剪辑或音频剪辑过程中,还需要手动将不需要的视频内容或音频内容裁剪掉。而本申请实施例中,可以在目标文件的音频信息中设置第四关键词和第五关键词,用于自动对目标文件进行裁剪处理操作,保留第四关键词和第五关键词对应的时间点之间的文件内容。然后将裁剪处理后的目标文件,按照第一关键词表示的拼接合成顺序进行拼接合成处理,这样可以自动保留用户想要的文件内容,省去用户手动裁剪的过程,提高了文件剪辑的效率。
其中,在对目标文件进行裁剪处理时,被裁剪掉的文件内容也包括第四关键词和第五关键词对应的文件内容,即:在目标文件为音频文件时,两个关键词对应的音频内容被裁剪掉;在目标文件为包括音频信息的视频文件时,两个关键词对应的音频内容和视频内容被裁剪掉,以避免这两个关键词的音频内容对拼接合成文件的影响。
为了更好地理解上述技术方案,下面以目标文件为包括音频信息的视频文件为例,进行进一步地解释说明。
在拍摄视频过程中,用户可以第一次发出“咔”(对应第四关键词)的声音表示视频正式开始,在拍摄结束前再次发出“咔”(对应第五关键词)的声音表示视频正式结束。
完成视频文件的拍摄之后,将拍摄的视频文件导入视频剪辑软件。如图3所示,视频剪辑软件可以通过自然语言处理技术识别“咔”在视频文件中出现的时间点,然后基于两个咔的时间点,对视频文件进行裁剪,保留两个时间点之间的视频内容,如图3中的裁剪进度条301所示,保留时间点00:06与12:30之间的视频内容。
若用户确认保留的视频内容即是自己想要的视频内容,则可以触发保存按键302,对裁剪后的视频文件进行保留。
若用户认为保留的视频内容不是自己想要的视频内容,也可以进行手动调整,如拖动裁剪进度条301来调整所需保留的视频内容。其中,拖动裁剪进度条的同时,可以在播放窗口303中显示裁剪进度条被拖动的一端当前时刻对应的视频内容,同时同步播放相应的音频内容,以便用户可以对视频内容和音频内容均进行了解。
可选地,由前述示例可知,第四关键词和第五关键词可以是相同的关键词,可以理解的是,二者也可以是不同的关键词,如第四关键词可以是“开始”,第五关键词可以是“结束”,由此也可知,第四关键词可以与第二关键词相同,第五关键词可以与第三关键词相同。当然,第四关键词也可以与第二关键词不同,第五关键词也可以与第三关键词不同,例如,同一目标文件中,可以既包括用于确定首尾拼接顺序的第二关键词和第三关键词,又包括用于对目标文件进行裁剪处理的第四关键词和第五关键词。在同一目标文件中既包括第二关键词和第三关键词又包括第四关键词和第五关键词的情况下,优选第二关键词和第三关键词处于第四关键词和第五关键词对应的时间点之间的文件内容之外,这样在对目标文件进行裁剪处理时,也可以将第二关键词和第三关键词对应的文件内容一同裁剪掉(即:在目标文件为音频文件时,第二关键词和第三关键词对应的音频内容被裁剪掉;在目标文件为包括音频信息的视频文件时,第二关键词和第三关键词对应的音频内容和视频内容被裁剪掉)。对于第一关键词,也优选处于第四关键词和第五关键词对应的时间点之间的文件内容之外,以便依据第四关键词和第五关键词在对目标文件进行裁剪处理时,也可以将第一关键词对应的文件内容一同裁剪掉。
可选地,在至少两个目标文件为具有音频信息的视频文件的情况下,在步骤103:按照每个所述第一关键词表示的拼接合成顺序,对所述至少两个目标文件进行拼接合成处理的过程中或之后,该文件处理方法还可以包括:
在识别到第二文件中的音频信息包括第六关键词的情况下,对目标视频内容,进行与第六关键词对应的转场效果处理。
其中,这里所述的第二文件为至少两个目标文件中的其中一个目标文件,这里所述的目标文件内容为第二文件中的视频内容且为需保留在经过拼接合成处理得到的合成文件中的视频内容。
本申请实施例中,还可以在视频文件的音频信息中设置第六关键词,用于自动对视频文件进行相应的转场效果处理,这样可以省去用户手动编辑的过程,提高了视频剪辑的效率。
可选地,在根据第六关键词对目标视频内容进行转场效果处理时,可以根据第六关键词在第二文件中的目标位置,对与目标位置对应的目标视频内容,进行与第六关键词对应的转场效果处理。
这里所述的目标位置为第二文件的开头位置或结尾位置。其中,开头位置和结尾位置可以预先设定,例如,将前预设时长(如前两分钟)对应的文件内容确定为文件的开头位置,将后预设时长(如最后两分钟)对应的文件内容确定为文件的结尾位置。
为了更好地理解上述技术方案,下面以目标文件为包括音频信息的视频文件且在拼接合成处理之后进行转场效果处理为例,进行进一步地解释说明。
一般转场效果出现在一段视频的开头或结尾处,因此在拍摄视频过程中,用户可以在视频开头处发出“拉远”(对应第六关键词)的声音,表示对视频开头处进行拉远的转场效果处理,或者在视频结尾处发出“拉远”(对应第六关键词)的声音,表示对视频结尾处进行拉远的转场效果处理。
在拍摄得到多个视频片段后,分别将这些视频片段导入视频剪辑软件。然后先对视频片段中的关键词进行识别并记录,再对这些视频片段进行拼接合成处理。在拼接合成处理时,可参考前文依据第一关键词进行拼接合成处理的方法。在完成视频片段的拼接合成处理后,依据识别到的转场效果关键词(即第六关键词),对合成视频中对应的视频片段的开头或结尾进行相应的转场效果处理。例如,某一视频片段的结尾处出现转场效果关键词“拉远”,那么针对该视频片段的结尾进行虚化模拟镜头拉向远处的转场效果处理。
可选地,针对转场效果处理,还可以设置用于控制进行转场效果处理的按键,如图4中所示的“添加转场”按键401。用户触发该按键后,视频编辑软件根据预先记录的转场效果关键词,如针对视频片段402预先记录的“拉远”关键词,以及针对视频片段403预先记录的“闪白”关键词,分别对视频片段402的结尾进行拉远的转场效果处理以及对视频片段403的开头进行闪白的转场效果处理。在完成对视频的编辑之后,触发“保存”按键404,即可对编辑好的视频文件进行保存。
可选地,由于第六关键词的音频内容通常不是用户所需的音频内容,因此对于第六关键词,可以参照前述关于第一关键词的裁剪处理方式,将包括第六关键词的文件内容裁剪掉。当然,若包括第六关键词的目标文件中还包括第四关键词和第五关键词,可以设置第六关键词处于第四关键词和第五关键词对应的时间点之间的文件内容之外,这样在对目标文件进行裁剪处理时,也可以将第六关键词对应的文件内容一同裁剪掉。
以上即为对本申请实施例提供的文件处理方法的描述,需要说明的是,对于上述第一关键词至第六关键词,用户在语音录入至目标文件时,录入的语音中包括对应的关键词即可,例如,表示拼接合成顺序的关键词为数字时,用户可以语音录入类似“第1段”这样包括数字的语句,并且该语句可以由用户预先进行设置,以便电子设备可以对语句所要表达的意思进行更好地识别。
综上所述,本申请实施例中,基于自然语音处理技术,通过在目标文件的音频信息中预设关键词的方式,自动对目标文件进行相应的编辑处理,减少了用户手动操作的过程,提高了文件编辑的效率。
需要说明的是,本申请实施例提供的文件处理方法,执行主体可以为文件处理装置,或者文件处理装置中的用于执行文件处理方法的控制模块。本申请实施例中以文件处理装置执行文件处理方法为例,说明本申请实施例提供的文件处理装置。
图5是本申请实施例提供的一种文件处理装置的示意框图。
如图5所示,所述文件处理装置包括:
获取模块501,用于获取至少两个目标文件。
其中,所述至少两个目标文件均为音频文件或包括音频信息的视频文件。
第一识别模块502,用于识别每个所述目标文件中的音频信息包括的第一关键词。
其中,所述第一关键词用于表示所述至少两个目标文件的拼接合成顺序。
第一处理模块503,用于按照每个所述第一关键词表示的拼接合成顺序,对所述至少两个目标文件进行拼接合成处理。
可选地,所述文件处理装置还包括:
第二识别模块,用于识别每个所述目标文件中的音频信息包括的第二关键词和第三关键词。
其中,所述第二关键词用于标记所述目标文件的开头,所述第三关键词用于标记所述目标文件的结尾。
所述第一处理模块503包括:
第一处理单元,用于按照每个所述第一关键词表示的拼接合成顺序,以及所述第二关键词标记的开头和所述第三关键词标记的结尾,对所述至少两个目标文件进行首尾拼接合成处理。
可选地,所述文件处理装置还包括:
第二处理模块,用于在识别到第一文件中的音频信息包括第四关键词和第五关键词的情况下,对所述第一文件进行裁剪处理,保留所述第四关键词和所述第五关键词对应的时间点之间的文件内容。
其中,所述第一文件为所述至少两个目标文件中的其中一个目标文件;
所述第一处理模块503包括:
第二处理单元,用于按照每个所述第一关键词表示的拼接合成顺序,对裁剪处理之后的所述至少两个目标文件进行拼接合成处理。
可选地,在所述至少两个目标文件为具有音频信息的视频文件的情况下,所述文件处理装置还包括:
第三处理模块,用于在识别到第二文件中的音频信息包括第六关键词的情况下,对目标视频内容进行与所述第六关键词对应的转场效果处理。
其中,所述第二文件为所述至少两个目标文件中的其中一个目标文件,所述目标文件内容为所述第二文件中的视频内容。
可选地,所述第三处理模块包括:
第三处理单元,用于根据所述第六关键词在所述第二文件中的目标位置,对与所述目标位置对应的所述目标视频内容,进行与所述第六关键词对应的转场效果处理。
其中,所述目标位置为所述第二文件的开头位置或结尾位置。
本申请实施例中,基于自然语音处理技术,通过在目标文件的音频信息中预设关键词的方式,自动对目标文件进行相应的编辑处理,减少了用户手动操作的过程,提高了文件编辑的效率。
本申请实施例中的文件处理装置可以是装置,也可以是终端中的部件、集成电路或芯片。该装置可以是移动电子设备,也可以为非移动电子设备。示例性的,移动电子设备可以为手机、平板电脑、笔记本电脑、掌上电脑、车载电子设备、可穿戴设备、超级移动个人计算机(ultra-mobile personal computer,UMPC)、上网本或者个人数字助理(personaldigital assistant,PDA)等,非移动电子设备可以为服务器、网络附属存储器(NetworkAttached Storage,NAS)、个人计算机(personal computer,PC)、电视机(television,TV)、柜员机或者自助机等,本申请实施例不作具体限定。
本申请实施例中的文件处理装置可以为具有操作系统的装置。该操作系统可以为安卓(Android)操作系统,可以为iOS操作系统,还可以为其他可能的操作系统,本申请实施例不作具体限定。
本申请实施例提供的文件处理装置能够实现图1所示的文件处理方法实施例实现的各个过程,为避免重复,这里不再赘述。
可选地,如图6所示,本申请实施例还提供一种电子设备600,包括处理器601,存储器602,存储在存储器602上并可在所述处理器601上运行的程序或指令,该程序或指令被处理器601执行时实现上述文件处理方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
需要说明的是,本申请实施例中的电子设备包括上述所述的移动电子设备和非移动电子设备。
图7为实现本申请实施例的一种电子设备的硬件结构示意图。
该电子设备700包括但不限于:射频单元701、网络模块702、音频输出单元703、输入单元704、传感器705、显示单元706、用户输入单元707、接口单元708、存储器709以及处理器710等部件。
本领域技术人员可以理解,电子设备700还可以包括给各个部件供电的电源(比如电池),电源可以通过电源管理系统与处理器710逻辑相连,从而通过电源管理系统实现管理充电、放电以及功耗管理等功能。图7中示出的电子设备结构并不构成对电子设备的限定,电子设备可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置,在此不再赘述。
其中,处理器710用于:获取至少两个目标文件;并识别每个所述目标文件中的音频信息包括的第一关键词;然后按照每个所述第一关键词表示的拼接合成顺序,对所述至少两个目标文件进行拼接合成处理。其中,所述至少两个目标文件均为音频文件或包括音频信息的视频文件;所述第一关键词用于表示所述至少两个目标文件的拼接合成顺序。
可选地,处理器710还用于:识别每个所述目标文件中的音频信息包括的第二关键词和第三关键词;然后按照每个所述第一关键词表示的拼接合成顺序,以及所述第二关键词标记的开头和所述第三关键词标记的结尾,对所述至少两个目标文件进行首尾拼接合成处理。其中,所述第二关键词用于标记所述目标文件的开头,所述第三关键词用于标记所述目标文件的结尾;
可选地,处理器710还用于:在识别到第一文件中的音频信息包括第四关键词和第五关键词的情况下,对所述第一文件进行裁剪处理,保留所述第四关键词和所述第五关键词对应的时间点之间的文件内容;然后按照每个所述第一关键词表示的拼接合成顺序,对裁剪处理之后的所述至少两个目标文件进行拼接合成处理。其中,所述第一文件为所述至少两个目标文件中的其中一个目标文件。
可选地,处理器710还用于:在识别到第二文件中的音频信息包括第六关键词的情况下,对目标视频内容进行与所述第六关键词对应的转场效果处理。其中,所述第二文件为所述至少两个目标文件中的其中一个目标文件,所述目标视频内容为所述第二文件中的视频内容。
可选地,处理器710还用于:根据所述第六关键词在所述第二文件中的目标位置,对与所述目标位置对应的所述目标视频内容,进行与所述第六关键词对应的转场效果处理。其中,所述目标位置为所述第二文件的开头位置或结尾位置。
本申请实施例中,基于自然语音处理技术,通过在目标文件的音频信息中预设关键词的方式,自动对目标文件进行相应的编辑处理,减少了用户手动操作的过程,提高了文件编辑的效率。
应理解的是,本申请实施例中,输入单元704可以包括图形处理器(GraphicsProcessing Unit,GPU)7041和麦克风7042,图形处理器7041对在视频捕获模式或图像捕获模式中由图像捕获装置(如摄像头)获得的静态图片或视频的图像数据进行处理。显示单元706可包括显示面板7061,可以采用液晶显示器、有机发光二极管等形式来配置显示面板7061。用户输入单元707包括触控面板7071以及其他输入设备7072。触控面板7071,也称为触摸屏。触控面板7071可包括触摸检测装置和触摸控制器两个部分。其他输入设备7072可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆,在此不再赘述。存储器709可用于存储软件程序以及各种数据,包括但不限于应用程序和操作系统。处理器710可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器710中。
本申请实施例还提供一种可读存储介质,所述可读存储介质上存储有程序或指令,该程序或指令被处理器执行时实现上述文件处理方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
其中,所述处理器为上述实施例中所述的电子设备中的处理器。所述可读存储介质,包括计算机可读存储介质,如计算机只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等。
本申请实施例另提供了一种芯片,所述芯片包括处理器和通信接口,所述通信接口和所述处理器耦合,所述处理器用于运行程序或指令,实现上述文件处理方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
应理解,本申请实施例提到的芯片还可以称为系统级芯片、系统芯片、芯片系统或片上系统芯片等。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。此外,需要指出的是,本申请实施方式中的方法和装置的范围不限按示出或讨论的顺序来执行功能,还可包括根据所涉及的功能按基本同时的方式或按相反的顺序来执行功能,例如,可以按不同于所描述的次序来执行所描述的方法,并且还可以添加、省去或组合各种步骤。另外,参照某些示例所描述的特征可在其他示例中被组合。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本申请各个实施例所述的方法。
上面结合附图对本申请的实施例进行了描述,但是本申请并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本申请的启示下,在不脱离本申请宗旨和权利要求所保护的范围情况下,还可做出很多形式,均属于本申请的保护之内。

Claims (11)

1.一种文件处理方法,其特征在于,包括:
获取至少两个目标文件;其中,所述至少两个目标文件均为音频文件或包括音频信息的视频文件;
识别每个所述目标文件中的音频信息包括的第一关键词;其中,所述第一关键词用于表示所述至少两个目标文件的拼接合成顺序;
按照每个所述第一关键词表示的拼接合成顺序,对所述至少两个目标文件进行拼接合成处理。
2.根据权利要求1所述的文件处理方法,其特征在于,在按照每个所述第一关键词表示的拼接合成顺序,对所述至少两个目标文件进行拼接合成处理之前,所述文件处理方法还包括:
识别每个所述目标文件中的音频信息包括的第二关键词和第三关键词;其中,所述第二关键词用于标记所述目标文件的开头,所述第三关键词用于标记所述目标文件的结尾;
所述按照每个所述第一关键词表示的拼接合成顺序,对所述至少两个目标文件进行拼接合成处理,包括:
按照每个所述第一关键词表示的拼接合成顺序,以及所述第二关键词标记的开头和所述第三关键词标记的结尾,对所述至少两个目标文件进行首尾拼接合成处理。
3.根据权利要求1所述的文件处理方法,其特征在于,在按照每个所述第一关键词表示的拼接合成顺序,对所述至少两个目标文件进行拼接合成处理之前,所述文件处理方法还包括:
在识别到第一文件中的音频信息包括第四关键词和第五关键词的情况下,对所述第一文件进行裁剪处理,保留所述第四关键词和所述第五关键词对应的时间点之间的文件内容;
其中,所述第一文件为所述至少两个目标文件中的其中一个目标文件;
所述按照每个所述第一关键词表示的拼接合成顺序,对所述至少两个目标文件进行拼接合成处理,包括:
按照每个所述第一关键词表示的拼接合成顺序,对裁剪处理之后的所述至少两个目标文件进行拼接合成处理。
4.根据权利要求1所述的文件处理方法,其特征在于,在所述至少两个目标文件为具有音频信息的视频文件的情况下,在按照每个所述第一关键词表示的拼接合成顺序,对所述至少两个目标文件进行拼接合成处理的过程中时或之后,所述文件处理方法还包括:
在识别到第二文件中的音频信息包括第六关键词的情况下,对目标视频内容进行与所述第六关键词对应的转场效果处理;
其中,所述第二文件为所述至少两个目标文件中的其中一个目标文件,所述目标视频内容为所述第二文件中的视频内容。
5.根据权利要求4所述的文件处理方法,其特征在于,所述在识别到第二文件中的音频信息包括第六关键词的情况下,对目标视频内容进行与所述第六关键词对应的转场效果处理,包括:
根据所述第六关键词在所述第二文件中的目标位置,对与所述目标位置对应的所述目标视频内容,进行与所述第六关键词对应的转场效果处理;
其中,所述目标位置为所述第二文件的开头位置或结尾位置。
6.一种文件处理装置,其特征在于,包括:
获取模块,用于获取至少两个目标文件;其中,所述至少两个目标文件均为音频文件或包括音频信息的视频文件;
第一识别模块,用于识别每个所述目标文件中的音频信息包括的第一关键词;其中,所述第一关键词用于表示所述至少两个目标文件的拼接合成顺序;
第一处理模块,用于按照每个所述第一关键词表示的拼接合成顺序,对所述至少两个目标文件进行拼接合成处理。
7.根据权利要求6所述的文件处理装置,其特征在于,所述文件处理装置还包括:
第二识别模块,用于识别每个所述目标文件中的音频信息包括的第二关键词和第三关键词;其中,所述第二关键词用于标记所述目标文件的开头,所述第三关键词用于标记所述目标文件的结尾;
所述第一处理模块包括:
第一处理单元,用于按照每个所述第一关键词表示的拼接合成顺序,以及所述第二关键词标记的开头和所述第三关键词标记的结尾,对所述至少两个目标文件进行首尾拼接合成处理。
8.根据权利要求6所述的文件处理装置,其特征在于,所述文件处理装置还包括:
第二处理模块,用于在识别到第一文件中的音频信息包括第四关键词和第五关键词的情况下,对所述第一文件进行裁剪处理,保留所述第四关键词和所述第五关键词对应的时间点之间的文件内容;
其中,所述第一文件为所述至少两个目标文件中的其中一个目标文件;
所述第一处理模块包括:
第二处理单元,用于按照每个所述第一关键词表示的拼接合成顺序,对裁剪处理之后的所述至少两个目标文件进行拼接合成处理。
9.根据权利要求6所述的文件处理装置,其特征在于,在所述至少两个目标文件为具有音频信息的视频文件的情况下,所述文件处理装置还包括:
第三处理模块,用于在识别到第二文件中的音频信息包括第六关键词的情况下,对目标视频内容进行与所述第六关键词对应的转场效果处理;
其中,所述第二文件为所述至少两个目标文件中的其中一个目标文件,所述目标视频内容为所述第二文件中的视频内容。
10.根据权利要求9所述的文件处理装置,其特征在于,所述第三处理模块包括:
第三处理单元,用于根据所述第六关键词在所述第二文件中的目标位置,对与所述目标位置对应的所述目标视频内容,进行与所述第六关键词对应的转场效果处理;
其中,所述目标位置为所述第二文件的开头位置或结尾位置。
11.一种电子设备,其特征在于,包括:处理器、存储器及存储在所述存储器上并可在所述处理器上运行的程序或指令,所述程序或指令被所述处理器执行时实现如权利要求1至5任一项所述的文件处理方法中的步骤。
CN202011187809.1A 2020-10-29 2020-10-29 文件处理方法、装置及电子设备 Pending CN112307252A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011187809.1A CN112307252A (zh) 2020-10-29 2020-10-29 文件处理方法、装置及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011187809.1A CN112307252A (zh) 2020-10-29 2020-10-29 文件处理方法、装置及电子设备

Publications (1)

Publication Number Publication Date
CN112307252A true CN112307252A (zh) 2021-02-02

Family

ID=74332407

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011187809.1A Pending CN112307252A (zh) 2020-10-29 2020-10-29 文件处理方法、装置及电子设备

Country Status (1)

Country Link
CN (1) CN112307252A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114449310A (zh) * 2022-02-15 2022-05-06 平安科技(深圳)有限公司 视频剪辑方法、装置、计算机设备及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6400886B1 (en) * 1996-11-15 2002-06-04 Futuretel, Inc. Method and apparatus for stitching edited video segments
CN107566892A (zh) * 2017-09-18 2018-01-09 北京小米移动软件有限公司 视频文件处理方法、装置及计算机可读存储介质
CN108831424A (zh) * 2018-06-15 2018-11-16 广州酷狗计算机科技有限公司 音频拼接方法、装置及存储介质
CN109147831A (zh) * 2018-09-26 2019-01-04 深圳壹账通智能科技有限公司 一种语音连接播放方法、终端设备及计算机可读存储介质
CN110691276A (zh) * 2019-11-06 2020-01-14 北京字节跳动网络技术有限公司 多媒体片段拼接的方法、装置、移动终端及存储介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6400886B1 (en) * 1996-11-15 2002-06-04 Futuretel, Inc. Method and apparatus for stitching edited video segments
CN107566892A (zh) * 2017-09-18 2018-01-09 北京小米移动软件有限公司 视频文件处理方法、装置及计算机可读存储介质
CN108831424A (zh) * 2018-06-15 2018-11-16 广州酷狗计算机科技有限公司 音频拼接方法、装置及存储介质
CN109147831A (zh) * 2018-09-26 2019-01-04 深圳壹账通智能科技有限公司 一种语音连接播放方法、终端设备及计算机可读存储介质
CN110691276A (zh) * 2019-11-06 2020-01-14 北京字节跳动网络技术有限公司 多媒体片段拼接的方法、装置、移动终端及存储介质

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114449310A (zh) * 2022-02-15 2022-05-06 平安科技(深圳)有限公司 视频剪辑方法、装置、计算机设备及存储介质

Similar Documents

Publication Publication Date Title
CN110519638B (zh) 处理方法、处理装置、电子装置和存储介质
CN109379633B (zh) 视频编辑方法、装置、计算机设备及可读存储介质
CN112422831A (zh) 视频生成方法、装置、计算机设备和存储介质
CN112954199B (zh) 视频录制方法及装置
CN113721810A (zh) 显示方法、装置、设备及存储介质
US9076489B1 (en) Circular timeline for video trimming
CN113918522A (zh) 一种文件生成方法、装置及电子设备
CN112087579A (zh) 视频拍摄方法、装置和电子设备
CN112887794B (zh) 视频剪辑方法及装置
CN112307252A (zh) 文件处理方法、装置及电子设备
CN113596574A (zh) 视频处理方法、视频处理装置、电子设备和可读存储介质
CN113810538B (zh) 视频编辑方法和视频编辑装置
CN116017043A (zh) 视频生成方法、装置、电子设备和存储介质
CN112399238B (zh) 视频播放方法、装置及电子设备
CN115767141A (zh) 视频播放方法、装置和电子设备
CN114302009A (zh) 视频处理方法、装置、电子设备及介质
CN114845171A (zh) 视频编辑方法、装置及电子设备
CN111757177B (zh) 视频裁剪方法及装置
CN114025237A (zh) 视频生成方法、装置和电子设备
CN113139367A (zh) 文档生成方法、装置和电子设备
CN112261483A (zh) 视频输出方法及装置
CN111599449A (zh) 电子图像的自动播放方法、装置、设备及存储介质
CN110662104B (zh) 视频拖动条生成方法、装置、电子设备及存储介质
CN112346698B (zh) 音频处理方法、装置
CN115278306B (zh) 视频剪辑方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination