CN110858492A - 音频剪辑方法、装置、设备和系统及数据处理方法 - Google Patents

音频剪辑方法、装置、设备和系统及数据处理方法 Download PDF

Info

Publication number
CN110858492A
CN110858492A CN201810968163.7A CN201810968163A CN110858492A CN 110858492 A CN110858492 A CN 110858492A CN 201810968163 A CN201810968163 A CN 201810968163A CN 110858492 A CN110858492 A CN 110858492A
Authority
CN
China
Prior art keywords
information
time point
audio
sensitive
clipping
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810968163.7A
Other languages
English (en)
Inventor
王康
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201810968163.7A priority Critical patent/CN110858492A/zh
Publication of CN110858492A publication Critical patent/CN110858492A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/02Editing, e.g. varying the order of information signals recorded on, or reproduced from, record carriers
    • G11B27/031Electronic editing of digitised analogue information signals, e.g. audio or video signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Document Processing Apparatus (AREA)

Abstract

本申请公开了一种音频剪辑方法,包括:接收待剪辑的音频信息对应的带有时间信息的文字信息;在所述文字信息中标注敏感信息;根据所述敏感信息对应的时间信息,得到所述敏感信息对应的起始时间点和终止时间点;根据所述敏感信息对应的起始时间点和终止时间点,对所述待剪辑的音频信息中的所述敏感信息对应的音频信息进行剪辑处理。采用上述方法,以提高音视频文件记录信息的真实性。

Description

音频剪辑方法、装置、设备和系统及数据处理方法
技术领域
本申请涉及音视频技术领域,具体涉及一种音频剪辑方法、装置、电子设备和存储设备,本申请还涉及一种音频剪辑系统,本申请还涉及一种数据处理方法。
背景技术
音频/视频会议纪要的后期处理、脱敏、存档过程中,经常需要对音频/视频文件进行剪辑处理,例如,涉及商业机密的信息,以及其它不适合公开的文字信息需要删除掉;再如无用的信息(大段空白和口语词汇)也应该被剪掉。进行剪辑处理后可以提升信息密度,提高听众的收听效率。剪辑工作非常繁琐,而且费时。
现有技术下,将音频文件通过语音转写系统生成文字,对文字进行剪辑,只对剪辑处理后的文字进行了记录,虽然记录的目的达到了,但原有音频文件中的语调、语速等情感信息没有被记录,损失了音视频文件记录信息的真实性。
发明内容
本申请提供一种音频剪辑方法、装置、电子设备及存储设备,以提高音视频文件记录信息的真实性。
本申请提供一种音频剪辑方法,包括:
接收待剪辑的音频信息对应的带有时间信息的文字信息;
在所述文字信息中标注敏感信息;
根据所述敏感信息对应的时间信息,得到所述敏感信息对应的起始时间点和终止时间点;
根据所述敏感信息对应的起始时间点和终止时间点,对所述待剪辑的音频信息中的所述敏感信息对应的音频信息进行剪辑处理。
可选的,所述方法应用于剪辑平台,所述方法还包括:
获得发布平台发送的音频剪辑请求;所述音频剪辑请求包含所述待剪辑的音频信息;
将所述音频剪辑请求发送到语音转写系统;
所述接收待剪辑的音频信息对应的带有时间信息的文字信息,包括:接收所述语音转写系统返回的待剪辑的音频信息对应的带有时间信息的文字信息。
可选的,所述敏感信息包括敏感分词信息;
所述方法还包括:将所述带有时间信息的文字信息转化为带有细粒度时间信息的分词信息;
所述在所述文字信息中标注敏感信息,包括:在所述带有细粒度时间信息的分词信息中标注敏感分词信息;
所述根据所述敏感信息对应的时间信息,得到所述敏感信息对应的起始时间点和终止时间点,包括:根据所述敏感分词信息对应的细粒度时间信息,得到所述敏感分词信息对应的起始时间点和终止时间点;
所述根据所述敏感信息对应的起始时间点和终止时间点,对所述敏感信息对应的音频信息进行剪辑处理,包括:
根据所述敏感分词信息对应的起始时间点和终止时间点,对所述敏感分词信息对应的音频信息进行剪辑处理。
可选的,所述在所述文字信息中标注敏感信息,包括:
向敏感信息库发送针对所述文字信息标注敏感信息的请求;
接收敏感信息库返回的标注敏感信息的结果。
可选的,所述根据所述敏感信息对应的起始时间点和终止时间点,对所述敏感信息对应的音频信息进行剪辑处理包括:
根据所述敏感信息对应的起始时间点和终止时间点,确定所述敏感信息对应的音频信息的起始时间点和终止时间点;
对所述起始时间点和终止时间点之间的音频信息进行剪辑处理。
可选的,所述对所述起始时间点和终止时间点之间的音频信息进行剪辑处理,包括:
对所述起始时间点和终止时间点之间的音频信息进行删除处理。
可选的,所述对所述起始时间点和终止时间点之间的音频信息进行剪辑处理,包括:
使用提示音覆盖所述起始时间点和终止时间点之间的音频信息。
可选的,所述对所述起始时间点和终止时间点之间的音频信息进行剪辑处理,包括:
调整所述起始时间点和终止时间点之间的音频信息在待剪辑的音频信息中的位置。
可选的,所述调整所述起始时间点和终止时间点之间的音频信息在待剪辑的音频信息中的位置,包括:
将所述敏感信息调整到所述文字信息中的目标位置;
根据所述敏感信息在文字信息中的目标位置,调整所述起始时间点和终止时间点之间的音频信息在待剪辑的音频信息中的位置。
可选的,还包括:
向所述发布平台发送剪辑处理后的音频信息。
可选的,所述音频信息包括:录制的音频文件和/或直播音频信息。
本申请还提供一种装置,包括:
文字信息接收单元,用于接收待剪辑的音频信息对应的带有时间信息的文字信息;
敏感信息标注单元,用于在所述文字信息中标注敏感信息;
时间点获得单元,用于根据所述敏感信息对应的时间信息,得到所述敏感信息对应的起始时间点和终止时间点;
音频剪辑单元,用于根据所述敏感信息对应的起始时间点和终止时间点,对所述待剪辑的音频信息中的所述敏感信息对应的音频信息进行剪辑处理。
本申请还提供一种电子设备,包括:
处理器;以及
存储器,用于存储音频剪辑方法的程序,该设备通电并通过所述处理器运行该音频剪辑方法的程序后,执行下述步骤:
接收待剪辑的音频信息对应的带有时间信息的文字信息;
在所述文字信息中标注敏感信息;
根据所述敏感信息对应的时间信息,得到所述敏感信息对应的起始时间点和终止时间点;
根据所述敏感信息对应的起始时间点和终止时间点,对所述待剪辑的音频信息中的所述敏感信息对应的音频信息进行剪辑处理。
本申请还提供一种存储设备,
存储有音频剪辑方法的程序,该程序被处理器运行,执行下述步骤:
接收待剪辑的音频信息对应的带有时间信息的文字信息;
在所述文字信息中标注敏感信息;
根据所述敏感信息对应的时间信息,得到所述敏感信息对应的起始时间点和终止时间点;
根据所述敏感信息对应的起始时间点和终止时间点,对所述待剪辑的音频信息中的所述敏感信息对应的音频信息进行剪辑处理。
本申请另外提供一种音频剪辑系统,包括:发布平台、剪辑平台、语音转写系统;
所述发布平台,用于向所述剪辑平台发送音频剪辑请求;所述音频剪辑请求包含待剪辑的音频信息;
所述剪辑平台,用于接收所述发布平台发送的音频剪辑请求;向所述语音转写系统发送针对待剪辑的音频信息的语音转写请求;接收语音转写系统返回的待剪辑的音频信息对应的带有时间信息的文字信息;以及在所述文字信息中标注敏感信息;并根据所述敏感信息对应的时间信息,得到所述敏感信息对应的起始时间点和终止时间点;根据所述敏感信息对应的起始时间点和终止时间点,对所述待剪辑的音频信息中的所述敏感信息对应的音频信息进行剪辑处理;
所述语音转写系统,用于接收剪辑平台发送的语音转写请求,向所述剪辑平台返回待剪辑的音频信息对应的带有时间信息的文字信息。
可选的,
所述剪辑平台,还用于将所述带有时间信息的文字信息转化为带有细粒度时间信息的分词信息;
所述在所述文字信息中标注敏感信息,包括:在所述带有细粒度时间信息的分词信息中标注敏感分词信息;
所述根据所述敏感信息对应的时间信息,得到所述敏感信息对应的起始时间点和终止时间点,包括:根据所述敏感分词信息对应的细粒度时间信息,得到所述敏感分词信息对应的起始时间点和终止时间点;
所述根据所述敏感信息对应的起始时间点和终止时间点,对所述敏感信息对应的音频信息进行剪辑处理,包括:
根据所述敏感分词信息对应的起始时间点和终止时间点,对所述敏感分词信息对应的音频信息进行剪辑处理。
可选的,还包括:敏感信息库;
所述剪辑平台,还用于向敏感信息库发送针对所述文字信息标注敏感信息的请求;以及接收敏感信息库返回的敏感信息标注的结果;
所述敏感信息库,用于接收所述剪辑平台发送的针对所述文字信息标注敏感信息的请求,并标注敏感信息,以及向所述剪辑平台发送敏感信息标注的结果。
可选的,
所述剪辑平台,还用于向所述发布平台发送剪辑处理后的音频信息;
所述发布平台,还用于将接收的剪辑处理后的音频信息进行发布。
本申请还提供一种数据处理方法,包括:
获取第一多媒体信息;
获取与所述第一多媒体信息对应的带有时间属性的文本信息,其中,所述时间属性包括起始时间点和终止时间点;
获取所述文本信息中的满足预设条件的目标信息;
根据所述目标信息对所述第一多媒体信息进行处理,生成第二多媒体信息。
可选的,所述第一多媒体信息包括音频信息或视频信息。
可选的,根据所述目标信息对所述第一多媒体信息进行处理,生成第二多媒体信息包括:
根据所述目标信息的起始时间点和终止时间点,对所述第一多媒体信息中的所述目标信息对应的多媒体信息进行删除。
可选的,根据所述目标信息对所述第一多媒体信息进行处理,生成第二多媒体信息包括:
根据所述目标信息的起始时间点和终止时间点,对所述第一多媒体信息中的所述目标信息对应的多媒体信息进行替换,替换为目标多媒体信息。
可选的,根据所述目标信息对所述第一多媒体信息进行处理,生成第二多媒体信息包括:
根据所述目标信息的起始时间点和终止时间点,对所述第一多媒体信息中的所述目标信息对应的多媒体信息进行预设信号处理,使所述目标信息对应的多媒体信息丧失辨识度。
可选的,所述获取所述文本信息中的满足预设条件的目标信息,包括:
获取所述文本信息中的不适合公开的目标信息;和/或,
获取所述文本信息中需要进行替换的目标信息。可选的,所述获取所述文本信息中的不适合公开的目标信息,包括:
通过将所述文本信息与目标信息库进行匹配的方式,获取所述文本信息中的不适合公开的目标信息。
与现有技术相比,本申请具有以下优点:
本申请提供一种音频剪辑方法、装置、电子设备及存储设备,根据敏感信息对应的起始时间点和终止时间点,对敏感信息对应待剪辑的音频信息中的音频信息进行剪辑处理,实现了在待剪辑的音频信息上对敏感信息对应的音频信息进行剪辑处理,提高了音视频文件记录信息的真实性。
附图说明
图1是本申请第一实施例提供的一种音频剪辑方法的流程图。
图2是本申请第一实施例提供的一种待剪辑的音频信息对应的带有时间信息的文字信息的示意图。
图3是本申请第一实施例提供的一种在所述文字信息中标注敏感信息的示意图。
图4是本申请第一实施例提供的一种带有细粒度时间信息的分词信息的示意图。
图5是本申请第二实施例提供的一种音频剪辑装置的示意图。
图6是本申请第三实施例提供的一种电子设备的示意图。
图7是本申请第五实施例提供的一种针对录制音频使用音频剪辑系统进行剪辑处理的流程图。
图8是本申请第五实施例提供的一种针对直播场景使用音频剪辑系统的实时剪辑处理流程图。
图9是本申请第六实施例提供的一种数据处理方法的流程图。
具体实施方式
在下面的描述中阐述了很多具体细节以便于充分理解本发明。但是本发明能够以很多不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本发明内涵的情况下做类似推广,因此本发明不受下面公开的具体实施的限制。
本申请第一实施例提供一种音频剪辑方法,所述方法应用于剪辑平台,以下结合图1、图2、图3和图4进行说明。
如图1所示,在步骤S101中,接收待剪辑的音频信息对应的带有时间信息的文字信息。
所述音频信息包括:录制的音频文件和/或直播音频信息。其中,直播音频信息可以来源于直播视频中的音频信息,也可以来源于直播音频中的音频信息。录制的音频文件包括:录制的只包括声音信息的文件,或者,由视频文件中的音频信息生成的音频文件。由于音频信息中存在涉及商业机密的信息、无用的信息(例如大段空白和口语词汇)以及其它不适合公开的信息,因此需要对音频信息进行剪辑处理。
在接收待剪辑的音频信息对应的带有时间信息的文字信息之前,还可以包括下述步骤:
获得发布平台发送的音频剪辑请求;所述音频剪辑请求包含所述待剪辑的音频信息;
将所述音频剪辑请求发送到语音转写系统。
所述接收待剪辑的音频信息对应的带有时间信息的文字信息,包括:接收所述语音转写系统返回的待剪辑的音频信息对应的带有时间信息的文字信息。
所述语音转写系统,指由机器学习生成的识别模型,可以自动将语音转换为文字。
如图2所示,其示出了一种待剪辑的音频信息对应的带有时间信息的文字信息的示意图,将带有时间信息的文字信息同步地附在了音频信息下面。
如图1所示,在步骤S102中,在所述文字信息中标注敏感信息。
所述敏感信息,指需要对其进行剪辑处理的音频信息对应的文字信息,包括待删除的音频信息对应的文字信息、待调整顺序的音频信息对应的文字信息等。例如,会议中涉及的商业机密信息和无用的信息(例如大段空白和口语词汇)。敏感信息的单位可以包括段落、句子、分词。例如,如果需要调整某个段落对应的音频信息的位置,则此段落为敏感信息。如图2所示,标亮的“它基本上它的流水会比较比较”为敏感信息。如图3所示,“呢”为敏感信息,将音频信息中的所有“呢”同步地标注在音轨下方。
所述在所述文字信息中标注敏感信息,包括:
向敏感信息库发送针对所述文字信息标注敏感信息的请求;
接收敏感信息库返回的标注敏感信息的结果。
在具体实施时,可以采用人工的方式进行标注敏感信息,为了提高标注速度,在某些场合下(例如,鉴/删黄场合),可以采用敏感信息库标注敏感信息的方式。为了避免采用敏感信息库标注敏感信息不准确的情况发生,可以采用人工复核的方式对敏感信息库标注的敏感信息进行复核。
当敏感信息为敏感分词信息时,剪辑平台还可以将所述带有时间信息的文字信息转化为带有细粒度时间信息的分词信息;所述在所述文字信息中标注敏感信息,包括:在所述带有细粒度时间信息的分词信息中标注敏感分词信息。如图4所示,使用分词引擎,结合语速预测,由语音转写系统返回的待剪辑的音频信息对应的带有时间信息(原始粗粒度时间信息)的文字信息,生成了带有细粒度时间信息的分词信息。由带有原始粗粒度时间信息的文字信息生成带有细粒度时间信息的分词信息,能够提供精细时间尺度的剪辑处理。
如图1所示,在步骤S103中,根据所述敏感信息对应的时间信息,得到所述敏感信息对应的起始时间点和终止时间点。
当敏感信息为敏感分词信息时,所述根据所述敏感信息对应的时间信息,得到所述敏感信息对应的起始时间点和终止时间点,包括:根据所述敏感分词信息对应的细粒度时间信息,得到所述敏感分词信息对应的起始时间点和终止时间点。例如,如图4所示,敏感分词信息为“会员”,根据敏感分词信息对应的时间信息,得到敏感信息对应的起始时间点为词头“会”对应的时刻“00h7m11.380s”,敏感信息对应的终止时间点为词尾“员”对应的时刻“00h7m11.654s”。
如图1所示,在步骤S104中,根据所述敏感信息对应的起始时间点和终止时间点,对所述待剪辑的音频信息中的所述敏感信息对应的音频信息进行剪辑处理。
当敏感信息为敏感分词信息时,所述根据所述敏感信息对应的起始时间点和终止时间点,对所述敏感信息对应的音频信息进行剪辑处理,包括:
根据所述敏感分词信息对应的起始时间点和终止时间点,对所述敏感分词信息对应的音频信息进行剪辑处理。
所述根据所述敏感信息对应的起始时间点和终止时间点,对所述敏感信息对应的音频信息进行剪辑处理包括:
根据所述敏感信息对应的起始时间点和终止时间点,确定所述敏感信息对应的音频信息的起始时间点和终止时间点;
对所述起始时间点和终止时间点之间的音频信息进行剪辑处理。
所述对所述起始时间点和终止时间点之间的音频信息进行剪辑处理,包括:
对所述起始时间点和终止时间点之间的音频信息进行删除处理。
例如,如图4,如果需要删除敏感信息“会员”对应的音频信息,敏感信息对应的起始时间点“00h7m11.380s”,敏感信息对应的终止时间点“00h7m11.654s”,则可以对起始时间点“00h7m11.380s”和终止时间点“00h7m11.654s”之间的音频信息进行删除处理,从而实现了删除敏感信息“会员”对应的音频信息。
所述对所述起始时间点和终止时间点之间的音频信息进行剪辑处理,包括:
使用提示音覆盖所述起始时间点和终止时间点之间的音频信息。
所述对所述起始时间点和终止时间点之间的音频信息进行剪辑处理,包括:
调整所述起始时间点和终止时间点之间的音频信息在待剪辑的音频信息中的位置。
所述调整所述起始时间点和终止时间点之间的音频信息在待剪辑的音频信息中的位置,包括:
将所述敏感信息调整到所述文字信息中的目标位置;
根据所述敏感信息在文字信息中的目标位置,调整所述起始时间点和终止时间点之间的音频信息在待剪辑的音频信息中的位置。
例如,如果敏感信息对应的起始时间点为“00h7m11s”,对应的终止时间点为“00h9m30s”,其调整后的目标位置对应的起始时间点为“00h5m11s”,则将起始时间点为“00h7m11s”和终止时间点为“00h7m30s”之间的音频信息相应地调整到起始时间点为“00h5m11s”、终止时间点为“00h7m30s”的音频位置。在很多场景下,需要改变大段音频信息的语序,将音频信息的语序调整后,使得音频信息更具有逻辑性或更突出音频信息的主题。
剪辑平台在对音频信息进行剪辑处理后,还可以向发布平台发送剪辑处理后的音频信息,供发布平台发布。
至此,对本申请第一实施例提供的音频剪辑方法的实施方式进行了详细说明。本申请通过将语音转写系统与剪辑平台结合,实现了在待剪辑的音频信息上对敏感信息对应的音频信息进行剪辑处理。同时,使用了分词引擎,结合语速预测,由语音转写系统的原始粗粒度时间信息中,生成细粒度时间信息,从而实现了精细时间尺度的剪辑处理。
与上述提供的一种音频剪辑方法相对应的,本申请第二实施例还提供了一种音频剪辑装置。
如图5所示,所述音频剪辑装置包括:
文字信息接收单元501,用于接收待剪辑的音频信息对应的带有时间信息的文字信息;
敏感信息标注单元502,用于在所述文字信息中标注敏感信息;
时间点获得单元503,用于根据所述敏感信息对应的时间信息,得到所述敏感信息对应的起始时间点和终止时间点;
音频剪辑单元504,用于根据所述敏感信息对应的起始时间点和终止时间点,对所述待剪辑的音频信息中的所述敏感信息对应的音频信息进行剪辑处理。
可选的,所述装置应用于剪辑平台,所述装置还包括:
音频剪辑请求获得单元,用于获得发布平台发送的音频剪辑请求;所述音频剪辑请求包含所述待剪辑的音频信息;
音频剪辑请求发送单元,用于将所述音频剪辑请求发送到语音转写系统;
所述文字信息接收单元,具体用于:接收所述语音转写系统返回的待剪辑的音频信息对应的带有时间信息的文字信息。
可选的,所述敏感信息包括敏感分词信息;
所述装置还包括:细粒度时间信息转换单元,用于将所述带有时间信息的文字信息转化为带有细粒度时间信息的分词信息;
所述敏感信息标注单元,具体用于:在所述带有细粒度时间信息的分词信息中标注敏感分词信息;
所述时间点获得单元,具体用于:根据所述敏感分词信息对应的细粒度时间信息,得到所述敏感分词信息对应的起始时间点和终止时间点;
所述音频剪辑单元,具体用于:
根据所述敏感分词信息对应的起始时间点和终止时间点,对所述敏感分词信息对应的音频信息进行剪辑处理。
可选的,所述敏感信息标注单元,具体用于:
向敏感信息库发送针对所述文字信息标注敏感信息的请求;
接收敏感信息库返回的标注敏感信息的结果。
可选的,所述音频剪辑单元,包括:
音频时间点确定子单元,用于根据所述敏感信息对应的起始时间点和终止时间点,确定所述敏感信息对应的音频信息的起始时间点和终止时间点;
剪辑处理子单元,用于对所述起始时间点和终止时间点之间的音频信息进行剪辑处理。
可选的,所述剪辑处理子单元,具体用于:
对所述起始时间点和终止时间点之间的音频信息进行删除处理。
可选的,所述剪辑处理子单元,具体用于:
使用提示音覆盖所述起始时间点和终止时间点之间的音频信息。
可选的,所述剪辑处理子单元,具体用于:
调整所述起始时间点和终止时间点之间的音频信息在待剪辑的音频信息中的位置。
可选的,所述调整所述起始时间点和终止时间点之间的音频信息在待剪辑的音频信息中的位置,包括:
将所述敏感信息调整到所述文字信息中的目标位置;
根据所述敏感信息在文字信息中的目标位置,调整所述起始时间点和终止时间点之间的音频信息在待剪辑的音频信息中的位置。
可选的,所述装置还包括:剪辑后音频信息发送单元,
用于向所述发布平台发送剪辑处理后的音频信息。
可选的,所述音频信息包括:录制的音频文件和/或直播音频信息。
需要说明的是,对于本申请第二实施例提供的音频剪辑装置的详细描述可以参考对本申请第一实施例的相关描述,这里不再赘述。
与上述提供的一种音频剪辑方法相对应的,本申请第三实施例还提供了一种电子设备,如图6所示,电子设备包括:
处理器601;以及
存储器602,用于存储音频剪辑方法的程序,该设备通电并通过所述处理器运行该音频剪辑方法的程序后,执行下述步骤:
接收待剪辑的音频信息对应的带有时间信息的文字信息;
在所述文字信息中标注敏感信息;
根据所述敏感信息对应的时间信息,得到所述敏感信息对应的起始时间点和终止时间点;
根据所述敏感信息对应的起始时间点和终止时间点,对所述待剪辑的音频信息中的所述敏感信息对应的音频信息进行剪辑处理。
可选的,所述电子设备还执行下述步骤:
获得发布平台发送的音频剪辑请求;所述音频剪辑请求包含所述待剪辑的音频信息;
将所述音频剪辑请求发送到语音转写系统;
所述接收待剪辑的音频信息对应的带有时间信息的文字信息,包括:接收所述语音转写系统返回的待剪辑的音频信息对应的带有时间信息的文字信息。
可选的,所述敏感信息包括敏感分词信息;
所述方法还包括:将所述带有时间信息的文字信息转化为带有细粒度时间信息的分词信息;
所述在所述文字信息中标注敏感信息,包括:在所述带有细粒度时间信息的分词信息中标注敏感分词信息;
所述根据所述敏感信息对应的时间信息,得到所述敏感信息对应的起始时间点和终止时间点,包括:根据所述敏感分词信息对应的细粒度时间信息,得到所述敏感分词信息对应的起始时间点和终止时间点;
所述根据所述敏感信息对应的起始时间点和终止时间点,对所述敏感信息对应的音频信息进行剪辑处理,包括:
根据所述敏感分词信息对应的起始时间点和终止时间点,对所述敏感分词信息对应的音频信息进行剪辑处理。
可选的,所述在所述文字信息中标注敏感信息,包括:
向敏感信息库发送针对所述文字信息标注敏感信息的请求;
接收敏感信息库返回的标注敏感信息的结果。
可选的,所述根据所述敏感信息对应的起始时间点和终止时间点,对所述敏感信息对应的音频信息进行剪辑处理包括:
根据所述敏感信息对应的起始时间点和终止时间点,确定所述敏感信息对应的音频信息的起始时间点和终止时间点;
对所述起始时间点和终止时间点之间的音频信息进行剪辑处理。
可选的,所述对所述起始时间点和终止时间点之间的音频信息进行剪辑处理,包括:
对所述起始时间点和终止时间点之间的音频信息进行删除处理。
可选的,所述对所述起始时间点和终止时间点之间的音频信息进行剪辑处理,包括:
使用提示音覆盖所述起始时间点和终止时间点之间的音频信息。
可选的,所述对所述起始时间点和终止时间点之间的音频信息进行剪辑处理,包括:
调整所述起始时间点和终止时间点之间的音频信息在待剪辑的音频信息中的位置。
可选的,所述调整所述起始时间点和终止时间点之间的音频信息在待剪辑的音频信息中的位置,包括:
将所述敏感信息调整到所述文字信息中的目标位置;
根据所述敏感信息在文字信息中的目标位置,调整所述起始时间点和终止时间点之间的音频信息在待剪辑的音频信息中的位置。
可选的,所述电子设备还执行下述步骤:
向所述发布平台发送剪辑处理后的音频信息。
可选的,所述音频信息包括:录制的音频文件和/或直播音频信息。
需要说明的是,对于本申请第三实施例提供的电子设备的详细描述可以参考对本申请第一实施例的相关描述,这里不再赘述。
与上述提供的一种音频剪辑方法相对应的,本申请第四实施例还提供了一种存储设备,存储有音频剪辑方法的程序,该程序被处理器运行,执行下述步骤:
接收待剪辑的音频信息对应的带有时间信息的文字信息;
在所述文字信息中标注敏感信息;
根据所述敏感信息对应的时间信息,得到所述敏感信息对应的起始时间点和终止时间点;
根据所述敏感信息对应的起始时间点和终止时间点,对所述待剪辑的音频信息中的所述敏感信息对应的音频信息进行剪辑处理。
需要说明的是,对于本申请第四实施例提供的存储设备的详细描述可以参考对本申请第一实施例的相关描述,这里不再赘述。
本申请第五实施例提供了一种音频剪辑系统,以下结合图7和图8进行说明。
如图7和图8所示,所述系统包括:发布平台、剪辑平台、语音转写系统。
所述发布平台,用于向所述剪辑平台发送音频剪辑请求;所述音频剪辑请求包含待剪辑的音频信息。
发布平台在接收到音频创作方发送的录制音频的发布请求后,向所述剪辑平台发送音频剪辑请求;所述发布请求包含待剪辑的音频信息。
所述剪辑平台,用于接收所述发布平台发送的音频剪辑请求;向所述语音转写系统发送针对待剪辑的音频信息的语音转写请求;接收语音转写系统返回的待剪辑的音频信息对应的带有时间信息的文字信息;以及在所述文字信息中标注敏感信息;并根据所述敏感信息对应的时间信息,得到所述敏感信息对应的起始时间点和终止时间点;根据所述敏感信息对应的起始时间点和终止时间点,对所述待剪辑的音频信息中的所述敏感信息对应的音频信息进行剪辑处理。
所述根据所述敏感信息对应的起始时间点和终止时间点,对所述敏感信息对应的音频信息进行剪辑处理包括:
根据所述敏感信息对应的起始时间点和终止时间点,确定所述敏感信息对应的音频信息的起始时间点和终止时间点;
对所述起始时间点和终止时间点之间的音频信息进行剪辑处理。
所述对所述起始时间点和终止时间点之间的音频信息进行剪辑处理,包括:
对所述起始时间点和终止时间点之间的音频信息进行删除处理。
所述对所述起始时间点和终止时间点之间的音频信息进行剪辑处理,包括:
使用提示音覆盖所述起始时间点和终止时间点之间的音频信息。
所述对所述起始时间点和终止时间点之间的音频信息进行剪辑处理,包括:
调整所述起始时间点和终止时间点之间的音频信息在待剪辑的音频信息中的位置。
所述调整所述起始时间点和终止时间点之间的音频信息在待剪辑的音频信息中的位置,包括:
将所述敏感信息调整到所述文字信息中的目标位置;
根据所述敏感信息在文字信息中的目标位置,调整所述起始时间点和终止时间点之间的音频信息在待剪辑的音频信息中的位置。
所述剪辑平台,还用于将所述带有时间信息的文字信息转化为带有细粒度时间信息的分词信息。
所述在所述文字信息中标注敏感信息,包括:在所述带有细粒度时间信息的分词信息中标注敏感分词信息;
所述根据所述敏感信息对应的时间信息,得到所述敏感信息对应的起始时间点和终止时间点,包括:根据所述敏感分词信息对应的细粒度时间信息,得到所述敏感分词信息对应的起始时间点和终止时间点;
所述根据所述敏感信息对应的起始时间点和终止时间点,对所述敏感信息对应的音频信息进行剪辑处理,包括:
根据所述敏感分词信息对应的起始时间点和终止时间点,对所述敏感分词信息对应的音频信息进行剪辑处理。
所述语音转写系统,用于接收剪辑平台发送的语音转写请求,向所述剪辑平台返回待剪辑的音频信息对应的带有时间信息的文字信息。
所述系统还包括:敏感信息库。
所述剪辑平台,还用于向敏感信息库发送针对所述文字信息标注敏感信息的请求;以及接收敏感信息库返回的敏感信息标注的结果。
所述敏感信息库,用于接收所述剪辑平台发送的针对所述文字信息标注敏感信息的请求,并标注敏感信息,以及向所述剪辑平台发送敏感信息标注的结果。
所述剪辑平台,还用于向所述发布平台发送剪辑处理后的音频信息。
所述发布平台,还用于将接收的剪辑处理后的音频信息进行发布。
下面结合图7和图8介绍音频剪辑系统的处理流程。
图7示出了一种针对录制音频使用音频剪辑系统进行剪辑处理的流程,其处理流程如下:
1、音频创作方将录制音频(待剪辑的音频信息)提交到发布平台;
2、发布平台提交脱敏请求(音频剪辑请求)到语音转写系统;
3、语音转写系统对待剪辑的音频信息进行语音转写,生成待剪辑的音频信息对应的带有时间信息的文字信息;并将所述带有时间信息的文字信息返回到剪辑平台;
4、剪辑平台:接收语音转写系统返回的待剪辑的音频信息对应的带有时间信息的文字信息,并进行细粒度分词时间戳划分(将所述带有时间信息的文字信息转化为带有细粒度时间信息的分词信息);
5、剪辑平台向敏感信息库发送针对文字信息标注敏感信息的请求;
6、敏感信息库标注敏感信息,并向所述剪辑平台发送敏感信息标注的结果;
7、剪辑平台:生成敏感信息时间起止信息(敏感信息对应的起始时间点和终止时间点);
8、剪辑平台将标注敏感信息的文字信息提供给审核员进行人工复核(可选),复核审核员更新敏感信息库(可选);
9、剪辑平台根据敏感信息对应的起始时间点和终止时间点,对敏感信息对应的音频信息进行剪辑处理;
10、剪辑平台向所述发布平台发送剪辑处理后的音频信息;
11、发布平台将接收的剪辑处理后的音频信息进行发布。
图8示出了一种针对直播场景使用音频剪辑系统的实时剪辑处理流程,其处理流程如下:
1、音频创作方提交推流到发布平台;发布平台进行时间缓冲;
2、发布平台提交脱敏请求(音频剪辑请求)到语音转写系统;
3、语音转写系统对待剪辑的音频信息进行语音转写,生成待剪辑的音频信息对应的带有时间信息的文字信息;并将所述带有时间信息的文字信息返回到剪辑平台;
4、剪辑平台:接收语音转写系统返回的待剪辑的音频信息对应的带有时间信息的文字信息,并进行细粒度分词时间戳划分(将所述带有时间信息的文字信息转化为带有细粒度时间信息的分词信息);
5、剪辑平台向敏感信息库发送针对文字信息标注敏感信息的请求;
6、敏感信息库标注敏感信息,并向所述剪辑平台发送敏感信息标注的结果;
7、剪辑平台:生成敏感信息时间起止信息(敏感信息对应的起始时间点和终止时间点);
8、剪辑平台根据敏感信息对应的起始时间点和终止时间点,对敏感信息对应的音频信息进行剪辑处理;
9、剪辑平台向所述发布平台发送脱敏后的音频(剪辑处理后的音频信息);
10、发布平台将接收的剪辑处理后的音频信息进行对外直播。
本申请第六实施例提供一种数据处理方法,以下结合图9进行说明。
如图9所示,在步骤901中,获取第一多媒体信息。
所述第一多媒体信息包括音频信息、视频信息或音视频混合。
如图9所示,在步骤902中,获取与所述第一多媒体信息对应的带有时间属性的文本信息,其中,所述时间属性包括起始时间点和终止时间点。
所述文本信息可以包括文字,也可以包括非文字的符号。
如图9所示,在步骤903中,获取所述文本信息中的满足预设条件的目标信息。
所述目标信息,指带有时间属性的文本信息中需要进行数据处理的文本信息。例如,会议中涉及的商业机密信息和无用的信息(例如大段空白和口语词汇)需要删除,则上述信息对应的文本信息可以作为目标信息。
获取所述文本信息中的不适合公开的目标信息;和/或,
获取所述文本信息中需要进行替换的目标信息。
其中,获取所述文本信息中的不适合公开的目标信息,可以通过人工方式,也可以通过将所述文本信息与目标信息库进行匹配的方式,获取所述文本信息中的不适合公开的目标信息。例如,目标信息库为鉴黄信息库。
如图9所示,在步骤904中,根据所述目标信息对所述第一多媒体信息进行处理,生成第二多媒体信息。
根据所述目标信息对所述第一多媒体信息进行处理,生成第二多媒体信息包括:
根据所述目标信息的起始时间点和终止时间点,对所述第一多媒体信息中的所述目标信息对应的多媒体信息进行删除。
根据所述目标信息对所述第一多媒体信息进行处理,生成第二多媒体信息包括:
根据所述目标信息的起始时间点和终止时间点,对所述第一多媒体信息中的所述目标信息对应的多媒体信息进行替换,替换为目标多媒体信息。
根据所述目标信息对所述第一多媒体信息进行处理,生成第二多媒体信息包括:
根据所述目标信息的起始时间点和终止时间点,对所述第一多媒体信息中的所述目标信息对应的多媒体信息进行预设信号处理,使所述目标信息对应的多媒体信息丧失辨识度。
所述丧失辨识度,指用户不能识别出目标信息对应的多媒体信息表达的信息。当第一多媒体信息为音频信息时,对所述第一多媒体信息中的目标信息对应的多媒体信息进行预设信号处理,可以采用将目标信息对应的多媒体信息用提示音代替的方式,也可以采用其他能够导致目标信息对应的多媒体信息丧失辨识度的方式。当第一多媒体信息为视频信息时,可以将目标信息对应的多媒体信息打上马赛克,使目标信息对应的多媒体信息丧失辨识度。
本申请虽然以较佳实施例公开如上,但其并不是用来限定本本申请,任何本领域技术人员在不脱离本发明的精神和范围内,都可以做出可能的变动和修改,因此本本申请的保护范围应当以本本申请权利要求所界定的范围为准。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括非暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
本领域技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

Claims (25)

1.一种音频剪辑方法,其特征在于,包括:
接收待剪辑的音频信息对应的带有时间信息的文字信息;
在所述文字信息中标注敏感信息;
根据所述敏感信息对应的时间信息,得到所述敏感信息对应的起始时间点和终止时间点;
根据所述敏感信息对应的起始时间点和终止时间点,对所述待剪辑的音频信息中的所述敏感信息对应的音频信息进行剪辑处理。
2.根据权利要求1所述的方法,其特征在于,所述方法应用于剪辑平台,所述方法还包括:
获得发布平台发送的音频剪辑请求;所述音频剪辑请求包含所述待剪辑的音频信息;
将所述音频剪辑请求发送到语音转写系统;
所述接收待剪辑的音频信息对应的带有时间信息的文字信息,包括:接收所述语音转写系统返回的待剪辑的音频信息对应的带有时间信息的文字信息。
3.根据权利要求1所述的方法,其特征在于,所述敏感信息包括敏感分词信息;
所述方法还包括:将所述带有时间信息的文字信息转化为带有细粒度时间信息的分词信息;
所述在所述文字信息中标注敏感信息,包括:在所述带有细粒度时间信息的分词信息中标注敏感分词信息;
所述根据所述敏感信息对应的时间信息,得到所述敏感信息对应的起始时间点和终止时间点,包括:根据所述敏感分词信息对应的细粒度时间信息,得到所述敏感分词信息对应的起始时间点和终止时间点;
所述根据所述敏感信息对应的起始时间点和终止时间点,对所述敏感信息对应的音频信息进行剪辑处理,包括:
根据所述敏感分词信息对应的起始时间点和终止时间点,对所述敏感分词信息对应的音频信息进行剪辑处理。
4.根据权利要求1所述的方法,其特征在于,所述在所述文字信息中标注敏感信息,包括:
向敏感信息库发送针对所述文字信息标注敏感信息的请求;
接收敏感信息库返回的标注敏感信息的结果。
5.根据权利要求1所述的方法,其特征在于,所述根据所述敏感信息对应的起始时间点和终止时间点,对所述敏感信息对应的音频信息进行剪辑处理包括:
根据所述敏感信息对应的起始时间点和终止时间点,确定所述敏感信息对应的音频信息的起始时间点和终止时间点;
对所述起始时间点和终止时间点之间的音频信息进行剪辑处理。
6.根据权利要求5所述的方法,其特征在于,所述对所述起始时间点和终止时间点之间的音频信息进行剪辑处理,包括:
对所述起始时间点和终止时间点之间的音频信息进行删除处理。
7.根据权利要求5所述的方法,其特征在于,所述对所述起始时间点和终止时间点之间的音频信息进行剪辑处理,包括:
使用提示音覆盖所述起始时间点和终止时间点之间的音频信息。
8.根据权利要求5所述的方法,其特征在于,所述对所述起始时间点和终止时间点之间的音频信息进行剪辑处理,包括:
调整所述起始时间点和终止时间点之间的音频信息在待剪辑的音频信息中的位置。
9.根据权利要求8所述的方法,其特征在于,所述调整所述起始时间点和终止时间点之间的音频信息在待剪辑的音频信息中的位置,包括:
将所述敏感信息调整到所述文字信息中的目标位置;
根据所述敏感信息在文字信息中的目标位置,调整所述起始时间点和终止时间点之间的音频信息在待剪辑的音频信息中的位置。
10.根据权利要求2所述的方法,其特征在于,还包括:
向所述发布平台发送剪辑处理后的音频信息。
11.根据权利要求1所述的方法,其特征在于,所述音频信息包括:录制的音频文件和/或直播音频信息。
12.一种音频剪辑装置,其特征在于,包括:
文字信息接收单元,用于接收待剪辑的音频信息对应的带有时间信息的文字信息;
敏感信息标注单元,用于在所述文字信息中标注敏感信息;
时间点获得单元,用于根据所述敏感信息对应的时间信息,得到所述敏感信息对应的起始时间点和终止时间点;
音频剪辑单元,用于根据所述敏感信息对应的起始时间点和终止时间点,对所述待剪辑的音频信息中的所述敏感信息对应的音频信息进行剪辑处理。
13.一种电子设备,其特征在于,包括:
处理器;以及
存储器,用于存储音频剪辑方法的程序,该设备通电并通过所述处理器运行该音频剪辑方法的程序后,执行下述步骤:
接收待剪辑的音频信息对应的带有时间信息的文字信息;
在所述文字信息中标注敏感信息;
根据所述敏感信息对应的时间信息,得到所述敏感信息对应的起始时间点和终止时间点;
根据所述敏感信息对应的起始时间点和终止时间点,对所述待剪辑的音频信息中的所述敏感信息对应的音频信息进行剪辑处理。
14.一种存储设备,其特征在于,
存储有音频剪辑方法的程序,该程序被处理器运行,执行下述步骤:
接收待剪辑的音频信息对应的带有时间信息的文字信息;
在所述文字信息中标注敏感信息;
根据所述敏感信息对应的时间信息,得到所述敏感信息对应的起始时间点和终止时间点;
根据所述敏感信息对应的起始时间点和终止时间点,对所述待剪辑的音频信息中的所述敏感信息对应的音频信息进行剪辑处理。
15.一种音频剪辑系统,其特征在于,包括:发布平台、剪辑平台、语音转写系统;
所述发布平台,用于向所述剪辑平台发送音频剪辑请求;所述音频剪辑请求包含待剪辑的音频信息;
所述剪辑平台,用于接收所述发布平台发送的音频剪辑请求;向所述语音转写系统发送针对待剪辑的音频信息的语音转写请求;接收语音转写系统返回的待剪辑的音频信息对应的带有时间信息的文字信息;以及在所述文字信息中标注敏感信息;并根据所述敏感信息对应的时间信息,得到所述敏感信息对应的起始时间点和终止时间点;根据所述敏感信息对应的起始时间点和终止时间点,对所述待剪辑的音频信息中的所述敏感信息对应的音频信息进行剪辑处理;
所述语音转写系统,用于接收剪辑平台发送的语音转写请求,向所述剪辑平台返回待剪辑的音频信息对应的带有时间信息的文字信息。
16.根据权利要求15所述的系统,其特征在于,
所述剪辑平台,还用于将所述带有时间信息的文字信息转化为带有细粒度时间信息的分词信息;
所述在所述文字信息中标注敏感信息,包括:在所述带有细粒度时间信息的分词信息中标注敏感分词信息;
所述根据所述敏感信息对应的时间信息,得到所述敏感信息对应的起始时间点和终止时间点,包括:根据所述敏感分词信息对应的细粒度时间信息,得到所述敏感分词信息对应的起始时间点和终止时间点;
所述根据所述敏感信息对应的起始时间点和终止时间点,对所述敏感信息对应的音频信息进行剪辑处理,包括:
根据所述敏感分词信息对应的起始时间点和终止时间点,对所述敏感分词信息对应的音频信息进行剪辑处理。
17.根据权利要求15所述的系统,其特征在于,所述系统还包括:敏感信息库;
所述剪辑平台,还用于向敏感信息库发送针对所述文字信息标注敏感信息的请求;以及接收敏感信息库返回的敏感信息标注的结果;
所述敏感信息库,用于接收所述剪辑平台发送的针对所述文字信息标注敏感信息的请求,并标注敏感信息,以及向所述剪辑平台发送敏感信息标注的结果。
18.根据权利要求15所述的系统,其特征在于,
所述剪辑平台,还用于向所述发布平台发送剪辑处理后的音频信息;
所述发布平台,还用于将接收的剪辑处理后的音频信息进行发布。
19.一种数据处理方法,其特征在于,包括:
获取第一多媒体信息;
获取与所述第一多媒体信息对应的带有时间属性的文本信息,其中,所述时间属性包括起始时间点和终止时间点;
获取所述文本信息中的满足预设条件的目标信息;
根据所述目标信息对所述第一多媒体信息进行处理,生成第二多媒体信息。
20.根据权利要求19所述的数据处理方法,其特征在于,所述第一多媒体信息包括音频信息或视频信息。
21.根据权利要求19所述的数据处理方法,其特征在于,根据所述目标信息对所述第一多媒体信息进行处理,生成第二多媒体信息包括:
根据所述目标信息的起始时间点和终止时间点,对所述第一多媒体信息中的所述目标信息对应的多媒体信息进行删除。
22.根据权利要求19所述的数据处理方法,其特征在于,根据所述目标信息对所述第一多媒体信息进行处理,生成第二多媒体信息包括:
根据所述目标信息的起始时间点和终止时间点,对所述第一多媒体信息中的所述目标信息对应的多媒体信息进行替换,替换为目标多媒体信息。
23.根据权利要求19所述的数据处理方法,其特征在于,根据所述目标信息对所述第一多媒体信息进行处理,生成第二多媒体信息包括:
根据所述目标信息的起始时间点和终止时间点,对所述第一多媒体信息中的所述目标信息对应的多媒体信息进行预设信号处理,使所述目标信息对应的多媒体信息丧失辨识度。
24.根据权利要求19所述的数据处理方法,其特征在于,所述获取所述文本信息中的满足预设条件的目标信息,包括:
获取所述文本信息中的不适合公开的目标信息;和/或,
获取所述文本信息中需要进行替换的目标信息。
25.根据权利要求24所述的数据处理方法,其特征在于,所述获取所述文本信息中的不适合公开的目标信息,包括:
通过将所述文本信息与目标信息库进行匹配的方式,获取所述文本信息中的不适合公开的目标信息。
CN201810968163.7A 2018-08-23 2018-08-23 音频剪辑方法、装置、设备和系统及数据处理方法 Pending CN110858492A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810968163.7A CN110858492A (zh) 2018-08-23 2018-08-23 音频剪辑方法、装置、设备和系统及数据处理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810968163.7A CN110858492A (zh) 2018-08-23 2018-08-23 音频剪辑方法、装置、设备和系统及数据处理方法

Publications (1)

Publication Number Publication Date
CN110858492A true CN110858492A (zh) 2020-03-03

Family

ID=69635343

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810968163.7A Pending CN110858492A (zh) 2018-08-23 2018-08-23 音频剪辑方法、装置、设备和系统及数据处理方法

Country Status (1)

Country Link
CN (1) CN110858492A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112287691A (zh) * 2020-11-10 2021-01-29 深圳市天彦通信股份有限公司 会议录音方法及相关设备

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101159834A (zh) * 2007-10-25 2008-04-09 中国科学院计算技术研究所 一种重复性视频音频节目片段的检测方法和系统
CN102341859A (zh) * 2009-03-05 2012-02-01 诺基亚公司 来自多个内容源的内容的同步
CN104753970A (zh) * 2013-12-25 2015-07-01 上海那里信息科技有限公司 基于音频文件上传的定时发布方法和系统
CN106101819A (zh) * 2016-06-21 2016-11-09 武汉斗鱼网络科技有限公司 一种基于语音识别的直播视频敏感内容过滤方法及装置
CN107220228A (zh) * 2017-06-13 2017-09-29 深圳市鹰硕技术有限公司 一种教学录播数据修正装置
CN207149252U (zh) * 2017-08-01 2018-03-27 安徽听见科技有限公司 语音处理系统
CN107967250A (zh) * 2016-10-19 2018-04-27 中兴通讯股份有限公司 一种信息处理方法及装置
CN108228658A (zh) * 2016-12-22 2018-06-29 阿里巴巴集团控股有限公司 一种自动生成配音文字的方法、装置以及电子设备

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101159834A (zh) * 2007-10-25 2008-04-09 中国科学院计算技术研究所 一种重复性视频音频节目片段的检测方法和系统
CN102341859A (zh) * 2009-03-05 2012-02-01 诺基亚公司 来自多个内容源的内容的同步
CN104753970A (zh) * 2013-12-25 2015-07-01 上海那里信息科技有限公司 基于音频文件上传的定时发布方法和系统
CN106101819A (zh) * 2016-06-21 2016-11-09 武汉斗鱼网络科技有限公司 一种基于语音识别的直播视频敏感内容过滤方法及装置
CN107967250A (zh) * 2016-10-19 2018-04-27 中兴通讯股份有限公司 一种信息处理方法及装置
CN108228658A (zh) * 2016-12-22 2018-06-29 阿里巴巴集团控股有限公司 一种自动生成配音文字的方法、装置以及电子设备
CN107220228A (zh) * 2017-06-13 2017-09-29 深圳市鹰硕技术有限公司 一种教学录播数据修正装置
CN207149252U (zh) * 2017-08-01 2018-03-27 安徽听见科技有限公司 语音处理系统

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112287691A (zh) * 2020-11-10 2021-01-29 深圳市天彦通信股份有限公司 会议录音方法及相关设备
CN112287691B (zh) * 2020-11-10 2024-02-13 深圳市天彦通信股份有限公司 会议录音方法及相关设备

Similar Documents

Publication Publication Date Title
US10095694B2 (en) Embedding content-based searchable indexes in multimedia files
US8548618B1 (en) Systems and methods for creating narration audio
US8150687B2 (en) Recognizing speech, and processing data
US8966360B2 (en) Transcript editor
US9666208B1 (en) Hybrid audio representations for editing audio content
WO2021083071A1 (zh) 语音转换、文件生成、播音、语音处理方法、设备及介质
CN109754783B (zh) 用于确定音频语句的边界的方法和装置
US20180174587A1 (en) Audio transcription system
US20130007043A1 (en) Voice description of time-based media for indexing and searching
US8620670B2 (en) Automatic realtime speech impairment correction
US20190155843A1 (en) A secure searchable media object
CN104994404A (zh) 一种为视频获取关键词的方法及装置
CN109213977A (zh) 庭审笔录的生成系统
CN110312161B (zh) 一种视频配音方法、装置及终端设备
CN110858492A (zh) 音频剪辑方法、装置、设备和系统及数据处理方法
CN113593519A (zh) 文本的语音合成方法、系统、装置、设备及存储介质
US9524752B2 (en) Method and system for automatic B-roll video production
KR101783872B1 (ko) 동영상 검색 시스템 및 방법
CN104538048B (zh) 一种音频文件的处理方法及装置
CN114999464A (zh) 语音数据处理方法及装置
TW201409259A (zh) 多媒體記錄系統及方法
JP4631251B2 (ja) メディア検索装置およびメディア検索プログラム
JP6342792B2 (ja) 音声認識方法、音声認識装置及び音声認識プログラム
CN109933576B (zh) 音效sdk库建立方法及装置、电子设备和计算机可读介质
US20230410848A1 (en) Method and apparatus of generating audio and video materials

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20200303

RJ01 Rejection of invention patent application after publication