CN107134285A

CN107134285A - 音频数据播放方法、音频数据播放装置和终端

Info

Publication number: CN107134285A
Application number: CN201710159110.6A
Authority: CN
Inventors: 樊灵丹
Original assignee: Yulong Computer Telecommunication Scientific Shenzhen Co Ltd
Current assignee: Yulong Computer Telecommunication Scientific Shenzhen Co Ltd
Priority date: 2017-03-17
Filing date: 2017-03-17
Publication date: 2017-09-05

Abstract

本发明提出了一种音频数据播放方法、音频数据播放装置和终端，其中，所述音频数据播放方法包括：对音频数据进行识别，以识别出所述音频数据中的由同一用户产生的音频片段；当识别结果为所述音频数据包括多个用户产生的音频片段时，接收用户触发的播放音频片段的指令；播放所述多个用户中的目标用户的音频片段。通过本发明的技术方案，可以使用户更加方便地获取到音频数据中的目标用户的音频片段，从而节约大量时间，提高效率。

Description

音频数据播放方法、音频数据播放装置和终端

技术领域

本发明涉及终端技术领域，具体而言，涉及音频数据播放方法、音频数据播放装置和终端。

背景技术

目前，在播放记录了多个用户产生的音频数据时，如果用户想要播放某个用户产生的音频片段，需要将该音频数据从头到尾播放一遍，以找出该用户产生的音频片段。例如，在一音频数据中记录了A、B、C三名用户开会时的讲话内容，若用户想要获取B用户开会时的讲话内容，则通过将整个的音频数据播放一遍才能获取B用户讲话的所有内容，这样就比较麻烦。特别是音频数据的时长比较长时，用户需要耗费大量的时间来获取到想要的音频片段。

因此，如何使用户更加方便地获取音频数据中的目标用户的音频片段成为亟待解决的技术问题。

发明内容

本发明正是基于上述问题，提出了一种新的技术方案，解决了用户不方便在音频数据中获取目标用户的音频片段的技术问题。

有鉴于此，本发明的第一方面提出了一种音频数据播放方法，包括：对音频数据进行识别，以识别出所述音频数据中的由同一用户产生的音频片段；当识别结果为所述音频数据包括多个用户产生的音频片段时，接收用户触发的播放音频片段的指令；播放所述多个用户中的目标用户的音频片段。

在该技术方案中，通过识别出音频数据中的由同一用户产生的音频片段，以直接播放目标用户的音频片段，避免了将整个音频数据从头到尾播放一遍才能找出目标用户的音频片段，从而满足了用户对播放某个目标用户的音频片段的需求，进而提升了用户的使用体验。

在上述技术方案中，优选地，所述音频数据播放方法用于终端，所述对音频数据进行识别，以识别出所述音频数据中的由同一用户产生的音频片段，具体包括：在记录所述音频数据时，确定所述音频数据中音频片段的发声源方向和/或发声源与所述终端之间的距离；根据所述发声源方向和/或所述距离，识别出所述音频数据中的由同一用户产生的音频片段。

在该技术方案中，可以根据音频数据中的音频片段的发声源方向(即用户所在的方向)来识别出音频数据中由同一用户产生的音频片段，还可以根据音频数据中音频片段的发声源与记录该音频片段的终端之间的距离来识别出音频数据中由同一用户产生的音频片段，从而满足了用户对播放某个目标用户的音频片段的需求。特别是在开会时，参与会议的用户一般坐在会议桌的四周，在记录音频数据时，记录用户的音频片段的终端与每个用户的距离和方向是不同的。

在上述任一技术方案中，优选地，所述对音频数据进行识别，以识别出所述音频数据中的由同一用户产生的音频片段，具体包括：在记录或播放所述音频数据时，获取记录或播放的所述音频数据的声音参数；根据所述声音参数，识别出所述音频数据中的由同一用户产生的音频片段。

在该技术方案中，由于不同用户发出声音时的声音参数是不同的，因此，可以通过获取播放音频数据时的声音参数，以识别出音频数据中的由同一用户产生的音频片段，从而满足了用户对播放某个目标用户的音频片段的需求。

在上述任一技术方案中，优选地，在所述目标用户的音频片段的数量有多个的情况下，所述播放所述多个用户中的目标用户的音频片段，具体包括：获取所述目标用户的多个音频片段的播放顺序；按照所述播放顺序，依次播放所述目标用户的多个音频片段。

在该技术方案中，按照目标用户的多个音频片段的播放顺序，依次播放目标用户的多个音频片段，从而方便用户收听目标用户的多个音频片段。

在上述任一技术方案中，优选地，在所述目标用户的音频片段的数量有多个的情况下，还包括：若当前播放的音频片段为所述目标用户的第一音频片段，则在接收到切换指令时，将当前播放的音频片段切换到所述目标用户的第二音频片段。

在该技术方案中，在播放目标用户的多个音频片段时，可以根据用户的需求，在目标用户的多个音频片段中进行切换播放，从而满足了用户播放目标用户的某个音频片段的需求。例如，在播放目标用户的第一音频片段时，播放的第一音频片段并不是用户想要的，可以切换到用户想要播放的第二音频片段。

本发明的第二方面提出了一种音频数据播放装置，包括：识别单元，用于对音频数据进行识别，以识别出所述音频数据中的由同一用户产生的音频片段；接收单元，用于当所述识别单元的识别结果为所述音频数据包括多个用户产生的音频片段时，接收用户触发的播放音频片段的指令；播放单元，用于播放所述多个用户中的目标用户的音频片段。

在上述任一技术方案中，优选地，所述音频数据播放装置用于终端，所述识别单元包括：确定子单元，用于在记录所述音频数据时，确定所述音频数据中音频片段的发声源方向和/或发声源与所述终端之间的距离；第一识别子单元，用于根据所述发声源方向和/或所述距离，识别出所述音频数据中的由同一用户产生的音频片段。

在上述任一技术方案中，优选地，所述识别单元包括：第一获取子单元，用于在记录或播放所述音频数据时，获取记录或播放的所述音频数据的声音参数；第二识别子单元，用于根据所述声音参数，识别出所述音频数据中的由同一用户产生的音频片段。

在上述任一技术方案中，优选地，在所述目标用户的音频片段的数量有多个的情况下，所述播放单元包括：第二获取子单元，用于获取所述目标用户的多个音频片段的播放顺序；播放子单元，用于按照所述播放顺序，依次播放所述目标用户的多个音频片段。

在上述任一技术方案中，优选地，在所述目标用户的音频片段的数量有多个的情况下，还包括：切换单元，用于若当前播放的音频片段为所述目标用户的第一音频片段，则在接收到切换指令时，将当前播放的音频片段切换到所述目标用户的第二音频片段。

本发明的第三方面提出了一种终端，包括上述技术方案中任一项所述的音频数据播放装置，因此，该终端具有和上述技术方案中任一项所述的音频数据播放装置相同的技术效果，在此不再赘述。

通过本发明的技术方案，可以使用户更加方便地获取到音频数据中的目标用户的音频片段。

附图说明

图1示出了根据本发明的一个实施例的音频数据播放方法的流程示意图；

图2A和图2B示出了根据本发明的一个实施例的音频片段识别结果的示意图；

图3示出了根据本发明的一个实施例的终端界面的示意图；

图4示出了根据本发明的另一个实施例的音频数据播放方法的流程示意图；

图5示出了根据本发明的一个实施例的音频数据播放装置的结构示意图；

图6示出了根据本发明的一个实施例的终端的结构示意图；

图7示出了根据本发明的另一个实施例的终端的结构示意图。

具体实施方式

为了可以更清楚地理解本发明的上述目的、特征和优点，下面结合附图和具体实施方式对本发明进行进一步的详细描述。需要说明的是，在不冲突的情况下，本申请的实施例及实施例中的特征可以相互组合。

在下面的描述中阐述了很多具体细节以便于充分理解本发明，但是，本发明还可以采用其他不同于在此描述的其他方式来实施，因此，本发明的保护范围并不受下面公开的具体实施例的限制。

图1示出了根据本发明的一个实施例的音频数据播放方法的流程示意图。

如图1所示，根据本发明的一个实施例的音频数据播放方法，包括：

步骤102，对音频数据进行识别，以识别出音频数据中的由同一用户产生的音频片段。

如图2A和图2B所示，对一个20分钟的音频数据进行识别，以识别出音频数据中的由同一用户产生的音频片段。即0-2分钟的音频片段、5-7分钟的音频片段和16-20分钟的音频片段为用户A产生的音频片段，2-5分钟的音频片段和13-15分钟的音频片段为用户B产生的音频片段，7-10分钟的音频片段为用户C产生的音频片段，10-13分钟的音频片段为用户D产生的音频片段，15-16分钟的音频片段为用户E产生的音频片段。

步骤104，当识别结果为音频数据包括多个用户产生的音频片段时，接收用户触发的播放音频片段的指令。

步骤106，播放多个用户中的目标用户的音频片段。

如图3所示，在终端界面上显示一个20分钟的音频数据，该20分钟的音频数据由用户A、用户B、用户C、用户D和用户E产生的音频片段组成。当接收到选择A用户的指令时，仅播放用户A的语音片段，当接收到选择C用户的指令时，仅播放用户C的语音片段。

在上述技术方案中，优选地，音频数据播放方法用于终端，步骤102具体包括：在记录音频数据时，确定音频数据中音频片段的发声源方向和/或发声源与终端之间的距离；根据发声源方向和/或距离，识别出音频数据中的由同一用户产生的音频片段。

例如，在一段30分钟的音频数据中，前10分钟的音频片段的发声源位于左侧30°，10分钟到15分钟的音频片段的发声源位于右侧30°，15分钟到25分钟的音频片段的发声源位于左侧30°，25分钟到30分钟的音频片段的发声源位于右侧60°，因此，可以识别出发声源位于左侧30°方向的音频片段(即前10分钟的音频片段和15分钟到25分钟的音频片段)为A用户的音频片段，发声源位于右侧30°方向的音频片段(即10分钟到15分钟的音频片段)为B用户的音频片段，发声源位于右侧60°方向的音频片段(即25分钟到30分钟的音频片段)为C用户的音频片段，从而可以直接播放A用户、B用户和C用户中的任一用户的音频片段。

再例如，在一段30分钟的音频数据中，前10分钟的音频片段的发声源与记录该音频数据的终端之间的距离为0.5米，10分钟到15分钟的音频片段的发声源与记录整个音频数据的终端之间的距离为0.8米，15分钟到25分钟的音频片段的发声源与记录整个音频数据的终端之间的距离为0.5米，25分钟到30分钟的音频片段的发声源与记录整个音频数据的终端之间的距离为1.1米。基于上述的识别结果，可以识别出距离记录整个音频数据的终端的距离为0.5米的发声源产生的音频片段(即前10分钟的音频片段和15分钟到25分钟的音频片段)为A用户的音频片段，距离记录整个音频数据的终端的距离为0.8米的发声源产生的音频片段(即10分钟到15分钟的音频片段)为B用户的音频片段，距离记录整个音频数据的终端的距离为1.1米的发声源产生的音频片段(即25分钟到30分钟的音频片段)为B用户的音频片段，从而可以直接播放A用户、B用户和C用户中的任一用户的音频片段。

当然，也可以结合音频数据中音频片段的发声源方向和发声源与终端之间的距离，来识别出音频数据中各个用户产生的音频片段。

以上方案适用于在记录音频数据的过程中，识别音频数据中的同一用户产生的音频片段。

例如，在会议结束后保存记录的音频数据，如需要仅试听某个重要人物的讲话内容，可单击试听并找出该重要人物的讲话进行播放，从而节约大量时间，提高效率。本提案也可用于下述情况，即因未出席会议而错过领导的重要讲话，后续想快速了解领导在该会议上提到的重点内容时，可通过本方案快速播放领导的重要讲话。

在上述任一技术方案中，优选地，步骤102具体包括：在记录或播放所述音频数据时，获取记录或播放的所述音频数据的声音参数；根据声音参数，识别出音频数据中的由同一用户产生的音频片段。

例如，在一段30分钟的音频数据中，前10分钟的音频片段的声音参数与之后的15分钟至25分钟的音频片段的声音参数一致，说明前10分钟的音频片段和15分钟至25分钟的音频片段是由同一个用户产生的。另外，10分钟至15分钟的音频片段的声音参数与25分钟至30分钟的音频片段的声音参数一致，说明10分钟至15分钟的音频片段和25分钟至30分钟的音频片段是由同一个用户产生的。其中，声音参数包括以下之一或多种的组合：音调、响度和音色。

以上方案不仅适用于在记录音频数据的过程中，识别音频数据中的同一用户产生的音频片段，其中，该音频数据包括但不限于：开会时的音频数据和访谈时的音频数据。以上方案还适用于在播放音频数据的过程中，识别音频数据中的同一用户产生的音频片段，其中，该音频数据包括但不限于：开会时的音频数据、访谈时的音频数据、学习课程的音频数据、在网站上下载的音频数据。

在上述任一技术方案中，优选地，在目标用户的音频片段的数量有多个的情况下，播放多个用户中的目标用户的音频片段，具体包括：获取目标用户的多个音频片段的播放顺序；按照播放顺序，依次播放目标用户的多个音频片段。

在上述任一技术方案中，优选地，在目标用户的音频片段的数量有多个的情况下，还包括：若当前播放的音频片段为目标用户的第一音频片段，则在接收到切换指令时，将当前播放的音频片段切换到目标用户的第二音频片段。

图4示出了根据本发明的另一个实施例的音频数据播放方法的流程示意图。

如图4所示，根据本发明的另一个实施例的音频数据播放方法，包括：

步骤402，在接收到开始录音的指令时，记录语音数据。

步骤404，在记录语音数据的同时，对语音数据进行识别，以识别出语音数据中的由同一用户产生的语音片段。

步骤406，在接收到结束录音的指令时，根据该指令存储记录的语音数据。

步骤408，当识别结果为音频数据包括多个用户产生的音频片段时，接收用户触发的播放音频片段的指令。

步骤410，播放多个用户中的目标用户的音频片段。

图5示出了根据本发明的一个实施例的音频数据播放装置的结构示意图。

如图5所示，根据本发明的一个实施例的音频数据播放装置500，包括：识别单元502、接收单元504和播放单元506。

识别单元502，用于对音频数据进行识别，以识别出音频数据中的由同一用户产生的音频片段；接收单元504，用于当识别单元502的识别结果为音频数据包括多个用户产生的音频片段时，接收用户触发的播放音频片段的指令；播放单元506，用于播放多个用户中的目标用户的音频片段。

在上述任一技术方案中，优选地，音频数据播放装置500用于终端，识别单元502包括：确定子单元5022，用于在记录音频数据时，确定音频数据中音频片段的发声源方向和/或发声源与终端之间的距离；第一识别子单元5024，用于根据发声源方向和/或距离，识别出音频数据中的由同一用户产生的音频片段。

在上述任一技术方案中，优选地，识别单元502包括：第一获取子单元5026，用于在记录或播放所述音频数据时，获取记录或播放的所述音频数据的声音参数；第二识别子单元5028，用于根据声音参数，识别出音频数据中的由同一用户产生的音频片段。

在上述任一技术方案中，优选地，在目标用户的音频片段的数量有多个的情况下，播放单元506包括：第二获取子单元5062，用于获取目标用户的多个音频片段的播放顺序；播放子单元5064，用于按照播放顺序，依次播放目标用户的多个音频片段。

在上述任一技术方案中，优选地，在目标用户的音频片段的数量有多个的情况下，还包括：切换单元508，用于若当前播放的音频片段为目标用户的第一音频片段，则在接收到切换指令时，将当前播放的音频片段切换到目标用户的第二音频片段。

图6示出了根据本发明的一个实施例的终端的结构示意图。

如图6所示，根据本发明的一个实施例的终端600，包括上述技术方案中任一项的音频数据播放装置500，因此，该终端600具有和上述技术方案中任一项的音频数据播放装置500相同的技术效果，在此不再赘述。

其中，终端600包括但不限于：手机、电脑和录音笔。

如图7所示，根据本发明的另一个实施例的终端700，包括处理器702、存储器704和通信总线706。

处理器702可以是通用处理器，例如中央处理器(Central Processing Unit，CPU)，还可以是数字信号处理器(Digital Signal Processor，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)，或者是被配置成实施本发明实施例的一个或多个集成电路。存储器704，用于存储程序代码，并将该程序代码传输给处理器702。存储器704可以包括易失性存储器(Volatile Memory)，例如随机存取存储器(RandomAccess Memory，RAM)；存储器704也可以包括非易失性存储器(Non-Volatile Memory)，例如只读存储器(Read-Only Memory，ROM)、快闪存储器(Flash Memory)、硬盘(Hard DiskDrive，HDD)或固态硬盘(Solid-State Drive，SSD)；存储器704还可以包括上述种类的存储器704的组合。通信总线706用于实现处理器702和存储器704之间的连接通信。通信总线706可以是工业标准体系结构(Industry Standard Architecture，ISA)总线、外部设备互连(Peripheral Component Interconnect，PCI)总线或扩展标准体系结构(ExtendedIndustry Standard Architecture，EISA)总线等。该通信总线706可以分为地址总线、数据总线、控制总线等。

其中，处理器702用于调用存储器704存储的程序代码，执行如下操作：

对音频数据进行识别，以识别出音频数据中的由同一用户产生的音频片段；当识别结果为音频数据包括多个用户产生的音频片段时，接收用户触发的播放音频片段的指令；播放多个用户中的目标用户的音频片段。

优选地，处理器702具体用于，在记录音频数据时，确定音频数据中音频片段的发声源方向和/或发声源与终端700之间的距离；根据发声源方向和/或距离，识别出音频数据中的由同一用户产生的音频片段。

优选地，处理器702具体用于，在记录或播放音频数据时，获取记录或播放的音频数据的声音参数；根据声音参数，识别出音频数据中的由同一用户产生的音频片段。

优选地，处理器702具体用于，获取目标用户的多个音频片段的播放顺序；按照播放顺序，依次播放目标用户的多个音频片段。

优选地，在目标用户的音频片段的数量有多个的情况下，处理器702还用于，还包括：若当前播放的音频片段为目标用户的第一音频片段，则在接收到切换指令时，将当前播放的音频片段切换到目标用户的第二音频片段。

以上结合附图详细说明了本发明的技术方案，通过本发明的技术方案，可以使用户更加方便地获取到音频数据中的目标用户的音频片段，从而节约大量时间，提高效率。

在本发明中，术语“第一”、“第二”仅用于描述的目的，而不能理解为指示或暗示相对重要性；术语“多个”表示两个或两个以上。对于本领域的普通技术人员而言，可以根据具体情况理解上述术语在本发明中的具体含义。

以上所述仅为本发明的优选实施例而已，并不用于限制本发明，对于本领域的技术人员来说，本发明可以有各种更改和变化。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种音频数据播放方法，其特征在于，包括：

对音频数据进行识别，以识别出所述音频数据中的由同一用户产生的音频片段；

当识别结果为所述音频数据包括多个用户产生的音频片段时，接收用户触发的播放音频片段的指令；

播放所述多个用户中的目标用户的音频片段。

2.根据权利要求1所述的音频数据播放方法，其特征在于，所述音频数据播放方法用于终端，所述对音频数据进行识别，以识别出所述音频数据中的由同一用户产生的音频片段，具体包括：

在记录所述音频数据时，确定所述音频数据中音频片段的发声源方向和/或发声源与所述终端之间的距离；

根据所述发声源方向和/或所述距离，识别出所述音频数据中的由同一用户产生的音频片段。

3.根据权利要求1所述的音频数据播放方法，其特征在于，所述对音频数据进行识别，以识别出所述音频数据中的由同一用户产生的音频片段，具体包括：

在记录或播放所述音频数据时，获取记录或播放的所述音频数据的声音参数；

根据所述声音参数，识别出所述音频数据中的由同一用户产生的音频片段。

4.根据权利要求1至3中任一项所述的音频数据播放方法，其特征在于，在所述目标用户的音频片段的数量有多个的情况下，所述播放所述多个用户中的目标用户的音频片段，具体包括：

获取所述目标用户的多个音频片段的播放顺序；

按照所述播放顺序，依次播放所述目标用户的多个音频片段。

5.根据权利要求1至3中任一项所述的音频数据播放方法，其特征在于，在所述目标用户的音频片段的数量有多个的情况下，还包括：

若当前播放的音频片段为所述目标用户的第一音频片段，则在接收到切换指令时，将当前播放的音频片段切换到所述目标用户的第二音频片段。

6.一种音频数据播放装置，其特征在于，包括：

识别单元，用于对音频数据进行识别，以识别出所述音频数据中的由同一用户产生的音频片段；

接收单元，用于当所述识别单元的识别结果为所述音频数据包括多个用户产生的音频片段时，接收用户触发的播放音频片段的指令；

播放单元，用于播放所述多个用户中的目标用户的音频片段。

7.根据权利要求6所述的音频数据播放装置，其特征在于，所述音频数据播放装置用于终端，所述识别单元包括：

确定子单元，用于在记录所述音频数据时，确定所述音频数据中音频片段的发声源方向和/或发声源与所述终端之间的距离；

第一识别子单元，用于根据所述发声源方向和/或所述距离，识别出所述音频数据中的由同一用户产生的音频片段。

8.根据权利要求6所述的音频数据播放装置，其特征在于，所述识别单元包括：

第一获取子单元，用于在记录或播放所述音频数据时，获取记录或播放的所述音频数据的声音参数；

第二识别子单元，用于根据所述声音参数，识别出所述音频数据中的由同一用户产生的音频片段。

9.根据权利要求6至8中任一项所述的音频数据播放装置，其特征在于，在所述目标用户的音频片段的数量有多个的情况下，所述播放单元包括：

第二获取子单元，用于获取所述目标用户的多个音频片段的播放顺序；

播放子单元，用于按照所述播放顺序，依次播放所述目标用户的多个音频片段。

10.根据权利要求6至8中任一项所述的音频数据播放装置，其特征在于，在所述目标用户的音频片段的数量有多个的情况下，还包括：

切换单元，用于若当前播放的音频片段为所述目标用户的第一音频片段，则在接收到切换指令时，将当前播放的音频片段切换到所述目标用户的第二音频片段。

11.一种终端，其特征在于，包括：如权利要求6至10中任一项所述的音频数据播放装置。