CN104517068A

CN104517068A - 一种处理录音文件方法和装置

Info

Publication number: CN104517068A
Application number: CN201410855439.2A
Authority: CN
Inventors: 刘威威
Original assignee: Huawei Technologies Co Ltd
Current assignee: Huawei Technologies Co Ltd
Priority date: 2014-12-31
Filing date: 2014-12-31
Publication date: 2015-04-15

Abstract

本发明实施例公开了一种录音文件处理方法和设备。该方法包括：录音处理设备从录音设备获取录音源文件，从所述录音源文件中识别出含有涉及用户数据安全的敏感信息的第一录音片段，对所述含有所述敏感信息的第一录音片段进行加密，对录音源文件中非敏感信息所在的第二录音片段不做加密处理，将加密后的第一录音片段和所述不做加密处理的第二录音片段合并为录音目标文件，通过从录音源文件中识别出含有涉及用户数据安全的敏感信息的录音片段，并仅对涉及用户数据安全的该录音片段进行加密，在提高效率的同时提高了录音数据的安全性。

Description

一种处理录音文件方法和装置

技术领域

本发明涉及通信技术领域，特别涉及一种处理录音文件方法和装置。

背景技术

在通信日益发达的今天，外包呼叫中心的应用越来越普遍，电话成为产品服务和产品销售的主要渠道之一。为保障客户权益，避免纠纷，呼叫中心的通话需要被录音。特别对于金融行业电销系统来说，录音是保监会、银监会监管的重要手段，是金融保险公司是否合规的重要证据，因此对录音文档的存放年限有很高要求，录音数据量巨大。一个中等规格的呼叫中心，通常有3000左右坐席人员。在这些通话录音文件中存在用户大量敏感信息。如用户姓名、银行卡号、用户身份信息、密码保护信息等，可用做用户身份识别，办理各类业务等。因此需要如何在保证传输和播放效率的同时，保证录音数据的安全性就是面临的难题。

现有的技术是对录音文件进行全文加密。由于对如此大的录音文件进行全文加密是相当耗费计算机的技术资源的，耗时也非常长。要么是对录音文件没有进行加密，仅仅做了格式变换，用户的隐私、关键信息的安全得不到保障。

发明内容

本发明实施例提供一种处理录音文件方法和装置以提高录音数据的安全性。

第一方面，一种录音文件处理方法，包括录音处理设备从录音设备获取录音源文件；从所述录音源文件中识别出含有涉及用户数据安全的敏感信息的第一录音片段；对所述含有所述敏感信息的第一录音片段进行加密，对录音源文件中非敏感信息所在的第二录音片段不做加密处理；将加密后的第一录音片段和所述不做加密处理的第二录音片段合并为录音目标文件。

在第一方面的第一种可能的实现方式中，所述将加密后的第一录音片段和所述不做加密处理的第二录音片段合并为录音目标文件具体包括将加密后的第一录音片段和所述不做加密处理的第二录音片段进行散列组合后合并为录音目标文件。

结合第一方面的第一种可能的实现方式，在第二种可能的实现方式中，在所述录音目标文件的文件头上记录所述第一录音片段和所述第二录音片段的片段顺序。

结合第一方面的第一种可能的实现方式，在第三种可能的实现方式中，进一步包括设置关键字特征库，所述关键字特征库中包括关键字，所述从所述录音源文件中识别出含有涉及用户数据安全的敏感信息的第一录音片段包括：将所述录音源文件中的内容与所述关键字特征库中的关键字进行特征匹配，并根据匹配结果识别出含有所述涉及用户数据安全的敏感信息的第一录音片段。

结合第一方面的第三种可能的实现方式，在第四种可能的实现方式中进一步包括对所述录音源文件进行语音文本转化获得所述录音源文件的文本文件，所述将所述录音源文件中的内容与键字特征库中的关键字进行特征匹配包括将所述录音源文件的文本文件中的内容与键字特征库中的关键字进行特征匹配。

结合第一方面的第三种或者第四种可能的实现方式，第五种可能的实现方式中，所述关键字特征库包括提示音关键字；与所述录音源文件中的内容进行特征匹配的关键字为所述提示音关键字；所述根据匹配结果识别出含有所述涉及用户数据安全的敏感信息的第一录音片段包括：将所述录音源文件中与所述提示音关键字相匹配的部分之外的其它部分确定为含有所述涉及用户数据安全的敏感信息的第一录音片段。

结合第一方面的第五种可能的实现方式，第六种可能的实现方式中，进一步包括基于预设的时间段信息将所述录音源文件中与所述提示音关键字相匹配的部分之外的其他部分确定为含有所述涉及用户数据安全的敏感信息的第一录音片段。

结合第一方面的第三种或者第四种可能的实现方式，第七种可能的实现方式中，所述关键字特征库包括内容关键字；与所述录音源文件中的内容进行特征匹配的关键字为所述内容关键字；所述根据匹配结果识别出含有涉及用户数据安全的敏感信息的第一录音片段包括：将所述录音源文件中与所述内容关键字相匹配的部分确定为含有所述涉及用户数据安全的敏感信息的第一录音片段。

第二方面，录音处理设备，包括：获取模块，用于从录音设备获取录音源文件；识别模块，用于从所述录音源文件中识别出含有涉及用户数据安全的敏感信息的第一录音片段；加密模块，用于对所述含有所述敏感信息的第一录音片段进行加密，对录音源文件中非敏感信息所在的第二录音片段不做加密处理；文件形成模块，用于将加密后的第一录音片段和所述不做加密处理的第二录音片段合并为录音目标文件。

结合第二方面的第一种可能的实现方式中，所述文件形成模块用于将加密后的第一录音片段和所述不做加密处理的第二录音片段进行散列组合后合并为录音目标文件。

结合第二方面的第一种可能的实现方式，第二种可能的实现方式中，文件形成模块用于在所述录音目标文件的文件头上记录所述第一录音片段和所述第二录音片段的片段顺序。

结合第二方面的第二种可能的实现方式中，第三种可能的实现方式中，所述的录音处理设备进一步包括设置模块，用于设置关键字特征库，所述关键字特征库中包括关键字；所述识别模块具体用于根据所述录音源文件中的内容与所述键字特征库中的关键字进行特征匹配，并根据匹配结果识别出含有所述涉及用户数据安全的敏感信息的第一录音片段。

结合第二方面的第三种可能的实现方式中，第四种可能的实现方式中，所述的录音处理设备进一步包括转换模块，用于对所述录音源文件进行语音文本转化获得所述录音源文件的文本文件；所述识别模块具体用于将所述录音源文件的文本文件中的内容与关键字特征库中的关键字进行特征匹配，并根据匹配结果识别出含有所述涉及用户数据安全的敏感信息的第一录音片段。

结合第二方面的第三种可能的实现方式中，第五种可能的实现方式中，所述关键字特征库包括提示音关键字；所述识别模块具体用于将所述录音源文件的文本文件中的内容与所述提示音关键字进行特征匹配，将所述录音源文件中与所述提示音关键字相匹配的部分之外的其他部分确定为含有所述涉及用户数据安全的敏感信息的第一录音片段。

结合第二方面的第五种可能的实现方式中，第六种可能的实现方式中，所述识别模块具体用于基于预设的时间段信息将所述录音源文件中与所述提示音关键字相匹配的部分之外的其他部分确定为含有所述涉及用户数据安全的敏感信息的第一录音片段。

结合第二方面的第三种可能的实现方式中，第七种可能的实现方式中，所述关键字特征库包括内容关键字；所述识别模块具体用于将所述录音源文件的文本文件中的内容与所述内容关键字进行特征匹配，将所述录音源文件中与所述内容关键字相匹配的部分确定为含有所述涉及用户数据安全的敏感信息的第一录音片段。

第三方面，一种录音处理设备，包括：接收器用于从录音设备获取录音源文件；与所述接收器相连接的处理器，用于从所述录音源文件中识别出含有涉及用户数据安全的敏感信息的第一录音片段；对所述含有所述敏感信息的第一录音片段进行加密，对录音源文件中非敏感信息所在的第二录音片段不做加密处理；将加密后的第一录音片段和所述不做加密处理的第二录音片段合并为录音目标文件。

结合第二方面的第一种可能的实现方式中，所述处理器具体用于将加密后的第一录音片段和所述不做加密处理的第二录音片段进行散列组合后合并为录音目标文件。

结合第三方面的第一种可能的实现方式，第二种可能的实现方式中，所述处理器进一步用于在所述录音目标文件的文件头上记录所述第一录音片段和所述第二录音片段的片段顺序。

结合第三方面的第一种可能的实现方式中，第三种可能的实现方式中，所述所述处理器进一步设置关键字特征库，所述关键字特征库中包括关键字；所述从所述录音源文件中识别出含有涉及用户数据安全的敏感信息的第一录音片段具体包括具体包括根据所述录音源文件中的内容与所述键字特征库中的关键字进行特征匹配，并根据匹配结果识别出含有所述涉及用户数据安全的敏感信息的第一录音片段。

结合第三方面的第三种可能的实现方式中，第四种可能的实现方式中，所述的处理器进一步用于对所述录音源文件进行语音文本转化获得所述录音源文件的文本文件；所述将所述录音源文件中的内容与键字特征库中的关键字进行特征匹配包括将所述录音源文件的文本文件中的内容与关键字特征库中的关键字进行特征匹配，并根据匹配结果识别出含有所述涉及用户数据安全的敏感信息的第一录音片段。

结合第三方面的第三种可能的实现方式中，第五种可能的实现方式中，所述关键字特征库包括提示音关键字；与所述录音源文件中的内容进行特征匹配的关键字为所述提示音关键字；所述根据匹配结果识别出含有所述涉及用户数据安全的敏感信息的第一录音片段包括将所述录音源文件中与所述提示音关键字相匹配的部分之外的其他部分确定为含有所述涉及用户数据安全的敏感信息的第一录音片段。

结合第三方面的第五种可能的实现方式中，第六种可能的实现方式中，进一步包括基于预设的时间段信息将所述录音源文件中与所述提示音关键字相匹配的部分之外的其他部分确定为含有所述涉及用户数据安全的敏感信息的第一录音片段。

结合第三方面的第三种可能的实现方式中，第七种可能的实现方式中，所述关键字特征库包括内容关键字；与所述录音源文件中的内容进行特征匹配的关键字为所述内容关键字；所述根据匹配结果识别出含有涉及用户数据安全的敏感信息的第一录音片段包括将所述录音源文件中与所述内容关键字相匹配的部分确定为含有所述涉及用户数据安全的敏感信息的第一录音片段。

在上述实施例中，通过从录音源文件中识别出含有涉及用户数据安全的敏感信息的录音片段，并仅对涉及用户数据安全的该录音片段进行加密，在提高效率的同时提高了录音数据的安全性。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明实施例提供的一种录音处理系统的系统架构图；

图2是本发明实施例提供的一种录音处理的结构示意图；

图3是本发明另一实施例提供的一种录音处理的结构示意图；

图4是本发明实施例提供的一种录音处理方法的方法流程图；

图5是本发明另一实施例提供的一种录音处理方法的方法流程图；

图6是本发明另一实施例提供的一种录音处理方法的方法流程图；

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

图1为本发明实施例提供的一种录音处理系统100的架构图。如图1所示，该系统包括录音文件存储设备101，录音处理设备102以及关键字特征库103。其中，录音文件存储设备101存储有录音源文件1011以及录音目标文件1022。录音处理设备102包括接收/发射器1021，处理器1022以及存储器1023。

其中，所述接收/发射器1021用于接收来自于录音文件存储设备101的录音源文件1011，以及将处理器1022处理后形成的录音目标文件1022发送至录音文件存储设备101进行保存。

所述处理器1022可以采用通用的中央处理器(Central Processing Unit，CPU)，微处理器，应用专用集成电路(Application Specific Integrated Circuit，ASIC)，或者一个或多个集成电路，或者现场可编逻辑门阵列(FieldProgrammable Gate Array,FPGA)用于执行相关程序，以执行本发明各实施例中所描述的识别模块、加密模块，文件形成模块，设置模块以及转换模块所具有的功能。

存储器1023可以是只读存储器(Read Only Memory，ROM)，静态存储设备，动态存储设备或者随机存取存储器(Random Access Memory，RAM)等各种类型的存储器。存储器1023可以存储操作系统和/或其他应用程序的指令以及应用数据，所述指令包括用于实现本发明各实施例中的识别模块、加密模块，文件形成模块，设置模块以及转换模块的功能的指令。

存储器1022中存储的指令由处理器1023来运行执行。

在本发明实施例中，处理器1022通过运行存储器1022中的指令实现以下功能：处理器1022用于从所述录音源文件中识别出含有涉及用户数据安全的敏感信息的第一录音片段，对所述含有所述敏感信息的第一录音片段进行加密，对录音源文件中非敏感信息所在的第二录音片段不做加密处理，将加密后的第一录音片段和所述不做加密处理的第二录音片段合并为录音目标文件。

处理器1022的上述功能的具体实现可参考下面的方法实施例部分，这里不再赘述。

关键字特征库103用于存储关键字，所述关键字用于与录音源文件中的内容进行特征匹配，从而识别出含有涉及用户数据安全的敏感信息的录音片段。具体实施例中，所述的关键字可以包括提示音关键字和/或内容关键字。不同类型的关键字匹配的方式不同，参见以下表一为提示音关键字，表二为内容关键字，具体匹配方式可以参考以下方法实施例中具体的描述，此处不赘述。

关键字特征库103中的关键字可以由呼叫中心系统预先设置，例如，呼叫中心根据各类业务场景等因素提取提示音关键字以及内容关键字。也可以由录音处理设备102进行预先设置，例如，录音处理设备102也可以根据各类业务场景等因素或历史录音文件记录等因素提取提示音关键字以及内容关键字。关键字特征库103中的关键字还可以被动态更新，根据新的业务增加新的关键字或者修改已经过时的关键字，例如根据历史业务记录和业务场景变更等情况进行动态更新。

需要说明的是，该关键字特征库103可以独立于所述录音处理设备102设置，也可以设置在所述的录音处理设备102中，本发明对此不做限定。关键字特征库中配置的提示音关键字的示例如表1所示，内容关键字的示例如表2所示。

表1

表2

下面结合附图分别对本发明录音处理设备的具体结构进行详细说明。

图2为本发明实施例提供的录音处理设备200的结构示意图。如图2所示，该录音处理设备200包括获取模块201、识别模块202，加密模块203以及文件形成模块204。

其中，获取模块201，用于从录音设备获取录音源文件。

识别模块202，用于从所述录音源文件中识别出含有涉及用户数据安全的敏感信息的第一录音片段。所述识别模块具体用于根据所述录音源文件中的内容与键字特征库中的关键字进行特征匹配，并根据匹配结果识别出含有所述涉及用户数据安全的敏感信息的第一录音片段。一个具体的实施例中，所述的关键字具体可以包括提示音关键字和/或内容关键字，所述识别模块可以分别根据不同的关键字进行不同的匹配，具体的匹配方式与下属方法实施例中一样，此处不赘述。

加密模块203，用于对所述含有所述敏感信息的第一录音片段进行加密，对录音源文件中非敏感信息所在的第二录音片段不做加密处理。

文件形成模块204，用于将加密后的第一录音片段和所述不做加密处理的第二录音片段合并为录音目标文件，所述文件形成模块进一步还用于将加密后的第一录音片段和所述不做加密处理的第二录音片段进行散列组合后合并为录音目标文件。从而通过加密一级分段散列存储，使得录音被非法读取的难度成倍增长。

图3为本发明另一实施例提供的录音处理设备300的结构示意图。如图3所示，该录音处理设备300在包括获取模块201、识别模块202、加密模块203以及文件形成模块204的基础上，进一步包括了转换模块205和设置模块206。

其中，设置模块，用于设置关键字特征库，所述关键字特征库中包括关键字。所述识别模块具体用于根据所述录音源文件中的内容与键字特征库中的关键字进行特征匹配，并根据匹配结果识别出含有所述涉及用户数据安全的敏感信息的第一录音片段。具体的设置方式请参考以上或以下其他实施例，具体过程一样，此处不赘述。

在一个具体实施例中，所述关键字特征库包括提示音关键字，所述识别模块具体用于将所述录音源文件的文本文件中的内容与所述提示音关键字进行特征匹配，将所述录音源文件中与所述提示音关键字相匹配的部分之外的其他部分确定为含有所述涉及用户数据安全的敏感信息的第一录音片段。

在另一个实施例中，所述关键字特征库包括内容关键字，所述识别模块具体用于将所述录音源文件的文本文件中的内容与所述内容关键字进行特征匹配，将所述录音源文件中与所述内容关键字相匹配的部分确定为含有所述涉及用户数据安全的敏感信息的第一录音片段。

所述转换模块，用于对所述录音源文件进行语音文本转化获得所述录音源文件的文本文件，所述识别模块具体用于将所述录音源文件的文本文件中的内容与关键字特征库中的关键字进行特征匹配，并根据匹配结果识别出含有所述涉及用户数据安全的敏感信息的第一录音片段。

本领域普通技术人员可以意识到，结合本文中所公开的实施例描述的各示例的模块及算法步骤，能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本发明的范围。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统、装置和模块的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

在本申请所提供的几个实施例中，应该理解到，所揭露的系统、装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本发明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。

所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

图4为本发明实施例提供的一种录音处理方法流程图。本实施例由上述实施例中的录音处理设备102、200或者300执行。如图4所述，该方法包括：

402，录音处理设备从录音设备获取录音源文件。

其中，该录音源文件可以包括客户和坐席的通话录音。

录音处理设备可以直接从呼叫中心获取录音源文件，或者也可以从其它存放有该录音源文件的服务器获取。

404，录音处理设备从所述录音源文件中识别出含有涉及用户数据安全的敏感信息的第一录音片段。

录音处理设备可以预先设置关键字特征库。关键字特征库中可包括不同类型的关键字，比如，提示音关键字或内容关键字。其中，提示音关键字可以是通常出现在客服人员提示音中的内容。内容关键字可以是通常出现在客户语音中的内容。该关键字特征库中存储的关键字具有行业相关性，即不同行业可以具有不同的关键字特征库。

从所述录音源文件中识别出含有涉及用户数据安全的敏感信息的第一录音片段具体可包括：将所述录音源文件中的内容与关键字特征库中的关键字进行特征匹配，并根据匹配结果识别出含有所述涉及用户数据安全的敏感信息的第一录音片段。

在进行匹配前，录音处理设备可以先对录音源文件进行语音文本转化获得所述录音源文件的文本文件，然后将所述录音源文件的文本文件中的内容与键字特征库中的关键字进行特征匹配。将录音源文件转换为文本文件的具体过程可参考图5中的步骤504。

根据关键字特征库的不同，根据匹配结果来识别敏感信息的方式也可能不同。下面分别以关键字特征库中包括提示音关键字和内容关键字为例进行说明。

实施例一：所述关键字特征库包括提示音关键字。

在该实施例中，与所述录音源文件中的内容进行特征匹配的关键字为所述提示音关键字。

所述根据匹配结果识别出含有所述涉及用户数据安全的敏感信息的第一录音片段包括：

将所述录音源文件中与所述提示音关键字相匹配的部分之外的其它部分确定为含有所述涉及用户数据安全的敏感信息的第一录音片段。

该实施例的具体识别过程参见图5所示实施例。

实施例二：所述关键字特征库包括内容关键字。

在该实施例中，与所述录音源文件中的内容进行特征匹配的关键字为所述内容关键字。

所述根据匹配结果识别出含有涉及用户数据安全的敏感信息的第一录音片段包括：

将所述录音源文件中与所述内容关键字相匹配的部分确定为含有所述涉及用户数据安全的敏感信息的第一录音片段。

该实施例的具体识别过程参见图6所示实施例。

406，录音处理设备对所述含有所述敏感信息的第一录音片段进行加密，对录音源文件中非敏感信息所在的第二录音片段不做加密处理。

本发明实施例中，仅从录音源文件中提取出含有敏感信息的第一录音片段进行加密，对于未包含敏感信息(即仅包含非敏感信息)的第二录音片段不做加密处理。

408，录音处理设备将加密后的第一录音片段和所述不做加密处理的第二录音片段合并为录音目标文件。

具体的，为了更进一步的提高安全性，可以将加密后的第一录音片段和所述不做加密处理的第二录音片段进行散列组合后合并为录音目标文件。具体可采用哈希表来对第一录音片段和第二录音片段进行散列组合。

进一步的，在合并后，录音处理设备还可以在所述录音目标文件的文件头上记录所述第一录音片段和所述第二录音片段的片段顺序。

本发明实施例通过从录音源文件中识别出含有涉及用户数据安全的敏感信息的录音片段，并仅对涉及用户数据安全的该录音片段进行加密，在提高效率的同时提高了录音数据的安全性。

图5为本发明另一实施例提供的一种录音处理方法流程图。本实施例由上述实施例中的录音处理设备102、200或者300执行。如图5所述，该方法包括：

502，录音处理设备从录音设备获取录音源文件。

504，录音处理设备对录音源文件进行语音文本转化获得所述录音源文件的文本文件。

录音处理设备在进行语音文本转化可以采用现有的语音识别技术来实现。与现有技术不同的是，本发明在语音转文本的过程中还可以进一步记录每个文字对应的音频时间轴。如表3所示，表3转换后的文本示例。

表3

序号	文字(5个字为一组)	开始时间
			1	为向您提供	0.01s
2	更好的服务	0.2S
			3	需要核实您	0.5S
4	……	……

506，录音处理设备将所述录音源文件的文本文件中的内容与关键字特征库中的提示音关键字进行特征匹配。

其中，提示音关键字可以是客服人员的标准提示音内容。例如，“您的小学班主任姓名”。

508，录音处理设备将所述录音源文件中与所述提示音关键字相匹配的部分之外的其它部分确定为含有所述涉及用户数据安全的敏感信息的第一录音片段。

具体的，在匹配时可以按照特征关键字特征库中设置的匹配规则进行匹配。

本步骤中，主要是根据匹配结果对录音源文件进行分段。

具体的，录音处理设备可以采用与所述提示音关键字相匹配的部分来分段。比如，如果匹配了特征库中的提示音关键字“您的小学班主任姓名”，假设开始时间为12.5s，结束时间为16s。则将原始录音文件分为3段。第0-12.5s为一段，第12.5s-16s为一段，剩余的为一段。录音处理设备将与所述提示音关键字相匹配的部分，如第12.5s-16s，作为非敏感信息，将剩余部分，如第0-12.5s和第16s之后的部分，作为敏感信息。

在另一种可选的方式中，录音处理设备可以基于预设的时间段信息将所述录音源文件中与所述提示音关键字相匹配的部分之外的其它部分确定为含有所述涉及用户数据安全的敏感信息的第一录音片段。具体的，录音处理设将与所述提示音关键字相匹配的部分以及与提示音关键字相匹配的部分之后预设时间段内的部分分为一段。即将与所述提示音关键字相匹配的部分对应的时间段延长预设时间段，采用该延长后得到的时间段来分段。举例说明，假设匹配了特征库中的提示音关键字“您的小学班主任姓名”，开始时间为12.5s，结束时间为16s，预设时间段为2s，则将原始录音文件分为3段。第0-12.5s为一段，第12.5s-18s为一段，剩余的为一段。其中，18s为将16s延长预设时间段2s得到。

当然，也可以将与所述提示音关键字相匹配的部分对应的时间段前移预设时间段，采用该前移后得到的时间段来分段。

需要说明的是，如果匹配到多个提示音关键字可同样采用上述分段方式进行分段。

另外，与提示音关键字相匹配的部分可以是从文本文件中匹配到的提示音关键字本身，也可以是从文本文件中匹配到的两个提示音关键字之间的部分。

510，录音处理设备对所述含有所述敏感信息的第一录音片段进行加密，对录音源文件中非敏感信息所在的第二录音片段不做加密处理。

512，录音处理设备将加密后的第一录音片段和所述不做加密处理的第二录音片段合并为录音目标文件。

下面举例说明，假设关键字特征库中的的提示音关键字为“你的小学班主任姓名”，“你的中学语文老师姓名”和“你的母亲生日”。通话内容如下：

A 话务员：“为向您提供更好的服务，需要核实您的身份。请按照您实现在本银行留下的个人信息回答下列问题：您的小学班主任姓名”

B 银行客户：“刘宏伟”

C 话务员：“您的中学老师姓名”

D 银行客户：“张晓华”

E 话务员：“您母亲的生日”

F 银行客户：“1970年4月21日”

其中，通话内容中的“你的小学班主任姓名”，“你的中学语文老师姓名”和“你的母亲生日”为与提示音关键字相匹配的部分。因此，按照图5所示实施例中的方法，可将上述内容分为段为A、B、C、D、E、F几部分。录音处理设备将B、D、F加密，形成B’、D’、F’，然后将A、B’、C、D’、E、F’进行散列组合得到“B’、C、A、E、D’、F’。

图6为本发明另一实施例提供的一种录音处理方法流程图。本实施例由上述实施例中的录音处理设备102、200或者300执行。如图6所述，该方法包括：

602，录音处理设备从录音设备获取录音源文件。

604，录音处理设备对录音源文件进行语音文本转化获得所述录音源文件的文本文件。

具体实现过程可参考图5的步骤504部分，这里不再赘述。

606，录音处理设备将所述录音源文件的文本文件中的内容与关键字特征库中的内容关键字进行特征匹配。

其中，内容关键字可参考表2所示的示例。录音处理设备按照关键字特征库中的匹配规则进行匹配。

608，录音处理设备将所述录音源文件中与所述内容关键字相匹配的部分确定为含有所述涉及用户数据安全的敏感信息的第一录音片段。

与图5所示实施例中的步骤508类似，录音处理设备是可以根据匹配结果对录音源文件进行分段。

录音处理设备分段后，根据文本文件中的时间轴获取匹配到的部分对应的音频部分。

610，录音处理设备对所述含有所述敏感信息的第一录音片段进行加密，对录音源文件中非敏感信息所在的第二录音片段不做加密处理。

612，录音处理设备将加密后的第一录音片段和所述不做加密处理的第二录音片段合并为录音目标文件。

下面举例说明，假设关键字特征库中的的内容关键字为百家姓，数字，日期，地名。通话内容如下：

B 银行客户：“刘宏伟”

C 话务员：“您的中学老师姓名”

D 银行客户：“张晓华”

E 话务员：“您母亲的生日”

F 银行客户：“1970年4月21日”

其中，通话内容中的“刘”，“张”和“1970年4月21日”为与内容关键字相匹配的部分。因此，按照图6所示实施例中的方法，可将上述内容分为段为A、B、C、D、E、F几部分。录音处理设备将B、D、F加密，形成B’、D’、F’，然后将A、B’、C、D’、E、F’进行散列组合得到“B’、C、A、E、D’、F’。

通过以上的实施例的描述，本领域普通技术人员可以理解：实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成，所述的程序可以存储于一计算机可读取存储介质中，该程序在执行时，包括如上述方法实施例的步骤，所述的存储介质，如：ROM/RAM、磁碟、光盘等。

以上所述，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应所述以权利要求的保护范围为准。

Claims

1.一种录音文件处理方法，其特征在于，包括：

录音处理设备从录音设备获取录音源文件；

从所述录音源文件中识别出含有涉及用户数据安全的敏感信息的第一录音片段；

对所述含有所述敏感信息的第一录音片段进行加密，对录音源文件中非敏感信息所在的第二录音片段不做加密处理；

将加密后的第一录音片段和所述不做加密处理的第二录音片段合并为录音目标文件。

2.如权利要求1所述的方法，其特征在于，所述将加密后的第一录音片段和所述不做加密处理的第二录音片段合并为录音目标文件具体包括：

将加密后的第一录音片段和所述不做加密处理的第二录音片段进行散列组合后合并为录音目标文件。

3.如权利要求2所述的方法，其特征在于，进一步包括：

在所述录音目标文件的文件头上记录所述第一录音片段和所述第二录音片段的片段顺序。

4.如权利要求2所述的方法，其特征在于，进一步包括：

设置关键字特征库，所述关键字特征库中包括关键字；

所述从所述录音源文件中识别出含有涉及用户数据安全的敏感信息的第一录音片段包括：

将所述录音源文件中的内容与所述关键字特征库中的关键字进行特征匹配，并根据匹配结果识别出含有所述涉及用户数据安全的敏感信息的第一录音片段。

5.如权利要求4所述的方法，其特征在于，所述方法进一步包括，对所述录音源文件进行语音文本转化获得所述录音源文件的文本文件；

所述将所述录音源文件中的内容与键字特征库中的关键字进行特征匹配包括：

将所述录音源文件的文本文件中的内容与键字特征库中的关键字进行特征匹配。

6.如权利要求4或5所述的方法，其特征在于，所述关键字特征库包括提示音关键字；与所述录音源文件中的内容进行特征匹配的关键字为所述提示音关键字；

7.如权利要求6所述的方法，其特征在于，基于预设的时间段信息将所述录音源文件中与所述提示音关键字相匹配的部分之外的其他部分确定为含有所述涉及用户数据安全的敏感信息的第一录音片段。

8.如权利要求4或5所述的方法，其特征在于，所述关键字特征库包括内容关键字；与所述录音源文件中的内容进行特征匹配的关键字为所述内容关键字；

9.一种录音处理设备，其特征在于，包括：

获取模块，用于从录音设备获取录音源文件；

识别模块，用于从所述录音源文件中识别出含有涉及用户数据安全的敏感信息的第一录音片段；

加密模块，用于对所述含有所述敏感信息的第一录音片段进行加密，对录音源文件中非敏感信息所在的第二录音片段不做加密处理；

文件形成模块，用于将加密后的第一录音片段和所述不做加密处理的第二录音片段合并为录音目标文件。

10.如权利要求9所述的录音处理设备，其特征在于，所述文件形成模块用于将加密后的第一录音片段和所述不做加密处理的第二录音片段进行散列组合后合并为录音目标文件。

11.如权利要求10所述的录音处理设备，其特征在于，文件形成模块用于在所述录音目标文件的文件头上记录所述第一录音片段和所述第二录音片段的片段顺序。

12.如权利要求11所述的录音处理设备，其特征在于，所述的录音处理设备进一步包括设置模块，用于设置关键字特征库，所述关键字特征库中包括关键字；

所述识别模块具体用于根据所述录音源文件中的内容与所述键字特征库中的关键字进行特征匹配，并根据匹配结果识别出含有所述涉及用户数据安全的敏感信息的第一录音片段。

13.如权利要求12所述的录音处理设备，其特征在于，所述的录音处理设备进一步包括转换模块，用于对所述录音源文件进行语音文本转化获得所述录音源文件的文本文件；

所述识别模块具体用于将所述录音源文件的文本文件中的内容与关键字特征库中的关键字进行特征匹配，并根据匹配结果识别出含有所述涉及用户数据安全的敏感信息的第一录音片段。

14.如权利要求12所述的录音处理设备，其特征在于，所述关键字特征库包括提示音关键字；

所述识别模块具体用于将所述录音源文件的文本文件中的内容与所述提示音关键字进行特征匹配，将所述录音源文件中与所述提示音关键字相匹配的部分之外的其他部分确定为含有所述涉及用户数据安全的敏感信息的第一录音片段。

15.如权利要求14所述的录音处理设备，其特征在于，所述识别模块具体用于基于预设的时间段信息将所述录音源文件中与所述提示音关键字相匹配的部分之外的其他部分确定为含有所述涉及用户数据安全的敏感信息的第一录音片段。

16.如权利要求12所述的录音处理设备，其特征在于，所述关键字特征库包括内容关键字；

所述识别模块具体用于将所述录音源文件的文本文件中的内容与所述内容关键字进行特征匹配，将所述录音源文件中与所述内容关键字相匹配的部分确定为含有所述涉及用户数据安全的敏感信息的第一录音片段。

17.一种录音处理设备，其特征在于，包括：

接收器，用于从录音设备获取录音源文件；

与所述接收器相连接的处理器，用于：

18.如权利要求17所述的方录音处理设备，其特征在于，所述处理器具体用于将加密后的第一录音片段和所述不做加密处理的第二录音片段进行散列组合后合并为录音目标文件。

19.如权利要求18所述的录音处理设备，其特征在于，所述处理器进

一步用于：

20.如权利要求18所述的录音处理设备，其特征在于，所述处理器进一步用于设置关键字特征库，所述关键字特征库包括关键字；

所述从所述录音源文件中识别出含有涉及用户数据安全的敏感信息的第一录音片段具体包括：

21.如权利要求20所述的录音处理设备，所述处理器进一步用于对所述录音源文件进行语音文本转化获得所述录音源文件的文本文件；

22.如权利要求20所述的录音处理设备，其特征在于，所述关键字特征库包括提示音关键字；与所述录音源文件中的内容进行特征匹配的关键字为所述提示音关键字；

将所述录音源文件中与所述提示音关键字相匹配的部分之外的其他部分确定为含有所述涉及用户数据安全的敏感信息的第一录音片段。

23.如权利要求22所述的录音处理设备，其特征在于，基于预设的时间段信息将所述录音源文件中与所述提示音关键字相匹配的部分之外的其他部分确定为含有所述涉及用户数据安全的敏感信息的第一录音片段。

24.如权利要求20所述的录音处理设备，其特征在于，所述关键字特征库包括内容关键字；与所述录音源文件中的内容进行特征匹配的关键字为所述内容关键字；