CN111883128A

CN111883128A - 语音处理方法及系统、语音处理装置

Info

Publication number: CN111883128A
Application number: CN202010756619.0A
Authority: CN
Inventors: 钱晓萌; 江林格
Original assignee: Industrial and Commercial Bank of China Ltd ICBC
Current assignee: Industrial and Commercial Bank of China Ltd ICBC
Priority date: 2020-07-31
Filing date: 2020-07-31
Publication date: 2020-11-03

Abstract

本发明涉及信息安全领域的一种语音处理方法及系统、语音处理装置，语音处理方法包括：获取语音数据，确定所述语音数据中的设定敏感信息的位置，对所述语音数据中与所述设定敏感信息的位置对应的部分进行降低辨识度的处理。这种语音处理系统、语音处理方法以及语音处理装置可以对语音数据中的敏感信息识别，从而有效地保护用户隐私。

Description

语音处理方法及系统、语音处理装置

技术领域

本发明涉及信息安全的数据处理技术领域，具体涉及一种语音处理方法及系统、语音处理装置。

背景技术

目前,随着5G、互联网等技术的发展，数据的处理也越发重要，语音数据作为一种常用的数据，被各行各业广泛应用。

然而，语音数据中往往会包含各种敏感信息，例如，身份证号、手机号码等，若不对语音数据进行处理，容易造成信息泄露的风险。

发明内容

鉴于上述问题，提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的语音处理方法及系统、语音处理装置。

根据本发明的第一个方面，提供了一种语音处理方法，包括：获取语音数据；确定所述语音数据中的设定敏感信息的位置；对所述语音数据中与所述设定敏感信息的位置对应的部分进行降低辨识度的处理。

可选地，所述获取语音数据与所述确定所述语音数据中的设定敏感信息的位置间还包括：将所述语音数据分割成多个语音段；且所述确定所述语音数据中的设定敏感信息的位置包括：根据每个所述语音段中所述设定敏感信息的位置确定所述语音数据中的所述设定敏感信息的位置。

可选地，所述获取语音数据与所述确定所述语音数据中的设定敏感信息的位置间还包括：将所述语音数据转换为文本数据；确定所述文本数据中的所述设定敏感信息的位置；且所述确定所述语音数据中的设定敏感信息的位置包括：根据所述文本数据确定所述语音数据中的所述设定敏感信息的位置。

可选地，所述文本数据为未经过增删变换的未解码文本数据；且所述确定所述语音数据中的设定敏感信息的位置包括：根据所述未解码文本数据确定所述语音数据中的所述设定敏感信息的位置。

可选地，所述确定所述文本数据中的所述设定敏感信息的位置前还包括：根据预设位数的数字、预设字或预设符号确定所述设定敏感信息。

可选地，所述对所述语音数据中与所述设定敏感信息的位置对应的部分进行降低辨识度的处理包括：对所述语音数据中与所述设定敏感信息的位置相邻的位置对应的部分也进行所述降低辨识度的处理。

可选地，对所述语音数据中与所述设定敏感信息的位置对应的部分进行降低辨识度的处理包括：对所述语音数据中与所述设定敏感信息的位置对应的部分进行消音或替换音频处理。

可选地，所述获取语音数据与所述确定所述语音数据中的设定敏感信息的位置间还包括：对所述语音数据进行语音去噪和/或语音增强处理。

根据本发明的第二个方面，还提供了一种语音处理系统，包括计算机可读存储介质、处理器和存储在所述计算机可读存储介质上并可在所述处理器上运行的程序，所述程序被所述处理器执行时实现上述任一所述的语音处理方法。

根据本发明的第三个方面，还提供了一种语音处理装置，包括：获取模块，用于获取语音数据；确定模块，用于确定所述语音数据中的设定敏感信息的位置；处理模块，用于对所述语音数据中与所述设定敏感信息的位置对应的部分进行降低辨识度的处理。

本发明的这种语音处理系统、语音处理方法以及语音处理装置可以对语音数据中的敏感信息识别，并保证了对敏感信息识别的准确度和完整度，能对用户的信息安全进行有效地把控，从而有效地保护用户隐私，确定所述语音数据中的设定敏感信息的位置的步骤可以确定敏感信息，用户可以自行设置敏感信息，并且，可以先将语音数据转换为文本数据，然后根据所述文本数据确定所述语音数据中的所述设定敏感信息的位置，由于文本数据更加容易识别和控制，这种方式可以提高识别的准确度，更容易对文本数据中的敏感信息进行控制和操作。

本发明的这种语音处理系统、语音处理方法以及语音处理装置可以用于银行的对语音数据的业务测试，提升了语音数据处理的效率，保证了语音数据的可用性以及用户信息的安全性，通过数字信号处理方法、语音信号能量检测技术等人工智能技术手段对语音数据进行整体识别、变形，提高了语音的处理效率，对语音数据的识别以及处理过程均利用人工智能技术进行，整个过程无需人工介入，提高对语音处理过程的效能。

附图说明

通过下文中参照附图对本发明所作的描述，本发明的其它目的和优点将显而易见，并可帮助对本发明有全面的理解。

图1是根据本发明一个实施例的语音处理方法的示意图；

图2是根据本发明一个实施例的语音处理方法的应用场景图；

图3是根据本发明一个实施例的语音处理方法的执行流程图；

图4是根据本发明另一个实施例的语音处理方法的执行流程图；

图5是根据本发明一个实施例的语音处理系统的结构框图；

图6是根据本发明一个实施例的语音处理装置的结构框图。

需要说明的是，附图并不一定按比例来绘制，而是仅以不影响读者理解的示意性方式示出。

其中，10为语音处理系统，100为计算机可读存储介质，110为程序，200为处理器，20为语音处理装置，300为获取模块，400为确定模块，500为处理模块。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚，下面将结合本发明实施例的附图，对本发明的技术方案进行清楚、完整地描述。显然，所描述的实施例是本发明的一个实施例，而不是全部的实施例。基于所描述的本发明的实施例，本领域普通技术人员在无需创造性劳动的前提下所获得的所有其他实施例，都属于本发明保护的范围。

除非另外定义，本发明使用的技术术语或者科学术语应当为本发明所属领域内具有一般技能的人士所理解的通常意义。

本实施例首先提供了一种语音处理方法，图1是根据本发明一个实施例的语音处理方法的示意图，图2是根据本发明一个实施例的语音处理方法的应用场景图。本发明实施例的语音处理方法包括：

S102，获取语音数据。

S104，确定所述语音数据中的设定敏感信息的位置。

S106，对所述语音数据中与所述设定敏感信息的位置对应的部分进行降低辨识度的处理。

在获取语音数据的步骤中，具体地，可以通过语音数据传输设备获取语音数据，如图2所示，例如，通过话筒、手机的语音模块或平板等的语音模块等获取语音，并将语音转换为语音数据，然后通过语音数据传输设备获取这些语音数据。

其中，所述设定敏感信息可以在确定所述语音数据中的设定敏感信息的位置之前设定，例如，可以根据预设位数的数字、预设字或预设符号确定所述设定敏感信息。根据预设位数的数字确定所述设定敏感信息，可以将预设位数的数字设置为所述设定敏感信息，在一些实施例中，预设位数的数字可以为18位数字或15位数字等，本领域技术人员可以理解地，一代身份证的身份证号码为15位，二代身份证的身份证号码为18位，这种方式可以避免用户的身份证号码泄露；在另一些实施例中，预设位数的数字可以为小于或等于6位数字等；在其他实施例中，预设位数的数字可以为8位数字，从而避免用户的传真号码泄露。根据预设字确定所述设定敏感信息，可以将预设字设置为所述设定敏感信息，也可以将预设字之前或之后设定第一位数的字设置为所述设定敏感信息，设定第一位数以及预设字可以根据实际情况选择，例如，预设字可以为“姓名”、“地址”、“小区”、“楼”、“单元”、“院”、“学校”等，设定第一位数可以为4位、5位等。根据预设符号确定所述设定敏感信息，可以将预设符号前或后设定第二位数设置为所述设定敏感信息，例如，预设符号可以为“@”等，将“@”前10位数的字设置为敏感信息。

确定所述语音数据中的设定敏感信息的位置可以根据人工智能技术来确定，例如，所述获取语音数据与所述确定所述语音数据中的设定敏感信息的位置间还可以包括：将所述语音数据转换为文本数据，确定所述文本数据中的所述设定敏感信息的位置。且所述确定所述语音数据中的设定敏感信息的位置包括根据所述文本数据确定所述语音数据中的所述设定敏感信息的位置。该步骤可以通过各种语音识别系统实现，由于这类语音识别系统是本领域技术人员所习知的，在此不做赘述。

也就是说，先在文本数据中找到所述设定敏感信息的位置，由于文本数据是语音数据转换得来的，所述设定敏感信息在文本数据中的位置对应的在语音数据中的位置既为语音数据中所述设定敏感信息的位置。

所述文本数据可以为未经过增删变换的未解码文本数据。且所述确定所述语音数据中的设定敏感信息的位置包括根据所述未解码文本数据确定所述语音数据中的所述设定敏感信息的位置。本领域技术人员可以理解地，语音识别系统会先将语音数据转换为未解码文本数据，然后再将未解码文本数据转换为解码文本数据，将未解码文本数据转换为解码文本数据时，可以采用ctc解码器，本实施例中，是在未解码的文本数据中定位所述设定敏感字，由于从语音数据到未解码文本数据只经历了伸缩变换而未经历增删变换，因此语音数据和未解码文本数据大致上一一对应，例如当语音数据的时长为3秒，对应的文本数据的字数为7个字，当文本数据没有经过增删变换时，语音数据的不同时长处的数据与文本数据中的这7个字是一一对应，从而便于根据文本数据中敏感信息的位置找到对应的语音数据中敏感信息的位置，敏感字在未解码文本数据上的相对位置即为在语音数据中的相对位置。也就是说，先在未解码文本数据中找到所述设定敏感信息的位置，由于未解码文本数据是语音数据转换得来的，且未经过增删变换，所述设定敏感信息在未解码文本数据中的位置对应的在语音数据中的位置既为语音数据中所述设定敏感信息的位置。

在一些实施例中，未解码文本数据可以经过伸缩变换，以使未解码文本数据的长度与用于确定所述文本数据中的所述设定敏感信息的位置的模型的入口长度相适配。

在一些实施例中，对所述语音数据中与所述设定敏感信息的位置相邻的位置对应的部分也进行所述降低辨识度的处理。由此，进一步保证用户的隐私，避免用户隐私的泄露，其中，相邻的位置的范围可以根据实际情况设定，例如设置为2位字段、3位字段等，例如，将敏感信息之前以及之后的3位字也进行所述降低辨识度处理。

对所述语音数据中与所述设定敏感信息的位置对应的部分进行降低辨识度的处理包括对所述语音数据中与所述设定敏感信息的位置对应的部分进行消音或替换音频处理。

在一些实施例中，所述获取语音数据与所述确定所述语音数据中的设定敏感信息的位置间还可以包括：对所述语音数据进行语音去噪和/或语音增强处理。以提高将语音数据转换为文本数据时的识别准确率，该步骤中，可以用谱减法、维纳滤波法、基于统计模型的方法、自适应滤波法等。

所述获取语音数据与所述确定所述语音数据中的设定敏感信息的位置间还包括：将所述语音数据分割成多个语音段；且所述确定所述语音数据中的设定敏感信息的位置包括：根据每个所述语音段中所述设定敏感信息的位置确定所述语音数据中的所述设定敏感信息的位置。该步骤中，每个语音段可以为单个的句子，可以采用语音信号能量检测技术做端点检测，以实现语音数据的句子级切分，提高后续语音数据转换为文本数据时的效率。本发明实施例通过在确定敏感信息前通过语音信号能量检测技术对语音数据进行分割，避免通过用于确定所述文本数据中的所述设定敏感信息的位置的模型来识别语句间的间隔而产生误差的情况，提高文本转换的准确度。

本发明实施例的这种语音处理方法可以对语音数据中的敏感信息识别，并保证了对敏感信息识别的准确度和完整度，能对用户的信息安全进行有效地把控，从而有效地保护用户隐私，本实施例的确定所述语音数据中的设定敏感信息的位置的步骤可以确定敏感信息，在一些实施例中，用户可以自行设置敏感信息，并且，本实施例可以先将语音数据转换为文本数据，然后根据所述文本数据确定所述语音数据中的所述设定敏感信息的位置，由于文本数据更加容易识别和控制，这种方式可以提高识别的准确度，更容易对文本数据中的敏感信息进行控制和操作。

本发明实施例提供的这种语音处理方法可以用于银行的对语音数据的业务测试，提升了语音数据处理的效率，保证了语音数据的可用性以及用户信息的安全性，通过数字信号处理方法、语音信号能量检测技术等人工智能技术手段对语音数据进行整体识别、变形，提高了语音的处理效率，对语音数据的识别以及处理过程均利用人工智能技术进行，整个过程无需人工介入，提高对语音处理过程的效能，本领域技术人员可以理解地，数字信号处理方法、语音信号能量检测技术等人工智能技术手段可以对处理的过程进行日志留痕，也就是可以保存历史记录，从而保证后续对数据回溯的可能性。

图3是根据本发明一个实施例的语音处理方法的执行流程图，如图3所示，该实施例的语音处理方法包括：

S302，获取语音数据。

S304，对所述语音数据进行语音去噪和/或语音增强处理。

S306，将所述语音数据分割成多个语音段。

S308，将所述语音数据转换为文本数据。

S310，根据预设位数的数字、预设字或预设符号确定所述设定敏感信息。

S312，确定所述文本数据中的所述设定敏感信息的位置。

S314，根据文本数据中设定敏感信息的位置确定所述语音数据中的设定敏感信息的位置。

S316，对所述语音数据中与所述设定敏感信息的位置对应的部分进行降低辨识度的处理。

图4是根据本发明另一个实施例的语音处理方法的执行流程图，如图4所示，该实施例的语音处理方法包括：

S402，获取语音数据。

S404，根据预设位数的数字、预设字或预设符号确定所述设定敏感信息。

S406，对所述语音数据进行语音去噪和/或语音增强处理。

S408，将所述语音数据分割成多个语音段。

S410，将所述语音数据转换为文本数据，所述文本数据为未解码文本数据。

S412，确定所述文本数据中的所述设定敏感信息的位置。

S414，根据未解码文本数据中设定敏感信息的位置确定所述语音数据中的设定敏感信息的位置。

S416，对所述语音数据中与所述设定敏感信息的位置对应的部分进行降低辨识度的处理。

本实施例还提供了一种语音处理系统10，图5是根据本发明一个实施例的语音处理系统10的结构框图。语音处理系统10包括计算机可读存储介质100、处理器200和存储在所述计算机可读存储介质100上并可在所述处理器200上运行的程序110，所述程序110被所述处理器200执行时实现上述任一所述的语音处理方法。经过处理后的语音数据可以通过语音输出设备输出，在一些实施例中，语音输出设备也可以为智能手机、平板等。

其中计算机可读存储介质也可以被称为存储器。处理器200可以根据存储在只读存储器(ROM)中的程序或者加载到随机访问存储器(RAM)中的程序110而执行各种适当的动作和处理。处理器200例如可以包括通用微处理器(例如CPU)、指令集处理器和/或相关芯片组和/或专用微处理器(例如，专用集成电路(ASIC))，等等。处理器200还可以包括用于缓存用途的板载存储器。处理器200可以包括用于执行根据本公开实施例的方法流程的不同动作的单一处理单元或者是多个处理单元。

在RAM中，存储有语音处理系统10操作所需的各种程序110和数据。处理器200、ROM以及RAM通过总线彼此相连。处理器200通过执行ROM和/或RAM中的程序110来执行根据本公开实施例的方法流程的各种操作。需要注意，程序110也可以存储在除ROM和RAM以外的一个或多个存储器中。处理器200也可以通过执行存储在所述一个或多个存储器中的程序110来执行根据本公开实施例的方法流程的各种操作。

根据本公开的实施例，语音处理系统10还可以包括输入/输出(I/O)接口，输入/输出(I/O)接口也连接至总线。语音处理系统10还可以包括连接至I/O接口的以下部件中的一项或多项：包括键盘、鼠标等的输入部分；包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分；包括硬盘等的存储部分；以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分。通信部分经由诸如因特网的网络执行通信处理。驱动器也根据需要连接至I/O接口。可拆卸介质，诸如磁盘、光盘、磁光盘、半导体存储器等等，根据需要安装在驱动器上，以便于从其上读出的计算机程序根据需要被安装入存储部分。

根据本公开的实施例，根据本公开实施例的方法流程可以被实现为计算机软件程序。例如，本公开的实施例包括一种计算机程序产品，其包括承载在计算机可读存储介质上的计算机程序，该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中，该计算机程序可以通过通信部分从网络上被下载和安装，和/或从可拆卸介质被安装。在该计算机程序被处理器200执行时，执行本公开实施例的系统中限定的上述功能。

本领域技术人员可以理解地，计算机可读存储介质100可以包括但不限于非易失性或易失性存储介质，例如随机存取存储器(RAM)、静态RAM、动态RAM、只读存储器(ROM)、可编程ROM、可擦除可编程ROM、电可擦除可编程ROM、闪存、安全数字(SD)卡等。

本发明实施例还提供了一种语音处理装置20，图6是根据本发明一个实施例的语音处理装置20的结构框图。

语音处理装置20包括获取模块300、确定模块400以及处理模块500。

获取模块300用于获取语音数据，确定模块400用于确定所述语音数据中的设定敏感信息的位置，处理模块500用于对所述语音数据中与所述设定敏感信息的位置对应的部分进行降低辨识度的处理。

处理模块500还可以用于将所述语音数据分割成多个语音段，则确定模块400可以用于根据每个所述语音段中所述设定敏感信息的位置确定所述语音数据中的所述设定敏感信息的位置。

处理模块500还可以用于将所述语音数据转换为文本数据，确定模块400用于确定所述文本数据中的所述设定敏感信息的位置，并用于根据所述文本数据中的所述设定敏感信息的位置确定所述语音数据中的所述设定敏感信息的位置。

确定模块400还可以用于根据所述未解码文本数据确定所述语音数据中的所述设定敏感信息的位置，还可以用于根据预设位数的数字、预设字或预设符号确定所述设定敏感信息。

处理模块500还可以用于对所述语音数据中与所述设定敏感信息的位置相邻的位置对应的部分也进行所述降低辨识度的处理，可以用于对所述语音数据中与所述设定敏感信息的位置对应的部分进行消音或替换音频处理，可以用于对所述语音数据进行语音去噪和/或语音增强处理。

本发明实施例提供的这种语音处理系统10、语音处理方法以及语音处理装置20可以对语音数据中的敏感信息识别，并保证了对敏感信息识别的准确度和完整度，能对用户的信息安全进行有效地把控，从而有效地保护用户隐私，确定所述语音数据中的设定敏感信息的位置的步骤可以确定敏感信息，在一些实施例中，用户可以自行设置敏感信息，并且，本实施例可以先将语音数据转换为文本数据，然后根据所述文本数据确定所述语音数据中的所述设定敏感信息的位置，由于文本数据更加容易识别和控制，这种方式可以提高识别的准确度，更容易对文本数据中的敏感信息进行控制和操作。

本发明实施例提供的这种语音处理系统10、语音处理方法以及语音处理装置20可以用于银行的对语音数据的业务测试，这种语音处理系统10、语音处理方法以及语音处理装置20还可以用于信息安全领域或者5G领域，提升了语音数据处理的效率，保证了语音数据的可用性以及用户信息的安全性，通过数字信号处理方法、语音信号能量检测技术等人工智能技术手段对语音数据进行整体识别、变形，提高了语音的处理效率，对语音数据的识别以及处理过程均利用人工智能技术进行，整个过程无需人工介入，提高对语音处理过程的效能，本领域技术人员可以理解地，数字信号处理方法、语音信号能量检测技术等人工智能技术手段可以对处理的过程进行日志留痕，也就是可以保存历史记录，从而保证后续对数据回溯的可能性。

对于本发明的实施例，还需要说明的是，在不冲突的情况下，本发明的实施例及实施例中的特征可以相互组合以得到新的实施例。

以上，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，本发明的保护范围应以权利要求的保护范围为准。

Claims

1.一种语音处理方法，包括：

获取语音数据；

确定所述语音数据中的设定敏感信息的位置；

对所述语音数据中与所述设定敏感信息的位置对应的部分进行降低辨识度的处理。

2.根据权利要求1所述的语音处理方法，其中，所述获取语音数据与所述确定所述语音数据中的设定敏感信息的位置间还包括：

将所述语音数据分割成多个语音段；且

所述确定所述语音数据中的设定敏感信息的位置包括：根据每个所述语音段中所述设定敏感信息的位置确定所述语音数据中的所述设定敏感信息的位置。

3.根据权利要求1所述的语音处理方法，其中，所述获取语音数据与所述确定所述语音数据中的设定敏感信息的位置间还包括：

将所述语音数据转换为文本数据；

确定所述文本数据中的所述设定敏感信息的位置；且所述确定所述语音数据中的设定敏感信息的位置包括：

根据所述文本数据中的所述设定敏感信息的位置确定所述语音数据中的所述设定敏感信息的位置。

4.根据权利要求3所述的语音处理方法，其中，

所述文本数据为未经过增删变换的未解码文本数据；且所述确定所述语音数据中的设定敏感信息的位置包括：

根据所述未解码文本数据确定所述语音数据中的所述设定敏感信息的位置。

5.根据权利要求3所述的语音处理方法，其中，所述确定所述文本数据中的所述设定敏感信息的位置前还包括：

根据预设位数的数字、预设字或预设符号确定所述设定敏感信息。

6.根据权利要求1至5中任一项所述的语音处理方法，其中，所述对所述语音数据中与所述设定敏感信息的位置对应的部分进行降低辨识度的处理包括：

对所述语音数据中与所述设定敏感信息的位置相邻的位置对应的部分也进行所述降低辨识度的处理。

7.根据权利要求1至5中任一项所述的语音处理方法，其中，对所述语音数据中与所述设定敏感信息的位置对应的部分进行降低辨识度的处理包括：

对所述语音数据中与所述设定敏感信息的位置对应的部分进行消音或替换音频处理。

8.根据权利要求1至5中任一项所述的语音处理方法，其中，所述获取语音数据与所述确定所述语音数据中的设定敏感信息的位置间还包括：

对所述语音数据进行语音去噪和/或语音增强处理。

9.一种语音处理系统，包括计算机可读存储介质、处理器和存储在所述计算机可读存储介质上并可在所述处理器上运行的程序，所述程序被所述处理器执行时实现如权利要求1至8中任一项所述的语音处理方法。

10.一种语音处理装置，包括：

获取模块，用于获取语音数据；

确定模块，用于确定所述语音数据中的设定敏感信息的位置；

处理模块，用于对所述语音数据中与所述设定敏感信息的位置对应的部分进行降低辨识度的处理。