CN109065058B

CN109065058B - 语音通信方法、装置及系统

Info

Publication number: CN109065058B
Application number: CN201811160149.0A
Authority: CN
Inventors: 王庆贺; 王东方; 苏同上; 程磊磊; 宋威; 张扬; 刘宁; 王海涛; 汪军; 李广耀
Original assignee: BOE Technology Group Co Ltd; Hefei Xinsheng Optoelectronics Technology Co Ltd
Current assignee: BOE Technology Group Co Ltd; Hefei Xinsheng Optoelectronics Technology Co Ltd
Priority date: 2018-09-30
Filing date: 2018-09-30
Publication date: 2024-03-15
Anticipated expiration: 2038-09-30
Also published as: US10873661B2; US20200106879A1; CN109065058A

Abstract

本发明公开了一种语音通信方法、装置及系统，涉及通信技术领域，主要目的在于解决现有语音通信过程中，存在安全性较低的问题。本发明的方法主要包括：在发送端获取语音信息；判断所述语音信息是否为预设用户发出的，并在确定该语音信息为预设用户发出时，将所述语音信息发送至对端设备，否则，则不发送所述语音信息；以及，在输出端接收来自对端设备发送的语音信息；采集第一环境信息，并确定所述第一环境信息是否符合语音输出条件；并发送端在确定所述第一环境信息符合语音输出条件时，输出所述语音信息，否则，则不输出所述语音信息。本发明适用于语音通信的过程中。

Description

语音通信方法、装置及系统

技术领域

本发明涉及通信技术领域，特别是涉及一种语音通信方法、装置及系统。

背景技术

在日常生活中，人们经常进行语音通话。当人们进行语音通话时，在很多情况下都是处于较为复杂的语音环境中，例如大街，车站等人流密集且噪音较大的公共场合。

目前，当用户基于现有的语音通信方式进行语音通信时，很多语音信息都是较为敏感的个人信息，然而，在上述环境中，人们语音通话时的语音信息很有可能被周围其他人所获取，这样就导致目前人们在进行语音通话时，语音信息存在被泄露和窃取的可能，从而导致语音通话的安全性易受到影响。

发明内容

有鉴于此，本发明提供的语音通信方法、装置及系统，其目的在于解决现有语音通信过程中，存在安全性较低的问题。

本发明的目的是采用以下技术方案来实现的：

第一方面，本发明提供了一种语音通信方法，应用于发送端，所述方法包括：

获取语音信息；

判断所述语音信息是否为预设用户发出的；

若是，则将所述语音信息发送至对端设备，若否，则不输出所述语音信息。

可选的，所述判断所述语音信息是否为预设用户发出的包括：

判断所述语音信息的音频特征与预设用户的音频特征是否一致；

和/或获取所述语音信息的发出者的面部特征，判断所述面部特征与预设用户的面部特征是否一致；

和/或获取所述语音信息的发出者的动作特征，判断所述动作特征与预设用户的动作特征是否一致。

可选的，在所述将所述语音信息发送至对端设备之前，所述方法还包括：

获取所述发送端所处的语音环境，并根据所述发送端所处的语音环境，对所述语音信息进行优化处理，所述优化处理包括改变音量和/或降噪处理；

所述将所述语音信息发送至对端设备包括：

将所述经优化处理后的语音信息发送至对端设备。

第二方面，本发明提供了一种语音通信方法，应用于输出端，所述方法包括：

接收来自对端设备发送的语音信息；

采集第一环境信息，并确定所述第一环境信息是否符合语音输出条件；

若是，则输出所述语音信息，否则，则不输出所述语音信息。

可选的，所述采集第一环境信息，并确定所述第一环境信息是否符合语音输出条件包括：

判断语音接收者的数量是否唯一；

和/或，

判断语音接收者的面部特征是否与预设接收用户的面部特征一致；

和/或，

判断语音接收者之外的其他用户的距离是否超过预设阈值。

可选的，所述输出所述语音信息包括：

当输出所述语音信息时，采集第二环境信息；

若确定所述第二环境信息不符合语音输出条件，则停止输出所述语音信息并切换输出预设语音；

或者，

若确定所述第二环境信息不符合语音输出条件，则输出干扰叠加语音，所述干扰叠加语音为在所述语音信息中叠加了干扰音频的语音。

可选的，所述输出所述语音信息，包括：

根据所述第一环境信息调整所述语音信息的输出音量，输出调整后的语音信息。

第三方面，本发明提供了一种语音通信装置，应用于发送端，所述装置包括：

获取单元，用于获取语音信息；

判断单元，用于判断所述语音信息是否为预设用户发出的；

发送单元，用于若判断所述语音信息为预设用户发出的，则将所述语音信息发送至输出端，若判断所述语音信息并非是预设用户发出的，则不发送所述语音信息。

可选的，所述获取单元还用于获取所述语音发出者的面部特征和动作特征；

所述判断单元包括：

第一判断模块，用于判断所述语音信息的音频特征与预设用户的音频特征是否一致；第二判断模块，用于判断所述面部特征与预设用户的面部特征是否一致；

第三判断模块，用于判断所述动作特征与预设用户的动作特征是否一致。

可选的，所述装置还包括：

处理单元，用于获取所述发送端所处的语音环境，并根据所述发送端所处的语音环境，对所述语音信息进行优化处理，所述优化处理包括改变音量以及降噪处理；

所述发送单元，还用于将所述经优化处理后的语音信息发送至对端设备。

第四方面，本发明提供了一种语音通信装置，应用于输出端，所述装置包括：

接收单元，用于接收来自对端设备发送的语音信息；

确定单元，用于采集第一环境信息，并确定所述第一环境信息是否符合语音输出条件；

输出单元，用于若确定所述第一环境信息符合语音输出条件，则输出所述语音信息，否则，则不输出所述语音信息。

可选的，所述确定单元包括：

第四判断模块，用于判断语音接收者的数量是否唯一；

第五判断模块，用于判断语音接收者的面部特征是否与预设接收用户的面部特征一致；

第六判断模块，用于判断语音接收者之外的其他用户的距离是否超过预设阈值。

可选的，所述输出单元包括：

采集模块，用于当输出所述语音信息时，采集第二环境信息；

切换输出模块，用于若确定所述第二环境信息不符合语音输出条件，则停止输出所述语音信息并切换输出预设语音；

第一输出模块，用于若确定所述第二环境信息不符合语音输出条件，则输出干扰叠加语音，所述干扰叠加语音为在所述语音信息中叠加了干扰音频的语音。

可选的，所述输出单元还包括：

调整模块，用于根据所述第一环境信息调整所述语音信息的输出音量；

第二输出模块，用于输出调整后的语音信息。。

第五方面，本发明提供了一种语音通信系统，包括：发送端及输出端；

所述发送端，用于获取语音信息，判断所述语音信息是否为预设用户发出的，并当所述语音信息为预设用户发出的时，将所述语音信息发送至输出端，当所述语音信息并非是预设用户发出的，则不发送所述语音信息。

所述输出端，用于接收由所述发送端发送的所述语音信息，采集第一环境信息，并确定所述第一环境信息是否符合语音输出条件，当所述第一环境信息符合语音输出条件时，输出所述语音信息。

第六方面，本发明提供了一种存储介质，所述存储介质存储有计算机程序，所述计算机程序适用于由处理器加载并执行如第一方面、和/或第二方面所述的语音通信方法，否则，则不输出所述语音信息。

借由上述技术方案，本发明提供的语音通信方法、装置及系统，包括发送端及输出端。其中，在发送端通过获取语音信息并判断该语音信息是否为预设用户发出的，并在确定该语音信息为预设用户发出时，对该语音信息进行发送，否则，则不输出所述语音信息。这样能够从发送端实现对语音信息的发出者的身份进行确认，从而确保整体的语音通信过程的安全性。同时，在输出端通过获取第一环境信息并判断是否符合语音输出条件，并在符合语音输出条件时进行语音信息的输出，否则，则不输出所述语音信息。这样，能够从输出端实现对语音信息输出时对当前环境是否符合语音输出条件进行判断，继而在当前环境符合语音输出条件时进行语音信息的输出，从而避免了语音信息被他人获取的可能，继而确保整体的语音通信过程的安全性。

上述说明仅是本发明技术方案的概述，为了能够更清楚了解本发明的技术手段，而可依照说明书的内容予以实施，并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂，以下特举本发明的具体实施方式。

附图说明

通过阅读下文优选实施方式的详细描述，各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的，而并不认为是对本发明的限制。而且在整个附图中，用相同的参考符号表示相同的部件。在附图中：

图1示出了本发明实施例提供的一种语音通信方法的流程图；

图2示出了本发明实施例提供的另一种语音通信方法的流程图；

图3示出了本发明实施例提供的又一种语音通信方法的流程图；

图4示出了本发明实施例提供的一种语音通信装置的组成框图；

图5示出了本发明实施例提供的另一种语音通信装置的组成框图；

图6示出了本发明实施例提供的又一种语音通信装置的组成框图；

图7示出了本发明实施例提供的再一种语音通信装置的组成框图；

图8示出了本发明实施例提供的一种语音通信系统的组成框图。

具体实施方式

下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例，然而应当理解，可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反，提供这些实施例是为了能够更透彻地理解本公开，并且能够将本公开的范围完整的传达给本领域的技术人员。

本发明实施例提供了一种语音通信方法，应用于发送端，如图1所示，所述方法主要包括：

101、获取语音信息。

其中，在本发明实施例中，当发送端检测到外界环境中存在语音时，可以通过发送端中部署的语音采集单元对外部环境中的语音进行获取，即本发明实施例中所述的语音信息。在获取过程中，该语音采集单元可以选取麦克风或电子耳等可用于语音采集的装置来进行语音信息的获取。其中，在本发明实施例中，对于语音信息的检测和获取，其方式可以通过现有的任一种方式来进行，在此不做限定，可根据需要进行选取。

102、判断所述语音信息是否为预设用户发出的。

为了提高语音通信时的安全性，避免因他人对语音通信安全的影响，在本发明实施例中，当前述步骤101获取了语音信息后，还需要对语音信息的发出者进行判断，以检测其是否为机主或设备的持有者。因此，可以根据本步骤所述的方法，判断前述步骤所获取的语音信息是否为预设用户所发出的。

具体的，对于判断该语音信息是否为预设用户发出的，可以包括但不限于以下方式来进行：例如，可以通过当前获取的语音信息中的音频来进行判断。具体的，可以首先从该语音信息提取音频特征，然后与预先录入的机主音频特征进行对比，其中，该机主音频特征可以是从用户预先录入的语音中提取的。由于每一个人的音频特征都是不同的，因此，可以根据当前语音信息的音频特征与预先录入的机主音频特征进行对比，当相似度超过用户设定的阈值时，则说明这两个语音是由同一个人发出的，进而确定当前所获取的语音信息确实是由预设用户所发出的，能够确定当前在语音通信设备的发送端前发出语音的用户为预设用户。

当然，在本发明实施例中，上述判断方式仅为判断语音信息是否为预设用户发出的一种实现方式，还可以通过其他方式如对面部或动作等行为进行判断进行，在此并不做具体的限定，可以根据用户的实际需要进行选取。

103、若所述语音信息为预设用户发出的，则将所述语音信息发送至对端设备，否则，则不发送所述语音信息。

经过步骤102的判断，当判断出所述语音信息确实为预设用户所发出时，则可以确定当前发出语音的用户确实为预设用户，是可以将该语音进行发送的，因此，则可根据本步骤所述的方法，对该语音信息进行发送至对应发送端的输出端中。其中，对于发送过程及传输方式可以选取现有任意中语音传输方式进行，可以为无线传输或有线传输，在此，对于发送方式和传输过程并不做具体的限定，在确保语音信息准确的情况下可选取现有技术中任意一种方式来进行。

而经步骤102的判断，当判断出所述语音信息并非是由预设用户所发出的，则可以确定当前发出语音的不是预设用户，无需将语音信息进行发送。这样，能够避免他人冒用机主来进行语音通信所造成的语音信息泄露的问题，提高了本发明实施所述的语音通信的安全性。

由此，本发明实施例提供的应用于发送端的语音通信方法，在发送端通过获取语音信息并判断该语音信息是否为预设用户发出的，并在确定该语音信息为预设用户发出时，对该语音信息进行发送。这样能够从发送端实现对语音信息的发出者的身份进行确认，避免了他人使用语音设备影响语音通信安全的问题，从而整体上提高了语音通信过程的安全性。并且，当语音信息并非是预设用户发出的，则不发送语音信息，这样能够在避免他人冒用预设用户进行语音通信所导致语音信息泄露的问题，还能够避免无关语音信息的传输，从而减少整体的功耗。

进一步的，依据图2所示的方法，本发明的另一个实施例还提供了一种语音通信方法，应用于输出端，如图2所示，所述方法主要包括：

201、接收来自对端设备发送的语音信息。

在本发明实施例中，所述对端设备可以前述实施例中的发送端，为了便于描述，在本发明实施例中，该输出端的对端设备以前述实施例中的发送端为例。因此，当发送端进行语音信息发送后，可以通过所述输出端进行该语音信息的接收，具体的，接收方式可以选取无线接收或有线接收中任意一种，当然，要确保输出端的语音信息接收方式与发送端的发送方式相匹配，以免出现数据丢失的问题。

202、采集第一环境信息，并确定所述第一环境信息是否符合语音输出条件。

当前述步骤201中接收到了语音信息后，为了提高语音通信的安全性，避免在输出语音信息时出现语音信息被他人偷听、窃取等情况，在输出该语音信息前，还需要对当前环境是否满足输出语音信息进行判断，因此，可以根据本步骤所述的方法，首先采集第一环境信息，然后根据该第一环境信息判断当前的环境状况是否符合预设的语音输出条件。其中，该语音输出条件可以是用户在进行语音通信之前预先设置的，用以界定当前是否具备进行语音输出的条件。其中，确定第一环境信息是否符合语音输出条件的方式可以通过语音接收者的面部识别来进行接收者的身份认定，具体的可以通过面部识别单元对当前位于输出端的语音接收者的面部进行面部特征的采集，然后与预设的接收用户面部特征进行对比，并基于二者之间的相似程度确定二者是否一致，从而实现基于面部特征的接收者身份的确定。当然，在本发明实施例中，对于第一环境信息是否符合语音输出条件的判断方式不仅包括上述方式，还可以包括其他的判断方式，例如还可以通过输出端当前的语音接收者的人数、或者通过接收者附近的其他人的距离等方式进行判断外界环境是否符合输出语音信息的条件。在此，对于判断方式、种类并不做具体的限定，可根据实际需要进行选取。

203、若确定所述第一环境信息符合语音输出条件，则输出所述语音信息，否则，则不输出所述语音信息。

当前述步骤202判断后，当确定第一环境信息符合语音输出条件时，则说明当前输出端附近排除了他人对语音信息安全的影响，可以进行语音输出，在此，则可通过语音输出单元对该语音信息进行输出，具体的，该语音输出单元可以为外置喇叭、耳机等任意种用于输出语音的扬声器。

当前述步骤202判断后，当确定第一环境信息并不符合语音输出条件时，则说明若在当环境下输出语音信息存在被他人获取的可能，因此，可以根据本步骤所述的方法，并不进行语音信息的输出。当然，在接收到由发送端的语音信息后，可以将该语音信息保存在预设的存储介质中，以确保当第一环境信息符合语音输出条件时进行语音信息的输出。

由此，本发明实施例提供的应用于输出端的语音通信方法，在输出端通过获取第一环境信息并判断是否符合语音输出条件，并在符合语音输出条件时进行语音信息的输出，否则，则不输出语音信息。这样，能够从输出端实现对语音信息输出时对当前环境是否符合语音输出条件进行判断，继而在当前环境符合语音输出条件时进行语音信息的输出，而在不符合语音输出条件时，不输出语音信息，这样能够避免语音信息被他人获取的可能，继而确保整体的语音通信过程的安全性。

进一步的，依据图3所示的方法，本发明的又一个实施例还提供了一种语音通信方法，分别应用于发送端及输出端，如图3所示，所述方法主要包括：

301、发送端获取语音信息。

在本发明实施例中，采用发送端及输出端两端进行语音信息通信，其中所述发送端在进行语音信息的获取过程及方式皆与前述实施例中步骤101中的描述一致，在此不再赘述。具体的，在进行语音信息的获取时，可以选用任意种语音输入器件，例如麦克风等。

302、发送端判断所述语音信息是否为预设用户发出的。

在根据前述步骤301获取到语音信息后，为了确保发送端当前的用户确实为机主或允许使用该语音通信发送端的用户，即预设用户，则在本发明实施例中还需要根据所获取的语音信息进行判断和识别，以确认当前的语音信息是否为预设用户发出的。

具体的，在判断该语音信息是否为预设用户发出的可以根据下述方式进行：

第一方面，判断所述语音信息的音频特征与预设用户的音频特征是否一致。具体的，在进行判断时，可以根据当前所获取的所述语音信息中提取音频特征，然后与预先录入的预设用户的音频特征进行对比，基于每个人的音频特征都存在区别，因此，通过音频特征的对比，能够对当前语音信息是否为预设用户所发出的进行判断。其中，在进行判断时，可以通过设置于发送端的语音输入器件进行语音的采集，然后再传输到对应的信息处理器中进行判断和识别。在此，对于信息处理器及语音输入器件在此并不做具体的限定，可以根据实际需要进行选取。

第二方面，获取所述语音信息的发出者的面部特征，并判断所述面部特征与预设用户的面部特征是否一致。具体的，在进行判断时，可以通过对当前发送端前的用户进行面部图像的采集，并从中提取图像的特征，即所述语音信息的发出者的面部特征。然后根据该用户的面部特征与预先录入的预设用户的面部特征进行对比，确认二者是否一致。由于每一个用户的面部特征都是存在区别的，因此，可以通过面部特征来进行用户的识别。其中，在进行面部识别和判断的过程中，可以通过设置于发送端中的图像采集器件进行，例如电子眼，然后将采集到的图像传输至用于图像识别和判断的信息处理器中。

第三方面，获取所述语音信息的发出者的动作特征，并判断所述动作特征与预设用户的动作特征是否一致。具体的，在进行判断时，可以通过设置于发送端的图像采集器件，例如电子眼、摄像头等装置对当前发送端前的用户的动作进行获取，然后将获取到的图像传输至用于进行动作识别的信息处理器中进行识别，以确定当前是否为预设用户。其中，在进行判断前，可以通过机主等预设用户预先录入用于判断的动作或姿势。这样，能够通过动作识别来进行预设用户的识别，不仅能够保证确定结果的准确性，还能够避免机主等预设用户无意中触发语音通信的情况，减少不必要的语音传输，提高语音通信的准确性。

需要说明的是，在上述三种判断方式中，可以根据实际需要选择任意一种方式进行，当然，为了进一步确保判断结果的准确性，还可以将上述方式进行结合，在此，并不做具体的限定，可根据用户需要自行选取。

303、若发送端判断所述语音信息为预设用户发出的，则将所述语音信息发送至输出端，否则，则不发送所述语音信息。

在本发明实施例中，经步骤302判断后，存在两种结果，其一为当前的语音信息并非是预设用户发出的，其二为当前的语音信息时预设用户发出的。

其中，当判断出所述语音信息并非是由预设用户所发出的，则可以确定当前发出语音的不是预设用户，无需将语音信息进行发送，优选的还可以发送提示语音至输出端以提醒接收者。这样，能够避免他人冒用机主来进行语音通信所造成的语音信息泄露的问题，提高了本发明实施所述的语音通信的安全性。

当确定所述语音信息为预设用户所发出的之后，则说明该语音信息时需要进行传输至输出端的，因此，可以根据本步骤所述的方法，将当前的语音信息通过传输器件发送至对应的输出端。

进一步的，由于用户进行本发明实施例所述的语音通信的过程中，语音信息可能受到环境噪音的干扰，在本发明实施例中，在将语音信息发送至输出端之前，还可以先获取发送端所处的语音环境，并根据语音环境来对该语音信息进行相应的优化处理，并将所述经优化处理后的语音信息发送至输出端。具体的该过程可以为：获取所述发送端所处的语音环境，并对语音环境进行判断，判断当前发送端附近是否存在噪音，以及存在噪音时噪音的音量，然后基于所述发送端所处的语音环境，对所述语音信息进行优化处理，其中，在获取发送端所述的语音环境时，获取过程可以基于设置于发送端的麦克风来进行，或者在发送端中单独设置的用于采集环境信息的电子耳等装置进行，具体的，对于采集方式可以根据实际需要选取。同时，对于语音信息进行优化处理的具体方式可以包括：对语音信息进行改变音量的操作以及对语音信息进行降噪处理。在此，改变音量的具体方式包括提高音量或降低音量。例如，当检测到外界的噪音较大时，则可以对当前的语音信息进行降噪处理，并适当提高该语音信息的音量，从而在语音输出时能够确保接收该语音用户能够得到较为准确的语音信息。

304、输出端接收来自对端设备发送的语音信息。

其中，在本发明实施例中，发送语音信息的为所述发送端，因此，在本步骤中输出端所接收语音信息的对端设备实际上即为本发明实施例中，前述步骤中的发送端。由此，当发送端将所采集到的语音信息发送后，可以通过本步骤的方法，由对应的输出端进行接收，其中，输出端在进行接收所述语音信息的过程中，可以选取现有的任意种方式进行，当然，该输出端接收语音信息的方式要与发送端的发送方式相匹配，以避免出现数据丢失的情况。

305、输出端采集第一环境信息，并确定所述第一环境信息是否符合语音输出条件。

在本发明实施例中，为了确保用户在接收语音信息时，避免他人窃听或他人冒用机主等情况，在本步骤中，还需要对当前输出端前的环境进行检测，确定是否符合输出语音信息的条件。

其中，在本发明实施例，该第一环境信息实际上可以理解为在进行语音输出前输出端所处的环境信息，确定第一环境信息是否符合语音输出条件可以按照以下方式进行：

第一方面，判断语音接收者的数量是否唯一。一般来说，在进行语音通话的过程中，可能存在用户在接收时，周围还有其他人的情况，为了确保语音信息不被他人获取，则需要对当前发送端前的接收者的数量进行判断，当数量多于一个时，则说明除了如机主等预设用户外还存在其他人，当前的环境并不符合语音输出条件。具体的，在进行判断的过程中，可以通过设置于输出端的图像采集器件进行，例如摄像头、电子眼等。通过对当前输出端前的用户进行图像采集，并识别用户的数量是否唯一。

第二方面，判断语音接收者的面部特征是否与预设接收用户的面部特征一致。由于每一个人的面部特征都是不同的，因此，基于人脸图像识别可以对用户的身份进行识别，因此，可以通过设置于输出端的图像采集器件对输出端前的用户进行图像采集，然后发送至对应的信息处理器进行图像的提取，并在提取面部特征后与预设用户预先录入的面部特征进行对比，继而实现对语音接收者的身份识别功能。

第三方面，判断语音接收者之外的其他用户的距离是否超过预设阈值。在本发明实施例中，由于在进行语音信息输出时，可能存在其他人在语音通信的预设接收用户的周围，基于声波传输的原理，在语音输出时，需要避免他人偷听的情况，因此，可以通过设置于输出端的图像采集器件，对当前语音接收者之外的其他人的位置进行采集，然后通过计算器件对距离进行计算，并通过预设的处理器对其他用户的距离与预设的距离阈值进行判断，当判断存在小于预设阈值的其他用户时，则说明在实际的语音信息接收者身边还有其他距离较近的其他人，这样，可能存在输出语音后语音被他人窃听的风险。这样，通过对语音接收者之外的其他用户的距离与预设阈值进行判断，能够避免他人距离较近，导致语音被窃听的情况，从而能够保证语音通信的准确性。

在上述三种确定方式中，可以根据实际需要选择任意一种方式进行，当然，为了进一步确保判断结果的准确性，还可以将上述方式进行结合，在此，并不做具体的限定，可根据用户需要自行选取，例如，可以将上述三种方式相结合，当输出端接收到语音信息后，可以首先对输出端前的用户的数量进行判断，当用户唯一时，再判断当前的用户的面部特征是否与预设用户的面部特征是否一致。当确定二者面部特征一致时，再次判断除了当前的用户，附近其他用户的距离是否超过预设阈值。这样，能够通过对语音接收者的数量、面部特征、以及周围他人的距离判断当前的环境是否符合语音输出条件，能够更为准确的确保输出语音信息的安全性。

306、若输出端确定所述第一环境信息符合语音输出条件，则输出所述语音信息，否则，则不输出所述语音信息。

其中，由于语音信息输出的过程中，可能随时出现影响到语音通信安全的情况，例如，突然有其他人来到正在输出语音信息的输出端附近，可能存在正在输出的语音信息被他人听到的情况，因此，为了在进行语音信息输出的过程中，进一步提高语音通信的安全性，还可以当输出所述语音信息时，采集第二环境信息，其中，该第二环境信息可以理解为在进行语音信息输出过程中，输出端所处的环境信息。因此若确定所述第二环境信息不符合语音输出条件，则停止输出所述语音信息，优选的，停止输出所述语音信息并切换输出预设语音，其中，该预设语音可以为系统内预设的、或用户预先录制的，与语音通信无关的语音，这样能够避免当外界环境变化时，他人无法获取到用户正在进行的语音通信。

或者，若确定所述第二环境信息不符合语音输出条件，还可以输出干扰叠加语音，其中，该干扰叠加语音为在所述语音信息中叠加了干扰音频的语音，这样能够在确保用户能够接收到语音信息的同时，他人仅能接收到干扰语音，避免语音泄露所导致的语音通信的安全问题。

进一步的，在进行本发明实施例所述的语音信息的输出过程中，为了使输出的语音能够与环境相适应，还可以在输出之前，通过所获取的输出之前的输出端所处的环境信息进行输出音量的控制，即通过所述第一环境信息来调整所述语音信息的输出音量，并输出调整后的语音信息。这样，能够确保当输出端输出语音之前的外界环境较为安静时，能够以较低的音量进行语音信息的输出，从而避免被他人获取的情况，提高了语音通信的安全性。而当输出端输出语音之前的外界环境较为吵闹时，能够以较大的音量进行语音信息的输出，能够使用户接收语音信息时减少外界的干扰。

进一步的，依据上述方法实施例，本发明的一个实施例还提供了一种语音通信装置，应用于发送端，如图4所示，所述装置主要包括：获取单元41、判断单元42以及发送单元43。其中，

获取单元41，可以用于获取语音信息；

判断单元42，可以用于判断所述获取单元41获取的语音信息是否为预设用户发出的；

发送单元43，可以用于若所述判断单元42判断所述语音信息为预设用户发出的，则将所述语音信息发送至输出端，若所述判断单元42判断所述语音信息并非是预设用户发出的，则不发送所述语音信息。

进一步的，依据上述方法实施例，本发明的另一个实施例还提供了一种语音通信装置，应用于发送端，如图5所示，所述装置主要包括：获取单元51、判断单元52以及发送单元53。其中，

获取单元51，可以用于获取语音信息；

判断单元52，可以用于判断所述获取单元51获取的语音信息是否为预设用户发出的；

发送单元53，可以用于若所述判断单元52判断所述语音信息为预设用户发出的，则将所述语音信息发送至输出端，若所述判断单元52判断所述语音信息并非是预设用户发出的，则不发送所述语音信息。

可选的，所述获取单元51还可以用于获取所述语音发出者的面部特征和动作特征；

所述判断单元52包括：

第一判断模块521，可以用于判断所述语音信息的音频特征与预设用户的音频特征是否一致；

第二判断模块522，可以用于判断所述面部特征与预设用户的面部特征是否一致；

第三判断模块523，可以用于判断所述动作特征与预设用户的动作特征是否一致。

可选的，所述装置还包括：

处理单元54，可以用于获取所述发送端所处的语音环境，并根据所述发送端所处的语音环境，对所述语音信息进行优化处理，所述优化处理包括改变音量以及降噪处理；

所述发送单元53，还可以用于将所述处理单元54优化处理后的语音信息发送至对端设备。

进一步的，依据上述方法实施例，本发明的一个实施例还提供了一种语音通信装置，应用于输出端，如图6所示，所述装置主要包括：接收单元61、确定单元62以及输出单元63。其中，

接收单元61，可以用于接收来自对端设备发送的语音信息；

确定单元62，可以用于采集第一环境信息，并确定所述第一环境信息是否符合语音输出条件；

输出单元63，可以用于若所述确定单元62确定所述第一环境信息符合语音输出条件，则输出所述接收单元61接收到的语音信息，若所述确定单元62确定所述第一环境信息不符合语音输出条件，则不输出所述接收单元61接收到的语音信息。

进一步的，依据上述方法实施例，本发明的另一个实施例还提供了一种语音通信装置，应用于输出端，如图7所示，所述装置主要包括：接收单元71、确定单元72以及输出单元73。其中，

接收单元71，可以用于接收来自对端设备发送的语音信息；

确定单元72，可以用于采集第一环境信息，并确定所述第一环境信息是否符合语音输出条件；

输出单元73，可以用于若所述确定单元72确定所述第一环境信息符合语音输出条件，则输出所述接收单元71接收到的语音信息，若所述确定单元72确定所述第一环境信息不符合语音输出条件，则不输出所述接收单元71接收到的语音信息。

可选的，所述确定单元72包括：

第四判断模块721，可以用于判断语音接收者的数量是否唯一；

第五判断模块722，可以用于判断语音接收者的面部特征是否与预设接收用户的面部特征一致；

第六判断模块723，可以用于判断语音接收者之外的其他用户的距离是否超过预设阈值。

可选的，所述输出单元73包括：

采集模块731，可以用于当输出所述语音信息时，采集第二环境信息；

切换输出模块732，可以用于若确定所述采集模块731采集到的第二环境信息不符合语音输出条件，则停止输出所述语音信息并切换输出预设语音；

第一输出模块733，可以用于若所述采集模块731确定所述第二环境信息不符合语音输出条件，则输出干扰叠加语音，所述干扰叠加语音为在所述语音信息中叠加了干扰音频的语音。

可选的，所述输出单元73还包括：

调整模块734，可以用于根据所述第一环境信息调整所述语音信息的输出音量；

第二输出模块735，输出调整后的语音信息。

进一步的，依据上述方法实施例，本发明的另一个实施例还提供了一种语音通信系统，如图8所示，所述系统主要包括：发送端81及输出端82；

所述发送端81，可以用于获取语音信息，判断所述语音信息是否为预设用户发出的，并当所述语音信息为预设用户发出的时，将所述语音信息发送至输出端82，否则，则不发送所述语音信息。

所述输出端82，可以用于接收由所述发送端81发送的所述语音信息，采集第一环境信息，并确定所述第一环境信息是否符合语音输出条件，当所述第一环境信息符合语音输出条件时，输出所述语音信息，否则，则不输出所述语音信息。

借由上述实施例所述的方案，本发明实施例提供了一种语音通信方法、装置及系统，包括发送端及输出端。其中，在发送端通过获取语音信息并判断该语音信息是否为预设用户发出的，并在确定该语音信息为预设用户发出时，对该语音信息进行发送，否则，则不输出所述语音信息。这样能够从发送端实现对语音信息的发出者的身份进行确认，从而确保整体的语音通信过程的安全性。同时，在输出端通过获取第一环境信息并判断是否符合语音输出条件，并在符合语音输出条件时进行语音信息的输出否则，则不输出所述语音信息。这样，能够从输出端实现对语音信息输出时对当前环境是否符合语音输出条件进行判断，继而在当前环境符合语音输出条件时进行语音信息的输出，从而避免了语音信息被他人获取的可能，继而确保整体的语音通信过程的安全性。

进一步的，在发送端，通过判断所述语音信息的音频特征与预设用户的音频特征是否一致，能够以音频特征的方式实现对发送端所获取的语音信息是否为预设用户发出的判断，同时，通过获取所述语音信息的发出者的面部特征，判断所述面部特征与预设用户的面部特征是否一致，能够以面部特征的方式实现对语音信息是否为预设用户发出的进行判断，另外，通过获取所述语音信息的发出者的动作特征，判断所述动作特征与预设用户的动作特征是否一致，能够以动作特征来实现对语音信息的发出者是否为预设用户进行判断，并且还能够避免机主等预设用户无意中触发语音通信的情况，减少不必要的语音传输。并且，在进行语音信息的发送之前，通过对该语音信息进行优化处理，然后将所述经优化处理后的语音信息发送至输出端，能够实现对语音信息的音量大小进行控制，并减少语音信息中噪声的干扰，确保了语音通信时语音信息的准确性。

此外，在输出端，通过判断语音接收者的数量是否唯一、判断语音接收者的面部特征是否与预设接收用户的面部特征一致、以及判断语音接收者之外的其他用户的距离是否超过预设阈值，能够确保在进行语音输出时，仅令真正的用户实现语音信息的接收，避免了他人冒用或在附近窃听的可能，提高了语音通信的安全性。进一步的，通过输出所述语音信息时，采集第二环境信息，若确定所述第二环境信息不符合语音输出条件，则停止输出所述语音信息并切换输出预设语音，能够避免在语音信息输出的过程中出现他人窃听时，及时停止输出语音信息并输出与语音信息无关的其他语音，避免了被窃听的可能。另外，若确定所述第二环境信息不符合语音输出条件，还可以通过输出干扰叠加语音，能够在使真正的接收者能够听到语音信息的同时，还能确保其他用户仅能够听到干扰语音，使得用户能够在接收到语音信息的同时，又避免了被他人窃听的可能，继而提高了语音通信的安全性。并且，通过根据所述第一环境信息调整所述语音信息的输出音量，并输出调整后的语音信息，能够确保输出的语音信息能够与环境中的背景音量相适应，从而确保了当环境较为嘈杂时以较大音量输出语音信息，使得用户能够获取到准确的语音信息，并在当环境较为安静时，以较小音量输出语音信息，减少被其他人窃听的概率，提高了语音通信的准确性。

进一步的，依据上述方法实施例，本发明的另一个实施例还提供了一种存储介质，所述存储介质存储有计算机程序，所述计算机程序适用于由处理器加载并执行如第一方面、和/或第二方面所述的语音通信方法。

本发明实施例提供的语音通信存储介质中的计算机程序，该计算机程序由处理器执行时能够在发送端通过获取语音信息并判断该语音信息是否为预设用户发出的，并在确定该语音信息为预设用户发出时，对该语音信息进行发送，否则，则不发送所述语音信息。这样能够从发送端实现对语音信息的发出者的身份进行确认，从而确保整体的语音通信过程的安全性。同时，该计算机程序由处理器执行时还能够在输出端通过获取第一环境信息并判断是否符合语音输出条件，并在符合语音输出条件时进行语音信息的输出，否则，则不输出所述语音信息。这样，能够从输出端实现对语音信息输出时对当前环境是否符合语音输出条件进行判断，继而在当前环境符合语音输出条件时进行语音信息的输出，从而避免了语音信息被他人获取的可能，继而确保整体的语音通信过程的安全性。

在上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述的部分，可以参见其他实施例的相关描述。

可以理解的是，上述方法及装置中的相关特征可以相互参考。另外，上述实施例中的“第一”、“第二”等是用于区分各实施例，而并不代表各实施例的优劣。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统，装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

在此处所提供的说明书中，说明了大量具体细节。然而，能够理解，本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中，并未详细示出公知的方法、结构和技术，以便不模糊对本说明书的理解。

类似地，应当理解，为了精简本公开并帮助理解各个发明方面中的一个或多个，在上面对本发明的示例性实施例的描述中，本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而，并不应将该公开的方法解释成反映如下意图：即所要求防护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说，如下面的权利要求书所反映的那样，发明方面在于少于前面公开的单个实施例的所有特征。因此，遵循具体实施方式的权利要求书由此明确地并入该具体实施方式，其中每个权利要求本身都作为本发明的单独实施例。

本领域那些技术人员可以理解，可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件，以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外，可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述，本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。

此外，本领域的技术人员能够理解，尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征，但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如，在下面的权利要求书中，所要求防护的实施例的任意之一都可以以任意的组合方式来使用。

本发明的各个部件实施例可以以硬件实现，或者以在一个或者多个处理器上运行的软件模块实现，或者以它们的组合实现。本领域的技术人员应当理解，可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的语音通信方法及装置中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如，计算机程序和计算机程序产品)。这样的实现本发明的计算机程序可以存储在计算机可读介质上，或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到，或者在载体信号上提供，或者以任何其他形式提供。

应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制，并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中，不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中，这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。

Claims

1.一种语音通信方法，其特征在于，应用于语音通信系统中的发送端，所述方法包括：

获取语音信息；

判断所述语音信息是否为预设用户发出的，所述判断所述语音信息是否为预设用户发出的用于识别所述语音信息的发出者的身份是否为机主或设备的持有者；

若是，则将所述语音信息发送至对端设备，以便所述对端设备在采集到环境信息后，根据所述环境信息是否满足语音输出条件，确定是否输出所述语音信息，若否，则不发送所述语音信息，以提高所述语音通信系统进行语音通信的安全性，所述对端设备为所述语音通信系统中的输出端。

2.根据权利要求1所述的方法，其特征在于，所述判断所述语音信息是否为预设用户发出的包括：

和/或，

获取所述语音信息的发出者的面部特征，判断所述面部特征与预设用户的面部特征是否一致；

和/或，

获取所述语音信息的发出者的动作特征，判断所述动作特征与预设用户的动作特征是否一致。

3.根据权利要求2所述的方法，其特征在于，在所述将所述语音信息发送至对端设备之前，所述方法还包括：

所述将所述语音信息发送至对端设备包括：

将所述经优化处理后的语音信息发送至对端设备。

4.一种语音通信方法，其特征在于，应用于语音通信系统中的输出端，所述方法包括：

接收来自对端设备发送的语音信息，其中，所述语音信息为所述对端设备在判断所述语音信息为预设用户发出的后，向所述输出端发送的，所述对端设备判断所述语音信息是否为所述预设用户发出的用于识别所述语音信息的发出者的身份是否为机主或设备的持有者；

采集第一环境信息，并确定所述第一环境信息是否符合语音输出条件，所述语音输出条件为用户在进行语音通信之前预先设置的，用以界定当前是否具备进行语音输出的条件；

若是，则输出所述语音信息，否则，则不输出所述语音信息，以提高所述语音通信系统进行语音通信的安全性，所述对端设备为所述语音通信系统中的发送端；

所述输出所述语音信息包括：

当输出所述语音信息时，采集第二环境信息；

若确定所述第二环境信息不符合语音输出条件，则停止输出所述语音信息或切换输出预设语音；

或者，

5.根据权利要求4所述的方法，其特征在于，所述采集第一环境信息，并确定所述第一环境信息是否符合语音输出条件包括：

判断语音接收者的数量是否唯一；

和/或，

判断语音接收者之外的其他用户的距离是否超过预设阈值。

6.根据权利要求4或5所述的方法，其特征在于，所述输出所述语音信息，包括：

7.一种语音通信装置，其特征在于，应用于语音通信系统中的发送端，所述装置包括：

获取单元，用于获取语音信息；

判断单元，用于判断所述语音信息是否为预设用户发出的，所述判断所述语音信息是否为预设用户发出的用于识别所述语音信息的发出者的身份是否为机主或设备的持有者；

发送单元，用于若判断所述语音信息为预设用户发出的，则将所述语音信息发送至输出端，以便对端设备在采集到环境信息后，根据所述环境信息是否满足语音输出条件，确定是否输出所述语音信息，若判断所述语音信息并非是预设用户发出的，则不发送所述语音信息，以提高所述语音通信系统进行语音通信的安全性，所述对端设备为所述语音通信系统中的输出端。

8.根据权利要求7所述的装置，其特征在于，所述获取单元还用于获取所述语音发出者的面部特征和动作特征；

所述判断单元包括：

第一判断模块，用于判断所述语音信息的音频特征与预设用户的音频特征是否一致；

第二判断模块，用于判断所述面部特征与预设用户的面部特征是否一致；

9.根据权利要求8所述的装置，其特征在于，所述装置还包括：

10.一种语音通信装置，其特征在于，应用于语音通信系统中的输出端，所述装置包括：

接收单元，用于接收来自对端设备发送的语音信息，其中，所述语音信息为所述对端设备在判断所述语音信息为预设用户发出的后，向所述输出端发送的，所述对端设备判断所述语音信息是否为所述预设用户发出的用于识别所述语音信息的发出者的身份是否为机主或设备的持有者；

确定单元，用于采集第一环境信息，并确定所述第一环境信息是否符合语音输出条件，所述语音输出条件为用户在进行语音通信之前预先设置的，用以界定当前是否具备进行语音输出的条件；

输出单元，用于若确定所述第一环境信息符合语音输出条件，则输出所述语音信息，否则，则不输出所述语音信息，以提高所述语音通信系统进行语音通信的安全性，所述对端设备为所述语音通信系统中的发送端；

所述输出单元包括：

11.根据权利要求10所述的装置，其特征在于，所述确定单元包括：

第四判断模块，用于判断语音接收者的数量是否唯一；

12.根据权利要求10或11所述的装置，其特征在于，所述输出单元还包括：

第二输出模块，用于输出调整后的语音信息。

13.一种语音通信系统，其特征在于，包括：发送端及输出端；

所述发送端，用于获取语音信息，判断所述语音信息是否为预设用户发出的，所述判断所述语音信息是否为预设用户发出的用于识别所述语音信息的发出者的身份是否为机主或设备的持有者，并当所述语音信息为预设用户发出的时，将所述语音信息发送至输出端，当所述语音信息并非是预设用户发出的，则不发送所述语音信息，以提高所述语音通信系统进行语音通信的安全性；

所述输出端，用于接收由所述发送端发送的所述语音信息，采集第一环境信息，并确定所述第一环境信息是否符合语音输出条件，所述语音输出条件为用户在进行语音通信之前预先设置的，用以界定当前是否具备进行语音输出的条件，当所述第一环境信息符合语音输出条件时，输出所述语音信息，否则，则不输出所述语音信息，以提高所述语音通信系统进行语音通信的安全性；所述输出所述语音信息包括：当输出所述语音信息时，采集第二环境信息；若确定所述第二环境信息不符合语音输出条件，则停止输出所述语音信息或切换输出预设语音；或者，若确定所述第二环境信息不符合语音输出条件，则输出干扰叠加语音，所述干扰叠加语音为在所述语音信息中叠加了干扰音频的语音。

14.一种存储介质，其特征在于，所述存储介质存储有计算机程序，所述计算机程序适用于由处理器加载并执行如权利要求1-3中任一项所述的语音通信方法；和/或

所述计算机程序适用于由处理器加载并执行如权利要求4-6中任一项所述的语音通信方法。