CN107948417A

CN107948417A - 一种语音数据监控的方法、装置、终端及存储介质

Info

Publication number: CN107948417A
Application number: CN201711173596.5A
Authority: CN
Inventors: 周燕红
Original assignee: Individual
Current assignee: Individual
Priority date: 2017-11-22
Filing date: 2017-11-22
Publication date: 2018-04-20

Abstract

本发明实施例公开了一种语音数据监控的方法、装置、终端及存储介质，其中，所述方法包括：基于预设的待调整语句数据库，对发送端发送的语音数据进行监测，并获取所述语音数据中的情绪变化信息；根据所述情绪变化信息判断在预设时间内的情绪变化的信息值是否达到预设的变化阈值；若是，则根据所述情绪变化信息生成提示信号并发送至发送端，并按照预设的标准语音格式，对所述语音数据进行调整；将调整后的语音数据发送至接收端以实现监控用户在通话过程中的情绪变化，提醒用户克制情绪，提高通话质量，增强终端的用户体验效果。

Description

一种语音数据监控的方法、装置、终端及存储介质

技术领域

本发明实施例涉及电子技术领域，尤其涉及一种语音数据监控的方法、装置、终端及存储介质。

背景技术

现代通信技术的快速发展，极大的扩展了人们的工作范围，手机等移动终端逐渐成为人与人之间沟通和交流的最重要手段之一。当用户使用手机等移动终端与他人进行语音通话，解决工作和生活中大量繁杂事务时，难免会出现情绪激动或失控的情形，从而影响沟通效果，甚至可能会造成不可挽回的后果。

现在的移动终端中的通讯应用程序(即时的电话功能，非即时的如微信语聊功能)，都没有对通话中说的话以及表现出来的情绪进行合适性提醒，无法使用户意识到沟通中存在的问题以进行及时的改善。

发明内容

本发明提供一种语音数据监控的方法、装置、终端及存储介质，以实现监控用户在通话过程中的情绪变化，提醒用户克制情绪，提高通话质量，增强终端的用户体验效果。

第一方面，本发明实施例提供了一种语音数据监控的方法，包括：基于预设的待调整语句数据库，对发送端发送的语音数据进行监测，并获取所述语音数据中的情绪变化信息；

根据所述情绪变化信息判断在预设时间内的情绪变化的信息值是否达到预设的变化阈值；

若是，则根据所述情绪变化信息生成提示信号并发送至发送端，并按照预设的标准语音格式，对所述语音数据进行调整；

将调整后的语音数据发送至接收端。

第二方面，本发明实施例还提供了一种语音数据监控装置，包括：

监测获取模块，用于基于预设的待调整语句数据库，对发送端发送的语音数据进行监测，并获取所述语音数据中的情绪变化信息；

变化阈值判断模块，用于根据所述情绪变化信息判断在预设时间内的情绪变化的信息值是否达到预设的变化阈值；

提示调整模块，用于在预设时间内的情绪变化的信息值达到预设的变化阈值时，根据所述情绪变化信息生成提示信号并发送至发送端，并按照预设的标准语音格式，对所述语音数据进行调整；

语音数据发送模块，用于将调整后的语音数据发送至接收端。

第三方面，本发明实施例还提供了一种终端，所述终端包括：

一个或多个处理器；

存储装置，用于存储一个或多个程序，

当所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现上述所涉及的任一所述的语音数据监控方法。

第四方面，本发明实施例还提供了一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现上述所涉及的任一所述的语音数据监控方法。

本发明实施例通过对语音数据进行情绪分析、语音监测，提醒用户克制情绪，以帮助用户及时发现问题，提高通话质量，改善沟通方式，起到改善沟通效果的作用。

附图说明

图1是本发明实施例一提供的一种语音数据监控的方法的流程图；

图2是本发明实施例二提供的一种语音数据监控装置的示意图；

图3是本发明实施例三提供的一种终端的结构示意图。

具体实施方式

下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是，此处所描述的具体实施例仅仅用于解释本发明，而非对本发明的限定。另外还需要说明的是，为了便于描述，附图中仅示出了与本发明相关的部分而非全部结构。

实施例一

图1为本发明实施例一提供的一种语音数据监控的方法的流程图，本实施例可适用于监控语音数据的情况，该方法可以由语音数据监控装置来执行，该装置可以由软件和/或硬件来实现，一般可集成在终端中，该方法包括如下步骤：

S110、基于预设的待调整语句数据库，对发送端发送的语音数据进行监测，并获取所述语音数据中的情绪变化信息。

在本发明的一个实施例中，可选的，基于预设的待调整语句数据库，对发送端发送的语音数据进行监测包括：提取上述语音数据中的特征参数；基于上述特征参数与上述待调整语句数据库中存储的特征参数是否匹配，对上述语音数据进行监测；和/或，提取上述语音数据中的语音词汇；基于上述词汇与上述待调整语句数据库中存储的预设语音词汇是否匹配，对上述语音数据进行监测。通过上述实施方式，实现了对发送端是否处于非正常情绪状态的监测，为后续对上述情况下的发送端发送的语音数据进行调整提供了基础。

本实施例中所描述的情绪变化信息可包括：人体温度变化数据、脸色变化数据、通话音量变化数据等数据中的一种或者多种。

在本发明的一个可选的实施例中，通过终端传感器采集温度、或者脸色、或者通话音量，并处理得到在预设时间内的温度变化数据、或者脸色变化数据、或者音量变化数据；其中，所述终端传感器，包括：温度传感器、摄像传感器、音频传感器中至少一种。

具体的，可通过手机的温度传感器采集用户在通话过程中面部或者耳根部的温度，并根据采集到的温度数据处理得到相应的温度变化数据，例如，可根据采集到的温度处理得到用户在预设时间(比如2秒)内的温度变化数据，进而可根据用户在预设时间内的温度变化数据来判断用户的情绪变化。此外，由于用户处于生气状态或者正要生气的状态时脸色会变化，例如用户面部或者耳根部的颜色会变红，故此还可通过手机的摄像传感器(例如手机的前置摄像头)采集用户在通话过程中的面部或者耳根部的图片，通过图片处理来判断用户在预设时间(例如2秒)内的脸色变化，进而根据用户在预设时间内的脸色变化数据来判断用户的情绪变化。由于用户处于生气或者正要生气的状态时，情绪会比较激动，说话的声音也会比较大，甚至会用吼的方式来发泄情绪，故此，可通过手机的音频传感器(例如手机的麦克风)来采集用户在通话过程中说话的音量，并根据采集到的音量数据判断用户在预设时间(例如2秒)内的音量变化数据，以通过用户通话的音量变化来判断用户的情绪变化。

S120、根据所述情绪变化信息判断在预设时间内的情绪变化的信息值是否达到预设的变化阈值。

在本发明的一个实施例中，可选的，根据温度变化数据判断在所述预设时间内温度变化值是否达到预设的温度变化阈值；或根据脸色变化数据判断在所述预设的时间内脸色变化值是否达到预设的脸色变化阈值；或若温度变化值或者脸色变化值达到预设的变化阈值，则根据音量变化数据判断在所述预设时间内的音量变化值是否达到预设的音量变化阈值，若是，则判定在预设时间内的情绪变化信息值达到预设的情绪变化信息阈值。

具体的，手机通过其内置温度传感器、摄像头、麦克风采集到用户在预设的通话时间内面部或者耳根部的温度变化数据、脸色变化数据以及通话音量的变化数据之后则可根据采集到的数据判断用户的情绪变化。具体的，可通过多次实验判断用户情绪平和时和生气或者正要生气时面部或者耳根部的温度变化、脸色变化以及通话声音变化等情况，并预先设定一个预设时间内用户的面部或者耳根部的温度变化阈值，面部或者耳根部的脸色变化阈值，通话音量变化阈值，当监控到用户在通话过程中面部或者耳根部的温度变化、或者脸色变化、或者通话音量变化达到预设的变化阈值时，则可判断该用户处于生气状态或者正要生气，进而可进行进一步处理。

在本发明的一个实施例中，当用户直接通过手机的听筒和麦克风进行通话(即没有带耳机)时，由于手机在通话过程中对用户面部或者耳根部的辐射比较大，用户通话时间长了可能会使得用户的面部或者耳根部发热，脸色发红，此时如果先通过用户面部或者耳根部的温度变化和用户的脸色变化做判断，或者用户面部或者耳根部的温度变化或脸色变化、通话音量变化中任意一个情绪变化信息进行判断，则可能会带来较大的误差，引起不必要的资源浪费。故此，当用户直接通过手机听筒和麦克风进行通话时，则可通过手机听筒附近的手机内置温度传感器采集用户的面部或者耳根部的温度，并通过手机内相应的处理模块处理得到用户面部或者耳根部的温度变化数据，进而判断在预设时间内用户的面部或者耳根部的温度变化值是否达到预设的温度变化阈值。此外，还可通过手机的前置摄像头等摄像传感器采集用户面部或者耳根部的照片，通过对采集到的照片的处理得到用户面部或者耳根部的脸色变化数据，并根据处理得到的数据判断用户的面部或者耳根部的脸色变化值是否达到预设的脸色变化阈值。同时，还要根据手机的音频传感器(例如麦克风)采集到的通话音量变化数据判断在预设时间内用户的通话音量变化值是否达到预设的音量变化阈值。如果判断得知上述用户的面部或者耳根部的温度变化值和脸色变化值，以及用户的通话音量变化值均达到预设的变化阈值，则可判断用户此时的情绪处于异常状态，即用户此时可能处于生气状态或者正要生气，进而可根据用户的情绪变化信息做进一步处理，以通知用户或者对方克制情绪。

S130、若在预设时间内的情绪变化的信息值达到预设的变化阈值，则根据所述情绪变化信息生成提示信号并发送至发送端，并按照预设的标准语音格式，对所述语音数据进行调整。

在监测到发送端发送的语音数据需要调整，即发送端处于非正常情绪状态之后，需要对该语音数据进行调整，对于具体的调整策略，可以通过多种方式实现，只要能够将处于非正常情绪状态的发送端发送的语音数据调整为正常状态下的语音数据即可。

在本发明的一个实施例中，可选的，对所述语音数据的特征参数进行提取，根据所述特征参数，获得语音情绪；对所述语音数据的语音内容进行分解，获得语音词汇；基于所述语音词汇与所述待调整语句数据库中存储的预设语音词汇是否匹配，对所述语音数据进行监测。

其中，特征参数可以是用户在处于非正常情绪状态下的特征参数，所述特征参数包括但不限于语速、平均基频、强度参数；所述语音情绪包括但不限于悲伤、高兴、惊讶、生气。

上述语音词汇可以是用户在处于非正常情绪状态下的不雅词汇。当然，上述特征参数也可以与正常情绪状态下的用户所具备的特征参数进行对比，在二者不匹配时，对语音数据进行调整。对于正常情绪状态下的特征参数，以及非正常状态下的特征参数，可以存储在预设的待调整语句数据库中，从而提高上述对比操作的执行效率和执行准确度。

本发明实施例还提供了另外一种调整方式，在语句调整数据库中搜索，是否存在与预设语音词汇相对应的礼貌词汇；如果存在，则根据礼貌词汇替换预设语音词汇。

S140、将调整后的语音数据发送至接收端。

在本发明的一个实施例中，经过调整后的语音数据能够避免不良情绪对沟通交流的不利影响，有利于维护个人形象。另外，向发送端发送提示信号，以及对语音数据进行监测，这两个动作的执行时机并无限定。例如，可以先向发送端发送提示信号，在得到发送端的用户允许的情况下，对语音数据进行调整；或者，向发送端发送提示信号和对语音数据进行监测同时执行。即，发送端的用户可以设置为自动执行语音数据的调整操作，也可以设置一个确认步骤，在接收到提示信号后，确认是否执行语音数据的调整操作。具体如何设置可以根据实际情况确定。

在本发明的一个的实施方式中，手机根据上述用户的体温变化、脸色变化以及通话音量变化判断得知用户处于情绪异常状态时，则可根据上述用户的情绪变化信息生成提示信号输出至手机提示器，提醒用户或者对方克制情绪。具体的，上述手机提示器，可包括：手机屏幕、手机喇叭、手机振动器等，上述提示信号，可包括：屏幕亮度、手机铃声或者振动等。具体实现中，当判断得知用户处于情绪异常状态，则可根据获取到的用户的脸色变化数据或者通话音量变化数据等生成屏幕亮度信号(例如屏幕闪烁信号)，或者手机铃声、振动等信号，通过手机屏幕或者手机喇叭、手机振动器通知用户或者通话双方，告知用户或者对方该用户此时的情绪状态，用户可根据手机的提示信息克制情绪，对方也可根据提示信息获知该用户的情绪，安抚该用户情绪，以避免无谓的争吵或者误会。具体的，当获取到用户的脸色变化值比较大，或者通话音量变化值比较大时，则可通过手机屏幕输出比较亮的提示信号，或者通过手机喇叭输出音量比较大的铃声，用户情绪变化不大时，则可输出较为缓和的提示信号。

实施例二

图2是本发明实施例二提供的一种语音数据监控装置的示意图，本发明实施例所提供的语音数据监控装置可执行本发明任意实施例所提供的语音数据监控方法，具备执行方法相应的功能模块和有益效果。

所述装置包括：

监测获取模块210，用于基于预设的待调整语句数据库，对发送端发送的语音数据进行监测，并获取所述语音数据中的情绪变化信息。

变化阈值判断模块220，用于根据所述情绪变化信息判断在预设时间内的情绪变化的信息值是否达到预设的变化阈值。

提示调整模块230，用于在预设时间内的情绪变化的信息值达到预设的变化阈值时，根据所述情绪变化信息生成提示信号并发送至发送端，并按照预设的标准语音格式，对所述语音数据进行调整。

语音数据发送模块240，用于将调整后的语音数据发送至接收端。

进一步的，监测获取模块210，用于通过终端传感器采集温度、或者脸色、或者通话音量，并处理得到在预设时间内的温度变化数据、或者脸色变化数据、或者音量变化数据；其中，所述终端传感器，包括：温度传感器、摄像传感器、音频传感器中至少一种。

进一步的，变化阈值判断模块220，用于根据温度变化数据判断在所述预设时间内温度变化值是否达到预设的温度变化阈值；或

根据脸色变化数据判断在所述预设的时间内脸色变化值是否达到预设的脸色变化阈值；或

若温度变化值或者脸色变化值达到预设的变化阈值，则根据音量变化数据判断在所述预设时间内的音量变化值是否达到预设的音量变化阈值，若是，则判定在预设时间内的情绪变化信息值达到预设的情绪变化信息阈值。

进一步的，提示调整模块230，用于在所述语句调整数据库中搜索，是否存在与所述预设语音词汇相对应的礼貌词汇；如果存在，则根据所述礼貌词汇替换所述预设语音词汇。

进一步的，所述特征参数包括语速、平均基频、强度参数；所述语音情绪包括悲伤、高兴、惊讶、生气。

所述装置还包括：

语音数据检测模块250，用于对所述语音数据的特征参数进行提取，根据所述特征参数，获得语音情绪；

对所述语音数据的语音内容进行分解，获得语音词汇；

基于所述语音词汇与所述待调整语句数据库中存储的预设语音词汇是否匹配，对所述语音数据进行监测。

提示信号发送模块260，用于向所述发送端发送提示信号。

实施例三

图3为本发明实施例三提供的一种终端的结构示意图。图3示出了适于用来实现本发明实施方式的终端312的框图。图3显示的终端312仅仅是一个示例，不应对本发明实施例的功能和使用范围带来任何限制。

如图3所示，终端312以通用计算设备的形式表现。终端312的组件可以包括但不限于：一个或者多个处理器316，存储装置328，连接不同系统组件(包括存储装置328和处理器316)的总线318。

总线318表示几类总线结构中的一种或多种，包括存储器总线或者存储器控制器，外围总线，图形加速端口，处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说，这些体系结构包括但不限于工业标准体系结构(ISA)总线，微通道体系结构(MAC)总线，增强型ISA总线、视频电子标准协会(VESA)局域总线以及外围组件互连(PCI)总线。

终端312典型地包括多种计算机系统可读介质。这些介质可以是任何能够被终端312访问的可用介质，包括易失性和非易失性介质，可移动的和不可移动的介质。

存储装置328可以包括易失性存储器形式的计算机系统可读介质，例如随机存取存储器(RAM)330和/或高速缓存存储器332。终端312可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例，存储系统334可以用于读写不可移动的、非易失性磁介质(图3未显示，通常称为“硬盘驱动器”)。尽管图3中未示出，可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器，以及对可移动非易失性光盘(例如CD-ROM，DVD-ROM或者其它光介质)读写的光盘驱动器。在这些情况下，每个驱动器可以通过一个或者多个数据介质接口与总线318相连。存储装置328可以包括至少一个程序产品，该程序产品具有一组(例如至少一个)程序模块，这些程序模块被配置以执行本发明各实施例的功能。

具有一组(至少一个)程序模块326的程序336，可以存储在例如存储装置328中，这样的程序模块326包括但不限于操作系统、一个或者多个应用程序、其它程序模块以及程序数据，这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块326通常执行本发明所描述的实施例中的功能和/或方法。

终端312也可以与一个或多个外部设备314(例如键盘、指向设备、摄像头、显示器324等)通信，还可与一个或者多个使得用户能与该终端312交互的设备通信，和/或与使得该终端312能与一个或多个其它计算设备进行通信的任何设备(例如网卡，调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口322进行。并且，终端312还可以通过网络适配器320与一个或者多个网络(例如局域网(LAN)，广域网(WAN)和/或公共网络，例如因特网)通信。如图所示，网络适配器320通过总线318与终端312的其它模块通信。应当明白，尽管图中未示出，可以结合终端312使用其它硬件和/或软件模块，包括但不限于：微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。

处理器316通过运行存储在存储装置328中的程序，从而执行各种功能应用以及数据处理，例如实现本发明上述实施例所提供的语音数据监控方法。

通过所述终端对语音数据进行情绪分析、语音监测，提醒用户克制情绪，以帮助用户及时发现问题，提高通话质量，改善沟通方式，起到改善沟通效果的作用。

实施例四

本发明实施例四还提供一种存储计算机程序的计算机存储介质，所述计算机程序在由计算机处理器执行时用于执行本发明上述实施例任一所述的语音数据监控方法。

本发明实施例的计算机存储介质，可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括：具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中，计算机可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。

计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式，包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质，该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。

计算机可读介质上包含的程序代码可以用任何适当的介质传输，包括——但不限于无线、电线、光缆、RF等等，或者上述的任意合适的组合。

可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码，所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++，还包括常规的过程式程序设计语言——诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中，远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机，或者，可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。

注意，上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解，本发明不限于这里所述的特定实施例，对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此，虽然通过以上实施例对本发明进行了较为详细的说明，但是本发明不仅仅限于以上实施例，在不脱离本发明构思的情况下，还可以包括更多其他等效实施例，而本发明的范围由所附的权利要求范围决定。

Claims

1.一种语音数据监控的方法，其特征在于，包括：

基于预设的待调整语句数据库，对发送端发送的语音数据进行监测，并获取所述语音数据中的情绪变化信息；

将调整后的语音数据发送至接收端。

2.根据权利要求1所述的方法，其特征在于，所述获取所述语音数据中的情绪变化信息，包括：

通过终端传感器采集温度、或者脸色、或者通话音量，并处理得到在预设时间内的温度变化数据、或者脸色变化数据、或者音量变化数据；其中，所述终端传感器，包括：温度传感器、摄像传感器、音频传感器中至少一种。

3.根据权利要求1-2任一所述的方法，其特征在于，所述根据所述情绪变化信息判断在预设时间内的情绪变化的信息值是否达到预设的变化阈值，包括：

根据温度变化数据判断在所述预设时间内温度变化值是否达到预设的温度变化阈值；或

4.根据权利要求1所述的方法，其特征在于，包括：

对所述语音数据的特征参数进行提取，根据所述特征参数，获得语音情绪；

对所述语音数据的语音内容进行分解，获得语音词汇；

5.根据权利要求1所述的方法，其特征在于，按照设定的标准语音格式对所述语音数据进行调整包括：

在所述语句调整数据库中搜索，是否存在与所述预设语音词汇相对应的礼貌词汇；如果存在，则根据所述礼貌词汇替换所述预设语音词汇。

6.根据权利要求4所述的方法，其特征在于，所述特征参数包括语速、平均基频、强度参数；所述语音情绪包括悲伤、高兴、惊讶、生气。

7.权利要求1所述的方法，其特征在于，在对所述语音数据进行调整之后，所述方法还包括：

向所述发送端发送提示信号。

8.一种语音数据监控装置，其特征在于，包括：

9.一种终端，其特征在于，所述终端包括：

一个或多个处理器；

存储装置，用于存储一个或多个程序，

当所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现如权利要求1-7中任一所述的语音数据监控方法。

10.一种计算机存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时实现如权利要求1-7中任一所述的语音数据监控方法。