CN108540373B

CN108540373B - 即时聊天中语音数据的摘要生成方法、服务器及系统

Info

Publication number: CN108540373B
Application number: CN201810240649.9A
Authority: CN
Inventors: 范大宇
Original assignee: Unisound Intelligent Technology Co Ltd
Current assignee: Unisound Intelligent Technology Co Ltd
Priority date: 2018-03-22
Filing date: 2018-03-22
Publication date: 2020-12-29
Anticipated expiration: 2038-03-22
Also published as: CN108540373A

Abstract

本发明提供了一种即时聊天中语音数据的摘要生成方法，包括：获取即时聊天时终端发送的语音消息，语音消息包括语音数据和语音数据在终端的存储路径；对语音数据进行语音识别，确定语音数据对应的文本信息，并根据文本信息提取语音数据的摘要信息；根据语音识别结果生成语音消息的摘要数据列表，摘要数据列表包括语音数据的摘要信息、语音数据的生成时间、语音数据的终端存储路径和语音数据的时间偏移量；将语音消息的摘要数据列表下发至终端，指示终端根据摘要数据列表检索所需的语音消息。本即时聊天中语音数据的摘要生成方法，生成即时聊天软件中语音消息的摘要信息，根据摘要信息来搜索需要搜索的历史语音消息，提高了搜索的效率，节约了时间。

Description

即时聊天中语音数据的摘要生成方法、服务器及系统

技术领域

本发明涉及语音识别技术领域，特别涉及一种即时聊天中语音数据的摘要生成方法、服务器及系统。

背景技术

目前，即时聊天软件中需要搜索历史消息，但其中语音消息无提示信息，无摘要信息，所以若需要搜索的信息在语音消息中就会很麻烦，浪费了大量的时间。

发明内容

本发明提供一种即时聊天中语音数据的摘要生成方法，生成即时聊天软件中语音消息的摘要信息，根据摘要信息来搜索需要搜索的历史语音消息，提高了搜索的效率，节约了时间。

本发明实施例提供的一种即时聊天中语音数据的摘要生成方法，包括：

获取即时聊天时终端发送的语音消息，所述语音消息包括语音数据和所述语音数据在终端的存储路径；

对所述语音数据进行语音识别，确定所述语音数据对应的文本信息，并根据所述文本信息提取所述语音数据的摘要信息；

根据语音识别结果生成所述语音消息的摘要数据列表，所述摘要数据列表包括所述语音数据的摘要信息、所述语音数据的生成时间、所述语音数据的终端存储路径和所述语音数据的时间偏移量；

将所述语音消息的摘要数据列表下发至所述终端，指示所述终端根据所述摘要数据列表检索所需的语音消息。

其中，将所述语音消息的摘要数据列表下发至所述终端包括：

周期性将生成的所述语音消息的摘要数据列表推送至所述终端；或

接收终端发送的用于获取摘要数据列表的获取请求，将在所述终端上一次发送获取请求与本次发送获取请求之间的时间段内生成的语音消息的摘要数据列表推送至所述终端。

在一个实施例中，即时聊天中语音数据的摘要生成方法还包括：

存储所述语音消息和所述语音消息的摘要数据列表；

接收所述终端发送的语音消息获取请求，将与所述语音消息获取请求相对应的语音消息和语音消息的摘要数据列表下发至所述终端。

在一个实施例中，根据所述文本信息提取所述语音数据的摘要信息包括：

判断所述文本信息包含的字符数是否大于预设阈值；

当所述文本信息包含的字符数不大于预设阈值时，将所述文本信息作为所述语音数据的摘要信息；

当所述文本信息包含的字符数大于预设阈值时，对所述文本信息进行分词处理，并去除所述文本信息中的停用词生成第一文本信息；

判断所述第一文本信息包含的字符数是否大于预设阈值；

当所述第一文本信息包含的字符数不大于预设阈值时，将所述第一文本信息作为所述语音数据的摘要信息；

当所述第一文本信息包含的字符数大于预设阈值时，去除所述第一文本信息中的虚词，并生成第二文本信息，所述虚词包括数量词、介词、连词、助词、感叹词和象声词；

判断所述第二文本信息包含的字符数是否大于预设阈值；

当所述第二文本信息包含的字符数不大于预设阈值时，将所述第二文本信息作为所述语音数据的摘要信息；

当所述第二文本信息包含的字符数大于预设阈值时，选取所述第二文本信息中字符数小于所述预设阈值的信息，将选取出的信息作为第三文本信息，并为所述第三文本信息添加隐藏标记，并将所述第三文本信息作为所述语音数据的摘要信息；所述隐藏标记用于表示所述第三文本信息包含所述语音数据中的部分信息。

本发明还提供一种即时聊天中语音数据的摘要生成服务器，包括：

获取模块，用于获取即时聊天时终端发送的语音消息，所述语音消息包括语音数据和所述语音数据在终端的存储路径；

处理模块，用于对所述语音数据进行语音识别，确定所述语音数据对应的文本信息，并根据所述文本信息提取所述语音数据的摘要信息；

列表生成模块，用于根据语音识别结果生成所述语音消息的摘要数据列表，所述摘要数据列表包括所述语音数据的摘要信息、所述语音数据的生成时间、所述语音数据的终端存储路径和所述语音数据的时间偏移量；

下发模块，用于将所述语音消息的摘要数据列表下发至所述终端，指示所述终端根据所述摘要数据列表检索所需的语音消息。

其中，下发模块用于：

在一个实施例中，服务器还包括：

存储模块，用于存储所述语音消息和所述语音消息的摘要数据列表；

接收模块，用于接收所述终端发送的语音消息获取请求，将与所述语音消息获取请求相对应的语音消息和语音消息的摘要数据列表下发至所述终端。

在一个实施例中，处理模块包括：

第一判断单元，用于判断所述文本信息包含的字符数是否大于预设阈值；

第一处理单元，用于当所述文本信息包含的字符数不大于预设阈值时，将所述文本信息作为所述语音数据的摘要信息；

分词单元，用于当所述文本信息包含的字符数大于预设阈值时，对所述文本信息进行分词处理，并去除所述文本信息中的停用词生成第一文本信息；

第二判断单元，用于判断所述第一文本信息包含的字符数是否大于预设阈值；

第二处理单元，用于当所述第一文本信息包含的字符数不大于预设阈值时，将所述第一文本信息作为所述语音数据的摘要信息；

虚词去除单元，用于当所述第一文本信息包含的字符数大于预设阈值时，去除所述第一文本信息中的虚词，并生成第二文本信息，所述虚词包括数量词、介词、连词、助词、感叹词和象声词；

第三判断单元，用于判断所述第二文本信息包含的字符数是否大于预设阈值；

第三处理单元，用于当所述第二文本信息包含的字符数不大于预设阈值时，将所述第二文本信息作为所述语音数据的摘要信息；

第四处理单元，用于当所述第二文本信息包含的字符数大于预设阈值时，选取所述第二文本信息中字符数小于所述预设阈值的信息，将选取出的信息作为第三文本信息，并为所述第三文本信息添加隐藏标记，并将所述第三文本信息作为所述语音数据的摘要信息；所述隐藏标记用于表示所述第三文本信息包含所述语音数据中的部分信息。

本发明还提供一种即时聊天中语音数据的摘要生成系统，包括：终端和上述任一服务器。

本即时聊天中语音数据的摘要生成方法、服务器及系统，生成即时聊天软件中语音消息的摘要信息，根据摘要信息来搜索需要搜索的历史语音消息，提高了搜索的效率，节约了时间。另外还可运用生成的摘要信息恢复想要恢复的语音消息。

本发明的其它特征和优点将在随后的说明书中阐述，并且，部分地从说明书中变得显而易见，或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。

下面通过附图和实施例，对本发明的技术方案做进一步的详细描述。

附图说明

附图用来提供对本发明的进一步理解，并且构成说明书的一部分，与本发明的实施例一起用于解释本发明，并不构成对本发明的限制。在附图中：

图1为本发明实施例中一种即时聊天中语音数据的摘要生成方法的示意图；

图2为本发明实施例中一种即时聊天中语音数据的摘要生成服务器的示意图；

图3为本发明实施例处理模块的示意图。

具体实施方式

以下结合附图对本发明的优选实施例进行说明，应当理解，此处所描述的优选实施例仅用于说明和解释本发明，并不用于限定本发明。

本发明实施例提供了一种即时聊天中语音数据的摘要生成方法，如图1所示，包括：

S1：获取即时聊天时终端发送的语音消息，语音消息包括语音数据和语音数据在终端的存储路径；语音数据即语音聊天时的录入的声音。

S2：对语音数据进行语音识别，确定语音数据对应的文本信息，并根据文本信息提取语音数据的摘要信息；

S3：根据语音识别结果生成语音消息的摘要数据列表，摘要数据列表包括语音数据的摘要信息、语音数据的生成时间、语音数据的终端存储路径和语音数据的时间偏移量；语音数据的生成时间是语音聊天时开始录入声音的时间；语音数据的时间偏移量是从开始录入声音到声音录入结束的总时间。

S4：将语音消息的摘要数据列表下发至终端，指示终端根据摘要数据列表检索所需的语音消息。

本发明实施例中，可以根据摘要数据列表搜索用户需要的历史语音消息；具体的，根据文本格式的语音数据的摘要信息来搜索需要搜索的历史语音消息；或者通过语音数据的生成时间来搜索，例如，记得想要搜索的语音数据在前天9点左右；可以指定前天8点半和9点半这个时间段进行搜索，将所有发生在这个时间内的语音消息搜索出来。这样就缩小了搜索的语音数据的寻找范围节约了时间。或者，通过语音数据的时间偏移量，例如，记得想要搜索的语音数据是50秒，可以将所有50秒的语音消息搜索出来。这样就缩小了搜索的语音数据的寻找范围节约了时间。

通过上述即时聊天中语音数据的摘要生成方法生成即时聊天软件中语音数据的摘要数据列表，既可以根据摘要数据列表中的语音数据的摘要信息来搜索需要搜索的历史语音消息，也可以通过语音数据的生成时间或语音数据的时间偏移量来搜索需要搜索的历史语音消息，提高了搜索的效率，节约了时间。

其中，将语音消息的摘要数据列表下发至终端包括：

周期性将生成的语音消息的摘要数据列表推送至终端；例如：每隔一分钟将生成的语音消息的摘要数据列表推送至终端；

或

接收终端发送的用于获取摘要数据列表的获取请求，将在终端上一次发送获取请求与本次发送获取请求之间的时间段内生成的语音消息的摘要数据列表推送至终端。将语音消息的摘要数据列表下发至终端，保证在用户运用终端进行搜索历史语音消息时，终端中存有完整的历史语音消息的摘要数据列表，保证搜索的准确与完整。

为了实现恢复终端的历史语音消息的目的，在一个实施例中，即时聊天中语音数据的摘要生成方法还包括：

存储语音消息和语音消息的摘要数据列表；

接收终端发送的语音消息获取请求，将与语音消息获取请求相对应的语音消息和语音消息的摘要数据列表下发至终端。例如，当终端本地存储的语音消息遗失或被删除后，当用户需要最近一个月的聊天记录时，终端可以向服务器发送用于获取一个月内的语音消息的获取请求，进而服务器可以就将一个月内的语音消息和语音消息的摘要数据列表发送给终端。

为实现根据文本信息提取语音数据的摘要信息，在一个实施例中，根据文本信息提取语音数据的摘要信息包括：

判断文本信息包含的字符数是否大于预设阈值；

当文本信息包含的字符数不大于预设阈值时，将文本信息作为语音数据的摘要信息；

当文本信息包含的字符数大于预设阈值时，对文本信息进行分词处理，并去除文本信息中的停用词生成第一文本信息；

判断第一文本信息包含的字符数是否大于预设阈值；

当第一文本信息包含的字符数不大于预设阈值时，将第一文本信息作为语音数据的摘要信息；

当第一文本信息包含的字符数大于预设阈值时，去除第一文本信息中的虚词，并生成第二文本信息，虚词包括数量词、介词、连词、助词、感叹词和象声词；

判断第二文本信息包含的字符数是否大于预设阈值；

当第二文本信息包含的字符数不大于预设阈值时，将第二文本信息作为语音数据的摘要信息；

当第二文本信息包含的字符数大于预设阈值时，选取第二文本信息中字符数小于预设阈值的信息，将选取出的信息作为第三文本信息，并为第三文本信息添加隐藏标记，并将第三文本信息作为语音数据的摘要信息；隐藏标记用于表示第三文本信息包含语音数据中的部分信息。

例如，预设阈值为10，首先判断文本信息包含的字符数是否大于10，当不大于10，直接将文本信息作为语音数据的摘要信息；当文本信息包含的字符数大于10，对文本信息进行分词处理，并去除文本信息中的停用词生成第一文本信息。然后判断第一文本信息包含的字符数是否大于10，当不大于10，将第一文本信息作为语音数据的摘要信息；当第一文本信息包含的字符数大于10，去除第一文本信息中的虚词，并生成第二文本信息；虚词包括介词、连词、助词、语气词。然后判断第二文本信息包含的字符数是否大于10；当第二文本信息包含的字符数不大于10，将第二文本信息作为语音数据的摘要信息；当第二文本信息包含的字符数大于10，选取第二文本信息中字符数小于预设阈值的信息，将选取出的信息作为第三文本信息，并为第三文本信息添加隐藏标记，并将第三文本信息作为语音数据的摘要信息；隐藏标记用于表示第三文本信息包含语音数据中的部分信息。隐藏标记可以用“……”表示。

上述根据文本信息提取语音数据的摘要信息，保证摘要信息包含的字符数在一定范围内，方便搜索。

本发明还提供一种即时聊天中语音数据的摘要生成服务器，如图2所示，包括：

获取模块21，用于获取即时聊天时终端发送的语音消息，语音消息包括语音数据和语音数据在终端的存储路径；

处理模块22，用于对语音数据进行语音识别，确定语音数据对应的文本信息，并根据文本信息提取语音数据的摘要信息；

列表生成模块23，用于根据语音识别结果生成语音消息的摘要数据列表，摘要数据列表包括语音数据的摘要信息、语音数据的生成时间、语音数据的终端存储路径和语音数据的时间偏移量；

下发模块24，用于将语音消息的摘要数据列表下发至终端，指示终端根据摘要数据列表检索所需的语音消息。

通过上述即时聊天中语音数据的摘要生成服务器生成即时聊天软件中语音数据的摘要数据列表，下发至终端。用户在终端处既可以根据摘要数据列表中的语音数据的摘要信息来搜索需要搜索的历史语音消息，也可以通过语音数据的生成时间或语音数据的时间偏移量来搜索需要搜索的历史语音消息，提高了搜索的效率，节约了时间。

其中，下发模块用于：

周期性将生成的语音消息的摘要数据列表推送至终端；或

接收终端发送的用于获取摘要数据列表的获取请求，将在终端上一次发送获取请求与本次发送获取请求之间的时间段内生成的语音消息的摘要数据列表推送至终端。

服务器将语音消息的摘要数据列表下发至终端，保证在用户运用终端进行搜索历史语音消息时，终端中存有完整的历史语音消息的摘要数据列表，保证搜索的准确与完整。

为了实现恢复终端的历史语音消息，在一个实施例中，服务器还包括：

存储模块，用于存储语音消息和语音消息的摘要数据列表；

接收模块，用于接收终端发送的语音消息获取请求，将与语音消息获取请求相对应的语音消息和语音消息的摘要数据列表下发至终端。

当终端处的历史语音信息删除时，通过服务器可以恢复在终端的历史语音信息。

为实现根据文本信息提取语音数据的摘要信息，在一个实施例中，处理模块，如图3所示，包括：

第一判断单元31，用于判断文本信息包含的字符数是否大于预设阈值；

第一处理单元32，用于当文本信息包含的字符数不大于预设阈值时，将文本信息作为语音数据的摘要信息；

分词单元33，用于当文本信息包含的字符数大于预设阈值时，对文本信息进行分词处理，并去除文本信息中的停用词生成第一文本信息；

第二判断单元34，用于判断第一文本信息包含的字符数是否大于预设阈值；

第二处理单元35，用于当第一文本信息包含的字符数不大于预设阈值时，将第一文本信息作为语音数据的摘要信息；

虚词去除单元36，用于当第一文本信息包含的字符数大于预设阈值时，去除第一文本信息中的虚词，并生成第二文本信息，虚词包括数量词、介词、连词、助词、感叹词和象声词；

第三判断单元37，用于判断第二文本信息包含的字符数是否大于预设阈值；

第三处理单元38，用于当第二文本信息包含的字符数不大于预设阈值时，将第二文本信息作为语音数据的摘要信息；

第四处理单元39，用于当第二文本信息包含的字符数大于预设阈值时，选取第二文本信息中字符数小于预设阈值的信息，将选取出的信息作为第三文本信息，并为第三文本信息添加隐藏标记，并将第三文本信息作为语音数据的摘要信息；隐藏标记用于表示第三文本信息包含语音数据中的部分信息。

例如，预设阈值为10，首先第一判断单元判断文本信息包含的字符数是否大于10，当不大于10，第一处理单元直接将文本信息作为语音数据的摘要信息；当文本信息包含的字符数大于10，分词单元对文本信息进行分词处理，并去除文本信息中的停用词生成第一文本信息。然后第二判断单元判断第一文本信息包含的字符数是否大于10，当不大于10，第二处理单元将第一文本信息作为语音数据的摘要信息；当第一文本信息包含的字符数大于10，虚词去除单元去除第一文本信息中的虚词，并生成第二文本信息。然后第三判断单元判断第二文本信息包含的字符数是否大于10；当第二文本信息包含的字符数不大于10，第三处理单元将第二文本信息作为语音数据的摘要信息；当第二文本信息包含的字符数大于10，第四处理单元选取第二文本信息中字符数小于预设阈值的信息，将选取出的信息作为第三文本信息，并为第三文本信息添加隐藏标记，并将第三文本信息作为语音数据的摘要信息；隐藏标记用于表示第三文本信息包含语音数据中的部分信息。隐藏标记可以用“……”表示。

上述处理单元根据文本信息提取语音数据的摘要信息，保证摘要信息包含的字符数在一定范围内，方便搜索。

本发明还提供一种即时聊天中语音数据的摘要生成系统，包括：终端和上述任一上述的服务器。该系统可以生成即时聊天软件中语音消息的摘要信息，根据摘要信息来搜索需要搜索的历史语音消息，提高了搜索的效率，节约了时间。另外还可运用生成的摘要信息恢复想要恢复的语音消息。

显然，本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样，倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内，则本发明也意图包含这些改动和变型在内。

Claims

1.一种即时聊天中语音数据的摘要生成方法，其特征在于，包括：

将所述语音消息的摘要数据列表下发至所述终端，指示所述终端根据所述摘要数据列表检索所需的语音消息；

所述根据所述文本信息提取所述语音数据的摘要信息包括：

判断所述文本信息包含的字符数是否大于预设阈值；

判断所述第一文本信息包含的字符数是否大于预设阈值；

判断所述第二文本信息包含的字符数是否大于预设阈值；

2.如权利要求1所述的方法，其特征在于，所述将所述语音消息的摘要数据列表下发至所述终端包括：

3.如权利要求1所述的方法，其特征在于，还包括：

存储所述语音消息和所述语音消息的摘要数据列表；

4.一种即时聊天中语音数据的摘要生成服务器，其特征在于，包括：

下发模块，用于将所述语音消息的摘要数据列表下发至所述终端，指示所述终端根据所述摘要数据列表检索所需的语音消息；

所述处理模块包括：

5.如权利要求4所述的服务器，其特征在于，所述下发模块用于：

6.如权利要求4所述的服务器，其特征在于，还包括：

7.一种即时聊天中语音数据的摘要生成系统，其特征在于，包括：终端和如权利要求4-6任一所述的服务器。