CN109842712B

CN109842712B - 通话记录生成的方法、装置、计算机设备和存储介质

Info

Publication number: CN109842712B
Application number: CN201910185524.5A
Authority: CN
Inventors: 陆小琪
Original assignee: Guizhou Fortuneship Technology Co ltd
Current assignee: Shenzhen waterward Software Technology Co.,Ltd.
Priority date: 2019-03-12
Filing date: 2019-03-12
Publication date: 2021-07-20
Anticipated expiration: 2039-03-12
Also published as: CN109842712A

Abstract

本申请涉及语音技术领域，特别涉及一种通话记录生成的方法、装置、计算机设备和存储介质。所述方法包括：获取用户的第二语音数据及与用户通话的远程用户的第一语音数据；将第一语音数据转换成第一文字信息，将第二语音数据转换成第二文字信息；分别将第一文字信息与第二文字信息按照每一段语音的开始通话的时间点进行排序生成通话内容文本；获取用户与远程用户建立通话的第一时间点，以及获取用户和远程用户的手机号码；将第一时间点、用户和远程用户的手机号码和通话内容文本生成通话记录，并将通话记录保存于服务器。解决现有的通话记录中没有记录通话内容，通话过后用户不能获知关于通话记录对应的通话内容的问题。

Description

通话记录生成的方法、装置、计算机设备和存储介质

技术领域

本申请涉及语音技术领域，特别涉及一种通话记录生成的方法、装置、计算机设备和存储介质。

背景技术

通话记录是指固定电话用户、移动电话用户发起的主叫通话、被叫通话、主叫短信、被叫短信、漫游通话等通话行为在运营商交换机里记录的各种信息。在现有技术中，双方进行通话之后，在通话记录中仅记录联系人的名称、手机号码及通话时间，并没有记录通话内容，过一段时间之后，用户在看到当时的通话记录，很难想起当前的通话内容，可能会使用户遗忘一些重要的通话信息。另外，现有的通话记录中没有包括通话内容，是由于通话内容是语音信息，存储语音信息需要占用较大的存储容量，会导致手机的存储容量不够用。

申请内容

针对现有技术不足，本申请提出一种通话记录生成的方法、装置、计算机设备和存储介质，旨在解决现有的通话记录中没有记录通话内容，通话过后用户不能获知关于通话记录对应的通话内容的问题。

本申请提出的技术方案是：

一种通话记录生成的方法，所述方法包括：

获取用户的第二语音数据及与所述用户通话的远程用户的第一语音数据；

将所述第一语音数据转换成第一文字信息，将所述第二语音数据转换成第二文字信息；

分别将所述第一文字信息与所述第二文字信息按照每一段语音的开始通话的时间点进行排序生成通话内容文本；

获取所述用户与所述远程用户建立通话的第一时间点，以及获取所述用户和所述远程用户的手机号码；

将所述第一时间点、所述用户和所述远程用户的手机号码和所述通话内容文本生成通话记录，并将所述通话记录保存于服务器。

进一步地，在所述获取用户的第二语音数据及与所述用户通话的远程用户的第一语音数据的步骤中，包括：

通过麦克风阵列采集用户的通话语音信息，并对所述用户的通话语音信息中的每一段语音的开始通话的时间点进行标记，获得多路语音数据；

获取与所述用户通话的远程用户的通话语音信息及所述远程用户的通话语音信息中的每一段语音对应的开始通话的时间点，获得第一语音数据；

将所述多路语音数据合成一路语音数据，获得第二语音数据。

进一步地，在所述将所述多路语音数据合成一路语音数据，获得第二语音数据的步骤中，包括：

将所述多路语音数据中每一路语音数据分成不同时间点的多段语音；

将所述多段语音在同一时间点的各段语音进行噪声比较，根据比较结果，从所述各段语音中选取噪声最低的一段语音，获得多段目标语音；

将所述多段目标语音进行消噪处理，并按照时间顺序合成一路语音数据，获得第二语音数据。

进一步地，在所述将所述第二语音数据转换成第二文字信息的步骤中，包括：

识别所述第二语音数据中的声纹特征；

将所述第二语音数据转换成文字信息，并根据预设声纹特征与标注的关系表对所述文字信息进行标注，获得第二文字信息。

进一步地，在所述将所述第一时间点、所述用户和所述远程用户的手机号码和所述通话内容文本生成通话记录，并将所述通话记录保存于服务器的步骤之后，包括：

向所述服务器发送查询请求信息；

接收所述服务器根据所述查询请求信息发送的对应的第一通话记录；

接收当前用户输入的语音信息；

识别所述语音信息的声纹特征，获得第一声纹特征；

将所述第一声纹特征与所述预设声纹特征与标注的关系表中的预设声纹特征进行匹配；

若匹配失败，则拒绝将所述第一通话记录展示。

进一步地，在所述将所述第一声纹特征与所述预设声纹特征与标注的关系表中的预设声纹特征进行匹配的步骤之后，包括：

若匹配成功，则根据所述预设声纹特征与标注的关系表获取与所述第一声纹特征对应的第一标注；

将所述第一标注与所述第一通话记录中的标注进行比较；

若所述第一标注与所述第一通话记录中的标注相同，则将所述第一通话记录进行展示；

若所述第一标注与所述第一通话记录中的标注不相同，则拒绝将所述第一通话记录进行展示。

进一步地，在所述将所述第一语音数据转换成第一文字信息，将所述第二语音数据转换成第二文字信息步骤中，包括：

将所述第一语音数据和所述第二语音数据发送给语音识别转换服务器；

接收所述语音识别服务器发送的根据所述第一语音数据转换成的第一文字信息和根据所述第二语音数据转换成的第二文字信息。

本申请还提供一种通话记录生成的装置，所述装置包括：

第一获取模块，用于获取用户的第二语音数据及与所述用户通话的远程用户的第一语音数据；

转换模块，用于将所述第一语音数据转换成第一文字信息，将所述第二语音数据转换成第二文字信息；

第一生成模块，用于分别将所述第一文字信息与所述第二文字信息按照每一段语音的通话时间点进行排序生成通话内容文本；

第二获取模块，用于获取所述用户与所述远程用户建立通话的第一时间点，以及获取所述用户和所述远程用户的手机号码；

第二生成模块，用于将所述第一时间点、所述用户和所述远程用户的手机号码和所述通话内容文本生成通话记录，并将所述通话记录保存于服务器。

本申请还提供一种计算机设备，其包括处理器、存储器及存储于所述存储器上并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现上述任一项所述的通话记录生成的方法。

本申请还提供一种存储介质，其上存储有计算机程序，所述计算机程序被执行时实现上述任一项所述的通话记录生成的方法。

根据上述的技术方案，本申请有益效果：将远程用户的第一语音数据和用户的第二语音数据进行转换成文字信息，将文字信息按照每一段语音的开始通话的时间点排序生成通话内容文本，之后根据第一时间点、双方的手机号和通话内容生成通话记录，并保存在服务器中，用户可以在服务器中查找对应的通话内容，解决现有的通话记录中没有记录通话内容，通话过后用户不能获知关于通话记录对应的通话内容的问题。

附图说明

图1是应用本申请实施例提供的通话记录生成的方法的流程图；

图2是应用本申请实施例提供的通话记录生成的装置的功能模块图；

图3是应用本申请实施例提供的计算机设备的结构示意框图；

图4是应用本申请实施例提供的存储介质的结构示意框图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本申请进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本申请，并不用于限定本申请。

如图1所示，本申请实施例提出一种通话记录生成的方法，所述方法包括以下步骤：

步骤S101、获取用户的第二语音数据及与所述用户通话的远程用户的第一语音数据。

在用户和远程用户建立通话时，获取用户的通话语音信息，获得第二语音数据，获取远程用户的通话语音信息，获得第一语音数据。

在本实施例中，在步骤S101中，包括：

每一个麦克风都会采集用户的通话语音信息，麦克风阵列包括多个麦克风，为此，麦克风阵列可以采集到多个通话语音信息，对每一个通话语音信息中的每一段语音的开始通话的时间点进行标记，获得多路语音数据。

在本实施例中，麦克风阵列是由四个麦克风组成，其中每个麦克风之间以预设距离布置，以保证每个麦克风采集到的通话语音信息的声波图形会存在区别。

在本实施例中，3cm≤预设距离≤6cm，具体地，预设距离为4.8cm。如果预设距离过小，会导致每个麦克风采集到的通话语音信息的声波图形会存在区别很小，如果预设距离过大，会导致每个麦克风采集到的通话语音信息的声波图形会存在区别很大，都不利于将多路语音数据合成一路语音数据。

双方通话，一方为用户，另一方为远程用户，用户是靠近麦克风阵列的一端，在本实施例中，用户的通话装置可以是手机，也还可以是音箱。具体地，可以在手机上设置麦克风阵列，也可以在音箱上设置麦克风阵列，并且音箱还具备打电话功能。在双方通话过程中，获取远程用户的通话语音信息及对应的开始通话的时间点，从而获得第一语音数据。

将多路语音数据合成一路语音数据，该一路语音数据是多路语音数据中每一段语音的噪声最少的，以保证获得的第一语音数据的语音质量在多路语音数据中是最好的。

在所述将所述多路语音数据合成一路语音数据，获得第二语音数据的步骤中，包括：

在各个时间点中选取噪声最低的一段语音，然后再进行消噪处理，重新合成一路语音数据，得到第二语音数据，以保证第二语音数据的语音质量。

步骤S102、将所述第一语音数据转换成第一文字信息，将所述第二语音数据转换成第二文字信息。

在本实施例中，集成语音转换文字的功能，从而能够直接将第一语音数据转换成第一文字信息，将第二语音数据转换成第二文字信息。

在一些实施例中，在步骤S102中，包括：

语音识别转换服务器具有语音转换文字的功能，将第一语音数据和第二语音数据发送给语音识别转换服务器，语音识别转换服务器将将第一语音数据转换成第一文字信息，将第二语音数据转换成第二文字信息，之后将第一文字信息、第二文字信息发送回，为此，可以通过语音识别服务器得到第一文字信息、第二文字信息。

步骤S103、分别将所述第一文字信息与所述第二文字信息按照开始通话的时间点进行排序生成通话内容文本。

第一文字信息、第二文字信息中每一段语音转换成文字信息，并对文字信息标上开始通话的时间点，然后根据开始通话的时间点，将第一文字信息、第二文字信息在文本上进行排序，形成通话时的对话内容，从而生成通话内容文本。

步骤S104、获取所述用户与所述远程用户建立通话的第一时间点，以及获取所述用户和所述远程用户的手机号码。

步骤S105、将所述第一时间点、所述用户和所述远程用户的手机号码和所述通话内容文本生成通话记录，并将所述通话记录保存于服务器。

通话记录不仅包括第一时间点和双方的手机号码，还包括通话内容文本，并且通话记录保存于服务器中，不占用用户的通话装置的存储量。

在本实施例中，用户的通话装置不存储通话记录，也不存储用户与远程用户建立通话的第一时间点，以及用户和远程用户的手机号码，也就是说，用户的通话装置没有通话记录界面，如果用户需要获取通话记录，就向服务器发起请求。

在一些实施例中，用户的通话装置仅存储用户与远程用户建立通话的第一时间点，以及用户和远程用户的手机号码。此时，用户的通话装置是不存储通话内容文本。

在步骤S105之后，包括：

向所述服务器发送查询请求信息；

将所述第一通话记录进行展示。

在需要向服务器获取第一通话记录时，首先向服务器发送查询请求信息，在服务器允许查询请求之后，服务器根据查询请求信息，查找对应的通话记录，将该通话记录返回，从而获得第一通话记录，将第一通话记录展示给用户，使用户获知第一通话记录，由于第一通话记录包括通话内容文本，用户是可以知道通话内容。

在一些实施例中，在所述将将所述第二语音数据转换成第二文字信息的步骤中，包括：

识别所述第二语音数据中的声纹特征；

识别第二语音数据中的声纹特征，也就是识别用户的声纹特征，由于每个人的声纹特征都存在区别，可以用来区别不同用户的身份，根据预设声纹特征与标注的关系表，在第二语音数据转换成文字信息之后，对文字信息进行标注，从而得到第二文字信息。

在一些实施例中，在步骤S105之后，包括：

向所述服务器发送查询请求信息；

接收当前用户输入的语音信息；

识别所述语音信息的声纹特征，获得第一声纹特征；

若匹配失败，则拒绝将所述第一通话记录展示。

在接收到服务器发送的第一通话记录之后,需要进行验证通过才会将第一通话记录展示,识别当前用户输入的语音信息的声纹特征，获得第一声纹特征，将第一声纹特征在预设声纹特征与标注的关系表进行匹配，如果匹配失败，说明当前用户的声纹特征没有预设在预设声纹特征与标注的关系表中，没有权限查看第一通话记录，不将第一通话记录进行展示。

在所述将所述第一声纹特征在所述预设声纹特征与标注的关系表中匹配的步骤之后，包括：

将所述第一标注与所述第一通话记录中的标注进行比较；

如果匹配成功，说明当前用户的声纹特征没有预设在预设声纹特征与标注的关系表中，需要进一步判断当前用户是否具备权限查看第一通话记录，将匹配到的第一标注与第一通话记录中的标注进行比较，如果比较结果是相同，说明当前用户具备权限查看第一通话记录，将第一通话记录进行展示，如果比较结果是不相同，说明当前用户不具备权限查看第一通话记录，不将第一通话记录进行展示。

综上所述，将远程用户的第一语音数据和用户的第二语音数据进行转换成文字信息，将文字信息按照每一段语音的开始通话的时间点排序生成通话内容文本，之后根据第一时间点、双方的手机号和通话内容生成通话记录，并保存在服务器中，用户可以在服务器中查找对应的通话内容，解决现有的通话记录中没有记录通话内容，通话过后用户不能获知关于通话记录对应的通话内容的问题。

如图2所示，本申请实施例提出一种通话记录生成的装置1，装置1包括第一获取模块11、转换模块12、第一生成模块13、第二获取模块14和第二生成模块15。

第一获取模块11，用于获取用户的第二语音数据及与所述用户通话的远程用户的第一语音数据。

在本实施例中，第一获取模块11包括：

采集模块，用于通过麦克风阵列采集用户的通话语音信息，并对所述用户的通话语音信息中的每一段语音的开始通话的时间点进行标记，获得多路语音数据；

获取模块，用于获取与所述用户通话的远程用户的通话语音信息及所述远程用户的通话语音信息中的每一段语音对应的开始通话的时间点，获得第一语音数据；

合成模块，用于将所述多路语音数据合成一路语音数据，获得第二语音数据。

合成模块包括：

第一分成模块，用于将所述多路语音数据中每一路语音数据分成不同时间点的多段语音；

第一选取模块，用于将所述多段语音在同一时间点的各段语音进行噪声比较，根据比较结果，从所述各段语音中选取噪声最低的一段语音，获得多段目标语音；

第一合成模块，用于将所述多段目标语音进行消噪处理，并按照时间顺序合成一路语音数据，获得第二语音数据。

转换模块12，用于将所述第一语音数据转换成第一文字信息，将所述第二语音数据转换成第二文字信息。

在一些实施例中，转换模块12包括：

第一发送模块，用于将所述第一语音数据和所述第二语音数据发送给语音识别转换服务器；

第一接收模块，用于接收所述语音识别服务器发送的根据所述第一语音数据转换成的第一文字信息和根据所述第二语音数据转换成的第二文字信息。

第一生成模块13，用于分别将所述第一文字信息与所述第二文字信息按照开始通话的时间点进行排序生成通话内容文本。

第二获取模块14，用于获取所述用户与所述远程用户建立通话的第一时间点，以及获取所述用户和所述远程用户的手机号码。

第二生成模块15，用于将所述第一时间点、所述用户和所述远程用户的手机号码和所述通话内容文本生成通话记录，并将所述通话记录保存于服务器。

装置1包括：

第二发送模块，用于向所述服务器发送查询请求信息；

第二接收模块，用于接收所述服务器根据所述查询请求信息发送的对应的第一通话记录；

第一展示模块，用于将所述第一通话记录进行展示。

转换模块12包括：

第一识别模块，用于识别所述第二语音数据中的声纹特征；

第一标记模块，用于将所述第二语音数据转换成文字信息，并根据预设声纹特征与标注的关系表对所述文字信息进行标注，获得第二文字信息。

在一些实施例中，装置1包括：

第四发送模块，用于向所述服务器发送查询请求信息；

第三接收模块，用于接收所述服务器根据所述查询请求信息发送的对应的第一通话记录；

第四接收模块，用于接收当前用户输入的语音信息；

第二识别模块，用于识别所述语音信息的声纹特征，获得第一声纹特征；

第一匹配模块，用于将所述第一声纹特征与所述预设声纹特征与标注的关系表中的预设声纹特征进行匹配；

第一拒绝模块，用于若匹配失败，则拒绝将所述第一通话记录展示。

装置1包括：

第三获取模块，用于若匹配成功，则根据所述预设声纹特征与标注的关系表获取与所述第一声纹特征对应的第一标注；

第一比较模块，用于将所述第一标注与所述第一通话记录中的标注进行比较；

第二展示模块，用于若所述第一标注与所述第一通话记录中的标注相同，则将所述第一通话记录进行展示；

第二拒绝模块，用于若所述第一标注与所述第一通话记录中的标注不相同，则拒绝将所述第一通话记录进行展示。

如图3所示，本申请还提出一种计算机设备2，其包括处理器21、存储器22及存储于存储器22上并可在所述处理器21上运行的计算机程序23，所述处理器21执行所述计算机程序23时实现上述任一项所述的通话记录生成的方法。

如图4所示，本申请还提出一种存储介质3，其上存储有计算机程序31，所述计算机程序31被执行时实现上述任一项所述的通话记录生成的方法。

在上述实施例中，计算机设备2可以是服务器，计算机设备2的处理器21用于提供计算和控制能力，计算机设备2的存储器22包括非易失性存储介质、内存储器。该非易失性存储介质存储有计算机程序23。该内存储器为非易失性存储介质中计算机程序23的运行提供环境。所述计算机程序31被所述处理器51执行时以实现一种通话记录生成的方法。

所述存储介质3可以是计算机能够存储的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质，(例如，软盘、硬盘、磁带)、光介质(例如，DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。所述计算机程序31包括一个或多个计算机指令。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在存储介质中，或者从一个计算机存储介质向另一计算机存储介质传输，例如，所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。在计算机上加载和执行所述计算机指令时，实现一种通话记录生成的方法。

以上所述仅为本申请的较佳实施例而已，并不用以限制本申请，凡在本申请的精神和原则之内所作的任何修改、等同替换和改进等，均应包括在本申请的保护范围之内。

Claims

1.一种通话记录生成的方法，其特征在于，所述方法包括：

用户的通话装置获取用户的第二语音数据及与所述用户通话的远程用户的第一语音数据；

将所述第一时间点、所述用户和所述远程用户的手机号码和所述通话内容文本生成通话记录，并将所述通话记录保存于服务器；

在所述将所述第一语音数据转换成第一文字信息，将所述第二语音数据转换成第二文字信息步骤中，包括：

接收所述语音识别服务器发送的根据所述第一语音数据转换成的第一文字信息和根据所述第二语音数据转换成的第二文字信息；

在所述将所述第二语音数据转换成第二文字信息的步骤中，包括：

识别所述第二语音数据中的声纹特征；

将所述第二语音数据转换成文字信息，并根据预设声纹特征与标注的关系表对所述文字信息进行标注，获得第二文字信息；

在所述将所述第一时间点、所述用户和所述远程用户的手机号码和所述通话内容文本生成通话记录，并将所述通话记录保存于服务器的步骤之后，包括：

向所述服务器发送查询请求信息；

接收当前用户输入的语音信息；

识别所述语音信息的声纹特征，获得第一声纹特征；

若匹配失败，则拒绝将所述第一通话记录展示；

在所述将所述第一声纹特征与所述预设声纹特征与标注的关系表中的预设声纹特征进行匹配的步骤之后，包括：

将所述第一标注与所述第一通话记录中的标注进行比较；

2.根据权利要求1所述的通话记录生成的方法，其特征在于，在所述获取用户的第二语音数据及与所述用户通话的远程用户的第一语音数据的步骤中，包括：

3.根据权利要求2所述的通话记录生成的方法，其特征在于，在所述将所述多路语音数据合成一路语音数据，获得第二语音数据的步骤中，包括：

4.一种通话记录生成的装置，其特征在于，所述装置包括：

第二生成模块，用于将所述第一时间点、所述用户和所述远程用户的手机号码和所述通话内容文本生成通话记录，并将所述通话记录保存于服务器；

所述转换模块包括：

第一接收模块，用于接收所述语音识别服务器发送的根据所述第一语音数据转换成的第一文字信息和根据所述第二语音数据转换成的第二文字信息；

转换模块包括：

第一识别模块，用于识别所述第二语音数据中的声纹特征；

第一标记模块，用于将所述第二语音数据转换成文字信息，并根据预设声纹特征与标注的关系表对所述文字信息进行标注，获得第二文字信息；

所述装置还包括：

第四发送模块，用于向所述服务器发送查询请求信息；

第四接收模块，用于接收当前用户输入的语音信息；

第一拒绝模块，用于若匹配失败，则拒绝将所述第一通话记录展示；

5.一种计算机设备，其特征在于，其包括处理器、存储器及存储于所述存储器上并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现如权利要求1-3任一项所述的通话记录生成的方法。

6.一种存储介质，其特征在于，其上存储有计算机程序，所述计算机程序被执行时实现如权利要求1-3任一项所述的通话记录生成的方法。