CN112423094A

CN112423094A - 一种双录业务播报方法、装置及存储介质

Info

Publication number: CN112423094A
Application number: CN202011200587.2A
Authority: CN
Inventors: 王先来; 程红琴; 杜镇生; 薛桂雄
Original assignee: Guangzhou Bairui Network Technology Co ltd
Current assignee: Guangzhou Bairui Network Technology Co ltd
Priority date: 2020-10-30
Filing date: 2020-10-30
Publication date: 2021-02-26

Abstract

本发明公开了一种双录业务播报方法、装置及存储介质，该方法先根据用户选取的业务场景，获取相应的话术信息，并针对话术信息的文字数量进行文本类型分类，再对分类后的文本进行语音转换。然后向用户自动播报转换后的语音文件，并且在播报时实现文字联动，最后对整个播报过程进行视频录制，生成本次业务播报对应的录像视频。采用本发明技术方案能够实时生成相应的语音文本，并通过音频播放和文字动画的联动，提高双录业务办理时的用户体验。此外，整个播报过程还通过视频录制的方式，生成相应的录像视频，后期审核人员进行业务审核时，可以对录制视频进行调用和回放，实现业务办理过程的追溯。

Description

一种双录业务播报方法、装置及存储介质

技术领域

本发明涉及计算机技术领域，尤其涉及一种双录业务播报方法、装置及存储介质。

背景技术

针对金融领域等行业在金融产品交易过程中的录音、录像、播报风险揭示的需求，传统办理模式需要在双录业务办理时与客户进行风险揭示以及购买意愿确认。现有技术是通过业务人员进行人工朗读的方式，或者自动播放对应业务信息的方式进行业务播报，朗读或播报后与客户确认信息。

现有技术中业务办理需要大量的工作人员，而人工朗读会存在读错、读漏等现象，朗读效率也会影响业务办理效率。语音自动播放虽然能够解决人工朗读的问题，但是需要事先进行制作语音文件，不能满足话术内容根据不同业务场景编号的需求，若每个业务场景都制作语音文件，会导致语音文件的容量较大，也会造成人力成本、时间成本和播报效率等问题。此外，金融产品交易往往是存在个性化定制的需求，业务类型和业务产品的自选性较强，预先制作的语音文件并不能适用于个性化定制业务。

发明内容

本发明实施例提供一种双录业务播报方法、装置及存储介质，能够提高双录业务播报的灵活性，提高业务办理时的用户体验。

本发明提供了一种业务播报方法，包括：

根据用户选取的业务场景，获取所述业务场景对应的话术信息；

根据所述话术信息的文字数量，判断所述话术信息是否为大文本类型；

若是，则将所述话术信息拆分成多个小文本，并将所述多个小文本进行语音转换，获得所述话术信息对应的语音文件；

否则，直接将所述话术信息转换为对应的语音文件；

向所述用户播报所述话术信息对应的语音文件，并在播报时进行文字联动；

录制整个播报过程，生成本次业务播报对应的录像视频。

进一步的，所述在播报时进行文字联动，具体为：

计算所述语音文件的总时长和语音文本的总字数，并根据所述总时长和所述总字数，计算所述文字联动动画的播放速率；

根据所述播放速率，调节所述文字联动动画的播放速度，以实现所述语音文件播报与所述文字联动动画的音词同步。

进一步的，所述将所述话术信息拆分成多个小文本，具体为：

根据所述话术信息中的文字段落和段落字数，结合预设的小文本长度，使用javascript方法对所述话术信息进行截取切分，获得多个小文本。

进一步的，所述将所述多个小文本进行语音转换，获得所述话术信息对应的语音文件，具体为：

分别查询每个小文本是否预先存储有对应的语音子文件；

若是，则调用已存储的语音子文件作为该小文本的语音文件；

若否，则将该小文本转换为对应的语音文件；

待所述多个小文本均配置对应的语音文件时，获得所述话术信息对应的语音文件。

进一步的，所述根据用户选取的业务场景，获取所述业务场景对应的话术信息，具体为：

根据所述业务场景，查询业务场景与话术信息关联表，并根据查询结果，获取所述业务场景对应的话术信息。

进一步的，所述根据所述话术信息的文字数量，判断所述话术信息是否为大文本类型，具体为：

判断所述话术信息的文字数量是否超过预设阈值；

若是，则确定所述话术信息为大文本类型；否则，确定所述话术信息为小文本类型。

相应的，本发明提供了一种双录业务播报装置，所述业务播报装置包括：

获取模块，用于根据用户选取的业务场景，获取所述业务场景对应的话术信息；

判断模块，用于根据所述话术信息的文字数量，判断所述话术信息是否为大文本类型；

第一转换模块，用于在所述判断模块确定所述话术信息为大文本类型时，将所述话术信息拆分成多个小文本，并将所述多个小文本进行语音转换，获得所述话术信息对应的语音文件；

第二转换模块，用于在所述判断模块确定所述话术信息不为大文本类型时，直接将所述话术信息转换为对应的语音文件；

播报模块，用于向所述用户播报所述话术信息对应的语音文件，并在播报时进行文字联动；

录制模块，用于录制整个播报过程，生成本次业务播报对应的录像视频。

相应的，本发明提供了一种存储介质，其中存储有处理器可执行的指令，所述处理器可执行的指令在由处理器执行时用于实现本发明所述的的双录业务播报方法。

由上可见，本发明提供的双录业务播报方法、装置及存储介质，该方法先根据用户选取的业务场景，获取相应的话术信息，并针对话术信息的文字数量进行文本类型分类，再对分类后的文本进行语音转换。然后向用户自动播报转换后的语音文件，并且在播报时实现文字联动，最后对整个播报过程进行视频录制，生成本次业务播报对应的录像视频。相比于现有技术通过人工朗读话术信息，本发明能够实时生成相应的语音文本，并通过音频播放和文字动画的联动，提高双录业务办理时的用户体验。此外，整个播报过程还通过视频录制的方式，生成相应的录像视频，后期审核人员进行业务审核时，可以对录制视频进行调用和回放，实现业务办理过程的追溯。

附图说明

图1是本发明提供的双录业务播报方法的一种实施例的流程示意图；

图2是本发明提供的双录业务播报装置的一种实施例的结构示意图；

图3是本发明提供的双录业务播报装置的另一种实施例的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

参见图1，是本发明提供的双录业务播报方法的一种实施例的流程示意图。如图1所示，该方法包括步骤101至步骤106，各步骤具体如下：

步骤101：根据用户选取的业务场景，获取业务场景对应的话术信息。

在本实施例中，步骤101具体为：根据业务场景，查询业务场景与话术信息关联表，并根据查询结果，获取业务场景对应的话术信息。每个业务场景都可以配置相应话术信息，如某些业务，某几项业务综合的业务包等，业务人员可以根据不同的业务场景进行自定义配置。配置完成后会自动写入业务场景与话术信息关联表，以供后续的查询和调用。用户选择了办理的业务信息后，系统会根据不同的业务场景查询关联表，从而获得相应的话术信息。话术信息例如“小红女士，您所购买的理财产品为XXX产品”。现有技术是由业务人员向客户进行人工朗读，而本申请是通过实时生成语音文件并播报的方式，能避免错读、漏读等问题，也能避免事先生成语音文件导致该语音文件与业务场景不匹配的问题，提高用户体验。

步骤102：根据话术信息的文字数量，判断话术信息是否为大文本类型。若是，则执行步骤103，否则，执行步骤104。

在本实施例中，步骤102具体为：判断话术信息的文字数量是否超过预设阈值；若是，则确定话术信息为大文本类型；否则，确定话术信息为小文本类型。该预设阈值的可根据实际的业务类型、服务器可承载量、语音转换效率等方面进行动态调整。

步骤103：将话术信息拆分成多个小文本，并将多个小文本进行语音转换，获得话术信息对应的语音文件。步骤103执行完成后执行步骤105。

在本实施例中，将话术信息拆分成多个小文本具体为：根据话术信息中的文字段落和段落字数，结合预设的小文本长度，使用javascript方法对话术信息进行截取切分，获得多个小文本。系统首先会根据文字段落使用javascript方法进行截取切分，切分出来的小文本长度在预设长度内，使得每个小文本的字数相当。如果段落字数长度太长，则在超过预设字数前会以标点符号进行切分，避免出现语义的混乱。预设字数可以设置为100/200/300，或根据实际情况动态调整，如将待切分话术信息的文字总数除以每个小文本的预设字数，获得的切分个数等。

作为本实施例的一种举例，将多个小文本进行语音转换，获得话术信息对应的语音文件，具体为：分别查询每个小文本是否预先存储有对应的语音子文件；若是，则调用已存储的语音子文件作为该小文本的语音文件；若否，则将该小文本转换为对应的语音文件；待多个小文本均配置对应的语音文件时，获得话术信息对应的语音文件。

在进行多个小文本的语音转换时，可以生成多个转换请求，针对每个转换请求执行一次语音转换，避免漏转或重复转换的问题。而在上述举例中，将历史已进行转换过的语音子文件存储在数据库，在实时转换时实现直接调用，提高转换效率。因为在金融领域中，某些行业的话术在各类业务中都是重复的，如业务风险、投资安全等常规话术，预先转换成语音子文件，而不是以整个业务作为语音文件，使得整个语音转换更有效率，语音文件的生成更加灵活。此外，在调用存储的语音子文件进行语音转换时，还可以采用语义切分文本，通过语义识别获取每个段落的语义，如果是预设的常规话术，则查询是否存储有语音子文件，如果不是预设的常规话术，则直接进行语音转换，无需所有小文本的查询，提高转换效率。

步骤104：直接将话术信息转换为对应的语音文件。步骤104执行完成后执行步骤105。

在本实施例中，如果话术信息不需要切分，则直接将其转换为语音文件。文本转语音为现有技术，在此不再赘述。

步骤105：向用户播报话术信息对应的语音文件，并在播报时进行文字联动。

在本实施例中，在播报时进行文字联动，具体为：计算语音文件的总时长和语音文本的总字数，并根据总时长和总字数，计算文字联动动画的播放速率；根据播放速率，调节文字联动动画的播放速度，以实现语音文件播报与文字联动动画的音词同步。

在本实施例中，通过语音文件的总时长和文本的总字数来计算获得播放速率，主要是为了实现音词同步。在播报开始时能做到音词同步，但在播放过程中会因为语音文件的文字语速差异导致细微偏差，因此在每个段落或每个语音子文件结束后，通过计算获得的播放速率来调节文字联动动画的播放速度，实现联动校准，达到播放与文字联动同步的效果。

在本实施例中，联动播放是可以但不限于采用跑马灯渲染效果进行同步展示，以提高用户观感和用户体验。

步骤106：录制整个播报过程，生成本次业务播报对应的录像视频。

在本实施例中，录制播报的全程视频是为了便于后期审核，因为金融类业务的特性，即使办理了相关流程，也需要后期审核人员进行确认，因此后期审核人员根据录像视频和话说信息提供的文字参照进行审核，能够大大减轻审核人员的压力，提高整体业务办理的质量。

相应的，参见图2，图2是本发明提供的双录业务播报装置的一种实施例的结构示意图。如图2所示，该业务播报装置包括包括：

获取模块201，用于根据用户选取的业务场景，获取所述业务场景对应的话术信息。

判断模块202，用于根据所述话术信息的文字数量，判断所述话术信息是否为大文本类型。

第一转换模块203，用于在判断模块202确定所述话术信息为大文本类型时，将所述话术信息拆分成多个小文本，并将所述多个小文本进行语音转换，获得所述话术信息对应的语音文件。

第二转换模块204，用于在判断模块202确定所述话术信息不为大文本类型时，直接将所述话术信息转换为对应的语音文件。

播报模块205，用于向所述用户播报所述话术信息对应的语音文件，并在播报时进行文字联动。

录制模块206，用于录制整个播报过程，生成本次业务播报对应的录像视频。

本装置更详细的工作原理和流程步骤可以但不限于参见上文描述的业务播报方法。

作为本实施例的一种举例，参见图3，图3是本发明提供的双录业务播报装置的另一种实施例的结构示意图。图3与图2的区别在于，图3还包括：视频播放模块307，视频播放模块307用于供业务审核人员调用和播放需审核业务对应的录像视频，可对录像视频实现回放和播放，实现业务办理过程的追溯。

相应的，本发明实施例还提供了一种存储介质，其中存储有处理器可执行的指令，所述处理器可执行的指令在由处理器执行时用于执行所述的一种业务播报方法。

由上可见，本发明提供的双录业务播报方法、装置及存储介质，该方法先根据用户选取的业务场景，获取相应的话术信息，并针对话术信息的文字数量进行文本类型分类，再对分类后的文本进行语音转换。然后向用户自动播报转换后的语音文件，并且在播报时实现文字联动，最后对整个播报过程进行视频录制，生成本次业务播报对应的录像视频。相比于现有技术通过人工朗读话术信息，本发明能够实时生成相应的语音文本，并通过音频播放和文字动画的联动，提高双录业务办理时的用户体验。此外，整个播报过程还通过视频录制的方式，生成相应的录像视频，后期审核人员可以对录制视频进行调用和回放，实现业务办理过程的追溯。

进一步的，本发明的在录制视频时可以将播报的语音文件和对应的文字信息进行动态同步渲染，实现词音同步的效果，并且可以录制到视频当中，进一步提高用户体验。。

需说明的是，以上所描述的装置实施例仅仅是示意性的，其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。另外，本发明提供的装置实施例附图中，模块之间的连接关系表示它们之间具有通信连接，具体可以实现为一条或多条通信总线或信号线。本领域普通技术人员在不付出创造性劳动的情况下，即可以理解并实施。

以上所述是本发明的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也视为本发明的保护范围。

Claims

1.一种双录业务播报方法，其特征在于，包括：

否则，直接将所述话术信息转换为对应的语音文件；

录制整个播报过程，生成本次业务播报对应的录像视频。

2.根据权利要求1所述的双录业务播报方法，其特征在于，所述在播报时进行文字联动，具体为：

3.根据权利要求1或2所述的双录业务播报方法，其特征在于，所述将所述话术信息拆分成多个小文本，具体为：

4.根据权利要求3所述的双录业务播报方法，其特征在于，所述将所述多个小文本进行语音转换，获得所述话术信息对应的语音文件，具体为：

分别查询每个小文本是否预先存储有对应的语音子文件；

若否，则将该小文本转换为对应的语音文件；

5.根据权利要求1所述的双录业务播报方法，其特征在于，所述根据用户选取的业务场景，获取所述业务场景对应的话术信息，具体为：

6.根据权利要求1所述的双录业务播报方法，其特征在于，所述根据所述话术信息的文字数量，判断所述话术信息是否为大文本类型，具体为：

判断所述话术信息的文字数量是否超过预设阈值；

7.一种双录业务播报装置，其特征在于，所述业务播报装置包括：

8.一种存储介质，其中存储有处理器可执行的指令，其特征在于，所述处理器可执行的指令在由处理器执行时用于实现如权利要求1-6任一项所述的双录业务播报方法。