CN112423094A - 一种双录业务播报方法、装置及存储介质 - Google Patents

一种双录业务播报方法、装置及存储介质 Download PDF

Info

Publication number
CN112423094A
CN112423094A CN202011200587.2A CN202011200587A CN112423094A CN 112423094 A CN112423094 A CN 112423094A CN 202011200587 A CN202011200587 A CN 202011200587A CN 112423094 A CN112423094 A CN 112423094A
Authority
CN
China
Prior art keywords
information
broadcasting
service
voice
dialect
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011200587.2A
Other languages
English (en)
Inventor
王先来
程红琴
杜镇生
薛桂雄
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Bairui Network Technology Co ltd
Original Assignee
Guangzhou Bairui Network Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Bairui Network Technology Co ltd filed Critical Guangzhou Bairui Network Technology Co ltd
Priority to CN202011200587.2A priority Critical patent/CN112423094A/zh
Publication of CN112423094A publication Critical patent/CN112423094A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/433Content storage operation, e.g. storage operation in response to a pause request, caching operations
    • H04N21/4334Recording operations
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/434Disassembling of a multiplex stream, e.g. demultiplexing audio and video streams, extraction of additional data from a video stream; Remultiplexing of multiplex streams; Extraction or processing of SI; Disassembling of packetised elementary stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/4402Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display
    • H04N21/440236Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display by media transcoding, e.g. video is transformed into a slideshow of still pictures, audio is converted into text
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/472End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content
    • H04N21/47217End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content for controlling playback functions for recorded or on-demand content, e.g. using progress bars, mode or play-point indicators or bookmarks

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Databases & Information Systems (AREA)
  • Human Computer Interaction (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

本发明公开了一种双录业务播报方法、装置及存储介质,该方法先根据用户选取的业务场景,获取相应的话术信息,并针对话术信息的文字数量进行文本类型分类,再对分类后的文本进行语音转换。然后向用户自动播报转换后的语音文件,并且在播报时实现文字联动,最后对整个播报过程进行视频录制,生成本次业务播报对应的录像视频。采用本发明技术方案能够实时生成相应的语音文本,并通过音频播放和文字动画的联动,提高双录业务办理时的用户体验。此外,整个播报过程还通过视频录制的方式,生成相应的录像视频,后期审核人员进行业务审核时,可以对录制视频进行调用和回放,实现业务办理过程的追溯。

Description

一种双录业务播报方法、装置及存储介质
技术领域
本发明涉及计算机技术领域,尤其涉及一种双录业务播报方法、装置及存储介质。
背景技术
针对金融领域等行业在金融产品交易过程中的录音、录像、播报风险揭示的需求,传统办理模式需要在双录业务办理时与客户进行风险揭示以及购买意愿确认。现有技术是通过业务人员进行人工朗读的方式,或者自动播放对应业务信息的方式进行业务播报,朗读或播报后与客户确认信息。
现有技术中业务办理需要大量的工作人员,而人工朗读会存在读错、读漏等现象,朗读效率也会影响业务办理效率。语音自动播放虽然能够解决人工朗读的问题,但是需要事先进行制作语音文件,不能满足话术内容根据不同业务场景编号的需求,若每个业务场景都制作语音文件,会导致语音文件的容量较大,也会造成人力成本、时间成本和播报效率等问题。此外,金融产品交易往往是存在个性化定制的需求,业务类型和业务产品的自选性较强,预先制作的语音文件并不能适用于个性化定制业务。
发明内容
本发明实施例提供一种双录业务播报方法、装置及存储介质,能够提高双录业务播报的灵活性,提高业务办理时的用户体验。
本发明提供了一种业务播报方法,包括:
根据用户选取的业务场景,获取所述业务场景对应的话术信息;
根据所述话术信息的文字数量,判断所述话术信息是否为大文本类型;
若是,则将所述话术信息拆分成多个小文本,并将所述多个小文本进行语音转换,获得所述话术信息对应的语音文件;
否则,直接将所述话术信息转换为对应的语音文件;
向所述用户播报所述话术信息对应的语音文件,并在播报时进行文字联动;
录制整个播报过程,生成本次业务播报对应的录像视频。
进一步的,所述在播报时进行文字联动,具体为:
计算所述语音文件的总时长和语音文本的总字数,并根据所述总时长和所述总字数,计算所述文字联动动画的播放速率;
根据所述播放速率,调节所述文字联动动画的播放速度,以实现所述语音文件播报与所述文字联动动画的音词同步。
进一步的,所述将所述话术信息拆分成多个小文本,具体为:
根据所述话术信息中的文字段落和段落字数,结合预设的小文本长度,使用javascript方法对所述话术信息进行截取切分,获得多个小文本。
进一步的,所述将所述多个小文本进行语音转换,获得所述话术信息对应的语音文件,具体为:
分别查询每个小文本是否预先存储有对应的语音子文件;
若是,则调用已存储的语音子文件作为该小文本的语音文件;
若否,则将该小文本转换为对应的语音文件;
待所述多个小文本均配置对应的语音文件时,获得所述话术信息对应的语音文件。
进一步的,所述根据用户选取的业务场景,获取所述业务场景对应的话术信息,具体为:
根据所述业务场景,查询业务场景与话术信息关联表,并根据查询结果,获取所述业务场景对应的话术信息。
进一步的,所述根据所述话术信息的文字数量,判断所述话术信息是否为大文本类型,具体为:
判断所述话术信息的文字数量是否超过预设阈值;
若是,则确定所述话术信息为大文本类型;否则,确定所述话术信息为小文本类型。
相应的,本发明提供了一种双录业务播报装置,所述业务播报装置包括:
获取模块,用于根据用户选取的业务场景,获取所述业务场景对应的话术信息;
判断模块,用于根据所述话术信息的文字数量,判断所述话术信息是否为大文本类型;
第一转换模块,用于在所述判断模块确定所述话术信息为大文本类型时,将所述话术信息拆分成多个小文本,并将所述多个小文本进行语音转换,获得所述话术信息对应的语音文件;
第二转换模块,用于在所述判断模块确定所述话术信息不为大文本类型时,直接将所述话术信息转换为对应的语音文件;
播报模块,用于向所述用户播报所述话术信息对应的语音文件,并在播报时进行文字联动;
录制模块,用于录制整个播报过程,生成本次业务播报对应的录像视频。
相应的,本发明提供了一种存储介质,其中存储有处理器可执行的指令,所述处理器可执行的指令在由处理器执行时用于实现本发明所述的的双录业务播报方法。
由上可见,本发明提供的双录业务播报方法、装置及存储介质,该方法先根据用户选取的业务场景,获取相应的话术信息,并针对话术信息的文字数量进行文本类型分类,再对分类后的文本进行语音转换。然后向用户自动播报转换后的语音文件,并且在播报时实现文字联动,最后对整个播报过程进行视频录制,生成本次业务播报对应的录像视频。相比于现有技术通过人工朗读话术信息,本发明能够实时生成相应的语音文本,并通过音频播放和文字动画的联动,提高双录业务办理时的用户体验。此外,整个播报过程还通过视频录制的方式,生成相应的录像视频,后期审核人员进行业务审核时,可以对录制视频进行调用和回放,实现业务办理过程的追溯。
附图说明
图1是本发明提供的双录业务播报方法的一种实施例的流程示意图;
图2是本发明提供的双录业务播报装置的一种实施例的结构示意图;
图3是本发明提供的双录业务播报装置的另一种实施例的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
参见图1,是本发明提供的双录业务播报方法的一种实施例的流程示意图。如图1所示,该方法包括步骤101至步骤106,各步骤具体如下:
步骤101:根据用户选取的业务场景,获取业务场景对应的话术信息。
在本实施例中,步骤101具体为:根据业务场景,查询业务场景与话术信息关联表,并根据查询结果,获取业务场景对应的话术信息。每个业务场景都可以配置相应话术信息,如某些业务,某几项业务综合的业务包等,业务人员可以根据不同的业务场景进行自定义配置。配置完成后会自动写入业务场景与话术信息关联表,以供后续的查询和调用。用户选择了办理的业务信息后,系统会根据不同的业务场景查询关联表,从而获得相应的话术信息。话术信息例如“小红女士,您所购买的理财产品为XXX产品”。现有技术是由业务人员向客户进行人工朗读,而本申请是通过实时生成语音文件并播报的方式,能避免错读、漏读等问题,也能避免事先生成语音文件导致该语音文件与业务场景不匹配的问题,提高用户体验。
步骤102:根据话术信息的文字数量,判断话术信息是否为大文本类型。若是,则执行步骤103,否则,执行步骤104。
在本实施例中,步骤102具体为:判断话术信息的文字数量是否超过预设阈值;若是,则确定话术信息为大文本类型;否则,确定话术信息为小文本类型。该预设阈值的可根据实际的业务类型、服务器可承载量、语音转换效率等方面进行动态调整。
步骤103:将话术信息拆分成多个小文本,并将多个小文本进行语音转换,获得话术信息对应的语音文件。步骤103执行完成后执行步骤105。
在本实施例中,将话术信息拆分成多个小文本具体为:根据话术信息中的文字段落和段落字数,结合预设的小文本长度,使用javascript方法对话术信息进行截取切分,获得多个小文本。系统首先会根据文字段落使用javascript方法进行截取切分,切分出来的小文本长度在预设长度内,使得每个小文本的字数相当。如果段落字数长度太长,则在超过预设字数前会以标点符号进行切分,避免出现语义的混乱。预设字数可以设置为100/200/300,或根据实际情况动态调整,如将待切分话术信息的文字总数除以每个小文本的预设字数,获得的切分个数等。
作为本实施例的一种举例,将多个小文本进行语音转换,获得话术信息对应的语音文件,具体为:分别查询每个小文本是否预先存储有对应的语音子文件;若是,则调用已存储的语音子文件作为该小文本的语音文件;若否,则将该小文本转换为对应的语音文件;待多个小文本均配置对应的语音文件时,获得话术信息对应的语音文件。
在进行多个小文本的语音转换时,可以生成多个转换请求,针对每个转换请求执行一次语音转换,避免漏转或重复转换的问题。而在上述举例中,将历史已进行转换过的语音子文件存储在数据库,在实时转换时实现直接调用,提高转换效率。因为在金融领域中,某些行业的话术在各类业务中都是重复的,如业务风险、投资安全等常规话术,预先转换成语音子文件,而不是以整个业务作为语音文件,使得整个语音转换更有效率,语音文件的生成更加灵活。此外,在调用存储的语音子文件进行语音转换时,还可以采用语义切分文本,通过语义识别获取每个段落的语义,如果是预设的常规话术,则查询是否存储有语音子文件,如果不是预设的常规话术,则直接进行语音转换,无需所有小文本的查询,提高转换效率。
步骤104:直接将话术信息转换为对应的语音文件。步骤104执行完成后执行步骤105。
在本实施例中,如果话术信息不需要切分,则直接将其转换为语音文件。文本转语音为现有技术,在此不再赘述。
步骤105:向用户播报话术信息对应的语音文件,并在播报时进行文字联动。
在本实施例中,在播报时进行文字联动,具体为:计算语音文件的总时长和语音文本的总字数,并根据总时长和总字数,计算文字联动动画的播放速率;根据播放速率,调节文字联动动画的播放速度,以实现语音文件播报与文字联动动画的音词同步。
在本实施例中,通过语音文件的总时长和文本的总字数来计算获得播放速率,主要是为了实现音词同步。在播报开始时能做到音词同步,但在播放过程中会因为语音文件的文字语速差异导致细微偏差,因此在每个段落或每个语音子文件结束后,通过计算获得的播放速率来调节文字联动动画的播放速度,实现联动校准,达到播放与文字联动同步的效果。
在本实施例中,联动播放是可以但不限于采用跑马灯渲染效果进行同步展示,以提高用户观感和用户体验。
步骤106:录制整个播报过程,生成本次业务播报对应的录像视频。
在本实施例中,录制播报的全程视频是为了便于后期审核,因为金融类业务的特性,即使办理了相关流程,也需要后期审核人员进行确认,因此后期审核人员根据录像视频和话说信息提供的文字参照进行审核,能够大大减轻审核人员的压力,提高整体业务办理的质量。
相应的,参见图2,图2是本发明提供的双录业务播报装置的一种实施例的结构示意图。如图2所示,该业务播报装置包括包括:
获取模块201,用于根据用户选取的业务场景,获取所述业务场景对应的话术信息。
判断模块202,用于根据所述话术信息的文字数量,判断所述话术信息是否为大文本类型。
第一转换模块203,用于在判断模块202确定所述话术信息为大文本类型时,将所述话术信息拆分成多个小文本,并将所述多个小文本进行语音转换,获得所述话术信息对应的语音文件。
第二转换模块204,用于在判断模块202确定所述话术信息不为大文本类型时,直接将所述话术信息转换为对应的语音文件。
播报模块205,用于向所述用户播报所述话术信息对应的语音文件,并在播报时进行文字联动。
录制模块206,用于录制整个播报过程,生成本次业务播报对应的录像视频。
本装置更详细的工作原理和流程步骤可以但不限于参见上文描述的业务播报方法。
作为本实施例的一种举例,参见图3,图3是本发明提供的双录业务播报装置的另一种实施例的结构示意图。图3与图2的区别在于,图3还包括:视频播放模块307,视频播放模块307用于供业务审核人员调用和播放需审核业务对应的录像视频,可对录像视频实现回放和播放,实现业务办理过程的追溯。
相应的,本发明实施例还提供了一种存储介质,其中存储有处理器可执行的指令,所述处理器可执行的指令在由处理器执行时用于执行所述的一种业务播报方法。
由上可见,本发明提供的双录业务播报方法、装置及存储介质,该方法先根据用户选取的业务场景,获取相应的话术信息,并针对话术信息的文字数量进行文本类型分类,再对分类后的文本进行语音转换。然后向用户自动播报转换后的语音文件,并且在播报时实现文字联动,最后对整个播报过程进行视频录制,生成本次业务播报对应的录像视频。相比于现有技术通过人工朗读话术信息,本发明能够实时生成相应的语音文本,并通过音频播放和文字动画的联动,提高双录业务办理时的用户体验。此外,整个播报过程还通过视频录制的方式,生成相应的录像视频,后期审核人员可以对录制视频进行调用和回放,实现业务办理过程的追溯。
进一步的,本发明的在录制视频时可以将播报的语音文件和对应的文字信息进行动态同步渲染,实现词音同步的效果,并且可以录制到视频当中,进一步提高用户体验。。
需说明的是,以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。另外,本发明提供的装置实施例附图中,模块之间的连接关系表示它们之间具有通信连接,具体可以实现为一条或多条通信总线或信号线。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也视为本发明的保护范围。

Claims (8)

1.一种双录业务播报方法,其特征在于,包括:
根据用户选取的业务场景,获取所述业务场景对应的话术信息;
根据所述话术信息的文字数量,判断所述话术信息是否为大文本类型;
若是,则将所述话术信息拆分成多个小文本,并将所述多个小文本进行语音转换,获得所述话术信息对应的语音文件;
否则,直接将所述话术信息转换为对应的语音文件;
向所述用户播报所述话术信息对应的语音文件,并在播报时进行文字联动;
录制整个播报过程,生成本次业务播报对应的录像视频。
2.根据权利要求1所述的双录业务播报方法,其特征在于,所述在播报时进行文字联动,具体为:
计算所述语音文件的总时长和语音文本的总字数,并根据所述总时长和所述总字数,计算所述文字联动动画的播放速率;
根据所述播放速率,调节所述文字联动动画的播放速度,以实现所述语音文件播报与所述文字联动动画的音词同步。
3.根据权利要求1或2所述的双录业务播报方法,其特征在于,所述将所述话术信息拆分成多个小文本,具体为:
根据所述话术信息中的文字段落和段落字数,结合预设的小文本长度,使用javascript方法对所述话术信息进行截取切分,获得多个小文本。
4.根据权利要求3所述的双录业务播报方法,其特征在于,所述将所述多个小文本进行语音转换,获得所述话术信息对应的语音文件,具体为:
分别查询每个小文本是否预先存储有对应的语音子文件;
若是,则调用已存储的语音子文件作为该小文本的语音文件;
若否,则将该小文本转换为对应的语音文件;
待所述多个小文本均配置对应的语音文件时,获得所述话术信息对应的语音文件。
5.根据权利要求1所述的双录业务播报方法,其特征在于,所述根据用户选取的业务场景,获取所述业务场景对应的话术信息,具体为:
根据所述业务场景,查询业务场景与话术信息关联表,并根据查询结果,获取所述业务场景对应的话术信息。
6.根据权利要求1所述的双录业务播报方法,其特征在于,所述根据所述话术信息的文字数量,判断所述话术信息是否为大文本类型,具体为:
判断所述话术信息的文字数量是否超过预设阈值;
若是,则确定所述话术信息为大文本类型;否则,确定所述话术信息为小文本类型。
7.一种双录业务播报装置,其特征在于,所述业务播报装置包括:
获取模块,用于根据用户选取的业务场景,获取所述业务场景对应的话术信息;
判断模块,用于根据所述话术信息的文字数量,判断所述话术信息是否为大文本类型;
第一转换模块,用于在所述判断模块确定所述话术信息为大文本类型时,将所述话术信息拆分成多个小文本,并将所述多个小文本进行语音转换,获得所述话术信息对应的语音文件;
第二转换模块,用于在所述判断模块确定所述话术信息不为大文本类型时,直接将所述话术信息转换为对应的语音文件;
播报模块,用于向所述用户播报所述话术信息对应的语音文件,并在播报时进行文字联动;
录制模块,用于录制整个播报过程,生成本次业务播报对应的录像视频。
8.一种存储介质,其中存储有处理器可执行的指令,其特征在于,所述处理器可执行的指令在由处理器执行时用于实现如权利要求1-6任一项所述的双录业务播报方法。
CN202011200587.2A 2020-10-30 2020-10-30 一种双录业务播报方法、装置及存储介质 Pending CN112423094A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011200587.2A CN112423094A (zh) 2020-10-30 2020-10-30 一种双录业务播报方法、装置及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011200587.2A CN112423094A (zh) 2020-10-30 2020-10-30 一种双录业务播报方法、装置及存储介质

Publications (1)

Publication Number Publication Date
CN112423094A true CN112423094A (zh) 2021-02-26

Family

ID=74827893

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011200587.2A Pending CN112423094A (zh) 2020-10-30 2020-10-30 一种双录业务播报方法、装置及存储介质

Country Status (1)

Country Link
CN (1) CN112423094A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113035201A (zh) * 2021-03-16 2021-06-25 广州佰锐网络科技有限公司 一种金融业务质检方法和系统
CN113206996A (zh) * 2021-04-30 2021-08-03 中国工商银行股份有限公司 一种业务录制数据的质检方法及装置
CN113485668A (zh) * 2021-05-17 2021-10-08 广州佰锐网络科技有限公司 一种智能开户方法及系统

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102543063A (zh) * 2011-12-07 2012-07-04 华南理工大学 基于说话人分割与聚类的多说话人语速估计方法
CN102543068A (zh) * 2010-12-31 2012-07-04 北大方正集团有限公司 语音播放文本信息的方法和装置
US20160358597A1 (en) * 2014-03-04 2016-12-08 Tribune Digital Ventures, Llc Real Time Popularity Based Audible Content Acquisition
CN108366182A (zh) * 2018-02-13 2018-08-03 京东方科技集团股份有限公司 文字语音同步播报的校准方法及装置、计算机存储介质
CN109658776A (zh) * 2018-12-17 2019-04-19 广东小天才科技有限公司 一种背诵流畅度的检测方法及电子设备
CN110266981A (zh) * 2019-06-17 2019-09-20 深圳壹账通智能科技有限公司 视频录制的方法、装置、计算机设备和存储介质
CN110597964A (zh) * 2019-09-27 2019-12-20 神州数码融信软件有限公司 一种双录质检语义分析方法、装置及双录质检系统
CN110781328A (zh) * 2019-09-09 2020-02-11 天脉聚源(杭州)传媒科技有限公司 基于语音识别的视频生成方法、系统、装置和存储介质
US20200226327A1 (en) * 2019-01-11 2020-07-16 Applications Technology (Apptek), Llc System and method for direct speech translation system

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102543068A (zh) * 2010-12-31 2012-07-04 北大方正集团有限公司 语音播放文本信息的方法和装置
CN102543063A (zh) * 2011-12-07 2012-07-04 华南理工大学 基于说话人分割与聚类的多说话人语速估计方法
US20160358597A1 (en) * 2014-03-04 2016-12-08 Tribune Digital Ventures, Llc Real Time Popularity Based Audible Content Acquisition
CN108366182A (zh) * 2018-02-13 2018-08-03 京东方科技集团股份有限公司 文字语音同步播报的校准方法及装置、计算机存储介质
CN109658776A (zh) * 2018-12-17 2019-04-19 广东小天才科技有限公司 一种背诵流畅度的检测方法及电子设备
US20200226327A1 (en) * 2019-01-11 2020-07-16 Applications Technology (Apptek), Llc System and method for direct speech translation system
CN110266981A (zh) * 2019-06-17 2019-09-20 深圳壹账通智能科技有限公司 视频录制的方法、装置、计算机设备和存储介质
CN110781328A (zh) * 2019-09-09 2020-02-11 天脉聚源(杭州)传媒科技有限公司 基于语音识别的视频生成方法、系统、装置和存储介质
CN110597964A (zh) * 2019-09-27 2019-12-20 神州数码融信软件有限公司 一种双录质检语义分析方法、装置及双录质检系统

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113035201A (zh) * 2021-03-16 2021-06-25 广州佰锐网络科技有限公司 一种金融业务质检方法和系统
CN113206996A (zh) * 2021-04-30 2021-08-03 中国工商银行股份有限公司 一种业务录制数据的质检方法及装置
CN113485668A (zh) * 2021-05-17 2021-10-08 广州佰锐网络科技有限公司 一种智能开户方法及系统
CN113485668B (zh) * 2021-05-17 2024-05-10 广州佰锐网络科技有限公司 一种智能开户方法及系统

Similar Documents

Publication Publication Date Title
US9858929B2 (en) Computer-implemented system and method for transcription error reduction
US10650826B2 (en) Diarization using acoustic labeling
CN112423094A (zh) 一种双录业务播报方法、装置及存储介质
US11699456B2 (en) Automated transcript generation from multi-channel audio
US11463772B1 (en) Selecting advertisements for media programs by matching brands to creators
US8005676B2 (en) Speech analysis using statistical learning
US20160189107A1 (en) Apparatus and method for automatically creating and recording minutes of meeting
US20160189103A1 (en) Apparatus and method for automatically creating and recording minutes of meeting
CN111010484A (zh) 一种通话录音自动质检方法
CN114283851B (zh) 基于视频彩铃识别客户的方法、系统、装置及存储介质
US11785299B1 (en) Selecting advertisements for media programs and establishing favorable conditions for advertisements
KR102291113B1 (ko) 회의록 작성 장치 및 방법
CN112837688A (zh) 语音转写方法、装置、相关系统及设备
Afonso et al. Combining Text-to-Speech Services with Conventional Voiceover for News Oralization
CN115240657A (zh) 一种语音处理方法、装置、设备及存储介质
CN115223542A (zh) 一种方言语义快速转写技术
CN116153292A (zh) 语音数据的处理方法、装置、电子设备及存储介质
WO2012098838A1 (ja) 報告文書作成支援システム、報告文書作成支援方法および報告文書作成支援プログラム
JP2010008764A (ja) 音声認識方法、音声認識システム、および音声認識装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20210226

RJ01 Rejection of invention patent application after publication