CN112614480A - 语音播报的方法、装置、设备及存储介质 - Google Patents

语音播报的方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN112614480A
CN112614480A CN202011532791.4A CN202011532791A CN112614480A CN 112614480 A CN112614480 A CN 112614480A CN 202011532791 A CN202011532791 A CN 202011532791A CN 112614480 A CN112614480 A CN 112614480A
Authority
CN
China
Prior art keywords
dynamic
audio data
data
filled
fixed
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011532791.4A
Other languages
English (en)
Other versions
CN112614480B (zh
Inventor
李�昊
刘方
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Bank Co Ltd
Original Assignee
Ping An Bank Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Bank Co Ltd filed Critical Ping An Bank Co Ltd
Priority to CN202011532791.4A priority Critical patent/CN112614480B/zh
Publication of CN112614480A publication Critical patent/CN112614480A/zh
Application granted granted Critical
Publication of CN112614480B publication Critical patent/CN112614480B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/02Methods for producing synthetic speech; Speech synthesisers
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/08Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Telephonic Communication Services (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

本发明涉及一种人工智能技术,揭露了一种语音播报的方法、装置、设备及存储介质,该方法包括:在接收到语音播报请求后,根据语音播报请求确定对应的文案内容;确定各个待填充的动态文案对应的业务系统,从对应的业务系统中获取业务数据;对每一业务数据进行分析,获取每一业务数据对应的分析结果,将分析结果作为动态文案;从本地获取每一动态文案对应的动态音频数据;从本地获取各个固定文案的固定音频数据,按照文案内容中固定文案及待填充的动态文案的先后顺序,拼接动态音频数据及固定音频数据,并播报拼接后的音频数据。本发明能够避免在大量语音播报请求场景下所导致的语音播报延迟、响应慢的问题,使得语音播报及时、流畅。

Description

语音播报的方法、装置、设备及存储介质
技术领域
本发明涉及人工智能技术领域,尤其涉及一种语音播报的方法、装置、设备及存储介质。
背景技术
目前,对于不同场景中的语音播报,为了降低人力成本,目前多采用从文本到语音(TextToSpeech,TTS)播报方式对需要播报的内容或者信息进行播报。例如,对于银行支行的晨会,首先形成一个会议文案,将会议文案通过中台系统,调用相应的字转音服务,将会议文案转换为音频,传输回支行的设备中进行语音播报。
发明人意识到,上述语音播报方法需要将文案数据进行上传及将音频文件下载,若在每个时间段内对大量的文案进行语言播报的情况下,请求数据及下载数据会非常大,占用大量带宽,导致该时间段语音播报出现延迟、响应慢情况。
发明内容
本发明的目的在于提供一种语音播报的方法、装置、设备及存储介质,旨在实现及时、流畅地播报语音。
本发明提供一种语音播报的方法,包括:
在接收到语音播报请求后,根据所述语音播报请求确定对应的文案内容,所述文案内容包括多个固定文案及多个待填充的动态文案;
确定各个待填充的动态文案对应的业务系统,从对应的业务系统中获取业务数据;
对每一业务数据进行分析,获取每一业务数据对应的分析结果,将所述分析结果作为填充至对应的待填充的动态文案位置的动态文案;
从本地获取每一动态文案对应的动态音频数据;
从本地获取各个固定文案的固定音频数据,按照所述文案内容中固定文案及待填充的动态文案的先后顺序,拼接所述动态音频数据及固定音频数据,并播报拼接后的音频数据。
本发明还提供一种语音播报的装置,包括:
确定模块,用于在接收到语音播报请求后,根据所述语音播报请求确定对应的文案内容,所述文案内容包括多个固定文案及多个待填充的动态文案;
第一获取模块,用于确定各个待填充的动态文案对应的业务系统,从对应的业务系统中获取业务数据;
分析模块,用于对每一业务数据进行分析,获取每一业务数据对应的分析结果,将所述分析结果作为填充至对应的待填充的动态文案位置的动态文案;
第二获取模块,用于从本地获取每一动态文案对应的动态音频数据;
播报模块,用于从本地获取各个固定文案的固定音频数据,按照所述文案内容中固定文案及待填充的动态文案的先后顺序,拼接所述动态音频数据及固定音频数据,并播报拼接后的音频数据。
本发明还提供一种计算机设备,所述计算机设备包括存储器及与所述存储器连接的处理器,所述存储器中存储有可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述的语音播报的方法的步骤。
本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述的语音播报的方法的步骤。
本发明的有益效果是:本发明对于从文本到语音的语音播报场景,在有语音播报请求时,首先确定请求对应的文案内容,该文案内容包括固定文案及需要根据业务系统中的实际业务数据填充的动态文案,通过对业务数据的分析,得到填充至待填充的动态文案位置的动态文案,然后从本地直接获取动态文案对应的动态音频数据及各个固定文案的固定音频数据,按照文案内容中固定文案及待填充的动态文案的先后顺序,拼接动态音频数据及固定音频数据,最后播报拼接后的音频数据。本发明不需要向服务器发起字转音的请求,从而也不需要从服务器中下载音频数据,能够避免在大量语音播报请求场景下所导致的语音播报延迟、响应慢的问题,使得语音播报及时、流畅。
附图说明
图1为本发明语音播报的方法一实施例的流程示意图;
图2为本发明语音播报的装置一实施例的结构示意图;
图3为本发明计算机设备一实施例的硬件架构的示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,在本发明中涉及“第一”、“第二”等的描述仅用于描述目的,而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。另外,各个实施例之间的技术方案可以相互结合,但是必须是以本领域普通技术人员能够实现为基础,当技术方案的结合出现相互矛盾或无法实现时应当认为这种技术方案的结合不存在,也不在本发明要求的保护范围之内。
参阅图1所示,是本发明语音播报的方法一实施例的流程示意图,语音播报的方法包括:
步骤S1,在接收到语音播报请求后,根据所述语音播报请求确定对应的文案内容,所述文案内容包括多个固定文案及多个待填充的动态文案;
其中,有多种可以进行语音播报的文案内容,例如可以是晨会的文案内容或者其他会议的文案内容,各个文案内容存储在本地。当需要进行某种文案内容的语音播报时,在应用程序APP中进行点击操作以发起相应的语音播报请求,该语音播报请求中携带有文案内容的标识,通过该标识可以确定对应的文案内容。
其中,文案内容中的固定文案是固定不变的,而待填充的动态文案则需要根据实际数据进行填充。例如,对于某支行晨会的固定文案,其为:
“昨日AUM余额{1111.11}{亿}元,较上日{增加}资产{1111}{万}元。本月{减少}资产{1.11}{亿}元,环比上月{下降}{1.1}%;存款余额{1111.1}{亿}元,较上日{增加}{1111}{万}元,环比上月{增加}{12}%。”
其中“{}”中均为待填充的动态文案,需要根据各个业务系统中的实际业务数据进行填充数据;“{上升}、{下降}、{增加}、减少}”等均为需要根据实际业务数据进行分析判断得到;其余汉字部分均为固定文案,其中,“昨日AUM余额”为第一个固定文案,“元,较上日”为第二个固定文案,“资产”为第三个固定文案,等等。
步骤S2,确定各个待填充的动态文案对应的业务系统,从对应的业务系统中获取业务数据;
其中,待填充的动态文案的业务数据可以来源于一个业务系统或者多个不同的业务系统,每个待填充的动态文案均会预先标识对应的业务系统,以从该业务系统中获取业务数据。在确定本次语音播报的文案内容后,可以从相应的业务系统中获取业务数据。
步骤S3,对每一业务数据进行分析,获取每一业务数据对应的分析结果,将所述分析结果作为填充至对应的待填充的动态文案位置的动态文案;
其中,从业务系统返回的业务数据包括有符号的及没有符号的,例如业务数据为111111000000、+11110000,对于业务数据111111000000,其为纯数字形式,对于业务数据+11110000,“+”包含上升、增加的意思,需要对各个业务数据进行进一步分析,得到对应的分析结果。得到分析结果的目的是为了能够直接从本地获取该分析结果关联的音频数据。
进一步地,步骤S3对每一业务数据进行分析,获取每一业务数据对应的分析结果,将所述分析结果作为填充至对应的待填充的动态文案位置的动态文案,具体包括:对每一业务数据进行分析,若所述业务数据只包括数据部分,则确定所述数据部分的数级,基于所述数级获取所述数据部分对应的待处理数据;将所述待处理数据及所述数级的单位作为填充至对应的待填充的动态文案位置的动态文案。
步骤S3进一步包括:若所述业务数据包括符号及数据部分,则确定所述数据部分的数级,基于所述数级获取所述数据部分对应的待处理数据,基于所述符号获取对应的判断结果,所述符号部分包括正号及负号;将所述待处理数据、所述数级的单位及所述判断结果作为填充至对应的待填充的动态文案位置的动态文案。
其中,如果业务数据只包括数据部分,确定数据部分对应的数级,确定的方法为:获取数据部分的最大数级,该最大数级使得最终得到的待处理数据的小数点左边最多包括4位数,最少包括1位数。本实施例采用4位分级的方式,其数级包括个级、万级和亿级等,对应数级的单位为个、万、亿。例如,对于业务数据为111111000000,确定最大数级为亿级,待处理数据为1111.11,数级的单位为单位亿。那么,对于上述的文案内容“昨日AUM余额{1111.11}{亿}元”,上述待处理数据“1111.11”为填充至第一个{}中的动态文案,数级的单位“亿”为填充至第二个{}中的动态文案。
如果业务数据符号及数据部分,则数据部分的处理如上所述,对于符号,如果是正号,则判断结果为“增加”、“上升”等,如果是负号,则判断结果为“减少”、“下降”等,而对于正号对应的“增加”、“上升”(或者对于负号对应的“减少”、“下降”),具体取哪一个词文案内容中已经根据实际情况预定。例如,对于业务数据+11110000,确定最大数级为万级,待处理数据为1111,数级的单位为单位万,判断结果为正号对应的增加。那么,对于上述的文案内容“较上日{增加}资产{1111}{万}元”,上述判断结果“增加”为填充至第一个{}中的动态文案,待处理数据“1111”为填充至第二个{}中的动态文案,数级的单位“万”为填充至第三个{}中的动态文案。
步骤S4,从本地获取每一动态文案对应的动态音频数据;
预先将动态文案涉及的动态音频数据存储在本地,在后续应用时,可以直接从本地获取对应的动态音频数据,这样,不需要向服务器发起字转音的请求,从而也不需要从服务器中下载音频数据。
进一步地,步骤S4具体包括:获取预存的映射表,若业务数据只包括数据部分,则基于所述映射表中的关联关系从本地获取所述待处理数据关联的第一动态音频数据、所述数级的单位关联的第二动态音频数据;若所述业务数据包括符号及数据部分,则基于所述映射表中的关联关系从本地获取所述待处理数据关联的第一动态音频数据、所述数级的单位关联的第二动态音频数据及所述判断结果关联的第三动态音频数据。
其中,预先存储映射表,映射表中记录了待处理数据关联的动态音频数据、数据的单位关联的动态音频数据及判断结果关联的动态音频数据。通过该映射表中映射的对应关系,可以直接从本地获取预存的动态音频数据。
例如,对于业务数据111111000000,其只包括数据部分“111111000000”,对应的待处理数据{1111.11}、数级的单位{亿},映射表中记录待处理数据{1111.11}映射的是第一动态音频数据、数级的单位{亿}映射的是第二动态音频数据,那么从本地直接获取第一动态音频数据及第二动态音频数据。第一动态音频数据播报时为“一千一百一十一点一一”。
又如,对于业务数据+11110000,其包括符号“+”及数据部分“11110000”,对应的判断结果{增加}、待处理数据{1111}、数级的单位{万},映射表中记录判断结果{增加}映射的是第三动态音频数据,待处理数据{1111}映射的是第一动态音频数据、数级的单位{万}映射的是第二动态音频数据,那么从本地直接获取第一动态音频数据、第二动态音频数据及第三动态音频数据。
进一步地,基于所述映射表中的关联关系从本地获取所述待处理数据关联的第一动态音频数据的步骤,具体包括:将所述待处理数据切割为一个或多个单独的字符,基于所述映射表中字符与音频数据的关联关系从本地分别获取每个单独的字符对应的字符音频数据,将所获取的字符音频数据按序拼接后得到的音频数据作为所述第一动态音频数据。
其中,待处理数据中的字符包括0至9的字符及小数点“.”,在获取待处理数据关联的第一动态音频数据时,需要将待处理数据切割为多个单独的字符,映射表中具体记录的是每一个字符映射的音频数据,这样,在获取每个单独的字符对应的音频数据后,按照待处理数据中各个字符的先后顺序,将所获取的音频数据进行拼接,拼接后得到音频数据作为第一动态音频数据。
步骤S5,从本地获取各个固定文案的固定音频数据,按照所述文案内容中固定文案及待填充的动态文案的先后顺序,拼接所述动态音频数据及固定音频数据,并播报拼接后的音频数据。
预先将各个固定文案的固定音频数据存储在本地,在后续应用时,可以直接从本地获取对应的固定音频数据,这样,不需要向服务器发起字转音的请求,从而也不需要从服务器中下载音频数据。
本实施例在获取动态音频数据及固定音频数据后,按照文案内容中固定文案及待填充的动态文案的先后顺序,拼接动态音频数据及固定音频数据,拼接后音频数据可以进行播报。
本实施例中,对于从文本到语音的语音播报场景,在有语音播报请求时,首先确定请求对应的文案内容,该文案内容包括固定文案及需要根据业务系统中的实际业务数据填充的动态文案,通过对业务数据的分析,得到填充至待填充的动态文案位置的动态文案,然后从本地直接获取动态文案对应的动态音频数据及各个固定文案的固定音频数据,按照文案内容中固定文案及待填充的动态文案的先后顺序,拼接动态音频数据及固定音频数据,最后播报拼接后的音频数据。本实施例不需要向服务器发起字转音的请求,从而也不需要从服务器中下载音频数据,能够避免在大量语音播报请求场景下所导致的语音播报延迟、响应慢的问题,使得语音播报及时、流畅。
进一步地,在其他实施例中,在上述步骤S4之后,还包括:获取前置音频数据,在所述拼接后的音频数据之前拼接所述前置音频数据并播报。
其中,前置音频数据可以根据语音播报的场景进行确定,一种语音播报的场景可以配置多种不同的前置音频数据。例如对于会议的语音播报的场景,前置音频数据可以是开场白的音频数据,也可以是当前日期的音频数据等。通过前置音频数据,并在前述拼接后的音频数据之前拼接前置音频数据,可以贴近当前的语音播报的场景,提高应用的灵活性。
进一步地,在其他实施例中,在上述步骤S4从本地获取每一动态文案对应的动态音频数据的步骤之前,还包括以下步骤:
将所述文案内容中各个固定文案及各个待填充的动态文案涉及的内容发送至预定的服务器中,接收所述服务器返回的各个固定文案对应的固定音频数据及各个待填充的动态文案涉及的内容对应的动态音频数据,并存储在本地。
其中,对于多个文案内容,将每个文案内容中各个固定文案及各个待填充的动态文案涉及的内容发送至预定的服务器中,通过该服务器提供的字转音服务,得到对应的固定音频数据及动态音频数据。
其中,对于各个待填充的动态文案涉及的内容包括判断结果、待处理数据及数级的单位,判断结果包括增加、上升、减少、下降等,待处理数据中包括字符0至9的字符及小数点,数级的单位包括个、万、亿等。这些词及字符为待填充的动态文案涉及的内容,会发送至服务器进行字转音,得到每个词、字符对应的音频数据,音频数据存储在本地。这样,可以直接从本地获取相应的音频数据,不需要向服务器发起字转音的请求,从而也不需要从服务器中下载音频数据。
在一实施例中,本发明提供一种语音播报的装置,该语音播报的装置与上述实施例中方法一一对应。如图2所示,该语音播报的装置包括:
确定模块101,用于在接收到语音播报请求后,根据所述语音播报请求确定对应的文案内容,所述文案内容包括多个固定文案及多个待填充的动态文案;
第一获取模块102,用于确定各个待填充的动态文案对应的业务系统,从对应的业务系统中获取业务数据;
分析模块103,用于对每一业务数据进行分析,获取每一业务数据对应的分析结果,将所述分析结果作为填充至对应的待填充的动态文案位置的动态文案;
第二获取模块104,用于从本地获取每一动态文案对应的动态音频数据;
播报模块105,用于从本地获取各个固定文案的固定音频数据,按照所述文案内容中固定文案及待填充的动态文案的先后顺序,拼接所述动态音频数据及固定音频数据,并播报拼接后的音频数据。
语音播报的装置的具体限定可以参见上文中对于语音播报的方法的限定,在此不再赘述。上述语音播报的装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备是一种能够按照事先设定或者存储的指令,自动进行数值计算和/或信息处理的设备。所述计算机设备可以是PC(Personal Computer,个人电脑),或者是智能手机、平板电脑、计算机、也可以是单个网络服务器、多个网络服务器组成的服务器组或者基于云计算的由大量主机或者网络服务器构成的云,其中云计算是分布式计算的一种,由一群松散耦合的计算机集组成的一个超级虚拟计算机。
如图3所示,所述计算机设备可包括,但不仅限于,可通过系统总线相互通信连接的存储器11、处理器12、网络接口13,存储器11存储有可在处理器12上运行的计算机程序。需要指出的是,图3仅示出了具有组件11-13的计算机设备,但是应理解的是,并不要求实施所有示出的组件,可以替代的实施更多或者更少的组件。
其中,存储器11可以是非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。本实施例中,存储器11的可读存储介质通常用于存储安装于计算机设备的操作系统和各类应用软件,例如存储本发明一实施例中的计算机程序的程序代码等。此外,存储器11还可以用于暂时地存储已经输出或者将要输出的各类数据。
所述处理器12在一些实施例中可以是中央处理器(Central Processing Unit,CPU)、控制器、微控制器、微处理器、或其他数据处理芯片,用于运行所述存储器11中存储的程序代码或者处理数据,例如运行计算机程序等。
所述网络接口13可包括标准的无线网络接口、有线网络接口,该网络接口13通常用于在所述计算机设备与其他电子设备之间建立通信连接。
所述计算机程序存储在存储器11中,包括至少一个存储在存储器11中的计算机可读指令,该至少一个计算机可读指令可被处理器12执行,以实现本申请各实施例的方法,包括:
在接收到语音播报请求后,根据所述语音播报请求确定对应的文案内容,所述文案内容包括多个固定文案及多个待填充的动态文案;
确定各个待填充的动态文案对应的业务系统,从对应的业务系统中获取业务数据;
对每一业务数据进行分析,获取每一业务数据对应的分析结果,将所述分析结果作为填充至对应的待填充的动态文案位置的动态文案;
从本地获取每一动态文案对应的动态音频数据;
从本地获取各个固定文案的固定音频数据,按照所述文案内容中固定文案及待填充的动态文案的先后顺序,拼接所述动态音频数据及固定音频数据,并播报拼接后的音频数据。
进一步地,所述对每一业务数据进行分析,获取每一业务数据对应的分析结果,将所述分析结果作为填充至对应的待填充的动态文案位置的动态文案的步骤,具体包括:
对每一业务数据进行分析,若所述业务数据只包括数据部分,则确定所述数据部分的数级,基于所述数级获取所述数据部分对应的待处理数据;
将所述待处理数据及所述数级的单位作为填充至对应的待填充的动态文案位置的动态文案。
进一步地,所述对每一业务数据进行分析,获取每一业务数据对应的分析结果,将所述分析结果作为填充至对应的待填充的动态文案位置的动态文案的步骤,进一步包括:
若所述业务数据包括符号及数据部分,则确定所述数据部分的数级,基于所述数级获取所述数据部分对应的待处理数据,基于所述符号获取对应的判断结果,所述符号部分包括正号及负号;
将所述待处理数据、所述数级的单位及所述判断结果作为填充至对应的待填充的动态文案位置的动态文案。
进一步地,所述从本地获取每一动态文案对应的动态音频数据的步骤,具体包括:
获取预存的映射表,若业务数据只包括数据部分,则基于所述映射表中的关联关系从本地获取所述待处理数据关联的第一动态音频数据、所述数级的单位关联的第二动态音频数据;
若所述业务数据包括符号及数据部分,则基于所述映射表中的关联关系从本地获取所述待处理数据关联的第一动态音频数据、所述数级的单位关联的第二动态音频数据及所述判断结果关联的第三动态音频数据。
进一步地,所述基于所述映射表中的关联关系从本地获取所述待处理数据关联的第一动态音频数据的步骤,具体包括:
将所述待处理数据切割为一个或多个单独的字符,基于所述映射表中字符与音频数据的关联关系从本地分别获取每个单独的字符对应的字符音频数据,将所获取的字符音频数据按序拼接后得到的音频数据作为所述第一动态音频数据,所述字符包括小数点及数字0至9。
进一步地,所述从本地获取各个固定文案的固定音频数据,按照所述文案内容中固定文案及待填充的动态文案的先后顺序,拼接所述动态音频数据及固定音频数据,并播报拼接后的音频数据之后,还包括:
获取前置音频数据,在所述拼接后的音频数据之前拼接所述前置音频数据并播报。
进一步地,所述从本地获取每一动态文案对应的动态音频数据的步骤之前,还包括:
将所述文案内容中各个固定文案及各个待填充的动态文案涉及的内容发送至预定的服务器中,接收所述服务器返回的各个固定文案对应的固定音频数据及各个待填充的动态文案涉及的内容对应的动态音频数据,并存储在本地。
本实施例对于从文本到语音的语音播报场景,在有语音播报请求时,首先确定请求对应的文案内容,该文案内容包括固定文案及需要根据业务系统中的实际业务数据填充的动态文案,通过对业务数据的分析,得到填充至待填充的动态文案位置的动态文案,然后从本地直接获取动态文案对应的动态音频数据及各个固定文案的固定音频数据,按照文案内容中固定文案及待填充的动态文案的先后顺序,拼接动态音频数据及固定音频数据,最后播报拼接后的音频数据。本实施例不需要向服务器发起字转音的请求,从而也不需要从服务器中下载音频数据,能够避免在大量语音播报请求场景下所导致的语音播报延迟、响应慢的问题,使得语音播报及时、流畅。
在一个实施例中,本发明提供了一种计算机可读存储介质,计算机可读存储介质可以是非易失性和/或易失性存储器,其上存储有计算机程序,计算机程序被处理器执行时实现上述实施例中语音播报的方法的步骤,包括:
在接收到语音播报请求后,根据所述语音播报请求确定对应的文案内容,所述文案内容包括多个固定文案及多个待填充的动态文案;
确定各个待填充的动态文案对应的业务系统,从对应的业务系统中获取业务数据;
对每一业务数据进行分析,获取每一业务数据对应的分析结果,将所述分析结果作为填充至对应的待填充的动态文案位置的动态文案;
从本地获取每一动态文案对应的动态音频数据;
从本地获取各个固定文案的固定音频数据,按照所述文案内容中固定文案及待填充的动态文案的先后顺序,拼接所述动态音频数据及固定音频数据,并播报拼接后的音频数据。
进一步地,所述对每一业务数据进行分析,获取每一业务数据对应的分析结果,将所述分析结果作为填充至对应的待填充的动态文案位置的动态文案的步骤,具体包括:
对每一业务数据进行分析,若所述业务数据只包括数据部分,则确定所述数据部分的数级,基于所述数级获取所述数据部分对应的待处理数据;
将所述待处理数据及所述数级的单位作为填充至对应的待填充的动态文案位置的动态文案。
进一步地,所述对每一业务数据进行分析,获取每一业务数据对应的分析结果,将所述分析结果作为填充至对应的待填充的动态文案位置的动态文案的步骤,进一步包括:
若所述业务数据包括符号及数据部分,则确定所述数据部分的数级,基于所述数级获取所述数据部分对应的待处理数据,基于所述符号获取对应的判断结果,所述符号部分包括正号及负号;
将所述待处理数据、所述数级的单位及所述判断结果作为填充至对应的待填充的动态文案位置的动态文案。
进一步地,所述从本地获取每一动态文案对应的动态音频数据的步骤,具体包括:
获取预存的映射表,若业务数据只包括数据部分,则基于所述映射表中的关联关系从本地获取所述待处理数据关联的第一动态音频数据、所述数级的单位关联的第二动态音频数据;
若所述业务数据包括符号及数据部分,则基于所述映射表中的关联关系从本地获取所述待处理数据关联的第一动态音频数据、所述数级的单位关联的第二动态音频数据及所述判断结果关联的第三动态音频数据。
进一步地,所述基于所述映射表中的关联关系从本地获取所述待处理数据关联的第一动态音频数据的步骤,具体包括:
将所述待处理数据切割为一个或多个单独的字符,基于所述映射表中字符与音频数据的关联关系从本地分别获取每个单独的字符对应的字符音频数据,将所获取的字符音频数据按序拼接后得到的音频数据作为所述第一动态音频数据,所述字符包括小数点及数字0至9。
进一步地,所述从本地获取各个固定文案的固定音频数据,按照所述文案内容中固定文案及待填充的动态文案的先后顺序,拼接所述动态音频数据及固定音频数据,并播报拼接后的音频数据之后,还包括:
获取前置音频数据,在所述拼接后的音频数据之前拼接所述前置音频数据并播报。
进一步地,所述从本地获取每一动态文案对应的动态音频数据的步骤之前,还包括:
将所述文案内容中各个固定文案及各个待填充的动态文案涉及的内容发送至预定的服务器中,接收所述服务器返回的各个固定文案对应的固定音频数据及各个待填充的动态文案涉及的内容对应的动态音频数据,并存储在本地。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,该计算机程序在执行时,可包括如上述各方法的实施例的流程。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、装置、物品或者方法所固有的要素。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (10)

1.一种语音播报的方法,其特征在于,包括:
在接收到语音播报请求后,根据所述语音播报请求确定对应的文案内容,所述文案内容包括多个固定文案及多个待填充的动态文案;
确定各个待填充的动态文案对应的业务系统,从对应的业务系统中获取业务数据;
对每一业务数据进行分析,获取每一业务数据对应的分析结果,将所述分析结果作为填充至对应的待填充的动态文案位置的动态文案;
从本地获取每一动态文案对应的动态音频数据;
从本地获取各个固定文案的固定音频数据,按照所述文案内容中固定文案及待填充的动态文案的先后顺序,拼接所述动态音频数据及固定音频数据,并播报拼接后的音频数据。
2.根据权利要求1所述的语音播报的方法,其特征在于,所述对每一业务数据进行分析,获取每一业务数据对应的分析结果,将所述分析结果作为填充至对应的待填充的动态文案位置的动态文案的步骤,具体包括:
对每一业务数据进行分析,若所述业务数据只包括数据部分,则确定所述数据部分的数级,基于所述数级获取所述数据部分对应的待处理数据;
将所述待处理数据及所述数级的单位作为填充至对应的待填充的动态文案位置的动态文案。
3.根据权利要求2所述的语音播报的方法,其特征在于,所述对每一业务数据进行分析,获取每一业务数据对应的分析结果,将所述分析结果作为填充至对应的待填充的动态文案位置的动态文案的步骤,进一步包括:
若所述业务数据包括符号及数据部分,则确定所述数据部分的数级,基于所述数级获取所述数据部分对应的待处理数据,基于所述符号获取对应的判断结果,所述符号部分包括正号及负号;
将所述待处理数据、所述数级的单位及所述判断结果作为填充至对应的待填充的动态文案位置的动态文案。
4.根据权利要求3所述的语音播报的方法,其特征在于,所述从本地获取每一动态文案对应的动态音频数据的步骤,具体包括:
获取预存的映射表,若业务数据只包括数据部分,则基于所述映射表中的关联关系从本地获取所述待处理数据关联的第一动态音频数据、所述数级的单位关联的第二动态音频数据;
若所述业务数据包括符号及数据部分,则基于所述映射表中的关联关系从本地获取所述待处理数据关联的第一动态音频数据、所述数级的单位关联的第二动态音频数据及所述判断结果关联的第三动态音频数据。
5.根据权利要求4所述的语音播报的方法,其特征在于,所述基于所述映射表中的关联关系从本地获取所述待处理数据关联的第一动态音频数据的步骤,具体包括:
将所述待处理数据切割为一个或多个单独的字符,基于所述映射表中字符与音频数据的关联关系从本地分别获取每个单独的字符对应的字符音频数据,将所获取的字符音频数据按序拼接后得到的音频数据作为所述第一动态音频数据,所述字符包括小数点及数字0至9。
6.根据权利要求1所述的语音播报的方法,其特征在于,所述从本地获取各个固定文案的固定音频数据,按照所述文案内容中固定文案及待填充的动态文案的先后顺序,拼接所述动态音频数据及固定音频数据,并播报拼接后的音频数据之后,还包括:
获取前置音频数据,在所述拼接后的音频数据之前拼接所述前置音频数据并播报。
7.根据权利要求1至6任一项所述的语音播报的方法,其特征在于,所述从本地获取每一动态文案对应的动态音频数据的步骤之前,还包括:
将所述文案内容中各个固定文案及各个待填充的动态文案涉及的内容发送至预定的服务器中,接收所述服务器返回的各个固定文案对应的固定音频数据及各个待填充的动态文案涉及的内容对应的动态音频数据,并存储在本地。
8.一种语音播报的装置,其特征在于,包括:
确定模块,用于在接收到语音播报请求后,根据所述语音播报请求确定对应的文案内容,所述文案内容包括多个固定文案及多个待填充的动态文案;
第一获取模块,用于确定各个待填充的动态文案对应的业务系统,从对应的业务系统中获取业务数据;
分析模块,用于对每一业务数据进行分析,获取每一业务数据对应的分析结果,将所述分析结果作为填充至对应的待填充的动态文案位置的动态文案;
第二获取模块,用于从本地获取每一动态文案对应的动态音频数据;
播报模块,用于从本地获取各个固定文案的固定音频数据,按照所述文案内容中固定文案及待填充的动态文案的先后顺序,拼接所述动态音频数据及固定音频数据,并播报拼接后的音频数据。
9.一种计算机设备,所述计算机设备包括存储器及与所述存储器连接的处理器,所述存储器中存储有可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7中任一项所述的语音播报的方法的步骤。
10.一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7中任一项所述的语音播报的方法的步骤。
CN202011532791.4A 2020-12-22 2020-12-22 语音播报的方法、装置、设备及存储介质 Active CN112614480B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011532791.4A CN112614480B (zh) 2020-12-22 2020-12-22 语音播报的方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011532791.4A CN112614480B (zh) 2020-12-22 2020-12-22 语音播报的方法、装置、设备及存储介质

Publications (2)

Publication Number Publication Date
CN112614480A true CN112614480A (zh) 2021-04-06
CN112614480B CN112614480B (zh) 2023-09-15

Family

ID=75244210

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011532791.4A Active CN112614480B (zh) 2020-12-22 2020-12-22 语音播报的方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN112614480B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006023592A (ja) * 2004-07-08 2006-01-26 Sony Corp 音声合成装置及び音声合成方法
CN103137124A (zh) * 2013-02-04 2013-06-05 武汉今视道电子信息科技有限公司 一种语音合成方法
CN110017847A (zh) * 2019-03-21 2019-07-16 腾讯大地通途(北京)科技有限公司 一种自适应导航语音播报方法、装置及系统
CN110047462A (zh) * 2019-01-31 2019-07-23 北京捷通华声科技股份有限公司 一种语音合成方法、装置和电子设备

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006023592A (ja) * 2004-07-08 2006-01-26 Sony Corp 音声合成装置及び音声合成方法
CN103137124A (zh) * 2013-02-04 2013-06-05 武汉今视道电子信息科技有限公司 一种语音合成方法
CN110047462A (zh) * 2019-01-31 2019-07-23 北京捷通华声科技股份有限公司 一种语音合成方法、装置和电子设备
CN110017847A (zh) * 2019-03-21 2019-07-16 腾讯大地通途(北京)科技有限公司 一种自适应导航语音播报方法、装置及系统

Also Published As

Publication number Publication date
CN112614480B (zh) 2023-09-15

Similar Documents

Publication Publication Date Title
US20190081914A1 (en) Method and apparatus for generating candidate reply message
CN109617647B (zh) 报文转换方法、装置、计算机设备及计算机可读存储介质
CN108052553B (zh) 电子手册生成的方法、装置、计算机设备及存储介质
CN110532107B (zh) 接口调用方法、装置、计算机设备及存储介质
CN112769802B (zh) 基于服务端的访问校验方法、装置、电子设备及存储介质
CN111191079A (zh) 一种文档内容获取方法、装置、设备及存储介质
CN109062906B (zh) 程序语言资源的翻译方法及装置
CN111144402A (zh) Ocr识别准确率的计算方法、装置、设备以及存储介质
CN113626223A (zh) 一种接口调用方法和装置
CN112422450B (zh) 计算机设备、服务请求的流量控制方法及装置
WO2022156087A1 (zh) 数据血缘关系建立方法、装置、计算机设备及存储介质
CN111126001A (zh) 文字标注方法、装置、设备及存储介质
CN105988995A (zh) 一种基于HFile批量加载数据的方法
CN111382570A (zh) 文本实体识别方法、装置、计算机设备及存储介质
CN113593519A (zh) 文本的语音合成方法、系统、装置、设备及存储介质
CN112614480A (zh) 语音播报的方法、装置、设备及存储介质
CN116955557A (zh) 应用于大语言模型的提示词确定方法、装置、设备及介质
CN114840634B (zh) 信息存储方法、装置、电子设备和计算机可读介质
CN112615869B (zh) 音频数据的处理方法、装置、设备及存储介质
CN113626438B (zh) 一种数据表管理的方法、装置、计算机设备及存储介质
CN114510908A (zh) 数据导出方法、装置、计算机设备及存储介质
CN112992151A (zh) 语音识别方法、系统、设备和可读存储介质
CN113256133A (zh) 会议纪要管理方法、装置、计算机设备及存储介质
CN113240555A (zh) 一种合同修改的方法及装置
CN112948474A (zh) 数据导出方法、装置、设备及计算机可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant