CN114120961A - 语音播报方法、装置、设备及存储介质 - Google Patents
语音播报方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN114120961A CN114120961A CN202111376129.9A CN202111376129A CN114120961A CN 114120961 A CN114120961 A CN 114120961A CN 202111376129 A CN202111376129 A CN 202111376129A CN 114120961 A CN114120961 A CN 114120961A
- Authority
- CN
- China
- Prior art keywords
- voice
- file
- target
- broadcasted
- attribute information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 62
- 238000006243 chemical reaction Methods 0.000 claims description 27
- 238000004590 computer program Methods 0.000 claims description 6
- 238000012545 processing Methods 0.000 description 26
- 238000012544 monitoring process Methods 0.000 description 11
- 238000010586 diagram Methods 0.000 description 8
- LIWAQLJGPBVORC-UHFFFAOYSA-N ethylmethylamine Chemical compound CCNC LIWAQLJGPBVORC-UHFFFAOYSA-N 0.000 description 7
- 230000003287 optical effect Effects 0.000 description 6
- 230000006870 function Effects 0.000 description 4
- 230000002159 abnormal effect Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 230000001186 cumulative effect Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 239000013307 optical fiber Substances 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 238000007670 refining Methods 0.000 description 2
- 230000001960 triggered effect Effects 0.000 description 2
- 238000003491 array Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/02—Methods for producing synthetic speech; Speech synthesisers
-
- G—PHYSICS
- G07—CHECKING-DEVICES
- G07C—TIME OR ATTENDANCE REGISTERS; REGISTERING OR INDICATING THE WORKING OF MACHINES; GENERATING RANDOM NUMBERS; VOTING OR LOTTERY APPARATUS; ARRANGEMENTS, SYSTEMS OR APPARATUS FOR CHECKING NOT PROVIDED FOR ELSEWHERE
- G07C5/00—Registering or indicating the working of vehicles
- G07C5/08—Registering or indicating performance data other than driving, working, idle, or waiting time, with or without registering driving, working, idle or waiting time
- G07C5/0816—Indicating performance data, e.g. occurrence of a malfunction
- G07C5/0833—Indicating performance data, e.g. occurrence of a malfunction using audio means
-
- G—PHYSICS
- G08—SIGNALLING
- G08B—SIGNALLING OR CALLING SYSTEMS; ORDER TELEGRAPHS; ALARM SYSTEMS
- G08B21/00—Alarms responsive to a single specified undesired or abnormal condition and not otherwise provided for
- G08B21/18—Status alarms
- G08B21/24—Reminder alarms, e.g. anti-loss alarms
-
- G—PHYSICS
- G08—SIGNALLING
- G08B—SIGNALLING OR CALLING SYSTEMS; ORDER TELEGRAPHS; ALARM SYSTEMS
- G08B3/00—Audible signalling systems; Audible personal calling systems
- G08B3/10—Audible signalling systems; Audible personal calling systems using electric transmission; using electromagnetic transmission
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/02—Methods for producing synthetic speech; Speech synthesisers
- G10L13/04—Details of speech synthesis systems, e.g. synthesiser structure or memory management
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- General Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Business, Economics & Management (AREA)
- Emergency Management (AREA)
- Electromagnetism (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
Abstract
本申请实施例公开了一种语音播报方法、装置、设备及存储介质。其中,该方法包括:根据车辆当前行驶状态,获取待转换语音文本,将所述待转换语音文本转换为待播报语音数据流;将所述待播报语音数据流存储为待播报语音文件,确定所述待播报语音文件的文件属性信息,其中,所述文件属性信息包括文件存储路径;将所述待播报语音文件的文件属性信息发送至预设队列,从预设队列中获取预设排序的目标文件属性信息;根据所述目标文件属性信息中的目标文件存储路径,确定目标语音文件,从目标语音文件中获取目标语音数据流进行语音播报。本申请实施例提高了车辆语音播报的效率。
Description
技术领域
本申请实施例涉及车辆控制技术领域,尤其涉及一种语音播报方法、装置、设备及存储介质。
背景技术
随着汽车领域的不断发展,针对驾驶员在行驶过程中的各种行驶状况,例如驾驶员疲劳驾驶,需要采用语音报警的方式向驾驶员予以提示,以保障驾驶员能够根据语音报警提示做出相应的安全措施。
在现有技术领域中,语音报警方式通常采用预先录制好的音频编码格式的音频文件进行编解码,实现语音播报;或者,需要添加CODEC硬件模块,对语音文件进行编解码处理,增加了硬件成本,而且,采用CODEC硬件实现的语音播报方式可能会出现播效果不太理想的情况,影响语音播报的效率和精度,降低了用户的使用体验感。
发明内容
本申请实施例提供一种语音播报方法、装置、设备及存储介质,以提高车辆语音播报的效率。
第一方面,本申请实施例提供了一种语音播报方法,该方法包括:
根据车辆当前行驶状态,获取待转换语音文本,将所述待转换语音文本转换为待播报语音数据流;
将所述待播报语音数据流存储为待播报语音文件,确定所述待播报语音文件的文件属性信息,其中,所述文件属性信息包括文件存储路径;
将所述待播报语音文件的文件属性信息发送至预设队列,从预设队列中获取预设排序的目标文件属性信息;
根据所述目标文件属性信息中的目标文件存储路径,确定目标语音文件,从目标语音文件中获取目标语音数据流进行语音播报。
第二方面,本申请实施例还提供了一种语音播报装置,该装置包括:
数据流获取模块,用于根据车辆当前行驶状态,获取待转换语音文本,将所述待转换语音文本转换为待播报语音数据流;
文件属性信息确定模块,用于将所述待播报语音数据流存储为待播报语音文件,确定所述待播报语音文件的文件属性信息,其中,所述文件属性信息包括文件存储路径;
目标文件属性信息获取模块,用于将所述待播报语音文件的文件属性信息发送至预设队列,从预设队列中获取预设排序的目标文件属性信息;
语音播报模块,用于根据所述目标文件属性信息中的目标文件存储路径,确定目标语音文件,从目标语音文件中获取目标语音数据流进行语音播报。
第三方面,本申请实施例还提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其中,所述处理器执行所述程序时实现如本申请实施例中任一所述的语音播报方法。
第四方面,本申请实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,其中,该程序被处理器执行时实现如本申请实施例中任一所述的语音播报方法。
本申请实施例通过根据车辆当前行驶状态,获取待转换语音文本,并将待转换语音文本转换为待播报语音数据流;将待播报语音数据流存储为待播报语音文件,确定待播报语音文件的文件属性信息;将待播报语音文件的文件属性信息发送至预设队列,从预设队列中获取预设排序的目标文件属性信息;根据目标文件属性信息中的目标文件存储路径,确定目标语音文件,从目标语音文件中获取目标语音数据流进行语音播报。上述方案通过获取待转换语音文本的方式,实现了能够根据车辆当前行驶状态,实时进行语音播报,使得整个语音播报过程的灵活度较高,提高了车辆语音播报的精度和效率,给用户带来良好的使用体验。通过软件的方式对语音数据流的接收和播放进行处理,减少了硬件模块的使用,降低了硬件成本。
附图说明
图1A是本申请的一种语音播报系统的结构示意图;
图1B是本申请实施例一中的一种语音播报方法的流程示意图;
图2是本申请实施例二中的一种语音播报方法的流程示意图;
图3是本申请实施例三中的一种语音播报方法的流程示意图;
图4是本申请实施例四中的一种语音播报方法的流程示意图;
图5是本申请实施例五中的一种语音播报方法的流程示意图;
图6是本申请实施例六中的一种语音播报装置的结构框图;
图7是本申请实施例七中的一种电子设备的结构示意图。
具体实施方式
下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本申请,而非对本申请的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本申请相关的部分而非全部结构。
图1A为本申请提供一种语音播报系统的结构示意图,如图1A所示,该系统包括:监测模块10、转换模块20和数据处理模块30,其中,转换模块20分别与监测模块10和数据处理模块30相连接,用于进行接收监测模块10的待转换语音文本数据并将待播报数据流发送至数据处理模块30。
实施例一
图1B为本申请实施例一提供的一种语音播报方法的流程示意图,本实施例可适用于对车辆行驶过程中的驾驶员的行驶情况进行实时播报的情况,该方法可以由语音播报装置来执行,该装置配置于语音播报系统中,可采用软件和/或硬件的方式实现,如图1B所示,该方法具体包括如下步骤:
S110、根据车辆当前行驶状态,获取待转换语音文本,将待转换语音文本转换为待播报语音数据流。
车辆当前行驶状态可以包括车辆当前车速、车辆当前累计行驶时长和车辆当前累计行驶公里数等中的至少一种。需要说明的是,车辆当前累计行驶时长和车辆当前累计行驶公里数均为车辆自启动时刻至当前时刻的累计行驶时长和累计行驶公里数。车辆当前行驶状态可以由监测模块10确定,并由监测模块10根据车辆当前行驶状态确定待转换语音文本。
待转换语音文本可以是根据车辆当前行驶状态确定的语音文本,例如,车辆当前行驶状态为车辆当前累计行驶时长为12小时,对应的待转换语音文本可以是“车辆当前累计行驶时长已达到12小时,请在合适的停车区域稍作休息”。其中,待转换语音文本可以是任意语言类型的文本,例如,待转换语音文本的语言类型可以是中文、英文、韩文或德文等。
待转换语音文本可以由监测模块确定,并发送至转换模块,由转换模块将待转换语音文本转换为待播报语音数据流。其中,转换模块可以是转换芯片或转换电路,其中,转换芯片可以是4G网络转换芯片。待播报语音数据流可以是任意语音格式的数据流,具体可以由相关技术人员提前预设。优选的,待播报语音数据流可以是PCM(Pulse-CodeModulation,脉冲调制编码)格式的数据流。PCM格式的音频数据是未经压缩的音频数据,因此,后续在进行语音播报时,无需进行解码操作,语音播放效果好且不容易失真。通过软件的方式对PCM语音数据流的接收和播放进行处理,替代了硬件模块的功能,降低了硬件成本。
示例性的,采用转换芯片将待转换语音文本转换为待播报数据流,转换芯片可以包括用于进行通信传输的AT端口和NMEA端口,其中,AT端口可以用于接收待转换语音文本,并输出判断结果,判断结果可以包括转换芯片接收到了待转换语音文本和转换芯片未接收到待转换语音文本。NMEA端口用于输出转换后的待播报语音数据流。
示例性的,可以通过转换芯片的AT端口判断转换芯片是否接收到了待转换语音文本,若是,则转换芯片可以通过AT端口向数据处理模块发送接收成功指示,若否,则转换芯片可以通过AT端口向数据处理模块发送未接收成功指示,数据处理模块在接收到未接收成功的指示后,可以向用户反馈语音报警提示,提示内容可以由相关技术人员进行预先设定,例如,反馈的语音报警提示的内容可以是“语音播报失败”。
可选的,可以在转换芯片接收待转换语音文本之前,提前进行NMEA端口初始化操作,从而使得NMEA端口能够稳定的将待播报语音数据流发送至数据处理模块。
可选的,数据处理模块接收到AT端口的接收成功指示之后,可以实时的监听转换芯片的NMEA端口,时刻准备从NMEA端口中接收PCM数据流。
获取用户所选择的语言类型和用户的车辆当前行驶状态,根据车辆当前行驶状态和选择的语言类型,确定待转换语音文本;由转换模块实时获取监测模块发送的待转换语音文本,并根据预设语音格式的数据流,例如,PCM格式的数据流,将获取的待转换语音文本转换为待播报语音数据流。
S120、将待播报语音数据流存储为待播报语音文件,确定待播报语音文件的文件属性信息,其中,文件属性信息包括文件存储路径。
其中,待播报语音文件中存储有待播报语音数据流,该待播报语音文件可以是临时存储于数据库中的文件。并且,待播报语音文件的文件格式与待播报语音数据流的数据格式相对应,例如,待播报语音数据流的数据格式为PCM格式的数据流,相应的,PCM格式的待播报语音数据流对应的待播报语音文件为PCM格式的语音文件。文件属性信息可以包括能够表示待播报语音文件属性的至少一条属性信息,例如,文件属性信息可以包括文件存储路径等。
示例性的,可以由数据处理模块获取待播报语音数据流,并根据待播报语音数据流的数据格式,将待播报语音数据流存储为待播报语音文件;由数据处理模块确定待播报语音文件的文件属性信息,其中,文件属性信息包括文件存储路径。可选的,数据处理模块可以将待播报语音文件,以及待播报语音文件对应的文件属性信息临时存储在数据库中,并在语音播报结束后删除临时存储的待播报语音文件和待播报语音文件对应的文件属性信息,避免了存储空间的占用。
S130、将待播报语音文件的文件属性信息发送至预设队列,从预设队列中获取预设排序的目标文件属性信息。
其中,预设队列可以是用于存放至少一条待播放语音文件的文件属性信息的线性表,预设队列的长度可以由相关技术人员根据实际需求进行预先设置,例如,可以根据预设时间内可能触发的语音播报事件的数量进行设定,预设时间可以是10秒。根据实际情况对预设队列的长度进行设置,避免了预设队列长度设置过小导致语音播报的高效性和流畅度,同时,避免了预设队列长度设置过大导致对内存空间的占用。
预设排序可以是队列中至少一个文件属性信息从队头至队尾的排列顺序,例如,预设排序是位于队头的第一位的排序,目标文件属性信息可以是位于队头的文件属性信息。由数据处理模块将待播报语音文件的文件属性信息发送至预设队列,根据预设队列的预设排序,获取预设队列中处于队头的文件属性信息,作为目标文件属性信息。
S140、根据目标文件属性信息中的目标文件存储路径,确定目标语音文件,从目标语音文件中获取目标语音数据流进行语音播报。
获取目标文件属性信息中的目标存储路径,根据目标存储路径,可以确定该存储路径下的目标语音文件。其中,目标语音文件是待播报语音文件中,用于进行语音播报所需的语音文件。目标语音文件中的语音数据流是目标语音数据流,从目标语音文件中获取目标语音数据流,并根据目标语音数据流进行语音播报。其中,目标语音数据流是用于进行语音播报的数据流。示例性的,可以将从目标语音文件获取的目标语音数据流发送至能够进行语音处理的平台芯片,由平台芯片的语音输出接口对目标语音数据流进行语音播报。
可选的,可以根据目标语音数据流对应的语音格式,确定是否需要对目标语音数据流进行解码操作,若是,则将解码后的数据流进行语音播报,若否,则直接将获取的目标语音数据流进行播报。示例性的,若目标语音数据流的语音格式为PCM格式,由于PCM格式为未压缩格式,则无需解码,可以直接将PCM格式的目标语音数据流进行语音播报。
可选的,在将待播报语音文件的文件属性信息发送至预设队列后,可以预先创建线程,基于预设的队列排序,将从队列中获取的预设排序内的文件属性信息作为目标文件属性信息,并放入创建的线程中;根据线程中目标文件属性信息中的目标文件存储路径,确定目标语音文件,从目标语音文件中获取目标语音数据流进行语音播报。
本申请实施例通过根据车辆当前行驶状态,获取待转换语音文本,并将待转换语音文本转换为待播报语音数据流;将待播报语音数据流存储为待播报语音文件,确定待播报语音文件的文件属性信息;将待播报语音文件的文件属性信息发送至预设队列,从预设队列中获取预设排序的目标文件属性信息;根据目标文件属性信息中的目标文件存储路径,确定目标语音文件,从目标语音文件中获取目标语音数据流进行语音播报。上述方案通过获取待转换语音文本的方式,实现了能够根据车辆当前行驶状态,实时进行语音播报,使得整个语音播报过程的灵活度较高,提高了车辆语音播报的精度和效率,给用户带来良好的使用体验。通过软件的方式对语音数据流的接收和播放进行处理,减少了硬件模块的使用,降低了硬件成本。
实施例二
图2为本申请实施例二提供的一种语音播报方法的流程示意图,本实施例在上述各技术方案的基础上,进行了优化改进。
进一步,将“根据车辆当前行驶状态,获取待转换语音文本”,细化为“根据车辆当前行驶状态,以及预设的行驶状态与语音文本模板之间的关联关系,确定与车辆当前行驶状态相关联的待转换语音文本。”以完善对待转换语音文本的确定方式。
如图2所示,该方法包括以下具体步骤:
S210、根据车辆当前行驶状态,以及预设的行驶状态与语音文本模板之间的关联关系,确定与车辆当前行驶状态相关联的待转换语音文本。
待转换语音文本与车辆当前行驶状态有关,可以根据车辆的不同行驶状态对应的不同语音文本模板,生成不同的待转换语音文本。其中,语音文本模板可以是由相关技术人员根据不同车辆行驶状态进行预先设定。例如,若车辆的行驶状态为车辆当前累计行驶时长,则对应的语音文本模板可以是“车辆当前的累计行驶时长已达到xxx小时,请在合适的停车区域稍作休息”。需要说明的是,根据用户所选的语言类型不同,相应的,各行驶状态对应的语音文本不同,具体可以由相关技术人员根据不同语言类型对不同语音文本模板进行设定,本实施例对此不进行限制。
在一个可选实施例中,根据车辆当前行驶状态,以及预设的行驶状态与语音文本模板之间的关联关系,确定与车辆当前行驶状态相关联的待转换语音文本,包括:判断车辆当前行驶状态是否满足预设的任一语音播报条件,若是,则确定目标语音播报条件,根据预设的语音播报条件与语音文本模板之间的关联关系,确定目标语音文本模板;根据车辆当前行驶状态,确定待补充语音文本,根据待补充语音文本和目标语音文本模板,得到待转换语音文本。
语音播报条件可以由相关技术人员根据不同车辆行驶状态进行预先设定,例如,车辆行驶状态为车辆车速对应的车速语音播报条件可以是车辆当前车速超过预设车速阈值时,获取待转换语音文本,其中,车速阈值可以是120km/h;车辆行驶状态为车辆累计行驶时长对应的时长语音播报条件可以是车辆当前累计行驶时长超过预设累计时长阈值时,获取待转换语音文本,其中,累计时长阈值可以是10小时;车辆行驶状态为车辆累计行驶公里数对应的公里数语音播放条件可以是车辆当前累计行驶公里数超过预设累计公里数阈值时,获取待转换语音文本,其中,累计公里数阈值可以是200公里。
其中,可以实时将车辆当前行驶状态与各个语音播报条件进行比较,确定车辆当前行驶状态是否满足任意一个语音播报条件。若是,则将所满足的语音播报条件确定为目标语音播报条件。即,目标语音播报条件可以是根据车辆当前行驶状态确定的与车辆当前行驶状态相关联的语音播报条件。例如,若获取到车辆当前累计行驶时长超过预设累计时长阈值,则目标语音播报条件可以是时长语音播报条件。
语音播报条件与语音文本模板之间的对应关系可以由相关技术人员进行预先设定。例如,时长语音播报条件对应的语音文本模板可以是“车辆当前累计行驶时长已达到xxx小时,请在合适的停车区域稍作休息”;车速语音播报条件对应的语音文本模板可以是“车辆当前车速已达到xxx km/h,请减速慢行”;公里数语音播报条件对应的语音文本模板可以是“车辆当前累计行驶公里数已达到xxx公里,请在合适的停车区域稍作休息”。
其中,待补充语音文本可以是根据车辆当前行驶状态和行驶状态对应的语音文本模板,确定的语音文本模板中待填写的语音文本。示例性的,若车辆当前累计行驶时长为15小时,满足预设的语音播报条件,语音文本模板为“车辆当前累计行驶时长已达到xxx小时,请在合适的停车区域稍作休息”,则待补充语音文本可以是“15”,并且,待补充语音文本在语音文本模板中的填写位置可以是“xxx”处。
示例性的,通过监测模块获取的车辆当前行驶状态为车辆当前累计行驶时长为15小时,预设的车辆累计行驶时长与时长语音播报条件的对应关系为车辆当前行驶累计时长超过预设时长阈值时,获取待转换语音文本,预设时长阈值为10小时,可以确定车辆当前累计行驶时长满足时长语音播报条件;根据语音播报条件与语音文本模板之间的关联关系,可以确定目标语音文本模板为“车辆当前累计行驶时长已达到xxx小时,请在合适的停车区域稍作休息”;根据车辆当前行驶状态,可以确定待补充文本为“10”,根据待补充语音文本和目标语音文本模板,将待补充文本“10”填写至目标语音文本模板中的“xxx”位置处,填写并替换“xxx”,得到待转换语音文本为“车辆当前累计行驶时长已达到10小时,请在合适的停车区域稍作休息”。
本可选实施例通过判断语音播报条件的方式,实现了根据车辆当前行驶状态对目标语音文本模板的实时确定;根据目标语音文本模板,确定待转换语音文本,实现了根据车辆当前行驶状态,对待转换语音文本的实时获取。
S220、将待转换语音文本转换为待播报语音数据流。
S230、将待播报语音数据流存储为待播报语音文件,确定待播报语音文件的文件属性信息,其中,文件属性信息包括文件存储路径。
S240、将待播报语音文件的文件属性信息发送至预设队列,从预设队列中获取预设排序的目标文件属性信息。
S250、根据目标文件属性信息中的目标文件存储路径,确定目标语音文件,从目标语音文件中获取目标语音数据流进行语音播报。
本实施例方案通过根据车辆当前行驶状态,以及预设的行驶状态与语音文本之间的关联关系,确定待转换语音文本的方式,提高了待转换语音文本确定的准确性,实现了对待转换语音文本和待播报语音数据流的实时获取,避免了只能够在特定的车辆行驶状态下对预先录制好的音频文件进行语音播报的情况,给用户带来了良好的使用体验感。
实施例三
图3为本申请实施例三提供的一种语音播报方法的流程示意图,本实施例在上述各技术方案的基础上,进行了优化改进。
进一步的,所述文件属性信息还包括文件生成时间,在步骤“从预设队列中获取预设排序的目标文件属性信息”之后,添加步骤“根据预设有效时间阈值,判断文件生成时间和当前时间的时间差是否在不大于所述有效时间阈值;若是,则执行根据目标文件属性信息中的目标文件存储路径,确定目标语音文件,从目标语音文件中获取目标语音数据流进行语音播报。”以完善对目标语音数据流的获取方式。
如图3所示,该方法包括以下具体步骤:
S310、根据车辆当前行驶状态,获取待转换语音文本,将待转换语音文本转换为待播报语音数据流。
S320、将待播报语音数据流存储为待播报语音文件,确定待播报语音文件的文件属性信息,其中,文件属性信息包括文件存储路径。
其中,文件属性信息还可以包括文件生成时间,可以在获取到待播报语音文件时确定待播报语音文件的文件生成时间;将待播报语音文件的文件生成时间和文件存储路径共同作为待播报语音文件的文件属性信息,并临时存储至数据库中。
S330、将待播报语音文件的文件属性信息发送至预设队列,从预设队列中获取预设排序的目标文件属性信息。
S340、根据预设有效时间阈值,判断文件生成时间和当前时间的时间差是否不大于有效时间阈值。
其中,有效时间阈值可以由相关技术人员进行提前预设,例如,有效时间阈值可以为1分钟。
获取待播报语音文件的文件属性信息,根据获取的文件属性信息确定文件生成时间;获取当前时间,确定当前时间和文件生成时间之间的时间差,判断当前时间和文件生成时间的时间差是否不大于有效时间阈值。示例性的,若文件生成时间为2021/11/14/12:05:20,当前时间为2021/11/14/12:05:50,预设有效时间阈值为1分钟,则可以确定当前时间和文件生成时间的时间差为30秒,小于有效时间阈值。
S350、若是,则根据目标文件属性信息中的目标文件存储路径,确定目标语音文件,从目标语音文件中获取目标语音数据流进行语音播报。
若目标语音文件的文件生成时间和当前时间的时间差不大于有效时间阈值,则可以执行根据目标文件属性信息中的目标文件存储路径,确定目标语音文件,从目标语音文件中获取目标语音数据流进行语音播报。
在一个可选实施例中,若文件生成时间和当前时间的时间差大于有效时间阈值,则丢弃目标文件属性信息。
若文件生成时间和当前时间的时间差大于有效时间阈值,则丢弃目标文件属性信息,从而确保语音播报的时效性。
示例性的,若文件生成时间为2021/11/14/12:05:20,当前时间为2021/11/14/12:07:20,预设有效时间阈值为1分钟,则可以确定当前时间和文件生成时间的时间差为2分钟,大于有效时间阈值,则丢弃队列中的该文件属性信息,从而确保语音播报的时效性。
本实施例方案通过根据预设有效时间阈值,判断文件生成时间和当前时间的时间差是否不大于所述有效时间阈值;若是,则执行根据目标文件属性信息中的目标文件存储路径,确定目标语音文件,若否,则丢弃目标文件属性信息,实现了语音播报的时效性,避免了语音超时播报导致与车辆当前行驶状况不符的情况发生,从而避免了超时播报为用户带来的不良体验感。
实施例四
图4为本申请实施例四提供的一种语音播报方法的流程示意图,本实施例在上述各技术方案的基础上,进行了优化改进。
进一步的,将“根据车辆当前行驶状态,获取待转换语音文本”,细化为“根据车辆当前行驶状态,获取至少两个候选语音文本;根据预设的行驶状态与优先级之间的关联关系,确定至少两个候选语音文本的优先级;根据至少两个候选语音文本的优先级,确定待转换语音文本。”以完善对存在至少两个候选语音文本时,对待转换语音文本的确定方式。
进一步的,所述待播报语音数据流包括开始标志和/或结束标志,相应的,在步骤“由转换模块将所述待转换语音文本转换为待播报语音数据流”之后,添加步骤“根据预设开始标志和/或预设结束标志,识别所述待播报语音数据流的所述开始标志和/或所述结束标志,舍弃所述开始标志和/或所述结束标志。根据所述文件生成时间信息,基于预设生成时间阈值,判断所述目标语音文件是否过期;若否,则根据所述目标语音文件的文件存储路径信息,对所述目标语音文件相关联的目标数据流进行语音播报。”以完善对待播报语音数据流的确定方式。
如图4所示,该方法包括以下具体步骤:
S410、根据车辆当前行驶状态,获取至少两个候选语音文本。
示例性的,根据车辆当前行驶状态,在同一时间下可以同时触发至少两个语音播放事件,例如,语音播放事件可以是对车辆当前车速进行语音播放,也可以是对车辆当前累计行驶时长进行语音播放,还可以是对车辆当前累计行驶公里数进行语音播放等。候选语音文本可以是根据车辆当前行驶状态确定的,与语音播放事件对应的语音文本。
根据车辆当前行驶状态,确定当前时间下,同时存在至少两个语音播放事件同时发起,则可以获取至少两个语音播放事件对应的候选语音文本。
S420、根据预设的行驶状态与优先级之间的关联关系,确定至少两个候选语音文本的优先级。
其中,行驶状态与优先级之间的关联关系可以由相关技术人员进行提前设定,例如,行驶状态为车辆当前车速的优先级为1,行驶状态为车辆当前累计行驶时长的优先级为2,行驶状态为车辆当前累计行驶公里数的优先级为3。行驶状态对应的优先级数字越小,表示该行驶状态的优先级别越高。
示例性的,若获取到的候选语音文本的数量为一个,则该候选语音文本对应的优先级为预设默认优先级,例如,预设默认优先级可以是1。若获取到的候选语音文本的数量为至少两个,则根据预先设定的行驶状态与优先级之间的关联关系,确定至少两个候选语音文本的优先级。
示例性的,若获取到的候选语音文本对应的行驶状态分别为车辆当前累计行驶时长和车辆当前累计行驶公里数,车辆当前累计行驶时长对应的优先级为2,车辆当前累计行驶公里数对应的优先级为3,车辆当前累计行驶时长的优先级级别大于车辆当前累计行驶公里数的优先级级别,因此,车辆当前累计行驶时长对应的候选语音文本的优先级级别,大于车辆当前累计行驶公里数对应的候选语音文本的优先级级别。
S430、根据至少两个候选语音文本的优先级,确定待转换语音文本。
可以根据至少两个候选语音文本的优先级,依次处理候选语音文本。可以将至少两个候选语音文本中,优先级级别最高的候选语音文本作为待转换语音文本。在待转换语音文本对应的语音数据流被播放后,再对优先级较低的候选语音文本进行转换和播报。
S440、将待转换语音文本转换为待播报语音数据流。
待播报语音数据流中可以包括与待转换语音文本对应的待播报的内容,还可以包括开始标志和/或结束标志。开始标志表示待播报内容的起始位置,结束标志表示待播报内容的结束位置。预设开始标志和/或结束标志,在生成待播报语音数据流时,将预设的开始标志放置在待播报的内容的前端,结束标志放置在待播报的内容的后端。
S450、根据预设开始标志和/或预设结束标志,识别待播报语音数据流的开始标志和/或所述结束标志,舍弃开始标志和/或结束标志。
其中,预设开始标志和/或预设结束标志的标志符号可以由相关技术人员进行预先确定,例如,标志符号可以是“#”,开始标志的标志符号和结束标志的标志符号可以相同或不同。待播报语音数据流可以同时存在开始标志和结束标志,也可以存在开始标志或结束标志中的其中一个。
示例性的,若待播报语音数据流同时存在开始标志和结束标志,则根据预设开始标志,识别待播报语音数据流的开始标志是否正确,若是,则舍弃开始标志,若否,则丢弃该待播报语音数据流;识别待播报语音数据流的结束标志是否正确,若是,则舍弃结束标识;若否,则丢弃该待播报语音数据流。通过识别待播报语音数据流的开始标志和/或预设结束标志的标志符号是否正确的方式,对标志识别正确的待播报语音数据流的开始标志和/或结束标志进行舍弃,只保留待播报的内容。对标志识别错误的待播报语音数据流进行舍弃,避免后续对语音数据流播报过程中出现杂音的情况,从而避免了不正常播报的情况发生。
S460、将待播报语音数据流存储为待播报语音文件,确定待播报语音文件的文件属性信息,其中,文件属性信息包括文件存储路径。
S470、将待播报语音文件的文件属性信息发送至预设队列,从预设队列中获取预设排序的目标文件属性信息。
S480、根据目标文件属性信息中的目标文件存储路径,确定目标语音文件,从目标语音文件中获取目标语音数据流进行语音播报。
本实施例方案通过根据车辆当前行驶状态,获取至少两个候选语音文本;根据预设的行驶状态与优先级之间的关联关系,确定至少两个候选语音文本的优先级;根据至少两个候选语音文本的优先级,确定待转换语音文本。上述方案通过预设行驶状态与优先级之间的关联关系的方式,实现了在获取至少两个候选语音文本时,能够根据优先级确定待转换语音文本;通过设置优先级的方式,实现了能够支持同时触发多个语音播报事件请求且互不干扰。通过识别语音数据流的开始标志和/或结束标志的方式,避免了语音数据流播报过程中出现杂音的情况,从而避免了不正常播报的情况发生。
实施例五
图5是本申请实施例五提供的一种语音播报方法的流程示意图,本申请实施例在上述各实施例的技术方案的基础上,提供了一种优选实施方式。
S501、监测模块获取车辆当前行驶状态。
S502、监测模块判断车辆当前行驶状态是否满足预设的任一语音播报条件,若是,则执行S503A,若否,则执行S503B。
S503A、确定至少一个目标语音播报条件和用户选择的语言类型,根据预设的语音播报条件与语音文本模板之间的关联关系,确定至少一个目标语音文本模板。
S503B、不进行语音播报。
S504、根据车辆当前行驶状态,确定至少一个待补充语音文本,根据待补充语音文本和目标语音文本模板,得到至少一个候选语音文本。
S505、判断当前时间获取的候选语音文本的数量是否不大于一个,若是,则执行S506A;若否,则执行S506B。
S506A、将候选语音文本确定为待转换语音文本。
S506B、根据预设的行驶状态与优先级之间的关联关系,确定至少两个候选语音文本的优先级;根据至少两个候选语音文本的优先级,确定待转换语音文本。
S507、监测模块将待转换语音文本发送至转换芯片。
S508、转换芯片通过AT端口接收到待转换语音文本,并将待转换语音文本转换为待播报PCM语音数据流,其中,待播报PCM语音数据流包括开始标志和结束标志。
S509、转换芯片通过NMEA端口将待播报PCM语音数据流发送至数据处理模块。
S510、数据处理模块根据预设开始标志和预设结束标志,识别待播报PCM语音数据流的开始标志和结束标志,舍弃开始标志和结束标志。
S511、数据处理模块将舍弃开始标志和结束标志后的待播报PCM数据流存储为待播报PCM语音文件,确定待播报PCM语音文件的文件属性信息,其中,文件属性信息包括文件存储路径和文件生成时间。
S512、数据处理模块判断预设队列是否已满,若是,则执行S513A,若否,则执行S513B。
S513A、等待预设队列存在空闲空间。
S513B、数据处理模块将待播报PCM语音文件的文件属性信息发送至预设队列。
S514、数据处理模块判断是否已创建语音播报线程,若是,则执行S515A,若否,则执行S515B。
S515A、数据处理模块取预设队列队头的文件属性信息作为目标文件属性信息。
S515B、数据处理模块创建语音播报线程。
S516、根据文件生成时间和预设有效时间阈值,在创建的线程中判断文件生成时间和当前时间的时间差。
S517,判断时间差是否不大于有效时间阈值,若是,则执行S518A,若否,则执行S518B。
其中,有效时间阈值可以是1分钟。
S518A、根据目标文件属性信息中的目标文件存储路径,确定目标语音文件,从目标语音文件中获取目标语音数据流进行语音播报。
S518B、丢弃目标文件属性信息。
实施例六
图6为本申请实施例六提供的一种语音播报装置的结构示意图。本申请实施例所提供的一种语音播报装置,该装置可适用于对车辆行驶过程中的驾驶员的行驶情况进行实时播报的情况,该装置可采用软件和/或硬件的方式实现。如图6所示,该装置具体包括:数据流获取模块601、文件属性信息确定模块602、目标文件属性信息获取模块603和语音播报模块604。其中,
数据流获取模块601,用于根据车辆当前行驶状态,获取待转换语音文本,将所述待转换语音文本转换为待播报语音数据流;
文件属性信息确定模块602,用于将所述待播报语音数据流存储为待播报语音文件,确定所述待播报语音文件的文件属性信息,其中,所述文件属性信息包括文件存储路径;
目标文件属性信息获取模块603,用于将所述待播报语音文件的文件属性信息发送至预设队列,从预设队列中获取预设排序的目标文件属性信息;
语音播报模块604,用于根据所述目标文件属性信息中的目标文件存储路径,确定目标语音文件,从目标语音文件中获取目标语音数据流进行语音播报。
本申请实施例通过根据车辆当前行驶状态,获取待转换语音文本,并将待转换语音文本转换为待播报语音数据流;将待播报语音数据流存储为待播报语音文件,确定待播报语音文件的文件属性信息;将待播报语音文件的文件属性信息发送至预设队列,从预设队列中获取预设排序的目标文件属性信息;根据目标文件属性信息中的目标文件存储路径,确定目标语音文件,从目标语音文件中获取目标语音数据流进行语音播报。上述方案通过获取待转换语音文本的方式,实现了能够根据车辆当前行驶状态,实时进行语音播报,使得整个语音播报过程的灵活度较高,提高了车辆语音播报的精度和效率,给用户带来良好的使用体验。通过软件的方式对语音数据流的接收和播放进行处理,减少了硬件模块的使用,降低了硬件成本。
可选的,数据流获取模块,包括:
第一待转换语音文本确定单元,用于根据车辆当前行驶状态,以及预设的行驶状态与语音文本之间的关联关系,确定与车辆当前行驶状态相关联的待转换语音文本。
可选的,第一待转换语音文本确定单元,包括:
目标语音文本目标确定子单元,用于判断车辆当前行驶状态是否满足预设的任一语音播报条件,若是,则确定目标语音播报条件,根据预设的语音播报条件与语音文本模板之间的关联关系,确定目标语音文本模板;
待转换语音文本确定子单元,用于根据车辆当前行驶状态,确定待补充语音文本,根据所述待补充语音文本和目标语音文本模板,得到待转换语音文本。
可选的,数据流获取模块,包括:
候选语音文本获取单元,用于根据车辆当前行驶状态,获取至少两个候选语音文本;
候选语音文本优先级确定单元,用于根据预设的行驶状态与优先级之间的关联关系,确定至少两个候选语音文本的优先级;
第二待转换语音文本确定单元,用于根据至少两个候选语音文本的优先级,确定所述待转换语音文本。
可选的,所述文件属性信息还包括文件生成时间;
可选的,该装置还包括:
时间判断模块,用于在从预设队列中获取预设排序的目标文件属性信息之后,根据预设有效时间阈值,判断所述文件生成时间和当前时间的时间差是否不大于所述有效时间阈值;
时间条件确定模块,用于若文件生成时间和当前时间的时间差不大于所述有效时间阈值,则执行所述根据所述目标文件属性信息中的目标文件存储路径,确定目标语音文件,从目标语音文件中获取目标语音数据流进行语音播报。
可选的,该装置还包括:
目标文件属性信息丢弃模块,用于在判断所述文件生成时间和当前时间的时间差是否在不大于所述有效时间阈值之后,若文件生成时间和当前时间的时间差大于所述有效时间阈值,则丢弃所述目标文件属性信息。
可选的,所述待播报语音数据流包括开始标志和/或结束标志;
可选的,该装置还包括:
标识识别模块,用于在由转换模块将所述待转换语音文本转换为待播报语音数据流之后,根据预设开始标志和/或预设结束标志,识别所述待播报语音数据流的所述开始标志和/或所述结束标志,舍弃所述开始标志和/或所述结束标志。
上述语音播报装置可执行本申请任意实施例所提供的语音播报方法,具备执行各语音播报方法相应的功能模块和有益效果。
实施例七
图7是本申请实施例七提供的一种电子设备的结构示意图。图7示出了适于用来实现本申请实施方式的示例性电子设备700的框图。图7显示的电子设备700仅仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。
如图7所示,电子设备700以通用计算设备的形式表现。电子设备700的组件可以包括但不限于:一个或者多个处理器或者处理单元701,系统存储器702,连接不同系统组件(包括系统存储器702和处理单元701)的总线703。
总线703表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(ISA)总线,微通道体系结构(MAC)总线,增强型ISA总线、视频电子标准协会(VESA)局域总线以及外围组件互连(PCI)总线。
电子设备700典型地包括多种计算机系统可读介质。这些介质可以是任何能够被电子设备700访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
系统存储器702可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(RAM)704和/或高速缓存存储器705。电子设备700可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统706可以用于读写不可移动的、非易失性磁介质(图7未显示,通常称为“硬盘驱动器”)。尽管图7中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如CD-ROM,DVD-ROM或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线703相连。存储器702可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本申请各实施例的功能。
具有一组(至少一个)程序模块707的程序/实用工具708,可以存储在例如存储器702中,这样的程序模块707包括但不限于操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块707通常执行本申请所描述的实施例中的功能和/或方法。
电子设备700也可以与一个或多个外部设备709(例如键盘、指向设备、显示器710等)通信,还可与一个或者多个使得用户能与该电子设备700交互的设备通信,和/或与使得该电子设备700能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口711进行。并且,电子设备700还可以通过网络适配器712与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器712通过总线703与电子设备700的其它模块通信。应当明白,尽管图7中未示出,可以结合电子设备700使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
处理单元701通过运行存储在系统存储器702中的程序,从而执行各种功能应用以及数据处理,例如实现本申请实施例所提供的一种语音播报的方法。
实施例八
本申请实施例八还提供一种包含计算机可执行指令的存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本申请实施例所提供的语音播报方法,包括:根据车辆当前行驶状态,获取待转换语音文本,将所述待转换语音文本转换为待播报语音数据流;将所述待播报语音数据流存储为待播报语音文件,确定所述待播报语音文件的文件属性信息,其中,所述文件属性信息包括文件存储路径;将所述待播报语音文件的文件属性信息发送至预设队列,从预设队列中获取预设排序的目标文件属性信息;根据所述目标文件属性信息中的目标文件存储路径,确定目标语音文件,从目标语音文件中获取目标语音数据流进行语音播报。
本申请实施例的计算机存储介质,可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本申请操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
注意,上述仅为本申请的较佳实施例及所运用技术原理。本领域技术人员会理解,本申请不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本申请的保护范围。因此,虽然通过以上实施例对本申请进行了较为详细的说明,但是本申请不仅仅限于以上实施例,在不脱离本申请构思的情况下,还可以包括更多其他等效实施例,而本申请的范围由所附的权利要求范围决定。
Claims (10)
1.一种语音播报方法,其特征在于,所述方法由语音播报系统执行,所述方法包括:
根据车辆当前行驶状态,获取待转换语音文本,将所述待转换语音文本转换为待播报语音数据流;
将所述待播报语音数据流存储为待播报语音文件,确定所述待播报语音文件的文件属性信息,其中,所述文件属性信息包括文件存储路径;
将所述待播报语音文件的文件属性信息发送至预设队列,从预设队列中获取预设排序的目标文件属性信息;
根据所述目标文件属性信息中的目标文件存储路径,确定目标语音文件,从目标语音文件中获取目标语音数据流进行语音播报。
2.根据权利要求1所述的方法,其特征在于,根据车辆当前行驶状态,获取待转换语音文本,包括:
根据车辆当前行驶状态,以及预设的行驶状态与语音文本模板之间的关联关系,确定与车辆当前行驶状态相关联的待转换语音文本。
3.根据权利要求2所述的方法,其特征在于,根据车辆当前行驶状态,以及预设的行驶状态与语音文本模板之间的关联关系,确定与车辆当前行驶状态相关联的待转换语音文本,包括:
判断车辆当前行驶状态是否满足预设的任一语音播报条件,若是,则确定目标语音播报条件,根据预设的语音播报条件与语音文本模板之间的关联关系,确定目标语音文本模板;
根据车辆当前行驶状态,确定待补充语音文本,根据所述待补充语音文本和目标语音文本模板,得到待转换语音文本。
4.根据权利要求1所述的方法,其特征在于,根据车辆当前行驶状态,获取待转换语音文本,包括:
根据车辆当前行驶状态,获取至少两个候选语音文本;
根据预设的行驶状态与优先级之间的关联关系,确定至少两个候选语音文本的优先级;
根据至少两个候选语音文本的优先级,确定所述待转换语音文本。
5.根据权利要1所述的方法,其特征在于,所述文件属性信息还包括文件生成时间;
在从预设队列中获取预设排序的目标文件属性信息之后,还包括:
根据预设有效时间阈值,判断所述文件生成时间和当前时间的时间差是否不大于所述有效时间阈值;
若是,则执行所述根据所述目标文件属性信息中的目标文件存储路径,确定目标语音文件,从目标语音文件中获取目标语音数据流进行语音播报。
6.根据权利要5所述的方法,其特征在于,在判断所述文件生成时间和当前时间的时间差是否在不大于所述有效时间阈值之后,还包括:
若文件生成时间和当前时间的时间差大于所述有效时间阈值,则丢弃所述目标文件属性信息。
7.根据权利要1所述的方法,其特征在于,所述待播报语音数据流包括开始标志和/或结束标志;
相应的,在将所述待转换语音文本转换为待播报语音数据流之后,还包括:
根据预设开始标志和/或预设结束标志,识别所述待播报语音数据流的所述开始标志和/或所述结束标志,舍弃所述开始标志和/或所述结束标志。
8.一种语音播报装置,其特征在于,所述装置配置于语音播报系统中,所述装置包括:
数据流获取模块,用于根据车辆当前行驶状态,获取待转换语音文本,将所述待转换语音文本转换为待播报语音数据流;
文件属性信息确定模块,用于将所述待播报语音数据流存储为待播报语音文件,确定所述待播报语音文件的文件属性信息,其中,所述文件属性信息包括文件存储路径;
目标文件属性信息获取模块,用于将所述待播报语音文件的文件属性信息发送至预设队列,从预设队列中获取预设排序的目标文件属性信息;
语音播报模块,用于根据所述目标文件属性信息中的目标文件存储路径,确定目标语音文件,从目标语音文件中获取目标语音数据流进行语音播报。
9.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1-7中任一所述的语音播报方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-7中任一所述的语音播报方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111376129.9A CN114120961A (zh) | 2021-11-19 | 2021-11-19 | 语音播报方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111376129.9A CN114120961A (zh) | 2021-11-19 | 2021-11-19 | 语音播报方法、装置、设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114120961A true CN114120961A (zh) | 2022-03-01 |
Family
ID=80397988
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111376129.9A Pending CN114120961A (zh) | 2021-11-19 | 2021-11-19 | 语音播报方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114120961A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110032626A (zh) * | 2019-04-19 | 2019-07-19 | 百度在线网络技术(北京)有限公司 | 语音播报方法和装置 |
CN116032566A (zh) * | 2022-12-14 | 2023-04-28 | 平安银行股份有限公司 | 一种隐私协议的语音播报方法、装置和终端设备 |
-
2021
- 2021-11-19 CN CN202111376129.9A patent/CN114120961A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110032626A (zh) * | 2019-04-19 | 2019-07-19 | 百度在线网络技术(北京)有限公司 | 语音播报方法和装置 |
CN116032566A (zh) * | 2022-12-14 | 2023-04-28 | 平安银行股份有限公司 | 一种隐私协议的语音播报方法、装置和终端设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11348571B2 (en) | Methods, computing devices, and storage media for generating training corpus | |
CN110069608B (zh) | 一种语音交互的方法、装置、设备和计算机存储介质 | |
US7899670B1 (en) | Server-based speech recognition | |
CN114120961A (zh) | 语音播报方法、装置、设备及存储介质 | |
CN112115706A (zh) | 文本处理方法、装置、电子设备及介质 | |
CN107943834B (zh) | 人机对话的实现方法、装置、设备及存储介质 | |
CN109473104B (zh) | 语音识别网络延时优化方法及装置 | |
CN107886944B (zh) | 一种语音识别方法、装置、设备及存储介质 | |
CN107578770B (zh) | 网络电话语音识别方法、装置、计算机设备和存储介质 | |
CN111798833A (zh) | 一种语音测试方法、装置、设备和存储介质 | |
CN108062212A (zh) | 一种基于场景的语音操作方法及装置 | |
US11741958B2 (en) | Using structured audio output to detect playback and/or to adapt to misaligned playback in wireless speakers | |
CN111163330A (zh) | 直播视频的渲染方法、装置、系统、设备及存储介质 | |
CN110944015B (zh) | 音频远程传输方法、装置、服务器及存储介质 | |
CN110223694B (zh) | 语音处理方法、系统和装置 | |
CN111400463B (zh) | 对话响应方法、装置、设备和介质 | |
CN113380229B (zh) | 语音响应速度确定方法、相关装置及计算机程序产品 | |
US20190103093A1 (en) | Method and apparatus for training acoustic model | |
CN112712799A (zh) | 一种误触发语音信息的获取方法、装置、设备及存储介质 | |
CN109036379B (zh) | 语音识别方法、设备及存储介质 | |
CN111582708A (zh) | 医疗信息的检测方法、系统、电子设备及计算机可读存储介质 | |
CN112542157A (zh) | 语音处理方法、装置、电子设备及计算机可读存储介质 | |
CN118824229A (zh) | 一种数据处理方法、装置、处理设备及可读存储介质 | |
CN118248133B (zh) | 二阶段语音识别方法、装置、计算机设备及可读存储介质 | |
CN114650339A (zh) | 语音权限处理方法、装置、服务器及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |