CN110333839A - 一种音频数据处理方法、装置及介质 - Google Patents

一种音频数据处理方法、装置及介质 Download PDF

Info

Publication number
CN110333839A
CN110333839A CN201910506512.8A CN201910506512A CN110333839A CN 110333839 A CN110333839 A CN 110333839A CN 201910506512 A CN201910506512 A CN 201910506512A CN 110333839 A CN110333839 A CN 110333839A
Authority
CN
China
Prior art keywords
audio data
processed
data processing
application program
processing platform
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910506512.8A
Other languages
English (en)
Other versions
CN110333839B (zh
Inventor
闫涛
贾志现
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201910506512.8A priority Critical patent/CN110333839B/zh
Publication of CN110333839A publication Critical patent/CN110333839A/zh
Application granted granted Critical
Publication of CN110333839B publication Critical patent/CN110333839B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Navigation (AREA)

Abstract

本发明公开了一种音频数据处理方法、装置及介质。该方法应用于为至少一个应用程序端提供统一接口的音频数据处理平台,车机系统为音频数据处理平台提供有用于调用车机系统对应的发声模块的系统接口,方法包括:通过统一接口接收应用程序端针对待处理音频数据的播放请求,播放请求携带有待处理音频数据对应的音频数据类型标识;根据待处理音频数据对应的音频数据类型标识,生成待处理音频数据对应的播放执行结果;将待处理音频数据对应的播放执行结果发送至应用程序端,以使得应用程序端根据待处理音频数据对应的播放执行结果来确定是否通过音频数据处理平台调用车机系统对应的发声模块。降低应用程序端对应的适配难度,提高应用程序的运行稳定性。

Description

一种音频数据处理方法、装置及介质
技术领域
本发明涉及互联网通信技术领域,尤其涉及一种音频数据处理方法、装置 及介质。
背景技术
伴随科技发展和用户的需要,车辆上的科技也得到了飞跃性的发展。车机 系统(比如智能车机)可以帮助用户在使用车辆时获得更便利的服务体验,比 如车机系统可以控制音频数据的播放,借助车机系统用户通过对应的应用程序 可以在车内体验智能语音交互、导航语音播报、音乐播放、有声读物播放等业 务服务。
然而,车机系统由不同的汽车厂商提供,对于车机系统的构建并未基于统 一的工业标准。同时,相对于应用程序,车机系统的研发周期长且迭代升级成 本高。这样应用程序需要进行不同程度的差异化调整以适配不同的车机系统, 否则影响该应用程序的运行稳定性,进而影响对应的业务服务的实现。因此, 需要提供更有效的方案,以便提高应用程序的运行稳定性。
发明内容
为了解决现有技术应用在借助车机系统体验应用程序对应的业务服务时, 应用程序的运行稳定性差等问题,本发明提供了一种音频数据处理方法、装置 及介质:
一方面,本发明提供了一种音频数据处理方法,应用于音频数据处理平台, 车机系统为所述音频数据处理平台提供有用于调用所述车机系统对应的发声模 块的系统接口,所述音频数据处理平台为至少一个应用程序端提供统一接口, 所述方法包括:
通过所述统一接口接收所述应用程序端针对待处理音频数据的播放请求, 所述播放请求携带有所述待处理音频数据对应的音频数据类型标识;
根据所述待处理音频数据对应的音频数据类型标识,生成所述待处理音频 数据对应的播放执行结果;
将所述待处理音频数据对应的播放执行结果发送至所述应用程序端,以使 得所述应用程序端根据所述待处理音频数据对应的播放执行结果来确定是否通 过所述音频数据处理平台调用所述发声模块。
另一方面提供了一种音频数据处理方法,应用于应用程序端,所述应用程 序端通过音频数据处理平台提供的统一接口以实现对车机系统对应的发声模块 的调用,所述车机系统为所述音频数据处理平台提供有用于调用所述发声模块 的系统接口,所述方法包括:
通过所述统一接口向所述音频数据处理平台发送针对待处理音频数据的播 放请求,所述播放请求携带有所述待处理音频数据对应的音频数据类型标识;
接收所述音频数据处理平台返回的所述待处理音频数据对应的播放执行结 果;
根据所述待处理音频数据对应的播放执行结果,确定是否通过所述音频数 据处理平台调用所述车机系统对应的系统接口;
其中,所述待处理音频数据对应的播放执行结果为所述音频数据处理平台 根据所述待处理音频数据对应的音频数据类型标识生成。
另一方面提供了一种音频数据处理装置,应用于音频数据处理平台,车机 系统为所述音频数据处理平台提供有用于调用所述车机系统对应的发声模块的 系统接口,所述音频数据处理平台为至少一个应用程序端提供统一接口,所述 装置包括:
播放请求接收模块:用于通过所述统一接口接收所述应用程序端针对待处 理音频数据的播放请求,所述播放请求携带有所述待处理音频数据对应的音频 数据类型标识;
播放执行结果生成模块:用于根据所述待处理音频数据对应的音频数据类 型标识,生成所述待处理音频数据对应的播放执行结果;
播放执行结果发送模块:用于将所述待处理音频数据对应的播放执行结果 发送至所述应用程序端,以使得所述应用程序端根据所述待处理音频数据对应 的播放执行结果来确定是否通过所述音频数据处理平台调用所述发声模块。
另一方面提供了一种音频数据处理装置,应用于应用程序端,所述应用程 序端通过音频数据处理平台提供的统一接口以实现对车机系统对应的发声模块 的调用,所述车机系统为所述音频数据处理平台提供有用于调用所述发声模块 的系统接口,所述装置包括:
播放请求发送模块:用于通过所述统一接口向所述音频数据处理平台发送 针对待处理音频数据的播放请求,所述播放请求携带有所述待处理音频数据对 应的音频数据类型标识;
播放执行结果接收模块:用于接收所述音频数据处理平台返回的所述待处 理音频数据对应的播放执行结果;
播放执行模块:用于根据所述播放执行结果,确定是否通过所述音频数据 处理平台调用所述车机系统对应的系统接口;
其中,所述待处理音频数据对应的播放执行结果为所述音频数据处理平台 根据所述待处理音频数据对应的音频数据类型标识生成。
另一方面提供了一种电子设备,所述电子设备包括处理器和存储器,所述 存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一 条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以 实现如上述的音频数据处理方法。
另一方面提供了一种计算机可读存储介质,所述存储介质中存储有至少一 条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段 程序、所述代码集或指令集由处理器加载并执行以实现如上述的音频数据处理 方法。
本发明提供的一种音频数据处理方法、装置及介质,具有如下技术效果:
本发明中车机系统为音频数据处理平台提供有用于调用所述车机系统对应 的发声模块的系统接口,所述音频数据处理平台为至少一个应用程序端提供统 一接口,能够降低应用程序端对应的适配难度、开发成本,提高应用程序的运 行稳定性,进而保证对应的音频数据的有效播放。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案和优点,下面将 对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下 面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲, 在不付出创造性劳动的前提下,还可以根据这些附图获得其它附图。
图1是本发明实施例提供的一种应用环境的示意图;
图2是本发明实施例提供的一种音频数据处理方法的流程示意图;
图3是本发明实施例提供的对音频数据播放策略表进行补充的一种的流程 示意图;
图4是本发明实施例提供的确定应用程序端类型标识的一种流程示意图;
图5是本发明实施例提供的根据所述待处理音频数据对应的音频数据类型 标识,生成所述待处理音频数据对应的播放执行结果的一种流程示意图;
图6也是本发明实施例提供的一种音频数据处理方法的流程示意图;
图7也是本发明实施例提供的一种音频数据处理方法的流程示意图;
图8是本发明实施例提供的一种音频数据处理装置的组成框图;
图9也是本发明实施例提供的一种音频数据处理装置的组成框图;
图10是本发明实施例提供的进行音频数据处理的一种应用场景示意图;
图11是本发明实施例提供的一种服务器的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清 楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是 全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造 性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“包括” 和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了 一系列步骤或单元的过程、方法、系统、产品或服务器不必限于清楚地列出的 那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品 或设备固有的其它步骤或单元。
请参阅图1,图1是本发明实施例提供的一种应用环境的示意图,如图1所 示,该应用环境中,在应用程序端于车机系统之间,构建一音频数据处理平台。 车机系统为音频数据处理平台提供有用于调用所述车机系统对应的发声模块的 系统接口,所述音频数据处理平台为至少一个应用程序端提供统一接口,应用 程序端可以通过音频数据处理平台提供的统一接口以实现对车机系统对应的发 声模块的调用。这样应用程序端通过音频数据处理平台实现对应的业务服务基 于车机系统的发声模块的音频数据播放。需要说明的是,图1仅仅是一种示例。
具体的,车机系统可以为原生操作系统,利用原生操作系统定义的音源通 道作为系统接口。车机系统也可以在原生操作系统定义的音源通道的基础上进 行扩展。在扩展时可以考虑可能在车内环境中出现的声音类型(比如报警、电 台、蓝牙通话等);同时考虑驾驶的安全性等,设置基于声音类型的播放策略, 以实现对车内环境播放声音的严格管控,避免出现不符合预期的声音。经扩展, 车机系统对应的声音类型数量往往庞大(比如20以上),进而基于声音类型的 播放策略也往往复杂繁琐。
具体的,应用程序端提供含有音频数据播放功能的应用程序。该应用程序 可以为C/S(客户端/服务器端)应用程序,也可以为B/S(浏览器端/服务器端) 应用程序。应用程序端可以提供包括至少一个上述应用程序的应用套件(比如 一系列功能性应用程序集合)。
在实际应用中,应用程序端基于车机系统的发声模块播放的音频数据的内 容包括但不限于歌曲、有声读物、导航语音、聊天语音(比如自然人聊天语音、 机器人聊天语音)。
以下介绍本发明一种音频数据处理方法的具体实施例,图2是本发明实施 例提供的一种音频数据处理方法的流程示意图,本说明书提供了如实施例或流 程图所述的方法操作步骤,但基于常规或者无创造性的劳动可以包括更多或者 更少的操作步骤。实施例中列举的步骤顺序仅仅为众多步骤执行顺序中的一种 方式,不代表唯一的执行顺序。在实际中的系统或服务器产品执行时,可以按 照实施例或者附图所示的方法顺序执行或者并行执行(例如并行处理器或者多 线程处理的环境)。具体的如图2所示,所述方法可以包括:
S201:应用程序端通过所述统一接口向所述音频数据处理平台发送针对待 处理音频数据的播放请求,所述播放请求携带有所述待处理音频数据对应的音 频数据类型标识;
在本发明实施例中,车机系统为所述音频数据处理平台提供有用于调用所 述车机系统对应的发声模块的系统接口,所述音频数据处理平台为至少一个应 用程序端提供统一接口,所述应用程序端可以通过音频数据处理平台提供的统 一接口以实现对车机系统对应的发声模块的调用。音频数据处理平台可以提供 虚拟音源服务,虚拟音源服务可以是独立于各应用程序端提供的应用程序的虚 拟音源服务应用。各应用程序端提供的应用程序可以通过所述统一接口与虚拟 音源服务应用连接,统一接口可以是集成到上述应用程序中的代码库,通过统 一接口可以实现将应用程序端状态回传至音频数据处理平台的功能。其中,所 述车机系统对应的发声模块可以为至少一个,所述发声模块对应的系统接口也 可以为至少一个。
进一步的,音频数据处理平台通过所述统一接口接收所述应用程序端针对 待处理音频数据的播放请求。播放请求指向所述车机系统的音频焦点(发声模 块正在播放的音频数据)。同一时间,音频焦点可以不只一个,这样可以实现 车内的混音播放场景。此时可以设置各音频焦点的对应播放音量。
在一个具体的实施例中,音频数据处理平台创建音频数据播放策略表,音 频数据播放策略表中记录包括至少一个音频数据类型标识和各个所述音频数据 类型标识对应的播放优先级信息。音频数据类型标识可以基于不同维度(比如 不同车辆使用场景下,不同应用程序端对应的使用热度;音频数据对应的使用 语言)进行分类而设置。所述音频数据类型标识对应的播放优先级信息可以包 括该音频数据类型标识对应的优先级别(比如A级、B级等)以及冲突响应分 类(对应不同音频数据类型标识的两个待处理音频数据存在播放冲突时的执行 响应,可参见下表1)。音频数据处理平台创建音频数据播放策略表时,可以参 考车机系统对应的声音类型播放策略表(由车机系统设置,记录包括至少一个 声音类型标识和各个所述声音类型标识对应的播放优先级信息)来创建;可以 结合应用程序端对应的业务属性(比如导航业务属性、聊天业务属性、音乐播 放业务属性等)来创建。应用程序端提供的业务服务往往更关注用户的需求变 化,也会根据不同的应用场景作出更细粒度的应用程序开发。
表1
在使用车机系统对应的发声模块进行对应的音频数据播放的过程中,可以 根据音频数据播放策略表对声音类型播放策略表进行灵活扩展、变更等。这样 可以解决应用程序端提供的业务服务对应的音频数据播放受限问题,进而更好 的为用户提供满足不同应用场景需求的业务服务。比如在车辆行驶场景中,可 以为导航音源设置较高级别的优先级,避免导航音源对应的重要导航内容因优 先级较低而无法播放,进而影响用户驾驶车辆的安全性。
在另一个具体的实施例中,如图3所示,所述音频数据播放策略表通过执 行下述步骤补充,包括:
S301:根据所述分类请求携带的所述目标类型标识,在所述音频数据播放 策略表中进行匹配,得到匹配结果;
音频数据播放策略表中包括至少一个音频数据类型标识。进行匹配时,将 目标类型标识与音频数据播放策略表中已记录的音频数据类型标识进行相似度 匹配。
S302:当所述匹配结果为匹配失败时,在所述音频数据播放策略表中补充 所述目标类型标识以及设置所述目标类型标识对应的播放优先级信息。
可以根据匹配计算得到的相似度值与相似度阈值之间的关系,确定匹配结 果为匹配成功或匹配失败。当所述匹配结果为匹配失败时,说明当前的音频数 据播放策略表中不存在与目标类型标识的相似度值超过相似度阈值的音频数据 类型标识,进而在当前的音频数据播放策略表中补充所述目标类型标识以及设 置所述目标类型标识对应的播放优先级信息。当然,当所述匹配结果为匹配成 功时,说明当前的音频数据播放策略表中存在与目标类型标识的相似度值超过 相似度阈值的音频数据类型标识,这样可以使用当前的音频数据播放策略表中 的音频数据类型标识作为后续步骤S402中的应用程序端类型标识。
灵活、及时的更新音频数据播放策略表,实现应用程序端与音频数据处理 平台就音频数据播放策略的对接,后续在音频数据播放策略表的基础上调整声 音类型播放策略表,减小应用程序端适应不同车机系统差异性的难度,进而保 证应用程序端提供的应用程序的稳定运行,实现对应的业务服务基于发声模块 的音频数据播放。
在另一个具体的实施例中,如图4所示,所述应用程序端通过所述统一接 口向所述音频数据处理平台发送针对待处理音频数据的播放请求之前,包括:
S401:通过所述统一接口向所述音频数据处理平台发送分类请求;
当分类请求中携带有目标类型标识时,可以参考步骤S301-S302对应的对 音频数据播放策略表进行补充的描述内容,这里不再赘述。当然,分类请求还 可以携带指向所述应用程序端对应的业务属性的信息。
S402:接收所述音频数据处理平台返回的应用程序端类型标识;
所述应用程序端类型标识为所述音频数据处理平台根据筛选信息从所述音 频数据播放策略表中选择确定,所述筛选信息包括从所述分类请求携带的目标 类型标识、所述应用程序端对应的业务属性组成的群组中选择的至少一个,所 述待处理音频数据对应的音频数据类型标识为所述应用程序端类型标识。
应用程序端对应的业务属性的信息可以在上述应用程序端发送的分类请求 中携带,也可以由音频数据处理平台根据应用程序端的其他特征确定。进一步 的,对于业务属性为导航业务属性的应用程序端,应用程序端可以根据导航内 容的重要程度,进行“导航诱导播报(高)”和“导航诱导播报(低)”的更 细化的分类请求。在车辆行驶场景中,可以将“前方右转”的导航内容分类为 “导航诱导播报(高)”,将“开始导航”的导航内容分类为“导航诱导播报 (低)”。
S202:音频数据处理平台根据所述待处理音频数据对应的音频数据类型标 识,生成所述待处理音频数据对应的播放执行结果;
如图5所示,所述根据所述待处理音频数据对应的音频数据类型标识,生 成所述待处理音频数据对应的播放执行结果,包括:
S501:获取当前播放音频数据对应的音频数据类型标识;
所述车机系统的音频焦点存在当前播放音频数据时,获取当前播放音频数 据对应的音频数据类型标识,这样便于后续步骤中在音频数据播放策略表进行 播放策略查询。当然,当车机系统的音频焦点不存在当前播放音频数据时,可 以直接生成允许播放所述待处理音频数据的播放执行结果;也可以结合车辆使 用场景确定是否允许播放所述待处理音频数据,进而生成对应的播放执行结果。
S502:根据所述待处理音频数据对应的音频数据类型标识和所述当前播放 音频数据对应的音频数据类型标识,在所述音频数据处理平台创建的音频数据 播放策略表中进行查询,得到所述待处理音频数据对应的播放执行结果和所述 当前播放音频数据对应的播放执行结果。
比如待处理音频数据对应的音频数据类型标识为a指向导航音源,在所述 音频数据播放策略表中进行查询,得到音频数据类型标识为a对应的播放优先 级信息为优先级别A级,当前播放音频数据对应的音频数据类型标识为b指向 媒体音源,在所述音频数据播放策略表中进行查询,得到音频数据类型标识为b 对应的播放优先级信息为优先级别B级。可以根据A级与B级的优先级别高低, 确定所述待处理音频数据对应的播放执行结果和所述当前播放音频数据对应的 播放执行结果。当所述车机系统的音频焦点(当前时刻的音频焦点为当前播放 音频数据)为一个,A级高于B级时,那么待处理音频数据对应的播放执行结果为:待处理音频数据将作为下一时刻的音频焦点;当前播放音频数据对应的 播放执行结果为:不作为下一时刻的音频焦点。当所述车机系统的音频焦点(当 前时刻的音频焦点为当前播放音频数据)为两个,A级高于B级时,那么待处 理音频数据对应的播放执行结果为:待处理音频数据将作为下一时刻的音频焦 点1,待处理音频数据对应的播放音量大于当前播放音频数据对应的播放音量; 当前播放音频数据对应的播放执行结果为:当前播放音频数据作为下一时刻的 音频焦点2,当前播放音频数据对应的播放音量小于待处理音频数据对应的播放 音量。
当然,基于应用程序端发出的播放请求,申请作为下一时刻的音频焦点的 待处理音频数据的数量不局限于上述。提供不同业务服务类型的应用程序可以 播放指向不同业务形态的待处理音频数据,比如待处理音频数据可以指向一条 导航话术,也可以指向在一定播放时长范围内的至少一条语音消息(比如聊天 应用中多条来自同一联系人的未读语音消息)。车机系统下一时刻的音频焦点 的数量可以根据车辆使用场景设置,也可以根据进行音频焦点申请的待处理音 频数据的数量设置。进一步的,所述待处理音频数据对应的播放执行结果包括 从所述待处理音频数据在当前播放优先级排序结果中位置、所述待处理音频数 据的播放时长、所述待处理音频数据的播放音量组成的群组中选择的至少一个。
在实际应用中,如图10所示,当存在多个应用程序(可以来自同一应用程 序端、也可来自不同的应用程序端)竞争音频焦点播放通道时,通过策略实现 对竞争的协调,使音源交互体验得到保障。
听服务应用提供在线音乐服务,当听服务应用开始播放音乐时,它以“媒 体音源”向音频数据处理平台发送播放请求,音频数据处理平台收到请求,因 为当前没有其它音源类型在播放,给予听服务应用申请通过的结果。
播放一会后,用户激活语音应用,语音输入“导航到A地”,此时已进入 语音交互过程,语音应用以“语音交互音源”向音频数据处理平台发送播放请 求,当前已有音乐存在,二者进行策略仲裁,结果是通知音乐暂停播放,语音 应用的播放请求通过。语音交互识别完成后,将“好的”回复给用户,语音应 用以“语音交互反馈音源”向音频数据处理平台发送播放请求,经策略仲裁后, 申请通过。
接着,语音应用发送识别结果给导航应用,导航应用开始执行“导航到A 地”动作,搜索并展示可选地点,同时通过语音应用告知用户“已为您找到xx 地点(A地)”,此时导航应用以“导航诱导播报(低)音源”向音频数据处 理平台发送播放请求,仲裁服务经过判断,告知导航应用申请通过。导航应用 执行查询可选路线动作,显示出三条可选,并提醒用户“已为您找到去xx地点 (A地)的路线”,此时导航应用以“导航诱导播报(低)音源”向音频数据 处理平台发送播放请求,仲裁服务经过判断,告知导航应用申请通过。
用户此时输入“开始导航”,语音应用识别意图后,语音反馈“好的, 即将开始导航”,语音应用以“语音交互反馈音源”向音频数据处理平台 发送播放请求,此时如果导航应用对应的“已为您找到去xx地点(A地) 的路线”这句话播报(导航应用进行诱导播报时,每播报一句路况信息, 都会申请“导航诱导播报(低)音源”,播放完成后,释放申请)还没有结束,语音应用的播放请求经过音频数据处理平台仲裁后,导航应用的声 音应该被停止,语音应用的反馈声音得到播放。
当播报完语音反馈后,释放“语音交互反馈音源”,用户未有后续语音交 互动作,语音退出,同时释放“语音交互音源”,此时音频数据处理平台根据 音频数据播放策略表,将通知音乐开始播放。后续流程中,“导航音源”和“媒 体音源”的声音将会同时出现,并根据系统混音策略输出实际声音大小(由车 机系统决定)。
S203:音频数据处理平台将所述待处理音频数据对应的播放执行结果发送 至所述应用程序端;
所述车机系统的音频焦点存在当前播放音频数据时,音频数据处理平台向 发出播放请求的应用程序端A返回所述待处理音频数据对应的播放执行结果, 音频数据处理平台还向对应的应用程序端B发送所述当前播放音频数据对应的 播放执行结果。应用程序端A和应用程序端B可以是两个不同的应用程序端, 也可以是同一个应用程序端。
S204:应用程序端根据所述待处理音频数据对应的播放执行结果,确定是 否通过所述音频数据处理平台调用所述车机系统对应的系统接口;
当应用程序端收到的所述待处理音频数据对应的播放执行结果为允许播放 时,所述应用程序端通过所述音频数据处理平台调用所述车机系统对应的系统 接口,以实现待处理音频数据的播放。当应用程序端收到的所述待处理音频数 据对应的播放执行结果为不允许播放时,所述应用程序端不执行通过所述音频 数据处理平台调用所述车机系统对应的系统接口的动作。当然,根据步骤S502 的描述,利用系统接口实现待处理音频数据的播放还包括对播放时长、播放音 量等的实现。
由以上本说明书实施例提供的技术方案可见,本说明书实施例中车机系统 为音频数据处理平台提供有用于调用所述车机系统对应的发声模块的系统接 口,所述音频数据处理平台为至少一个应用程序端提供统一接口,统一接口相 对固定,能够降低应用程序端对应的适配难度、开发成本,提高应用程序的运 行稳定性,进而保证对应的音频数据的有效播放。
以下以音频数据处理平台为执行主体介绍本发明一种音频数据处理方法的 具体实施例,图6是本发明实施例提供的一种音频数据处理方法的流程示意图, 本说明书提供了如实施例或流程图所述的方法操作步骤,但基于常规或者无创 造性的劳动可以包括更多或者更少的操作步骤。实施例中列举的步骤顺序仅仅 为众多步骤执行顺序中的一种方式,不代表唯一的执行顺序。在实际中的系统 或服务器产品执行时,可以按照实施例或者附图所示的方法顺序执行或者并行 执行(例如并行处理器或者多线程处理的环境)。具体的如图6所示,所述方 法应用于音频数据处理平台,车机系统为所述音频数据处理平台提供有用于调 用所述车机系统对应的发声模块的系统接口,所述音频数据处理平台为至少一 个应用程序端提供统一接口,所述方法包括:
S601:通过所述统一接口接收所述应用程序端针对待处理音频数据的播放 请求,所述播放请求携带有所述待处理音频数据对应的音频数据类型标识;
S602:根据所述待处理音频数据对应的音频数据类型标识,生成所述待处 理音频数据对应的播放执行结果;
S603:将所述待处理音频数据对应的播放执行结果发送至所述应用程序端, 以使得所述应用程序端根据所述待处理音频数据对应的播放执行结果来确定是 否通过所述音频数据处理平台调用所述发声模块。
本发明实施例还提供了一种音频数据处理平台,该音频数据处理平台包括 处理器和存储器,该存储器中存储有至少一条指令、至少一段程序、代码集或 指令集,该至少一条指令、该至少一段程序、该代码集或指令集由该处理器加 载并执行以实现如上述方法实施例所提供的音频数据处理方法。
本说明书实施例中,存储器可用于存储软件程序以及模块,处理器通过运 行存储在存储器的软件程序以及模块,从而执行各种功能应用以及数据处理。 存储器可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系 统、功能所需的应用程序等;存储数据区可存储根据所述设备的使用所创建的 数据等。此外,存储器可以包括高速随机存取存储器,还可以包括非易失性存 储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。 相应地,存储器还可以包括存储器控制器,以提供处理器对存储器的访问。
本发明实施例还提供了一种服务器的结构示意图,请参阅图11,该服务器 1100用于实施上述实施例中提供的音频数据处理方法。该服务器1100可因配置 或性能不同而产生比较大的差异,可以包括一个或一个以上中央处理器(Central Processing Units,CPU)1110(例如,一个或一个以上处理器)和存储器1130, 一个或一个以上存储应用程序1123或数据1122的存储介质1120(例如一个或 一个以上海量存储设备)。其中,存储器1130和存储介质1120可以是短暂存 储或持久存储。存储在存储介质1120的程序可以包括一个或一个以上模块,每 个模块可以包括对服务器中的一系列指令操作。更进一步地,中央处理器1110 可以设置为与存储介质1120通信,在服务器1100上执行存储介质1120中的一 系列指令操作。服务器1100还可以包括一个或一个以上电源1160,一个或一个 以上有线或无线网络接口1150,一个或一个以上输入输出接口1140,和/或,一 个或一个以上操作系统1121,例如Windows ServerTM,Mac OS XTM,UnixTM, LinuxTM,FreeBSDTM等等。
以下以应用程序端为执行主体介绍本发明一种音频数据处理方法的具体实 施例,图7是本发明实施例提供的一种音频数据处理方法的流程示意图,本说 明书提供了如实施例或流程图所述的方法操作步骤,但基于常规或者无创造性 的劳动可以包括更多或者更少的操作步骤。实施例中列举的步骤顺序仅仅为众 多步骤执行顺序中的一种方式,不代表唯一的执行顺序。在实际中的系统或服 务器产品执行时,可以按照实施例或者附图所示的方法顺序执行或者并行执行 (例如并行处理器或者多线程处理的环境)。具体的如图7所示,所述方法应 用于应用程序端,所述应用程序端通过音频数据处理平台提供的统一接口以实 现对车机系统对应的发声模块的调用,所述车机系统为所述音频数据处理平台 提供有用于调用所述发声模块的系统接口,所述方法包括:
S701:通过所述统一接口向所述音频数据处理平台发送针对待处理音频数 据的播放请求,所述播放请求携带有所述待处理音频数据对应的音频数据类型 标识;
S702:接收所述音频数据处理平台返回的所述待处理音频数据对应的播放 执行结果;
S703:根据所述待处理音频数据对应的播放执行结果,确定是否通过所述 音频数据处理平台调用所述车机系统对应的系统接口;
其中,所述待处理音频数据对应的播放执行结果为所述音频数据处理平台 根据所述待处理音频数据对应的音频数据类型标识生成。
本发明实施例还提供了一种应用程序端,该应用程序端包括处理器和存储 器,该存储器中存储有至少一条指令、至少一段程序、代码集或指令集,该至 少一条指令、该至少一段程序、该代码集或指令集由该处理器加载并执行以实 现如上述方法实施例所提供的音频数据处理方法。
本说明书实施例中,存储器可用于存储软件程序以及模块,处理器通过运 行存储在存储器的软件程序以及模块,从而执行各种功能应用以及数据处理。 存储器可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系 统、功能所需的应用程序等;存储数据区可存储根据所述设备的使用所创建的 数据等。此外,存储器可以包括高速随机存取存储器,还可以包括非易失性存 储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。 相应地,存储器还可以包括存储器控制器,以提供处理器对存储器的访问。
本发明实施例还提供了一种音频数据处理装置,如图8所示,所述装置应 用于音频数据处理平台,车机系统为所述音频数据处理平台提供有用于调用所 述车机系统对应的发声模块的系统接口,所述音频数据处理平台为至少一个应 用程序端提供统一接口,所述装置包括:
播放请求接收模块810:用于通过所述统一接口接收所述应用程序端针对待 处理音频数据的播放请求,所述播放请求携带有所述待处理音频数据对应的音 频数据类型标识;
播放执行结果生成模块820:用于根据所述待处理音频数据对应的音频数据 类型标识,生成所述待处理音频数据对应的播放执行结果;
播放执行结果发送模块830:用于将所述待处理音频数据对应的播放执行结 果发送至所述应用程序端,以使得所述应用程序端根据所述待处理音频数据对 应的播放执行结果来确定是否通过所述音频数据处理平台调用所述发声模块。
需要说明的,所述装置实施例中的装置与方法实施例基于同样的发明构思。
本发明实施例还提供了一种音频数据处理装置,如图9所示,所述装置应 用于应用程序端,所述应用程序端通过音频数据处理平台提供的统一接口以实 现对车机系统对应的发声模块的调用,所述车机系统为所述音频数据处理平台 提供有用于调用所述发声模块的系统接口,所述装置包括:
播放请求发送模块910:用于通过所述统一接口向所述音频数据处理平台发 送针对待处理音频数据的播放请求,所述播放请求携带有所述待处理音频数据 对应的音频数据类型标识;
播放执行结果接收模块920:用于接收所述音频数据处理平台返回的所述待 处理音频数据对应的播放执行结果;
播放执行模块930:用于根据所述播放执行结果,确定是否通过所述音频数 据处理平台调用所述车机系统对应的系统接口;
其中,所述待处理音频数据对应的播放执行结果为所述音频数据处理平台 根据所述待处理音频数据对应的音频数据类型标识生成。
需要说明的,所述装置实施例中的装置与方法实施例基于同样的发明构思。
本发明的实施例还提供了一种存储介质,所述存储介质可设置于音频数据 处理平台之中以保存用于实现方法实施例中一种音频数据处理方法相关的至少 一条指令、至少一段程序、代码集或指令集,该至少一条指令、该至少一段程 序、该代码集或指令集由该处理器加载并执行以实现上述方法实施例提供的音 频数据处理方法。
本发明的实施例还提供了一种存储介质,所述存储介质可设置于应用程序 端之中以保存用于实现方法实施例中一种音频数据处理方法相关的至少一条指 令、至少一段程序、代码集或指令集,该至少一条指令、该至少一段程序、该 代码集或指令集由该处理器加载并执行以实现上述方法实施例提供的音频数据 处理方法。
可选地,在本实施例中,上述存储介质可以位于计算机网络的多个网络服 务器中的至少一个网络服务器。可选地,在本实施例中,上述存储介质可以包 括但不限于:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储 器(RAM,RandomAccess Memory)、移动硬盘、磁碟或者光盘等各种可以存 储程序代码的介质。
需要说明的是:上述本发明实施例先后顺序仅仅为了描述,不代表实施例 的优劣。且上述对本说明书特定实施例进行了描述。其它实施例在所附权利要 求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不 同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描 绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某 些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相 似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。 尤其,对于装置和电子设备实施例而言,由于其基本相似于方法实施例,所以 描述的比较简单,相关之处参见方法实施例的部分说明即可。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过 硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于 一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或 光盘等。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的 精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的 保护范围之内。

Claims (10)

1.一种音频数据处理方法,其特征在于,应用于音频数据处理平台,车机系统为所述音频数据处理平台提供有用于调用所述车机系统对应的发声模块的系统接口,所述音频数据处理平台为至少一个应用程序端提供统一接口,所述方法包括:
通过所述统一接口接收所述应用程序端针对待处理音频数据的播放请求,所述播放请求携带有所述待处理音频数据对应的音频数据类型标识;
根据所述待处理音频数据对应的音频数据类型标识,生成所述待处理音频数据对应的播放执行结果;
将所述待处理音频数据对应的播放执行结果发送至所述应用程序端,以使得所述应用程序端根据所述待处理音频数据对应的播放执行结果来确定是否通过所述音频数据处理平台调用所述发声模块。
2.根据权利要求1所述的方法,其特征在于,所述通过所述统一接口接收所述应用程序端针对待处理音频数据的播放请求,包括:
响应于所述应用程序端发送的分类请求,根据筛选信息,从音频数据播放策略表中选择对应的所述音频数据类型标识作为应用程序端类型标识;
其中,所述筛选信息包括从所述分类请求携带的目标类型标识、所述应用程序端对应的业务属性组成的群组中选择的至少一个,所述音频数据播放策略表由所述音频数据处理平台创建,所述音频数据播放策略表中记录包括至少一个所述音频数据类型标识和各个所述音频数据类型标识对应的播放优先级信息,所述待处理音频数据对应的音频数据类型标识为所述应用程序端类型标识。
3.根据权利要求2所述的方法,其特征在于,所述音频数据播放策略表通过执行下述步骤补充,包括:
根据所述分类请求携带的所述目标类型标识,在所述音频数据播放策略表中进行匹配,得到匹配结果;
当所述匹配结果为匹配失败时,在所述音频数据播放策略表中补充所述目标类型标识以及设置所述目标类型标识对应的播放优先级信息。
4.根据权利要求1所述的方法,其特征在于,所述根据所述待处理音频数据对应的音频数据类型标识,生成所述待处理音频数据对应的播放执行结果,包括:
获取当前播放音频数据对应的音频数据类型标识;
根据所述待处理音频数据对应的音频数据类型标识和所述当前播放音频数据对应的音频数据类型标识,在所述音频数据处理平台创建的音频数据播放策略表中进行查询,得到所述待处理音频数据对应的播放执行结果和所述当前播放音频数据对应的播放执行结果。
5.根据权利要求1所述的方法,其特征在于,所述待处理音频数据对应的播放执行结果包括从所述待处理音频数据在当前播放优先级排序结果中位置、所述待处理音频数据的播放时长、所述待处理音频数据的播放音量组成的群组中选择的至少一个。
6.一种音频数据处理方法,其特征在于,应用于应用程序端,所述应用程序端通过音频数据处理平台提供的统一接口以实现对车机系统对应的发声模块的调用,所述车机系统为所述音频数据处理平台提供有用于调用所述发声模块的系统接口,所述方法包括:
通过所述统一接口向所述音频数据处理平台发送针对待处理音频数据的播放请求,所述播放请求携带有所述待处理音频数据对应的音频数据类型标识;
接收所述音频数据处理平台返回的所述待处理音频数据对应的播放执行结果;
根据所述待处理音频数据对应的播放执行结果,确定是否通过所述音频数据处理平台调用所述车机系统对应的系统接口;
其中,所述待处理音频数据对应的播放执行结果为所述音频数据处理平台根据所述待处理音频数据对应的音频数据类型标识生成。
7.根据权利要求6所述的方法,其特征在于,所述通过所述统一接口向所述音频数据处理平台发送针对待处理音频数据的播放请求之前,包括:
通过所述统一接口向所述音频数据处理平台发送分类请求;
接收所述音频数据处理平台返回的应用程序端类型标识;
其中,所述应用程序端类型标识为所述音频数据处理平台根据筛选信息从音频数据播放策略表中选择确定,所述筛选信息包括从所述分类请求携带的目标类型标识、所述应用程序端对应的业务属性组成的群组中选择的至少一个,所述音频数据播放策略表由所述音频数据处理平台创建,所述音频数据播放策略表中记录包括至少一个所述音频数据类型标识和各个所述音频数据类型标识对应的播放优先级信息,所述待处理音频数据对应的音频数据类型标识为所述应用程序端类型标识。
8.一种音频数据处理装置,其特征在于,应用于音频数据处理平台,车机系统为所述音频数据处理平台提供有用于调用所述车机系统对应的发声模块的系统接口,所述音频数据处理平台为至少一个应用程序端提供统一接口,所述装置包括:
播放请求接收模块:用于通过所述统一接口接收所述应用程序端针对待处理音频数据的播放请求,所述播放请求携带有所述待处理音频数据对应的音频数据类型标识;
播放执行结果生成模块:用于根据所述待处理音频数据对应的音频数据类型标识,生成所述待处理音频数据对应的播放执行结果;
播放执行结果发送模块:用于将所述待处理音频数据对应的播放执行结果发送至所述应用程序端,以使得所述应用程序端根据所述待处理音频数据对应的播放执行结果来确定是否通过所述音频数据处理平台调用所述发声模块。
9.一种音频数据处理装置,其特征在于,应用于应用程序端,所述应用程序端通过音频数据处理平台提供的统一接口以实现对车机系统对应的发声模块的调用,所述车机系统为所述音频数据处理平台提供有用于调用所述发声模块的系统接口,所述装置包括:
播放请求发送模块:用于通过所述统一接口向所述音频数据处理平台发送针对待处理音频数据的播放请求,所述播放请求携带有所述待处理音频数据对应的音频数据类型标识;
播放执行结果接收模块:用于接收所述音频数据处理平台返回的所述待处理音频数据对应的播放执行结果;
播放执行模块:用于根据所述播放执行结果,确定是否通过所述音频数据处理平台调用所述车机系统对应的系统接口;
其中,所述待处理音频数据对应的播放执行结果为所述音频数据处理平台根据所述待处理音频数据对应的音频数据类型标识生成。
10.一种计算机可读存储介质,其特征在于,所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现如权利要求1-5任一所述的音频数据处理方法或者权利要求6-7任一所述的音频数据处理方法。
CN201910506512.8A 2019-06-12 2019-06-12 一种音频数据处理方法、装置及介质 Active CN110333839B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910506512.8A CN110333839B (zh) 2019-06-12 2019-06-12 一种音频数据处理方法、装置及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910506512.8A CN110333839B (zh) 2019-06-12 2019-06-12 一种音频数据处理方法、装置及介质

Publications (2)

Publication Number Publication Date
CN110333839A true CN110333839A (zh) 2019-10-15
CN110333839B CN110333839B (zh) 2022-02-18

Family

ID=68140386

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910506512.8A Active CN110333839B (zh) 2019-06-12 2019-06-12 一种音频数据处理方法、装置及介质

Country Status (1)

Country Link
CN (1) CN110333839B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112153600A (zh) * 2020-09-23 2020-12-29 博泰车联网(南京)有限公司 一种音频管理方法、装置、系统及计算机存储介质
CN113271380A (zh) * 2020-02-14 2021-08-17 斑马智行网络(香港)有限公司 音频的处理方法和装置
CN115426588A (zh) * 2022-11-02 2022-12-02 杭州星犀科技有限公司 一种音频处理系统和方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105530171A (zh) * 2015-12-23 2016-04-27 腾讯科技(深圳)有限公司 车载终端播放即时消息音的方法和装置
CN105549945A (zh) * 2015-09-25 2016-05-04 宇龙计算机通信科技(深圳)有限公司 一种音频传输管理方法及用户终端
CN106598539A (zh) * 2016-12-15 2017-04-26 广州酷狗计算机科技有限公司 一种应用程序内音频的处理方法和装置
CN107967130A (zh) * 2016-10-20 2018-04-27 深圳联友科技有限公司 一种车机音频通道的切换方法及装置
CN107977185A (zh) * 2017-11-22 2018-05-01 深圳市沃特沃德股份有限公司 音频输出控制方法和装置
US20180160464A1 (en) * 2016-12-06 2018-06-07 Beijing Didi Infinity Technology And Development C O., Ltd. Systems and methods for assisting two terminals to establish connections therebetween

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105549945A (zh) * 2015-09-25 2016-05-04 宇龙计算机通信科技(深圳)有限公司 一种音频传输管理方法及用户终端
CN105530171A (zh) * 2015-12-23 2016-04-27 腾讯科技(深圳)有限公司 车载终端播放即时消息音的方法和装置
CN107967130A (zh) * 2016-10-20 2018-04-27 深圳联友科技有限公司 一种车机音频通道的切换方法及装置
US20180160464A1 (en) * 2016-12-06 2018-06-07 Beijing Didi Infinity Technology And Development C O., Ltd. Systems and methods for assisting two terminals to establish connections therebetween
CN106598539A (zh) * 2016-12-15 2017-04-26 广州酷狗计算机科技有限公司 一种应用程序内音频的处理方法和装置
CN107977185A (zh) * 2017-11-22 2018-05-01 深圳市沃特沃德股份有限公司 音频输出控制方法和装置

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113271380A (zh) * 2020-02-14 2021-08-17 斑马智行网络(香港)有限公司 音频的处理方法和装置
CN112153600A (zh) * 2020-09-23 2020-12-29 博泰车联网(南京)有限公司 一种音频管理方法、装置、系统及计算机存储介质
CN115426588A (zh) * 2022-11-02 2022-12-02 杭州星犀科技有限公司 一种音频处理系统和方法
CN115426588B (zh) * 2022-11-02 2023-03-03 杭州星犀科技有限公司 一种音频处理系统和方法

Also Published As

Publication number Publication date
CN110333839B (zh) 2022-02-18

Similar Documents

Publication Publication Date Title
CN110333839A (zh) 一种音频数据处理方法、装置及介质
CN108984157B (zh) 用于语音对话平台的技能配置和调用方法及系统
CN109783028A (zh) I/o调度的优化方法、装置、存储介质及智能终端
CN108763494A (zh) 对话系统间的知识分享方法、对话方法及装置
CN107146608B (zh) 一种播放控制方法、装置及智能设备
CN110211584A (zh) 车辆控制方法、装置、存储介质及控制终端
CN109876444A (zh) 数据展示方法和装置、存储介质及电子装置
CN111161717B (zh) 用于语音对话平台的技能调度方法及系统
CN104797001A (zh) 一种音乐播放方法和车载音乐播放系统
CN109729519A (zh) 数据下载的方法及相关装置
CN109859776A (zh) 一种语音编辑方法以及装置
CN111724880A (zh) 用户情绪调节方法、装置、设备和可读存储介质
CN106601242A (zh) 操作事件的执行方法及装置、终端
CN109285542B (zh) K歌系统的语音交互方法、介质、装置及系统
WO2023202161A1 (zh) 设备连接方法、装置、第一设备及计算机可读存储介质
CN106210908A (zh) 一种广告推送方法及装置
CN108231076A (zh) 一种语音控制方法、装置、设备及存储介质
CN111813900A (zh) 多轮对话处理方法、装置、电子设备及存储介质
CN110764724A (zh) 一种显示设备控制方法、装置、设备及存储介质
CN109756616A (zh) 消息的处理方法和装置、存储介质、电子装置
CN113727272A (zh) 分布式智能交互方法、装置、电子设备及存储介质
CN111857473A (zh) 音频播放方法、装置和电子设备
CN111740887B (zh) 分发电子终端的未完任务的方法及设备
CN109784915A (zh) 内容预置方法和装置
CN108235106A (zh) 一种智能电视上控制视频遮挡图的方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant