CN117065346A - 一种串流音频处理方法、装置、设备及介质 - Google Patents
一种串流音频处理方法、装置、设备及介质 Download PDFInfo
- Publication number
- CN117065346A CN117065346A CN202311108300.7A CN202311108300A CN117065346A CN 117065346 A CN117065346 A CN 117065346A CN 202311108300 A CN202311108300 A CN 202311108300A CN 117065346 A CN117065346 A CN 117065346A
- Authority
- CN
- China
- Prior art keywords
- audio
- api
- intercepted
- streaming audio
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 20
- 238000012545 processing Methods 0.000 claims abstract description 82
- 238000004458 analytical method Methods 0.000 claims abstract description 12
- 238000000034 method Methods 0.000 claims description 35
- 238000004590 computer program Methods 0.000 claims description 16
- 230000008569 process Effects 0.000 claims description 13
- 239000008186 active pharmaceutical agent Substances 0.000 description 84
- 230000005540 biological transmission Effects 0.000 description 10
- 238000004891 communication Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 230000009471 action Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000001953 sensory effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- A—HUMAN NECESSITIES
- A63—SPORTS; GAMES; AMUSEMENTS
- A63F—CARD, BOARD, OR ROULETTE GAMES; INDOOR GAMES USING SMALL MOVING PLAYING BODIES; VIDEO GAMES; GAMES NOT OTHERWISE PROVIDED FOR
- A63F13/00—Video games, i.e. games using an electronically generated display having two or more dimensions
- A63F13/50—Controlling the output signals based on the game progress
- A63F13/54—Controlling the output signals based on the game progress involving acoustic signals, e.g. for simulating revolutions per minute [RPM] dependent engine sounds in a driving game or reverberation against a virtual wall
-
- A—HUMAN NECESSITIES
- A63—SPORTS; GAMES; AMUSEMENTS
- A63F—CARD, BOARD, OR ROULETTE GAMES; INDOOR GAMES USING SMALL MOVING PLAYING BODIES; VIDEO GAMES; GAMES NOT OTHERWISE PROVIDED FOR
- A63F13/00—Video games, i.e. games using an electronically generated display having two or more dimensions
- A63F13/70—Game security or game management aspects
- A63F13/77—Game security or game management aspects involving data related to game devices or game servers, e.g. configuration data, software version or amount of memory
-
- A—HUMAN NECESSITIES
- A63—SPORTS; GAMES; AMUSEMENTS
- A63F—CARD, BOARD, OR ROULETTE GAMES; INDOOR GAMES USING SMALL MOVING PLAYING BODIES; VIDEO GAMES; GAMES NOT OTHERWISE PROVIDED FOR
- A63F2300/00—Features of games using an electronically generated display having two or more dimensions, e.g. on a television screen, showing representations related to the game
- A63F2300/60—Methods for processing data by generating or executing the game program
- A63F2300/6063—Methods for processing data by generating or executing the game program for sound processing
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Business, Economics & Management (AREA)
- Computer Security & Cryptography (AREA)
- General Business, Economics & Management (AREA)
- Reverberation, Karaoke And Other Acoustics (AREA)
Abstract
本发明公开了一种串流音频处理方法、装置、设备及介质。串流音频处理方法,包括:获取待拦截应用程序接口API;拦截待拦截API,并基于待拦截API,确定目标串流音频关联数据;对目标串流音频关联数据进行音频解析和处理,得到终端播放音频数据。本发明实施例的技术方案能够不使用声卡进行串流音频的处理,降低终端接收音频数据的延时时间,进而提升用户体验。
Description
技术领域
本发明涉及音频处理技术领域,尤其涉及一种串流音频处理方法、装置、设备及介质。
背景技术
一般情况下,游戏引擎中会要求有声卡,串流音频数据传输给声卡,并由声卡处理后将最终的音频数据传输至用户终端。
然而声卡处理过程中需要为播放预留时间,导致现有串流音频数据经过声卡处理存在网络延迟。
发明内容
本发明提供了一种串流音频处理方法、装置、设备及介质,以解决现有串流音频传输延时较长的问题。
根据本发明的一方面,提供了一种串流音频处理方法,包括:
获取待拦截API;
拦截待拦截API,并基于待拦截API,确定目标串流音频关联数据;
对目标串流音频关联数据进行音频解析和处理,得到终端播放音频数据。
根据本发明的另一方面,提供了一种串流音频处理装置,包括:
待拦截API获取模块,用于获取待拦截API;
目标串流音频关联数据确定模块,用于拦截待拦截API,并基于待拦截API,确定目标串流音频关联数据;
终端播放音频数据获取模块,用于对目标串流音频关联数据进行音频解析和处理,得到终端播放音频数据。
根据本发明的另一方面,提供了一种电子设备,所述电子设备包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行本发明任一实施例所述的串流音频处理方法。
根据本发明的另一方面,提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使处理器执行时实现本发明任一实施例所述的串流音频处理方法。
本发明实施例的技术方案,通过获取待拦截API,从而拦截待拦截API,并基于待拦截API,确定目标串流音频关联数据,进而对目标串流音频关联数据进行音频解析和处理,得到终端播放音频数据。由于本方案中未使用声卡进行音频处理,也不存在声卡处理音频数据过程中为音频播放提供预留时间的情况出现,可以大大降低串流音频传输的时间,解决了现有串流音频传输延时较长的问题,能够不使用声卡进行串流音频的处理,降低终端接收音频数据的延时时间,进而提升用户体验。
应当理解,本部分所描述的内容并非旨在标识本发明的实施例的关键或重要特征,也不用于限制本发明的范围。本发明的其它特征将通过以下的说明书而变得容易理解。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例一提供的一种串流音频处理方法的流程图;
图2为本发明实施例二提供的一种串流音频处理方法的流程图;
图3为本发明实施例三提供的一种串流音频处理装置的结构示意图;
图4示出了可以用来实施本发明的实施例的电子设备的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“原始”、“目标”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
实施例一
图1为本发明实施例一提供的一种串流音频处理方法的流程图,本实施例可适用于低延时的进行串流音频传输的情况,该方法可以由串流音频处理装置来执行,该串流音频处理装置可以采用硬件和/或软件的形式实现,该串流音频处理装置可配置于电子设备中。如图1所示,该方法包括:
步骤110、获取待拦截API。
其中,待拦截API可以是游戏引擎调用声卡时需要被拦截的API。
在本发明实施例中,可以对游戏引擎播放声音所需调用声卡的API进行筛选,得到待拦截API。
步骤120、拦截待拦截API,并基于待拦截API,确定目标串流音频关联数据。
其中,目标串流音频关联数据可以是基于待拦截API的参数确定的,与音频播放关联的串流音频数据。
具体的,游戏引擎在服务器上运行时,不需要播放音频,不涉及声卡功能,但在游戏引擎按照原有流程调用声卡时,会出现对声卡的API的调用,由于本方案中不设置声卡进行串流音频数据的处理,因此需要对待拦截API进行拦截,进而对待拦截API进行参数解析,得到目标串流音频关联数据。
步骤130、对目标串流音频关联数据进行音频解析和处理,得到终端播放音频数据。
其中,终端播放音频数据可以是登录游戏引擎的用户终端中为用户提供的与游戏适配的音频数据。
在本发明实施例中,可以对目标串流音频关联数据进行音频解析,并根据预先设置的音频处理方法对解析的音频结果,进行音频处理,得到终端播放音频数据,并通过用户终端将终端播放音频数据转换成声波,以供用户可以流畅的听到游戏的适配音频。
本发明实施例的技术方案,通过获取待拦截API,从而拦截待拦截API,并基于待拦截API,确定目标串流音频关联数据,进而对目标串流音频关联数据进行音频解析和处理,得到终端播放音频数据。由于本方案中未使用声卡进行音频处理,也不存在声卡处理音频数据过程中为音频播放提供预留时间的情况出现,可以大大降低串流音频传输的时间,解决了现有串流音频传输延时较长的问题,能够不使用声卡进行串流音频的处理,降低终端接收音频数据的延时时间,进而提升用户体验。
实施例二
图2为本发明实施例二提供的一种串流音频处理方法的流程图,本实施例以上述实施例为基础进行具体化,给出了对目标串流音频关联数据进行音频解析和处理,得到终端播放音频数据的具体的可选的实施方式。如图2所示,该方法包括:
步骤210、获取待拦截API。
在本发明的一个可选实施例中,获取待拦截API,可以包括:确定音频缓冲区管理API以及音频客户端实例创建API;基于音频缓冲区管理API以及音频客户端实例创建API,确定待拦截API。
其中,音频缓冲区管理API可以是与声卡输出客户端接口关联的API。示例性的,音频缓冲区管理API可以包括但不限于IAudioRenderClient_ReleaseBuffer和IAudioRenderClient_GetBuffer。音频客户端实例创建API可以是创建音频客户端实例的相关API。示例性的,音频客户端实例创建API可以包括但不限于IAudioClient_GetCurrentPadding和IAudioClient_GetMixFormat。
在本发明实施例中,可以对游戏引擎播放声音所需调用声卡的API中筛选出音频缓冲区管理API以及音频客户端实例创建API,可以将音频缓冲区管理API以及音频客户端实例创建API,作为待拦截API,也可以按需对音频缓冲区管理API以及音频客户端实例创建API,进一步筛选得到待拦截API。
步骤220、拦截待拦截API,并基于待拦截API,确定目标串流音频关联数据。
在本发明的一个可选实施例中,拦截待拦截API,可以包括:在目标串流音频关联数据,传输至待拦截API之后,若检测到待拦截API向声卡传输目标串流音频关联数据,则拦截待拦截API。
在本发明实施例中,当游戏引擎将目标串流音频关联数据,传输至待拦截API之后,进一步判断待拦截API是否存在向声卡传输目标串流音频关联数据的操作,若检测到待拦截API向声卡传输目标串流音频关联数据的操作时,对待拦截API进行拦截。
在本发明的一个可选实施例中,基于待拦截API,确定目标串流音频关联数据,可以包括:基于音频缓冲区管理API,确定音频帧配置字节数、静音播放标识以及音频播放路径;基于音频客户端实例创建API,确定音频缓存区空闲空间、音频格式、字节单位以及原始声道数量;将音频帧配置字节数、静音播放标识、音频播放路径、音频缓存区空闲空间、音频格式、字节单位以及原始声道数量,作为目标串流音频关联数据。
其中,音频帧配置字节数可以是为串流音频每帧设置的字节数。可选的,音频帧配置字节数可以包括串流音频每帧可写入的字节数以及每帧串流音频数据的字节数。静音播放标识可以是标识声音静音的标识。音频播放路径可以是播放音频数据的地址路径。音频缓存区空闲空间可以是声音缓冲区的空白空间。原始声道数量可以是游戏引擎为串流音频提供的可支持的声道数量。
在本发明实施例中,可以对音频缓冲区管理API的参数进行解析,得到音频帧配置字节数、静音播放标识以及音频播放路径,并对音频客户端实例创建API进行参数解析,得到音频缓存区空闲空间、音频格式、字节单位以及原始声道数量,从而将解析出的参数(音频帧配置字节数、静音播放标识、音频播放路径、音频缓存区空闲空间、音频格式、字节单位以及原始声道数量)作为目标串流音频关联数据。
步骤230、根据目标串流音频关联数据,获取待处理串流音频数据。
其中,待处理串流音频数据可以是根据目标串流音频关联数据确定的有效串流音频数据,用于处理为终端播放音频数据。
在本发明实施例中,可以对目标串流音频关联数据进行解析,并基于目标串流音频关联数据,获取游戏引擎需要向用户终端发送的有效串流音频数据,即待处理串流音频数据。
步骤240、对待处理串流音频数据,进行对齐处理以及混音处理,得到终端播放音频数据。
在本发明实施例中,可以对待处理串流音频数据进行解析,得到多种类型的音频,并对解析出的多种类型的音频进行对齐处理和混音处理,得到终端播放音频数据。
在本发明的一个可选实施例中,对待处理串流音频数据,进行对齐处理以及混音处理,可以包括:确定待处理串流音频数据中背景音频的背景音频时间轴;根据背景音频时间轴,对待处理串流音频数据中的非背景音频进行对齐处理以及混音处理。
其中,背景音频时间轴可以是待处理串流音频数据中背景音乐的时间轴。非背景音频可以是待处理串流音频数据中除背景音频之外的其他类型的音频。非背景音频可以包括但不限于环境音、人物动作声以及战斗音效等。
在本发明实施例中,可以对待处理串流音频数据进行音频类型的划分提取,得到待处理串流音频数据中的背景音频以及非背景音频,并确定背景音频的背景音频时间轴,进而根据背景音频时间轴,对待处理串流音频数据中的非背景音频进行时间轴的对齐处理,并将对齐的音频进行混音处理。
在本发明的一个可选实施例中,对待处理串流音频数据,进行对齐处理以及混音处理之后,还可以包括:获取播放终端播放音频数据的目标终端的终端声道数量;根据原始声道数量以及终端声道数量,对待处理串流音频数据进行声道匹配处理。
其中,目标终端可以是播放游戏引擎适配串流音频的用户终端。终端声道数量可以是用户终端在播放终端播放音频数据时的实际声道数量。
在本发明实施例中,可以先确定播放终端播放音频数据的目标终端的终端声道数量,从而按照终端声道数量,对原始声道数量的待处理串流音频数据进行声道匹配处理,以使待处理串流音频数据适配目标终端,保证串流音频的播放效果。
示例性的,假设终端声道数量为2,即用户终端为左右声道,可以将游戏内部做成左右声道(将待处理串流音频数据处理为左右声道),此时用户终端不需要声卡,使得网络延迟得到改善。
示例性的,可以将IAudioRenderClient_ReleaseBuffer、IAudioRenderClient_GetBuffer、IAudioClient_GetCurrentPadding以及IAudioClient_GetMixFormat作为待拦截API,从而对待拦截API进行拦截,取出待处理串流音频数据,进而将待处理串流音频数据中的背景音频、环境音、人物动作声以及战斗音效,按照背景音频时间轴进行多音频对齐处理,然后进行声音叠加处理即混音处理,得到终端播放音频数据,进而通过网络将终端播放音频数据发送至用户终端。
本发明实施例的技术方案,通过获取待拦截API,从而拦截待拦截API,并基于待拦截API,确定目标串流音频关联数据,进而根据目标串流音频关联数据,获取待处理串流音频数据,并对待处理串流音频数据,进行对齐处理以及混音处理,得到终端播放音频数据。由于本方案中未使用声卡进行音频处理,也不存在声卡处理音频数据过程中为音频播放提供预留时间的情况出现,可以大大降低串流音频传输的时间,解决了现有串流音频传输延时较长的问题,能够不使用声卡进行串流音频的处理,降低终端接收音频数据的延时时间,进而提升用户体验。
实施例三
图3为本发明实施例三提供的一种串流音频处理装置的结构示意图。如图3所示,该装置包括:
待拦截API获取模块310,用于获取待拦截API;
目标串流音频关联数据确定模块320,用于拦截待拦截API,并基于待拦截API,确定目标串流音频关联数据;
终端播放音频数据获取模块330,用于对目标串流音频关联数据进行音频解析和处理,得到终端播放音频数据。
本发明实施例的技术方案,通过获取待拦截API,从而拦截待拦截API,并基于待拦截API,确定目标串流音频关联数据,进而对目标串流音频关联数据进行音频解析和处理,得到终端播放音频数据。由于本方案中未使用声卡进行音频处理,也不存在声卡处理音频数据过程中为音频播放提供预留时间的情况出现,可以大大降低串流音频传输的时间,解决了现有串流音频传输延时较长的问题,能够不使用声卡进行串流音频的处理,降低终端接收音频数据的延时时间,进而提升用户体验。
可选的,待拦截API获取模块310,用于确定音频缓冲区管理API以及音频客户端实例创建API;基于所述音频缓冲区管理API以及所述音频客户端实例创建API,确定待拦截API。
可选的,目标串流音频关联数据确定模块320包括拦截单元以及目标串流音频关联数据确定单元。拦截单元,用于在所述目标串流音频关联数据,传输至所述待拦截API之后,若检测到所述待拦截API向声卡传输所述目标串流音频关联数据,则拦截所述待拦截API。
可选的,目标串流音频关联数据确定单元,用于基于所述音频缓冲区管理API,确定音频帧配置字节数、静音播放标识以及音频播放路径;基于所述音频客户端实例创建API,确定音频缓存区空闲空间、音频格式、字节单位以及原始声道数量;将所述音频帧配置字节数、所述静音播放标识、所述音频播放路径、所述音频缓存区空闲空间、所述音频格式、所述字节单位以及所述原始声道数量,作为所述目标串流音频关联数据。
可选的,终端播放音频数据获取模块330包括待处理串流音频数据获取单元以及第一音频处理单元。待处理串流音频数据获取单元,用于根据所述目标串流音频关联数据,获取待处理串流音频数据。第一音频处理单元,用于对所述待处理串流音频数据,进行对齐处理以及混音处理,得到所述终端播放音频数据。
可选的,第一音频处理单元,用于确定所述待处理串流音频数据中背景音频的背景音频时间轴;根据所述背景音频时间轴,对所述待处理串流音频数据中的非背景音频进行对齐处理以及混音处理。
可选的,串流音频处理装置还包括第二音频处理单元,用于在对所述待处理串流音频数据,进行对齐处理以及混音处理之后,获取播放所述终端播放音频数据的目标终端的终端声道数量;根据所述原始声道数量以及所述终端声道数量,对所述待处理串流音频数据进行声道匹配处理。
本发明实施例所提供的串流音频处理装置可执行本发明任意实施例所提供的串流音频处理方法,具备执行方法相应的功能模块和有益效果。
实施例四
图4示出了可以用来实施本发明的实施例的电子设备的结构示意图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备(如头盔、眼镜、手表等)和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本发明的实现。
如图4所示,电子设备10包括至少一个处理器11,以及与至少一个处理器11通信连接的存储器,如只读存储器(ROM)12、随机访问存储器(RAM)13等,其中,存储器存储有可被至少一个处理器执行的计算机程序,处理器11可以根据存储在只读存储器(ROM)12中的计算机程序或者从存储单元18加载到随机访问存储器(RAM)13中的计算机程序,来执行各种适当的动作和处理。在RAM 13中,还可存储电子设备10操作所需的各种程序和数据。处理器11、ROM 12以及RAM 13通过总线14彼此相连。输入/输出(I/O)接口15也连接至总线14。
电子设备10中的多个部件连接至I/O接口15,包括:输入单元16,例如键盘、鼠标等;输出单元17,例如各种类型的显示器、扬声器等;存储单元18,例如磁盘、光盘等;以及通信单元19,例如网卡、调制解调器、无线通信收发机等。通信单元19允许电子设备10通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
处理器11可以是各种具有处理和计算能力的通用和/或专用处理组件。处理器11的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的处理器、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。处理器11执行上文所描述的各个方法和处理,例如串流音频处理方法。
在一些实施例中,串流音频处理方法可被实现为计算机程序,其被有形地包含于计算机可读存储介质,例如存储单元18。在一些实施例中,计算机程序的部分或者全部可以经由ROM 12和/或通信单元19而被载入和/或安装到电子设备10上。当计算机程序加载到RAM 13并由处理器11执行时,可以执行上文描述的串流音频处理方法的一个或多个步骤。备选地,在其他实施例中,处理器11可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行串流音频处理方法。
本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
用于实施本发明的方法的计算机程序可以采用一个或多个编程语言的任何组合来编写。这些计算机程序可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器,使得计算机程序当由处理器执行时使流程图和/或框图中所规定的功能/操作被实施。计算机程序可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本发明的上下文中,计算机可读存储介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的计算机程序。计算机可读存储介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。备选地,计算机可读存储介质可以是机器可读信号介质。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
为了提供与用户的交互,可以在电子设备上实施此处描述的系统和技术,该电子设备具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给电子设备。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)、区块链网络和互联网。
计算系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,又称为云计算服务器或云主机,是云计算服务体系中的一项主机产品,以解决了传统物理主机与VPS服务中,存在的管理难度大,业务扩展性弱的缺陷。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发明中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本发明的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本发明保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明保护范围之内。
Claims (10)
1.一种串流音频处理方法,其特征在于,包括:
获取待拦截应用程序接口API;
拦截待拦截API,并基于所述待拦截API,确定目标串流音频关联数据;
对所述目标串流音频关联数据进行音频解析和处理,得到终端播放音频数据。
2.根据权利要求1所述的方法,其特征在于,获取待拦截API,包括:
确定音频缓冲区管理API以及音频客户端实例创建API;
基于所述音频缓冲区管理API以及所述音频客户端实例创建API,确定待拦截API。
3.根据权利要求1所述的方法,其特征在于,拦截待拦截API,包括:
在所述目标串流音频关联数据,传输至所述待拦截API之后,若检测到所述待拦截API向声卡传输所述目标串流音频关联数据,则拦截所述待拦截API。
4.根据权利要求2所述的方法,其特征在于,基于所述待拦截API,确定目标串流音频关联数据,包括:
基于所述音频缓冲区管理API,确定音频帧配置字节数、静音播放标识以及音频播放路径;
基于所述音频客户端实例创建API,确定音频缓存区空闲空间、音频格式、字节单位以及原始声道数量;
将所述音频帧配置字节数、所述静音播放标识、所述音频播放路径、所述音频缓存区空闲空间、所述音频格式、所述字节单位以及所述原始声道数量,作为所述目标串流音频关联数据。
5.根据权利要求4所述的方法,其特征在于,对所述目标串流音频关联数据进行音频解析和处理,得到终端播放音频数据,包括:
根据所述目标串流音频关联数据,获取待处理串流音频数据;
对所述待处理串流音频数据,进行对齐处理以及混音处理,得到所述终端播放音频数据。
6.根据权利要求5所述的方法,其特征在于,对所述待处理串流音频数据,进行对齐处理以及混音处理,包括:
确定所述待处理串流音频数据中背景音频的背景音频时间轴;
根据所述背景音频时间轴,对所述待处理串流音频数据中的非背景音频进行对齐处理以及混音处理。
7.根据权利要求5所述的方法,其特征在于,对所述待处理串流音频数据,进行对齐处理以及混音处理之后,还包括:
获取播放所述终端播放音频数据的目标终端的终端声道数量;
根据所述原始声道数量以及所述终端声道数量,对所述待处理串流音频数据进行声道匹配处理。
8.一种串流音频处理装置,其特征在于,包括:
待拦截API获取模块,用于获取待拦截API;
目标串流音频关联数据确定模块,用于拦截所述待拦截API,并基于所述待拦截API,确定目标串流音频关联数据;
终端播放音频数据获取模块,用于对所述目标串流音频关联数据进行音频解析和处理,得到终端播放音频数据。
9.一种电子设备,其特征在于,所述电子设备包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-7中任一项所述的串流音频处理方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使处理器执行时实现权利要求1-7中任一项所述的串流音频处理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311108300.7A CN117065346A (zh) | 2023-08-30 | 2023-08-30 | 一种串流音频处理方法、装置、设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311108300.7A CN117065346A (zh) | 2023-08-30 | 2023-08-30 | 一种串流音频处理方法、装置、设备及介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117065346A true CN117065346A (zh) | 2023-11-17 |
Family
ID=88719379
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311108300.7A Pending CN117065346A (zh) | 2023-08-30 | 2023-08-30 | 一种串流音频处理方法、装置、设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117065346A (zh) |
-
2023
- 2023-08-30 CN CN202311108300.7A patent/CN117065346A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108521612B (zh) | 视频摘要的生成方法、装置、服务器及存储介质 | |
WO2016045647A2 (zh) | 一种红包数据处理方法及终端 | |
US11936605B2 (en) | Message processing method, apparatus and electronic device | |
CN113794909A (zh) | 视频流传输系统、方法、服务器、装置以及存储介质 | |
CN110324566B (zh) | 视频会议中声音延时的测试方法、测试装置和测试设备 | |
CN113301135A (zh) | 一种数据共享方法 | |
CN117065346A (zh) | 一种串流音频处理方法、装置、设备及介质 | |
CN113824689B (zh) | 边缘计算网络、数据传输方法、装置、设备和存储介质 | |
CN113365140B (zh) | Mp4在线播放方法、装置、设备、存储介质及程序产品 | |
CN113742004B (zh) | 一种基于flink框架的数据处理方法和装置 | |
KR20220056836A (ko) | 음성 응답 속도 결정 방법, 장치, 전자 기기, 컴퓨터 판독 가능한 저장 매체 및 컴퓨터 프로그램 | |
CN113852835A (zh) | 直播音频处理方法、装置、电子设备以及存储介质 | |
CN114500105A (zh) | 一种网络包的拦截方法、装置、设备及存储介质 | |
CN114242067A (zh) | 语音识别方法、装置、设备和存储介质 | |
CN111355919B (zh) | 一种通信会话控制方法及装置 | |
CN114221940B (zh) | 音频数据处理方法、系统、装置、设备以及存储介质 | |
CN113674755B (zh) | 语音处理方法、装置、电子设备和介质 | |
CN110138991B (zh) | 回音消除方法和装置 | |
CN114095758B (zh) | 云图像截取方法、相关装置 | |
CN114286343B (zh) | 多路外呼系统、风险识别方法、设备、介质及产品 | |
CN113923527B (zh) | 云游戏的视频数据解码方法、装置、电子设备及存储介质 | |
CN118075290A (zh) | 数据同步方法、装置、设备、介质及产品 | |
CN115273901A (zh) | 音频检测方法、装置、电子设备和存储介质 | |
CN116578265A (zh) | 一种音频播放方法、虚拟化操作系统、设备及存储介质 | |
CN117153145A (zh) | 一种智能设备的打断唤醒的测试方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |