CN108111474B - 一种混音方法和装置 - Google Patents

一种混音方法和装置 Download PDF

Info

Publication number
CN108111474B
CN108111474B CN201611066882.7A CN201611066882A CN108111474B CN 108111474 B CN108111474 B CN 108111474B CN 201611066882 A CN201611066882 A CN 201611066882A CN 108111474 B CN108111474 B CN 108111474B
Authority
CN
China
Prior art keywords
way
audio
mixing
audio mixing
audio data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201611066882.7A
Other languages
English (en)
Other versions
CN108111474A (zh
Inventor
李云鹏
王晓燕
王艳辉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hainan Qiantang Shilian Information Technology Co.,Ltd.
Original Assignee
Visionvera Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Visionvera Information Technology Co Ltd filed Critical Visionvera Information Technology Co Ltd
Priority to CN201611066882.7A priority Critical patent/CN108111474B/zh
Publication of CN108111474A publication Critical patent/CN108111474A/zh
Application granted granted Critical
Publication of CN108111474B publication Critical patent/CN108111474B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/60Network streaming of media packets
    • H04L65/75Media network packet handling
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明实施例提供了一种混音方法及装置,所述混音方法包括:通过流媒体进程将从视联网服务器端获取到的一路或一路以上音频数据保存至共享存储中;通过混音进程从共享存储中读取一路或一路以上音频数据,并对一路或一路以上音频数据进行混音操作;通过混音进程将混音后的音频数据保存至共享存储中;通过流媒体进程从共享存储中获取混音后的音频数据,并将混音后的音频数据发送给终端。从而有效地降低了系统负担,减少内存占用,提高了系统稳定性以及可靠性,进而提升了用户体验。

Description

一种混音方法和装置
技术领域
本发明涉及视联网技术领域,特别是涉及一种混音方法和一种混音装置。
背景技术
随着网络科技的快速发展,视频会议、视频教学等双向通信在用户的生活、工作、学习等方面广泛普及。
在通信过程中,当多个终端同时产生音频数据时,流媒体系统针对不同终端的需求,对多录音频数据进行混音。在现有技术实施例中,混音过程是通过终端中的应用软件实现,因此,在视联网中存在用户较多的情况下,每个终端都会启用应用软件进行混音,导致流媒体系统的整体内存占用量过大,并造成流媒体系统异常退出,严重影响了用户体验。
发明内容
鉴于上述问题,提出了本发明实施例以便提供一种克服上述问题或者至少部分地解决上述问题的一种混音方法和相应的一种混音装置。
为了解决上述问题,本发明实施例公开了一种混音方法,应用于视联网中,所述方法包括:
通过流媒体进程将从视联网服务器端获取到的一路或一路以上音频数据保存至共享存储中;
通过混音进程从共享存储中读取一路或一路以上音频数据,并对一路或一路以上音频数据进行混音操作;
通过混音进程将混音后的音频数据保存至共享存储中;
通过流媒体进程从共享存储中获取混音后的音频数据,并将混音后的音频数据发送给终端。
在本发明的一个优选的实施例中,通过流媒体进程将从视联网服务器端获取到的一路或一路以上音频数据保存至共享存储中的步骤之后,还包括:
通过流媒体进程向混音进程发送混音请求,其中,混音请求中携带有一路或一路以上音频数据在共享存储中的第一保存路径以及混音规则。
在本发明的一个优选的实施例中,通过混音进程从共享存储中读取一路或一路以上音频数据,并对一路或一路以上音频数据进行混音操作的步骤,具体包括:
通过混音进程根据第一保存路径,从共享存储中读取一路或一路以上音频数据;以及,
根据混音规则,对一路或一路以上音频数据进行混音操作。
在本发明的一个优选的实施例中,通过混音进程将混音后的音频数据保存至共享存储中的步骤之后,还包括:
通过混音进程向流媒体进程发送混音响应,其中,混音响应中携带有混音后的音频数据在共享存储中的第二保存路径。
在本发明的一个优选的实施例中,通过流媒体进程从共享存储中获取混音后的音频数据的步骤,具体包括:
通过流媒体进程根据第二保存路径,从共享存储中获取混音后的音频数据。
根据本发明的另一方面,还提供了一种混音装置,应用于视联网中,包括:
流媒体模块,用于通过流媒体进程将从视联网服务器端获取到的一路或一路以上音频数据保存至共享存储中;
混音模块,用于通过混音进程从共享存储中读取一路或一路以上音频数据,并对一路或一路以上音频数据进行混音操作;
混音模块进一步用于通过混音进程将混音后的音频数据保存至共享存储中;
流媒体模块进一步用于通过流媒体进程从共享存储中获取混音后的音频数据,并将混音后的音频数据发送给终端。
在本发明的一个优选的实施例中,流媒体模块进一步用于通过流媒体进程向混音进程发送混音请求,其中,混音请求中携带有一路或一路以上音频数据在共享存储中的第一保存路径以及混音规则。
在本发明的一个优选的实施例中,混音模块进一步用于:
通过混音进程根据第一保存路径,从共享存储中读取一路或一路以上音频数据;以及,
根据混音规则,对一路或一路以上音频数据进行混音操作。
在本发明的一个优选的实施例中,混音模块进一步用于通过混音进程向流媒体进程发送混音响应,其中,混音响应中携带有混音后的音频数据在共享存储中的第二保存路径。
在本发明的一个优选的实施例中,流媒体模块进一步用于通过流媒体进程根据第二保存路径,从共享存储中获取混音后的音频数据
相比于现有技术,本发明实施例中的技术方案通过流媒体进程将从视联网服务器端获取到的一路或一路以上音频数据保存至共享存储中;通过混音进程从共享存储中读取一路或一路以上音频数据,并对一路或一路以上音频数据进行混音操作;通过混音进程将混音后的音频数据保存至共享存储中;通过流媒体进程从共享存储中获取混音后的音频数据,并将混音后的音频数据发送给终端。从而有效地降低了系统负担,减少内存占用,提高了系统稳定性以及可靠性,进而提升了用户体验。
附图说明
图1是本发明的一种视联网的组网示意图;
图2是本发明的一种节点服务器的硬件结构示意图;
图3是本发明的一种接入交换机的硬件结构示意图;
图4是本发明的一种以太网协转网关的硬件结构示意图;
图5是本发明的一种混音方法实施例的步骤流程图;
图6是本发明的一种混音装置实施例的结构框图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
视联网是网络发展的重要里程碑,是一个实时网络,能够实现高清视频实时传输,将众多互联网应用推向高清视频化,高清面对面。
视联网采用实时高清视频交换技术,可以在一个网络平台上将所需的服务,如高清视频会议、视频监控、智能化监控分析、应急指挥、数字广播电视、延时电视、网络教学、现场直播、VOD点播、电视邮件、个性录制(PVR)、内网(自办)频道、智能化视频播控、信息发布等数十种视频、语音、图片、文字、通讯、数据等服务全部整合在一个系统平台,通过电视或电脑实现高清品质视频播放。
为使本领域技术人员更好地理解本发明实施例,以下对视联网进行介绍:
视联网所应用的部分技术如下所述:
网络技术(Network Technology)
视联网的网络技术创新改良了传统以太网(Ethernet),以面对网络上潜在的巨大视频流量。不同于单纯的网络分组包交换(Packet Switching)或网络电路交换(CircuitSwitching),视联网技术采用Packet Switching满足Streaming需求。视联网技术具备分组交换的灵活、简单和低价,同时具备电路交换的品质和安全保证,实现了全网交换式虚拟电路,以及数据格式的无缝连接。
交换技术(Switching Technology)
视联网采用以太网的异步和包交换两个优点,在全兼容的前提下消除了以太网缺陷,具备全网端到端无缝连接,直通用户终端,直接承载IP数据包。用户数据在全网范围内不需任何格式转换。视联网是以太网的更高级形态,是一个实时交换平台,能够实现目前互联网无法实现的全网大规模高清视频实时传输,将众多网络视频应用推向高清化、统一化。
服务器技术(Server Technology)
视联网和统一视频平台上的服务器技术不同于传统意义上的服务器,它的流媒体传输是建立在面向连接的基础上,其数据处理能力与流量、通讯时间无关,单个网络层就能够包含信令及数据传输。对于语音和视频业务来说,视联网和统一视频平台流媒体处理的复杂度比数据处理简单许多,效率比传统服务器大大提高了百倍以上。
储存器技术(Storage Technology)
统一视频平台的超高速储存器技术为了适应超大容量和超大流量的媒体内容而采用了最先进的实时操作系统,将服务器指令中的节目信息映射到具体的硬盘空间,媒体内容不再经过服务器,瞬间直接送达到用户终端,用户等待一般时间小于0.2秒。最优化的扇区分布大大减少了硬盘磁头寻道的机械运动,资源消耗仅占同等级IP互联网的20%,但产生大于传统硬盘阵列3倍的并发流量,综合效率提升10倍以上。
网络安全技术(Network Security Technology)
视联网的结构性设计通过每次服务单独许可制、设备与用户数据完全隔离等方式从结构上彻底根除了困扰互联网的网络安全问题,一般不需要杀毒程序、防火墙,杜绝了黑客与病毒的攻击,为用户提供结构性的无忧安全网络。
服务创新技术(Service Innovation Technology)
统一视频平台将业务与传输融合在一起,不论是单个用户、私网用户还是一个网络的总合,都不过是一次自动连接。用户终端、机顶盒或PC直接连到统一视频平台,获得丰富多彩的各种形态的多媒体视频服务。统一视频平台采用“菜谱式”配表模式来替代传统的复杂应用编程,可以使用非常少的代码即可实现复杂的应用,实现“无限量”的新业务创新。
视联网的组网如下所述:
视联网是一种集中控制的网络结构,该网络可以是树型网、星型网、环状网等等类型,但在此基础上网络中需要有集中控制节点来控制整个网络。
如图1所示,视联网分为接入网和城域网两部分。
接入网部分的设备主要可以分为3类:节点服务器,接入交换机,终端(包括各种机顶盒、编码板、存储器等)。节点服务器与接入交换机相连,接入交换机可以与多个终端相连,并可以连接以太网。
其中,节点服务器是接入网中起集中控制功能的节点,可控制接入交换机和终端。节点服务器可直接与接入交换机相连,也可以直接与终端相连。
类似的,城域网部分的设备也可以分为3类:城域服务器,节点交换机,节点服务器。城域服务器与节点交换机相连,节点交换机可以与多个节点服务器相连。
其中,节点服务器即为接入网部分的节点服务器,即节点服务器既属于接入网部分,又属于城域网部分。
城域服务器是城域网中起集中控制功能的节点,可控制节点交换机和节点服务器。城域服务器可直接连接节点交换机,也可直接连接节点服务器。
由此可见,整个视联网络是一种分层集中控制的网络结构,而节点服务器和城域服务器下控制的网络可以是树型、星型、环状等各种结构。
形象地称,接入网部分可以组成统一视频平台(虚线圈中部分),多个统一视频平台可以组成视联网;每个统一视频平台可以通过城域以及广域视联网互联互通。
视联网设备分类
1.1本发明实施例的视联网中的设备主要可以分为3类:服务器,交换机(包括以太网网关),终端(包括各种机顶盒,编码板,存储器等)。视联网整体上可以分为城域网(或者国家网、全球网等)和接入网。
1.2其中接入网部分的设备主要可以分为3类:节点服务器,接入交换机(包括以太网网关),终端(包括各种机顶盒,编码板,存储器等)。
各接入网设备的具体硬件结构为:
节点服务器:
如图2所示,主要包括网络接口模块201、交换引擎模块202、CPU模块203、磁盘阵列模块204;
其中,网络接口模块201,CPU模块203、磁盘阵列模块204进来的包均进入交换引擎模块202;交换引擎模块202对进来的包进行查地址表205的操作,从而获得包的导向信息;并根据包的导向信息把该包存入对应的包缓存器206的队列;如果包缓存器206的队列接近满,则丢弃;交换引擎模202轮询所有包缓存器队列,如果满足以下条件进行转发:1)该端口发送缓存未满;2)该队列包计数器大于零。磁盘阵列模块204主要实现对硬盘的控制,包括对硬盘的初始化、读写等操作;CPU模块203主要负责与接入交换机、终端(图中未示出)之间的协议处理,对地址表205(包括下行协议包地址表、上行协议包地址表、数据包地址表)的配置,以及,对磁盘阵列模块204的配置。
接入交换机:
如图3所示,主要包括网络接口模块(下行网络接口模块301、上行网络接口模块302)、交换引擎模块303和CPU模块304;
其中,下行网络接口模块301进来的包(上行数据)进入包检测模块305;包检测模块305检测包的目地地址(DA)、源地址(SA)、数据包类型及包长度是否符合要求,如果符合,则分配相应的流标识符(stream-id),并进入交换引擎模块303,否则丢弃;上行网络接口模块302进来的包(下行数据)进入交换引擎模块303;CPU模块204进来的数据包进入交换引擎模块303;交换引擎模块303对进来的包进行查地址表306的操作,从而获得包的导向信息;如果进入交换引擎模块303的包是下行网络接口往上行网络接口去的,则结合流标识符(stream-id)把该包存入对应的包缓存器307的队列;如果该包缓存器307的队列接近满,则丢弃;如果进入交换引擎模块303的包不是下行网络接口往上行网络接口去的,则根据包的导向信息,把该数据包存入对应的包缓存器307的队列;如果该包缓存器307的队列接近满,则丢弃。
交换引擎模块303轮询所有包缓存器队列,在本发明实施例中分两种情形:
如果该队列是下行网络接口往上行网络接口去的,则满足以下条件进行转发:1)该端口发送缓存未满;2)该队列包计数器大于零;3)获得码率控制模块产生的令牌;
如果该队列不是下行网络接口往上行网络接口去的,则满足以下条件进行转发:1)该端口发送缓存未满;2)该队列包计数器大于零。
码率控制模块208是由CPU模块204来配置的,在可编程的间隔内对所有下行网络接口往上行网络接口去的包缓存器队列产生令牌,用以控制上行转发的码率。
CPU模块304主要负责与节点服务器之间的协议处理,对地址表306的配置,以及,对码率控制模块308的配置。
以太网协转网关
如图4所示,主要包括网络接口模块(下行网络接口模块401、上行网络接口模块402)、交换引擎模块403、CPU模块404、包检测模块405、码率控制模块408、地址表406、包缓存器407和MAC添加模块409、MAC删除模块410。
其中,下行网络接口模块401进来的数据包进入包检测模块405;包检测模块405检测数据包的以太网MAC DA、以太网MAC SA、以太网length or frame type、视联网目地地址DA、视联网源地址SA、视联网数据包类型及包长度是否符合要求,如果符合则分配相应的流标识符(stream-id);然后,由MAC删除模块410减去MAC DA、MAC SA、length or frame type(2byte),并进入相应的接收缓存,否则丢弃;
下行网络接口模块401检测该端口的发送缓存,如果有包则根据包的视联网目地地址DA获知对应的终端的以太网MAC DA,添加终端的以太网MAC DA、以太网协转网关的MACSA、以太网length or frame type,并发送。
以太网协转网关中其他模块的功能与接入交换机类似。
终端:
主要包括网络接口模块、业务处理模块和CPU模块;例如,机顶盒主要包括网络接口模块、视音频编解码引擎模块、CPU模块;编码板主要包括网络接口模块、视音频编码引擎模块、CPU模块;存储器主要包括网络接口模块、CPU模块和磁盘阵列模块。
1.3城域网部分的设备主要可以分为2类:节点服务器,节点交换机,城域服务器。其中,节点交换机主要包括网络接口模块、交换引擎模块和CPU模块;城域服务器主要包括网络接口模块、交换引擎模块和CPU模块构成。
2、视联网数据包定义
2.1接入网数据包定义
接入网的数据包主要包括以下几部分:目的地址(DA)、源地址(SA)、保留字节、payload(PDU)、CRC。
如下表所示,接入网的数据包主要包括以下几部分:
DA SA Reserved Payload CRC
其中:
目的地址(DA)由8个字节(byte)组成,第一个字节表示数据包的类型(例如各种协议包、组播数据包、单播数据包等),最多有256种可能,第二字节到第六字节为城域网地址,第七、第八字节为接入网地址;
源地址(SA)也是由8个字节(byte)组成,定义与目的地址(DA)相同;
保留字节由2个字节组成;
payload部分根据不同的数据报的类型有不同的长度,如果是各种协议包的话是64个字节,如果是单组播数据包话是32+1024=1056个字节,当然并不仅仅限于以上2种;
CRC有4个字节组成,其计算方法遵循标准的以太网CRC算法。
2.2城域网数据包定义
城域网的拓扑是图型,两个设备之间可能有2种、甚至2种以上的连接,即节点交换机和节点服务器、节点交换机和节点交换机、节点交换机和节点服务器之间都可能超过2种连接。但是,城域网设备的城域网地址却是唯一的,为了精确描述城域网设备之间的连接关系,在本发明实施例中引入参数:标签,来唯一描述一个城域网设备。
本说明书中标签的定义和MPLS(Multi-Protocol Label Switch,多协议标签交换)的标签的定义类似,假设设备A和设备B之间有两个连接,那么数据包从设备A到设备B就有2个标签,数据包从设备B到设备A也有2个标签。标签分入标签、出标签,假设数据包进入设备A的标签(入标签)是0x0000,这个数据包离开设备A时的标签(出标签)可能就变成了0x0001。城域网的入网流程是集中控制下的入网过程,也就意味着城域网的地址分配、标签分配都是由城域服务器主导的,节点交换机、节点服务器都是被动的执行而已,这一点与MPLS的标签分配是不同的,MPLS的标签分配是交换机、服务器互相协商的结果。
如下表所示,城域网的数据包主要包括以下几部分:
DA SA Reserved 标签 Payload CRC
即目的地址(DA)、源地址(SA)、保留字节(Reserved)、标签、payload(PDU)、CRC。其中,标签的格式可以参考如下定义:标签是32bit,其中高16bit保留,只用低16bit,它的位置是在数据包的保留字节和payload之间。
基于视联网的上述特性,本发明实施例的核心构思是提出一种混音方法以提高视联网系统的可靠性以及稳定性。
参照图5,示出了本发明的一种混音方法实施例的步骤流程图,该方法可以应用于视联网中,具体可以包括如下步骤:
步骤501,通过流媒体进程将从视联网服务器端获取到的一路或一路以上音频数据保存至共享存储中。
具体的,在本发明的混音方法可应用于视联网的会议系统等应用场景下。在本发明的实施例中,以会议系统为例进行详细阐述。在会议进行过程中,若一个或一个以上用户发言,则对应的终端将会产生相应的音频数据,并发送给视联网服务器。
视联网服务器获取到一个或一个以上终端发送的音频数据。随后,视联网服务器将获取到的一路或一路以上音频数据封装,并发送给流媒体服务器。流媒体接收到封装后的数据包后进行解封装,获取到一路或一路以上音频数据。具体的封装、解封装以及传输过程与现有技术实施例中相同,本发明不赘述。
流媒体服务器通过流媒体进程将从视联网服务器端获取到的一路或一路以上音频数据保存至共享存储中。在本发明的实施例中,共享存储用于流媒体进程与混音进程之间的数据交换,在本发明的一个实施例中,共享存储可以为内存。在本发明的另一个实施例中,管道或者是socket等用于进程间通信的方式,本发明对此不作限定。
在本发明的实施例中,流媒体进程将一路或一路以上音频数据写入到共享存储中的指定路径下(即本发明实施例中的第一保存路径)。接着,流媒体进程向混音进程发送混音请求,以通知混音进程进行混音操作。其中,混音请求中携带有第一保存路径,以告知混音进程读取路径。还携带有混音规则。混音规则可根据用户实际需求进行设定,本发明对此不作限定。举例说明:若在会议系统中,终端1只监听主席和发言者的音频,则终端1所对应的混音规则为,只将接收到的一路或一路以上音频中的主席和发言者对应的音频进行混音,而不对其他音频进行处理。若终端2监听包括主席在内的所有终端的音频,则终端2所对应的混音规则为,将接收到的一路或一路以上音频均进行混音,构成一路音频。
步骤502,通过混音进程从共享存储中读取一路或一路以上音频数据,并对一路或一路以上音频数据进行混音操作。
具体的,在本发明的实施例中,流媒体服务器中的混音进程接收来自流媒体进程的混音请求,并根据第一保存路径读取共享存储中的一路或一路以上音频数据。
接着,混音进程根据混音规则对一路或一路以上音频进行混音操作。具体的,由上文可知,不同终端可能对应有不同的混音规则,因此,混音进程通过不同的线程,并发处理不同终端的混音需求。举例说明:混音进程的线程1,可用于根据终端1对应的混音规则,将读取到的一路或一路以上音频进行混音处理。同时,线程2可用于根据终端2对应的混音规则,将读取到的一路或一路以上音频进行混音处理。从而实现多线程并发处理,以提高系统混音效率,同时满足各终端的需求。
此外,在本发明的一个优选的实施例中,如果终端1-5的混音规则相同,例如:均为接收全部终端的音频数据,则混音进程可只进行一次混音处理,从而进一步降低系统负担,提高资源利用率。
步骤503,通过混音进程将混音后的音频数据保存至共享存储中。
具体的,在本发明的实施例中,流媒体服务器中的混音进程将混音后的音频数据保存至共享存储中,并将流媒体进程发送混音响应,以通知流媒体进程混音完毕。其中,混音响应中携带有混音后的音频数据在共享存储中的保存路径(即本发明实施例中的第二保存路径)。
在本发明的一个实施例中,不同终端在共享存储中可对应有不同的保存路径,混音进程将针对不同终端的混音规则处理后的音频数据,存储至对应的保存路径下。保存方法可根据用户实际需求进行设定,本发明对此不做限定。
步骤504,通过流媒体进程从共享存储中获取混音后的音频数据,并将混音后的音频数据发送给终端。
具体的,在本发明的实施例中,流媒体服务器中的流媒体进程在接收到来自混音进程的混音响应后,根据其携带的第二保存路径从共享存储中获取混音后的音频数据,并将混音后的音频数据发送给对应的终端。
在本发明的一个实施例中,如前所述,若混音模块通过多线程,按照不同的混音规则对上述一路或一路以上音频数据进行混音,从而得到多个混音后的音频数据,则共享存储中当前存储有多个混音后的音频数据。流媒体进程同样可通过不同的线程,将混音后的音频数据分别发送给对应的终端。
综上所述,本发明实施例中的技术方案通过流媒体进程将从视联网服务器端获取到的一路或一路以上音频数据保存至共享存储中;通过混音进程从共享存储中读取一路或一路以上音频数据,并对一路或一路以上音频数据进行混音操作;通过混音进程将混音后的音频数据保存至共享存储中;通过流媒体进程从共享存储中获取混音后的音频数据,并将混音后的音频数据发送给终端。从而通过进程间的数据交换,实现对一路或一路以上音频数据的混音过程,其中,仅通过混音进程的多线程即可完成针对不同终端的混音操作,有效地降低了系统负担,减少内存占用,提高了系统稳定性以及可靠性,进而提升了用户体验。
需要说明的是,对于方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明实施例并不受所描述的动作顺序的限制,因为依据本发明实施例,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作并不一定是本发明实施例所必须的。
参照图6,示出了本发明的一种混音装置实施例的结构框图,该装置可以应用于视联网中,具体可以包括如下模块:
流媒体模块601,用于通过流媒体进程将从视联网服务器端获取到的一路或一路以上音频数据保存至共享存储中。
混音模块602,用于通过混音进程从共享存储中读取一路或一路以上音频数据,并对一路或一路以上音频数据进行混音操作。
混音模块602进一步用于通过混音进程将混音后的音频数据保存至共享存储中。
流媒体模块601进一步用于通过流媒体进程从共享存储中获取混音后的音频数据,并将混音后的音频数据发送给终端。
在本发明的一个优选的实施例中,流媒体模块601可以进一步用于通过流媒体进程向混音进程发送混音请求,其中,混音请求中携带有一路或一路以上音频数据在共享存储中的第一保存路径以及混音规则。
在本发明的一个优选的实施例中,混音模块602可以进一步用于:
通过混音进程根据第一保存路径,从共享存储中读取一路或一路以上音频数据;以及,
根据混音规则,对一路或一路以上音频数据进行混音操作。
在本发明的一个优选的实施例中,混音模块602可以进一步用于通过混音进程向流媒体进程发送混音响应,其中,混音响应中携带有混音后的音频数据在共享存储中的第二保存路径。
在本发明的一个优选的实施例中,流媒体模块进一步用于通过流媒体进程根据第二保存路径,从共享存储中获取混音后的音频数据
对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
本领域内的技术人员应明白,本发明实施例的实施例可提供为方法、装置、或计算机程序产品。因此,本发明实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明实施例是参照根据本发明实施例的方法、终端设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理终端设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理终端设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理终端设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理终端设备上,使得在计算机或其他可编程终端设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程终端设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明实施例的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明实施例范围的所有变更和修改。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。
以上对本发明所提供的一种混音方法和一种混音装置进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (6)

1.一种混音方法,其特征在于,所述方法应用于视联网中的流媒体服务器,包括:
通过流媒体进程将从视联网服务器端获取到的一路或一路以上音频数据保存至共享存储中;所述通过所述流媒体进程将从视联网服务器端获取到的一路或一路以上音频数据保存至共享存储中的步骤之后,还包括:通过所述流媒体进程向混音进程发送混音请求,其中,所述混音请求中携带有所述一路或一路以上音频数据在所述共享存储中的第一保存路径以及混音规则;其中,不同终端对应有不同的混音规则;通过混音进程从所述共享存储中读取所述一路或一路以上音频数据,并对所述一路或一路以上音频数据进行混音操作;所述通过所述混音进程从所述共享存储中读取所述一路或一路以上音频数据,并对所述一路或一路以上音频数据进行混音操作的步骤,具体包括:通过所述混音进程根据所述第一保存路径,从所述共享存储中读取所述一路或一路以上音频数据;以及,根据所述混音规则,对所述一路或一路以上音频数据进行混音操作;
通过所述混音进程将混音后的音频数据保存至所述共享存储中;
通过所述流媒体进程从所述共享存储中获取所述混音后的音频数据,并将所述混音后的音频数据发送给终端;
所述共享存储为内存。
2.根据权利要求1所述的方法,其特征在于,所述通过所述混音进程将混音后的音频数据保存至所述共享存储中的步骤之后,还包括:
通过所述混音进程向所述流媒体进程发送混音响应,其中,所述混音响应中携带有所述混音后的音频数据在所述共享存储中的第二保存路径。
3.根据权利要求2所述的方法,其特征在于,所述通过所述流媒体进程从所述共享存储中获取所述混音后的音频数据的步骤,具体包括:
通过所述流媒体进程根据所述第二保存路径,从所述共享存储中获取所述混音后的音频数据。
4.一种混音装置,其特征在于,所述装置应用于视联网中的流媒体服务器,包括:
流媒体模块,用于通过流媒体进程将从视联网服务器端获取到的一路或一路以上音频数据保存至共享存储中;所述流媒体模块进一步用于通过所述流媒体进程向混音进程发送混音请求,其中,所述混音请求中携带有所述一路或一路以上音频数据在所述共享存储中的第一保存路径以及混音规则;其中,不同终端对应有不同的混音规则;
混音模块,用于通过混音进程从所述共享存储中读取所述一路或一路以上音频数据,并对所述一路或一路以上音频数据进行混音操作;所述混音模块进一步用于:通过所述混音进程根据所述第一保存路径,从所述共享存储中读取所述一路或一路以上音频数据;以及,根据所述混音规则,对所述一路或一路以上音频数据进行混音操作;
所述混音模块进一步用于通过所述混音进程将混音后的音频数据保存至所述共享存储中;
所述流媒体模块进一步用于通过所述流媒体进程从所述共享存储中获取所述混音后的音频数据,并将所述混音后的音频数据发送给终端;
所述共享存储为内存。
5.根据权利要求4所述的装置,其特征在于,所述混音模块进一步用于通过所述混音进程向所述流媒体进程发送混音响应,其中,所述混音响应中携带有所述混音后的音频数据在所述共享存储中的第二保存路径。
6.根据权利要求5所述的装置,其特征在于,所述流媒体模块进一步用于通过所述流媒体进程根据所述第二保存路径,从所述共享存储中获取所述混音后的音频数据。
CN201611066882.7A 2016-11-25 2016-11-25 一种混音方法和装置 Active CN108111474B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201611066882.7A CN108111474B (zh) 2016-11-25 2016-11-25 一种混音方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201611066882.7A CN108111474B (zh) 2016-11-25 2016-11-25 一种混音方法和装置

Publications (2)

Publication Number Publication Date
CN108111474A CN108111474A (zh) 2018-06-01
CN108111474B true CN108111474B (zh) 2019-05-17

Family

ID=62204674

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201611066882.7A Active CN108111474B (zh) 2016-11-25 2016-11-25 一种混音方法和装置

Country Status (1)

Country Link
CN (1) CN108111474B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110730322A (zh) * 2018-07-16 2020-01-24 视联动力信息技术股份有限公司 一种基于视联网的音频流处理方法及系统
CN110767203B (zh) * 2018-07-27 2022-10-28 北京达佳互联信息技术有限公司 音频处理方法、装置及移动终端及存储介质
CN109474604A (zh) * 2018-11-27 2019-03-15 视联动力信息技术股份有限公司 一种视联网音频流处理方法及系统
CN109525463B (zh) * 2018-12-18 2020-08-28 视联动力信息技术股份有限公司 一种检测64位视联网协议通信功能的方法和装置
CN110225287A (zh) * 2019-04-29 2019-09-10 视联动力信息技术股份有限公司 音频处理方法及装置
CN112019488B (zh) * 2019-05-31 2023-12-12 广州市百果园信息技术有限公司 一种语音处理的方法、装置、设备和存储介质

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102202038B (zh) * 2010-03-24 2015-05-06 华为技术有限公司 一种实现语音能量显示的方法、系统、会议服务器和终端
CN102467909A (zh) * 2010-11-18 2012-05-23 盛乐信息技术(上海)有限公司 网络混音方法
CN102325173B (zh) * 2011-08-30 2013-12-11 重庆抛物线信息技术有限责任公司 一种混音视频共享方法及系统
CN104064191B (zh) * 2014-06-10 2017-12-15 北京音之邦文化科技有限公司 混音方法及装置
US9628206B2 (en) * 2015-01-03 2017-04-18 ClearOne Inc. Endpoint parameter management architecture for audio mixers
CN106161814B (zh) * 2015-03-24 2019-02-05 北京视联动力国际信息技术有限公司 一种多方会议的混音方法和装置
CN205596182U (zh) * 2016-05-12 2016-09-21 中国人民解放军装甲兵工程学院 一种参数可控的分组混音通话装置

Also Published As

Publication number Publication date
CN108111474A (zh) 2018-06-01

Similar Documents

Publication Publication Date Title
CN108881798B (zh) 一种利用桥接服务器进行跨视联网会议方法和系统
CN108121588B (zh) 一种访问外部资源的方法及其视联网接入服务器
CN108173804B (zh) 一种通过视联网访问互联网的方法及视联猫客户端
CN108111474B (zh) 一种混音方法和装置
CN108173803B (zh) 一种通过视联网访问互联网的方法及视联猫服务端
CN109120962A (zh) 软件终端连接视联网的方法和装置
CN108063745B (zh) 一种基于安卓设备的视频通话方法及其系统
CN108632559B (zh) 一种视频数据处理方法及装置
CN107888401B (zh) 一种实时监控视联网终端cpu利用率的方法和系统
CN108881799A (zh) 一种进行视联网视频会议的系统和方法
CN109120879A (zh) 一种视频会议的处理方法和系统
CN109474715A (zh) 一种基于视联网的资源配置方法和装置
CN110460804A (zh) 会议数据发送方法、系统、设备和计算机可读存储介质
CN110475090A (zh) 一种会议控制的方法和系统
CN109963109A (zh) 一种视频会议的处理方法和系统
CN110049346A (zh) 一种视频直播的方法和系统
CN110493513A (zh) 一种摄像头控制方法及一种视联网系统
CN110505430A (zh) 一种会议控制的方法和装置
CN110166833A (zh) 一种视频流转码方法及装置
CN109729184A (zh) 一种视联网业务处理的方法和装置
CN110022500A (zh) 一种丢包处理方法和装置
CN110519331A (zh) 一种视联网资源处理方法及装置
CN108574819B (zh) 一种终端设备和一种视频会议的方法
CN109474604A (zh) 一种视联网音频流处理方法及系统
CN110072154A (zh) 一种基于视联网的建群方法和中转服务器

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information
CB02 Change of applicant information

Address after: 100000 Dongcheng District, Beijing, Qinglong Hutong 1, 1103 house of Ge Hua building.

Applicant after: Video Link Power Information Technology Co., Ltd.

Address before: 100000 Beijing Dongcheng District Qinglong Hutong 1 Song Hua Building A1103-1113

Applicant before: BEIJING VISIONVERA INTERNATIONAL INFORMATION TECHNOLOGY CO., LTD.

GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20201230

Address after: 570105 room 1201, Central International Plaza, 77 Binhai street, Longhua District, Haikou City, Hainan Province

Patentee after: Hainan Qiantang Shilian Information Technology Co.,Ltd.

Address before: 100000 Dongcheng District, Beijing, Qinglong Hutong 1, 1103 house of Ge Hua building.

Patentee before: VISIONVERA INFORMATION TECHNOLOGY Co.,Ltd.