CN102436814A - 一种低码率立体声音频传输方案 - Google Patents

一种低码率立体声音频传输方案 Download PDF

Info

Publication number
CN102436814A
CN102436814A CN2011102662296A CN201110266229A CN102436814A CN 102436814 A CN102436814 A CN 102436814A CN 2011102662296 A CN2011102662296 A CN 2011102662296A CN 201110266229 A CN201110266229 A CN 201110266229A CN 102436814 A CN102436814 A CN 102436814A
Authority
CN
China
Prior art keywords
rtp
sound source
audio
sound
stereo sound
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2011102662296A
Other languages
English (en)
Inventor
张志飞
卢晶
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing University
Original Assignee
Nanjing University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing University filed Critical Nanjing University
Priority to CN2011102662296A priority Critical patent/CN102436814A/zh
Publication of CN102436814A publication Critical patent/CN102436814A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Stereophonic System (AREA)

Abstract

本发明公开了一种低码率立体声音频传输方案。常用的立体声音频传输方案通常在发送端通过麦克风采集双通道的立体声音频信号,经过立体声编码器编码后通过网络打包发送到接收端,接收端通过立体声解码器解码后通过耳机或扬声器回放。本发明中,在发送端采集单通道的音频信号并通过编码器编码,与此同时通过麦克风阵列获得声源的位置信息。采用RTP实时传送协议打包传输编码后的音频数据,并利用RTP的扩展包头携带声源的位置信息。在接收端接收到RTP包后,按照扩展后的RTP协议的规则解包提取出声源的位置信息和编码的音频数据。音频数据经过解码器解码后通过声源的位置信息分别重建出左右声道的音频信号,通过耳机或者扬声器回放。通过本发明的方法,可以有效的降低立体声音频传输的码率。

Description

一种低码率立体声音频传输方案
一、技术领域
本发明涉及一种低码率立体声音频传输方案。该方案中,在发送端采集单声道的音频信号和声源位置信息,经过扩展的RTP协议一起发送到接收端,在接收端将RTP包解包后根据声源位置信息由单声道音频信号重建出左右声道的音频信号,经过音频回放设备实现立体声回放。通过上述方式可以有效降低网络传输中立体声音频的码率。
二、背景技术
近年来,随着通信技术的发展,人们对通信系统的音质要求越来越高,立体声音频数据传输已逐渐成为主流方法。相比于单通道的音频数据,立体声需要同时传递两路音频数据,数据量明显增加,尽管人们采取了一些措施去降低立体声音频实际传输的码率,但相对于单通道的传输码率仍然明显偏高。
解决这个问题的方法已有大量文献进行了讨论,一般人们的做法是改进立体声编码算法,提高编码器的压缩率,从而降低音频流的码率,例如采用M/S或强度立体声编码方式,但是立体声音频的码率依旧比较高。本发明提出了一种基于扩展的RTP实时传送协议利用单通道的音频信号和声源的位置信息来实现立体声音频低码率传输的方案,整体框图见附图1。
三、发明内容
本发明涉及一种低码率立体声音频传输方案,基于扩展的RTP实时传送协议在网络上传输单通道的音频信号和声源的位置信息从而实现立体声音频的低码率传输。
本发明的目的通过以下技术方案来实现:
A)在发送端,通过麦克风阵列得到声源的位置信息,与此同时通过麦克风采集单通道的音频信号并通过编码器编码,编码器可采用目前任何一种单通道音频编码方案;
B)利用RTP实时传送协议的扩展包头携带声源的位置信息,与单通道的音频编码数据一起打包后发送到接收端;
C)在接收端,接收到RTP包之后按照扩展的RTP协议的规则提取出声源的位置信息和音频数据;
D)音频数据解码后基于声源的位置信息重建出左右声道的音频信号,从耳机或者扬声器回放出来。
四、附图说明
图1是低码率立体声音频传输方案整体框图。
图2是低码率立体声音频传输方案的一个实施流程示意图。
图3是RTP实时传输协议的固定包头。
图4是RTP实时传输协议的扩展包头。
五、具体实施
下面通过实例参照附图对本发明进行说明
附图2为本发明提供的低码率立体声音频传输方案的一个实施流程示意图,该实例实施包括以下步骤:
S1:在发送端,采集单声道的音频信号,同时用麦克风阵列获取声源的位置信息;
S2:单声道音频信号编码后与声源位置信息一起经过扩展的RTP协议打包经过过网络发送;
S3:在接收端接收到RTP包之后,根据扩展的RTP协议解包提取音频数据和声源的位置信息;
S4:声源的位置信息和解码后的音频数据根据立体声重建算法重建出左右声道的音频信号;
S5:左右声道的音频信通过音频回放设备实现立体声的回放。
附图3为本发明中用到的RTP协议的固定包头结构示意图。
若固定包头中的X值被设置成0,则固定包头之后就是要传送的音频数据;若X值被设置成1时,则表示在RTP打包的时候需要在固定包头之后加入一个扩展包头,之后才是所要传送的音频数据。本发明中,需将X值设置为1,利用RTP的扩展包头携带声源的位置信息。
附图4为本发明中用的RTP协议的扩展包头结构示意图。
本发明中,使用扩展包头中头扩展域中的32比特字来携带声源的位置信息。其中声源的位置信息在本发明中用水平角和仰角来表示。
本发明提出了一种低码率立体声音频传输方案,在发送端采集单声道的音频信号和声源位置信息,经过扩展的RTP协议一起发送到接收端,在接收端基于声源位置信息从单声道音频信号分别重建出左右声道的音频信号,再经过耳机或者扬声器回放。通过上述的方式可以有效降低网络传输中立体声音频的码率而不影响正常的数据流的传输。

Claims (2)

1.一种低码率立体声音频传输方案,其特征是通过RTP实时传输协议来降低立体声在网络上传输时的码率,包括以下步骤:
A)在发送端采集单声道音频信号并通过编码器编码,同时通过麦克风阵列采集声源的位置信息;
B)将编码后的音频数据流和声源的位置信息通过扩展的RTP实时传输协议打包后通过网络一起发送到接收端;
C)在接收端接收到RTP包后,分离出声源的位置信息和音频数据,将音频数据解码后通过声源的位置信息分别重建出左右声道的音频信号用于激励耳机或者扬声器实现立体声回放。
2.如权利要求1所述低码率立体声音频传输方案,其特征是步骤B)和C)中:音频数据通过网络传输时,在发送端使用RTP协议的扩展包头携带声源的位置信息,按照固定包头、扩展包头、音频数据的顺序组包发送;在接收端接收到RTP包后按上述顺序解包提取声源位置信息和音频数据。
CN2011102662296A 2011-09-09 2011-09-09 一种低码率立体声音频传输方案 Pending CN102436814A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2011102662296A CN102436814A (zh) 2011-09-09 2011-09-09 一种低码率立体声音频传输方案

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2011102662296A CN102436814A (zh) 2011-09-09 2011-09-09 一种低码率立体声音频传输方案

Publications (1)

Publication Number Publication Date
CN102436814A true CN102436814A (zh) 2012-05-02

Family

ID=45984836

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2011102662296A Pending CN102436814A (zh) 2011-09-09 2011-09-09 一种低码率立体声音频传输方案

Country Status (1)

Country Link
CN (1) CN102436814A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104143325A (zh) * 2014-07-18 2014-11-12 腾讯科技(深圳)有限公司 伴奏/原唱音频数据切换方法和系统
CN106162206A (zh) * 2016-08-03 2016-11-23 北京疯景科技有限公司 全景录制、播放方法及装置
CN106154231A (zh) * 2016-08-03 2016-11-23 厦门傅里叶电子有限公司 虚拟现实中声场定位的方法
CN111798866A (zh) * 2020-07-13 2020-10-20 商汤集团有限公司 音频处理网络的训练及立体声重构方法和装置
CN113674751A (zh) * 2021-07-09 2021-11-19 北京字跳网络技术有限公司 音频处理方法、装置、电子设备和存储介质

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104143325A (zh) * 2014-07-18 2014-11-12 腾讯科技(深圳)有限公司 伴奏/原唱音频数据切换方法和系统
CN106162206A (zh) * 2016-08-03 2016-11-23 北京疯景科技有限公司 全景录制、播放方法及装置
CN106154231A (zh) * 2016-08-03 2016-11-23 厦门傅里叶电子有限公司 虚拟现实中声场定位的方法
CN111798866A (zh) * 2020-07-13 2020-10-20 商汤集团有限公司 音频处理网络的训练及立体声重构方法和装置
CN113674751A (zh) * 2021-07-09 2021-11-19 北京字跳网络技术有限公司 音频处理方法、装置、电子设备和存储介质

Similar Documents

Publication Publication Date Title
JP6199334B2 (ja) 透かし入り信号を符号化し検出するための機器
CN101803263B (zh) 用于分组交换传输的可伸缩检错和交叉会话定时同步
CN104054317B (zh) 无线声音传输系统和方法
CN102810314B (zh) 音频编码方法及装置、音频解码方法及装置、编解码系统
CN102436814A (zh) 一种低码率立体声音频传输方案
CA2756328C (en) System and method for multi-stream video compression using multiple encoding formats
US12067993B2 (en) Inter-channel phase difference parameter encoding method and apparatus
TW200721702A (en) Audio data packet format, method for decoding audio data packet format, method for correcting codec setup error, and mobile communication terminal adapted to correct codec setup error
CN102216983B (zh) 用于编码与信号源相关联的至少一个参数的设备和方法
EP2276192A2 (en) Method and apparatus for transmitting/receiving multi - channel audio signals using super frame
CN114582356A (zh) 一种音频编解码方法和装置
US8515240B2 (en) Transporting vibro-kinetic signals in a digital cinema environment
JPS6198035A (ja) 暗号デジタル信号送受信装置および副帯域信
US11159885B2 (en) Optimized audio forwarding
CN117356114B (zh) 空间音频数据交换
CN114582357A (zh) 一种音频编解码方法和装置
WO2023051368A1 (zh) 编解码方法、装置、设备、存储介质及计算机程序产品
WO2023051367A1 (zh) 解码方法、装置、设备、存储介质及计算机程序产品
KR20070003574A (ko) 오디오 신호 인코딩 및 디코딩 방법 및 장치
JP2015119248A (ja) バイノーラル録音を用いた立体音響ip電話
CN115442339A (zh) 为语音呼叫使能立体声内容
CN117378220A (zh) 经由数据交换的空间音频单声道化
CN115240692A (zh) 接收音频数据的方法、装置以及音频播放设备
JP2004088342A (ja) 音声フレームストリーム伝送方法および装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20120502