CN112740708A - 一种音频数据传输方法及相关装置 - Google Patents
一种音频数据传输方法及相关装置 Download PDFInfo
- Publication number
- CN112740708A CN112740708A CN202080005026.9A CN202080005026A CN112740708A CN 112740708 A CN112740708 A CN 112740708A CN 202080005026 A CN202080005026 A CN 202080005026A CN 112740708 A CN112740708 A CN 112740708A
- Authority
- CN
- China
- Prior art keywords
- path
- code stream
- audio data
- formatted code
- stream data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 135
- 230000005540 biological transmission Effects 0.000 title claims abstract description 38
- 238000004891 communication Methods 0.000 claims abstract description 38
- 238000012545 processing Methods 0.000 claims description 80
- 238000006243 chemical reaction Methods 0.000 claims description 72
- 230000015654 memory Effects 0.000 claims description 45
- 238000004590 computer program Methods 0.000 claims description 34
- 230000006855 networking Effects 0.000 abstract description 2
- 238000013461 design Methods 0.000 description 56
- 230000008569 process Effects 0.000 description 33
- 238000010586 diagram Methods 0.000 description 27
- 230000006870 function Effects 0.000 description 26
- 230000006835 compression Effects 0.000 description 18
- 238000007906 compression Methods 0.000 description 18
- 230000000694 effects Effects 0.000 description 5
- 238000005070 sampling Methods 0.000 description 5
- 239000000284 extract Substances 0.000 description 4
- 238000013507 mapping Methods 0.000 description 3
- 238000010295 mobile communication Methods 0.000 description 3
- 230000003190 augmentative effect Effects 0.000 description 2
- 230000006837 decompression Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000013139 quantization Methods 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 235000019800 disodium phosphate Nutrition 0.000 description 1
- 230000005520 electrodynamics Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000008054 signal transmission Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/233—Processing of audio elementary streams
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/167—Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Mathematical Physics (AREA)
- Mobile Radio Communication Systems (AREA)
- Circuit For Audible Band Transducer (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
本申请公开了一种音频数据传输方法及相关装置,应用于座舱域通信,如智能驾驶、无人驾驶、车联网等领域,可以节省传输至少一路音频数据时所使用的无线资源,还可以降低接收装置的功耗和成本,该方法包括:发送装置获取对应至少一路音频数据的公共分量的第一格式化码流数据,获取对应至少一路音频数据的至少一路第二格式化码流数据;至少一路第二格式化码流数据是基于至少一路音频数据以及公共分量得到的;发送第一格式化码流数据以及至少一路第二格式化码流数据。接收装置接收对应至少一路音频数据的公共分量的第一格式化码流数据,接收对应至少一路音频数据的至少一路第二格式化码流数据;获取至少一路音频数据中的第一路音频数据。
Description
技术领域
本申请涉及通信技术领域,尤其涉及一种音频数据传输方法及相关装置。本申请还可以应用于座舱域通信,例如智能驾驶、无人驾驶或者车联网等领域。
背景技术
通常,为了获得质量较好的声音效果,大多数音频的发送装置都是多路的,如获取多个麦克风同时采集的多路音频数据,之后,将得到的多路音频数据经过统一处理后,发送给多个接收装置。
目前,由于发送装置与多个接收装置之间通过有线电缆传输音频数据,不利于发送装置与多个接收装置之间的移动,另外,线缆的部署不但增加额外的成本,且在某些场合部署线缆较困难。为了解决音频数据的有线传输带来的不便以及成本的问题,在现有的技术中,发送装置与多个接收装置之间一般采用无线方式(例如WiFi、蓝牙等)传输音频数据。具体的,发送装置将采集到的多路音频数据进行相应的处理转换成无线数据,然后将无线数据发送给多个接收装置,之后,多个接收装置中的每个接收装置再对接收到的无线数据进行相应的处理并分离出多路音频数据,再从多路音频数据中获取自己所需的一路音频数据。比如,发送装置通过将多路音频数据进行相应的去冗余处理后,形成统一的格式化码流数据。
然而,对于单个接收装置而言,若只需要一路音频数据,也必须将完整的格式化码流数据进行处理并分离出多路音频数据,再从多路音频数据中获取自己所需的一路音频数据,对于不需使用的音频数据只能丢弃,导致存在浪费传输多路音频数据时所使用的无线传输资源以及增大接收装置的功耗的问题。
发明内容
本申请实施例提供一种音频数据传输方法及相关装置,用于节省传输多路音频数据时所使用的无线传输资源以及降低接收装置的功耗。
第一方面。本申请实施例提供一种音频数据传输方法,所述方法包括:获取对应至少一路音频数据的公共分量的第一格式化码流数据;获取对应所述至少一路音频数据的至少一路第二格式化码流数据;发送所述第一格式化码流数据以及所述至少一路第二格式化码流数据;其中,所述至少一路第二格式化码流数据是基于所述至少一路音频数据以及所述公共分量得到的。
本申请第一方面所描述的方法可以由发送装置执行,也可以由发送装置中的部件(如具有信号处理能力的集成电路芯片,例如通用处理器等)执行。
采用上述设计,由于至少一路第二格式化码流数据为基于至少一路音频数据以及公共分量得到的,相较于现有的发送装置对至少一路音频数据进行处理得到统一的格式化码流数据而言,可以降低至少一路第二格式码流数据所占用的字节数,进一步的可以有效节省传输至少一路第二格式码流数据时所使用的无线资源。
在一种可能的设计中,所述发送所述第一格式化码流数据以及所述至少一路第二格式化码流数据,包括:通过至少一个无线通道发送所述第一格式化码流数据以及所述至少一路第二格式化码流数据。
采用上述设计,由于至少一路第二格式化码流数据以及第一格式化码流数据,是通过至少一个无线通道单独传输的,相较现有技术中,至少一个无线通道中每个无线通道传输由至少一路音频数据进行处理得到的统一格式化码流数据,可以有效节省传输至少一路第二格式码流数据时所使用的无线资源。
在一种可能的设计中,所述至少一路第二格式化码流数据包括N路第二格式化码流数据,所述至少一个无线通道的数量为N+1,所述N为正整数。
在一种可能的设计中,所述第一格式化码流数据是对所述公共分量进行压缩和/或编码得到的;和/或,所述至少一路第二格式化码流数据是对基于所述至少一路音频数据以及所述公共分量得到的至少一路子音频数据进行压缩和/或编码得到的。
采用上述设计,发送装置可以针对不同的接收装置对压缩和/或编码的不同需求,采用不同的压缩方式和/或编码方式对相应的音频数据进行压缩和/或编码,从而可以满足不同接收装置对压缩和/或编码的不同需求。
在一种可能的设计中,所述发送所述第一格式化码流数据以及所述至少一路第二格式化码流数据,包括:向多个接收装置发送所述第一格式化码流数据以及所述至少一路第二格式化码流数据。
采用上述设计,发送装置向多个接收装置发送至少一路音频数据对应的格式化码流数据时,无需向多个接收装置中的每个接收装置发送由至少一路音频数据进行处理得到的统一格式化码流数据,向接收装置发送第一格式化码流数据和至少一路第二格式化码流数据中的一路第二格式化码流数据即可,可以有效节省传输至少一路第二格式码流数据时所使用的无线资源。
在一种可能的设计中,所述公共分量是通过对所述至少一路音频数据进行变换域转换以及去冗余处理得到的。
采用上述设计,通过对所述至少一路音频数据进行变换域转换以及去冗余处理,提取至少一路音频数据对应的公共分量,可以降低至少一路音频数据所占用的字节数,从而可以有效节省发送装置传输至少一路音频数据时所使用的无线资源。
在一种可能的设计中,所述获取对应所述至少一路音频数据的至少一路第二格式化码流数据,包括:对基于所述至少一路音频数据以及所述公共分量得到的至少一路子音频数据分别执行编码以及格式化的码流转换,或者分别执行格式化的码流转换,得到所述至少一路第二格式化码流数据;其中,对所述至少一路子音频数据中的至少两路子音频数据执行的编码方式和/或格式化的码流转换方式不同。
采用上述设计,发送装置可以针对不同的接收装置对编码或者格式化的码流数据的不同需求,采用不同的编码方式或者格式化的码流转换方式对相应的音频数据进行编码或者格式化的码流转换,从而可以满足不同接收装置对编码或者格式化码流数据的不同需求。
在一种可能的设计中,所述至少一路音频数据的来源可以包括但不限于:来自至少一个收音装置(可以为麦克风,或者具有麦克风的其他装置),或者,来自至少一个存储介质。
在一种可能的设计中,所述至少一路音频数据的格式可以包括但不限于:CD格式、WAV格式、AIFF格式、MPEG格式、MPEG-4格式、FLAC格式、MP3格式、MIDI格式、WMA格式、RealAudio格式、AAC格式、AMR格式中的至少一个。
第二方面,本申请还提供了一种音频数据传输方法,包括:接收对应至少一路音频数据的公共分量的第一格式化码流数据;接收对应所述至少一路音频数据的至少一路第二格式化码流数据;获取所述至少一路音频数据中的第一路音频数据;其中,所述至少一路第二格式化码流数据是基于所述至少一路音频数据以及所述公共分量得到的。
本申请第二方面所描述的方法可以由发送装置执行,也可以由发送装置中的部件(如具有信号处理能力的集成电路芯片,例如通用处理器等)执行。
采用上述设计,由于至少一路第二格式化码流数据是基于至少一路音频数据以及公共分量得到的,相较于现有的对至少一路音频数据进行处理得到进行统一的格式化码流数据而言,可以降低至少一路第二格式码流数据所占用的字节数,可以节省接收装置接收至少一路第二格式化码流数据中的第一路第二格式化码流数据时所使用的无线资源,有利于降低接收装置的功耗,另外,对接收装置的性能要求不高,有利于降低接收装置的成本。
在一种可能的设计中,所述接收对应至少一路音频数据的公共分量的第一格式化码流数据以及所述至少一路第二格式化码流数据,包括:通过至少一个无线通道接收所述第一格式化码流数据以及所述至少一路第二格式化码流数据。
采用上述设计,接收装置可以接收通过至少一个无线通道单独传输的第一格式化码流数据和至少一路第二格式化码流数据中的一路第二格式化码流数据,相较现有技术,接收装置无需接收由至少一路音频数据进行处理得到的统一格式化码流数据,可以有效节省传输至少一路第二格式码流数据时所使用的无线资源,有利于降低接收装置的功耗。
在一种可能的设计中,所述至少一路第二格式化码流数据包括N路第二格式化码流数据,所述至少一个无线通道的数量为N+1,所述N为正整数。
在一种可能的设计中,所述第一格式化码流数据是对所述公共分量进行压缩和/或编码得到的;和/或,所述至少一路第二格式化码流数据是对基于所述至少一路音频数据以及所述公共分量得到的至少一路子音频数据进行压缩和/或编码得到的。
采用上述设计,可以支持接收装置根据所接收的第一格式化码流数据和一路第二格式化码流数据使用的压缩方式和/或编码方式,执行相应的解压缩和/或解码操作。
在一种可能的设计中,所述获取所述至少一路音频数据中的第一路音频数据,包括:对所述至少一路第二格式化码流数据中的第一路第二格式化码流数据以及所述第一格式化码流数据执行解码以及格式化的码流逆转换,或者执行格式化的码流逆转换,得到所述第一路音频数据。
采用上述设计,可以支持接收装置根据所接收的第一格式化码流数据和第一路第二格式化码流数据使用的编码方式以及格式化的码流转换方式,执行相应的解码以及格式化的码流逆转换操作,或者,根据所接收的第一格式化码流数据和第一路第二格式化码流数据所使用的格式化的码流转换方式,执行相应的格式化的码流逆转换操作。
在一种可能的设计中,所述至少一路音频数据的来源可以包括但不限于:来自至少一个收音装置(可以为麦克风,或者具有麦克风的其他装置),或者,来自至少一个存储介质。
在一种可能的设计中,所述至少一路音频数据的格式可以包括但不限于:CD格式、WAV格式、AIFF格式、MPEG格式、MPEG-4格式、FLAC格式、MP3格式、MIDI格式、WMA格式、RealAudio格式、AAC格式、AMR格式中的至少一个。
第三方面,本申请还提供一种发送装置,所述发送装置具有实现上述第一方面或者第一方面的任一种可能的设计中方法的功能,所述功能可以通过硬件实现,也可以通过硬件执行相应的软件实现。所述硬件或软件包括一个或多个与上述功能相对应的模块,比如包括处理单元和收发单元。
在一个可能的设计中,所述发送装置也可以是芯片或者集成电路。
在一个可能的设计中,所述发送装置可以包括存储器和至少一个处理器,存储器用于存储所述至少一个处理器执行的程序,当所述程序被所述至少一个处理器执行时,所述发送装置可以执行上述第一方面或者第一方面的任一种可能的设计中所述的方法。
第四方面,本申请还提供一种发送装置,包括:至少一个处理器和存储器;所述存储器存储一个或多个计算机程序;当所述存储器存储的一个或多个计算机程序被所述至少一个处理器执行时,使得所述发送装置执行上述第一方面或上述第一方面的任意一种可能的设计的方法。
第五方面,本申请提供了一种发送装置,包括:至少一个处理器;所述至少一个处理器用于与存储器耦合,并在读取所述存储器中的计算机程序指令之后,根据所述计算机程序指令执行如上述第一方面或上述第一方面的任意一种可能的设计的方法。
第六方面,本申请还提供一种计算机可读存储介质,所述计算机可读存储介质用于存储计算机程序,当计算机程序在计算机上运行时,使得所述计算机执行上述第一方面或上述第一方面的任意一种可能的设计的方法。
第七方面,本申请还提供一种程序产品,当所述程序产品在计算机上运行时,使得所述计算机执行上述第一方面或上述第一方面的任意一种可能的设计的方法。
第八方面,本申请还提供一种芯片,包括:至少一个处理器和接口,所述接口可以为代码/数据读写接口,所述接口用于将计算机执行指令(计算机执行指令存储在存储器中,可能直接从存储器读取,或可能经过其他器件)提供给所述至少一个处理器;所述至少一个处理器用于执行所述计算机执行指令,以实现上述第一方面或上述第一方面的任意一种可能的设计的方法。
上述第三方面至第八方面及其可能的设计中的有益效果可以参考上述对第一方面及其任意一种可能的设计中所述方法的有益效果的描述。
第九方面,本申请还提供一种接收装置,所述接收装置具有实现上述第二方面或者第二方面的任一种可能的设计中方法的功能,所述功能可以通过硬件实现,也可以通过硬件执行相应的软件实现。所述硬件或软件包括一个或多个与上述功能相对应的模块,比如包括收发单元和处理单元。
在一个可能的设计中,所述接收装置也可以是芯片或者集成电路。
在一个可能的设计中,所述接收装置可以包括存储器和至少一个处理器,存储器用于存储所述至少一个处理器执行的程序,当所述程序被所述至少一个处理器执行时,所述接收装置可以执行上述第二方面或者第二方面的任一种可能的设计中所述的方法。
第十方面,本申请还提供一种接收装置,包括:至少一个处理器和存储器;所述存储器存储一个或多个计算机程序;当所述存储器存储的一个或多个计算机程序被所述至少一个处理器执行时,使得所述接收装置执行上述第二方面或上述第二方面的任意一种可能的设计的方法。
第十一方面,本申请提供了一种接收装置,包括:至少一个处理器;所述至少一个处理器用于与存储器耦合,并在读取所述存储器中的计算机程序指令之后,根据所述计算机程序指令执行如上述第二方面或上述第二方面的任意一种可能的设计的方法。
第十二方面,本申请还提供一种计算机可读存储介质,所述计算机可读存储介质用于存储计算机程序,当计算机程序在计算机上运行时,使得所述计算机执行上述第二方面或上述第二方面的任意一种可能的设计的方法。
第十三方面,本申请还提供一种程序产品,当所述程序产品在计算机上运行时,使得所述计算机执行上述第二方面或上述第二方面的任意一种可能的设计的方法。
第十四方面,本申请还提供一种芯片,包括:至少一个处理器和接口,所述接口可以为代码/数据读写接口,所述接口用于将计算机执行指令(计算机执行指令存储在存储器中,可能直接从存储器读取,或可能经过其他器件)提供给所述至少一个处理器;所述至少一个处理器用于执行所述计算机执行指令,以实现上述第二方面或上述第二方面的任意一种可能的设计的方法。
上述第九方面至第十四方面及其可能的设计中的有益效果可以参考上述对第二方面及其任意一种可能的设计中所述方法的有益效果的描述。
第十五方面,本申请还提供一种通信系统,所述通信系统包括发装置和接收装置。所述发送装置用于执行上述第一方面中,或者本申请实施例提供的方案中由发送装置执行的步骤;所述接收装置用于执行上述第二方面中,或者本申请实施例提供的方案中由所述接收装置执行的步骤。
附图说明
图1为本申请实施例提供的一种通信系统的架构示意图;
图2为本申请实施例提供的另一种通信系统的架构示意图;
图3为本申请实施例提供的一种音频数据传输方法的流程示意图;
图4为本申请实施例提供的一种发送装置获取对应至少一路音频数据的公共分量的第一格式化码流数据的过程示意图;
图5为本申请实施例提供的一种发送装置获取对应至少一路音频数据的第二格式化码流数据的过程示意图;
图6为本申请实施例提供的一种音频数据传输方法的流程示意图;
图7为本申请实施例提供的一种接收装置获取至少一路音频数据中的第一路音频数据的过程示意图;
图8为本申请实施例提供的一种发送装置的结构示意图;
图9为本申请实施例提供的一种发送装置的结构示意图;
图10为本申请实施例提供的一种发送装置的结构示意图;
图11为本申请实施例提供的一种接收装置的结构示意图;
图12为本申请实施例提供的一种接收装置的结构示意图;
图13为本申请实施例提供的一种接收装置的结构示意图。
具体实施方式
为了使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施例作进一步地详细描述。
为了使本申请实施例的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施例作进一步地详细描述。
请参考图1所示,为本申请实施例提供的一种通信系统的架构示意图。如图1所示,该通信系统包括:发送装置101和多个接收装置102(图1中以3个为例)。
应理解,本申请实施例提供的通信系统,即可适用于低频场景(sub 6G),也适用于高频场景(above6G)。本申请实施例提供的通信系统的应用场景包括但不限于全球移动通讯(global system of mobile communication,GSM)系统、码分多址(code divisionmultiple access,CDMA)系统、宽带码分多址(wideband code division multipleaccess,WCDMA)系统、通用分组无线业务(general packet radio service,GPRS)、长期演进(long term evolution,LTE)系统、LTE频分双工(frequency division duplex,FDD)系统、LTE时分双工(time division duplex,TDD)、通用移动通信系统(universal mobiletelecommunication system,UMTS)、全球互联微波接入(worldwide interoperabilityfor microwave access,WiMAX)通信系统、未来的第五代(5th generation,5G)系统或新无线(new radio,NR)通信系统等。
应理解,本申请实施例中,发送装置101可以是具有无线收发功能的装置,能够与一个或多个接收装置102进行通信,其中,发送装置101可以部署在陆地上,包括室内或室外、手持或车载;也可以部署在水面上(如轮船等),还可以部署在空中(例如飞机、气球和卫星上等)。举例来说,本申请实施例中的发送装置101可以是用户设备(user equipment,UE)、终端(terminal)、移动台(mobile station,MS)、手机(mobile phone)、平板电脑(pad)、带无线收发功能的电脑、虚拟现实(virtual reality,VR)终端、增强现实(augmented reality,AR)终端、工业控制(industrial control)中的无线终端、无人驾驶(self driving)中的无线终端、远程医疗(remote medical)中的无线终端、智能电网(smart grid)中的无线终端、运输安全(transportation safety)中的无线终端、智慧城市(smart city)中的无线终端、智慧家庭(smart home)中的无线终端等。发送装置101也可以是具有通信模块且可以对音频数据进行压缩、编码以及格式化的码流转换的通信芯片。
应理解,本申请实施例中,接收装置102可以是具有无线收发功能的装置,能够与一个或多个发送装置101进行通信,其中,接收装置102可以部署在陆地上,包括室内或室外、手持或车载;也可以部署在水面上(如轮船等),还可以部署在空中(例如飞机、气球和卫星上等)。举例来说,本申请实施例中的接收装置102可以是用户设备(user equipment,UE)、终端(terminal)、移动台(mobile station,MS)、手机(mobile phone)、平板电脑(pad)、带无线收发功能的电脑、虚拟现实(virtual reality,VR)终端、增强现实(augmented reality,AR)终端、工业控制(industrial control)中的无线终端、无人驾驶(self driving)中的无线终端、远程医疗(remote medical)中的无线终端、智能电网(smart grid)中的无线终端、运输安全(transportation safety)中的无线终端、智慧城市(smart city)中的无线终端、智慧家庭(smart home)中的无线终端等。接收装置102也可以是具有通信模块且可以对音频数据进行解压缩、解码以及格式化的码流逆转换的通信芯片。
应理解,发送装置101和至少一个接收装置102之间可以通过无线进行连接。其中:
发送装置101,用于获取对应至少一路音频数据的公共分量的第一格式化码流数据,以及获取对应至少一路音频数据的至少一路第二格式化码流数据。其中,至少一路第二格式化码流数据是基于至少一路音频数据以及公共分量得到的。
发送装置101,还用于发送第一格式化码流数据以及至少一路第二格式化码流数据。
接收装置102,用于接收对应至少一路音频数据的公共分量的第一格式化码流数据,以及接收对应至少一路音频数据的至少一路第二格式化码流数据。
接收装置102,还用于获取至少一路音频数据中的第一路音频数据。
在本申请实施例中,由于至少一路第二格式化码流数据,是发送装置基于至少一路音频数据以及公共分量得到的,相较于现有的发送装置对至少一路音频数据进行处理得到统一的格式化码流数据而言,可以降低至少一路第二格式码流数据所占用的字节数,从而可以节省传输至少一路第二格式化码流数据时所使用的无线资源。另外,接收装置在接收到第一格式化码流数据和至少一路第二格式化码流数据时,无需对至少一路第二格式化码流数据中的所有第二格式化码流数据进行格式化的码流逆转换,只需对至少一路第二格式化码流数据中自己所需的一路第二路格式化码流数据以及第一格式化码流数据进行格式化的码流逆转换,即可得到自己所需的至少一路音频数据中的第一路音频数据,可以降低接收装置的功耗,对接收装置的性能要求不高,有利于降低接收装置的成本。
如图2所示,为本申请实施例提供的另一种通信系统的架构示意图。其中,该通信系统中除了可以包括图1中所示的发送装置101、接收装置102外,还可以包括多个音频功率放大器103(图2中以3个为例)和多个扬声器104(图2中以3个为例)。其中,音频功率放大器103,用于对接收装置102获取的至少一路音频数据中的第一路音频数据进行放大。扬声器104,用于对放大后的第一路音频数据进行播放。
应理解,本申请实施例中,音频功率放大器103可以包括但不限于:电子管功率放大器、晶体管功率放大器、集成电路功率放大器等。其中,多个音频功率放大器103可以为同一类型的音频功率放大器,也可以为不同类型的音频功率放大器,本申请实施例对此不作限定。
应理解,本申请实施例中,扬声器104可以包括但不限于:电动扬声器、纸盆式扬声器、号筒式扬声器、球顶形扬声器、磁式扬声器、离子扬声器、超声波扬声器、静电扬声器、压电扬声器等。其中,多个扬声器104可以为同一类型的扬声器,也可以为不同类型的扬声器,本申请实施例对此不作限定。
其中,在本申请实施例中,接收装置可以与音频功率放大器和扬声器采用集成的方式(例如紧耦合式)或者独立的方式进行设置。其中,当接收装置与音频功率放大器和扬声器采用独立的方式进行设置时,音频功率放大器和扬声器可以采用集成的方式(例如紧耦合式)进行设置,可以解决音频功率放大器和扬声器之间连线过长的问题,从而可以降低音频功率放大器和扬声器之间的连接成本。
下面结合附图介绍本申请实施例提供的技术方案。
在介绍本申请实施例之前,首先对本申请中的部分用语进行解释说明,以便于本领域技术人员理解。
1)本申请实施例所涉及的公共分量,可以为依据预先定义或者设置的规则得到的与至少两路音频数据的音频信息(例如采样值)之间的偏差值为最小的数据。其中,该规则对应的实现成本不同,所得到的公共分量可能会存在差异,但在其所对应的实现成本下,公共分量也可以是与至少两路音频数据的音频信息之间的偏差值为最小的数据。作为一种示例,公共分量可以为至少两路音频数据的音频信息的和;或者为至少两路音频数据的音频信息的和与相应系数的乘积,其中,若系数为0.5,则为至少两路音频数据的音频信息的平均值;或者为至少两路音频数据的音频信息的其它数值,例如至少两路音频数据的音频信息之间的数学期望值等。比如,以至少两路音频数据包括A路音频数据、B路音频数据,音频信息A1来自A路音频数据的音频信息,音频信息B1来自B路音频数据为例。A路音频数据和B路音频数据之间的公共分量,可以为音频信息1和音频信息B1的和,或者音频信息A1和音频信息B1的和与相应系数(例如0.6)的乘积,音频信息A1和音频信息B1之间的数学期望值等。其中,公共分量为至少两路音频数据的音频信息的和、或者为至少两路音频数据的音频信息的和与相应系数的乘积,或者为至少两路音频数据的音频信息的数学期望值等时所对应的规则不同,在其对应的规则下,可以求得公共分量为与至少两路音频数据的音频信息之间的偏差值为最小的数据。需要说明的是,本申请不对公共分量做具体限定,以能体现多路音频数据的公共信息为准。
2)本申请实施例所涉及的编码,是指将模拟音频数据转化为数字音频数据的过程,即指将模拟音频数据的量化值用一组二进制数字代码表示的过程。其中,模拟音频数据的量化值,是通过对模拟音频数据进行采样、量化处理得到的。对模拟音频数据进行采样处理,是指在时间上对模拟音频数据进行离散化处理的过程。对模拟音频数据进行量化处理,是指将对模拟音频数据进行采样处理后得到的每个采样值在幅度上进行离散化处理的过程。其中,音频数据的编码方式可以包括波形编码、参数编码和混合编码。其中,波形编码是指不利用生成音频数据的任何参数,直接将模拟音频数据变换为数字音频数据,使重构的音频数据的波形尽可能地与原始音频数据的波形形状保持一致。参数编码是从音频波形数据中提取生成音频的参数,使用这些参数通过音频生成模型重构出音频,使重构的音频数据尽可能地保持原始音频数据的语意。混合编码是指同时使用两种或两种以上的编码方式进行编码,比如同时使用波形编码和参数编码的编码方式进行编码。
3)本申请实施例所涉及的格式化码流数据,是指采用不同的音频格式处理得到的音频文件在通信端口单位时间内传输的数据流量。其中,音频格式可以但不限于包括:光盘(compact disk,CD)格式、WAV格式(windows多媒体音频格式)、音频交换文件格式(audiointerchange file format,AIFF)、动态影像专家组(moving picture experts group,MPEG)格式、动态影像专家组音频层面4(moving picture experts group audio layer-4,MPEG-4)格式、无损音频压缩编码(free lossless audio codec,FLAC)格式、动态影像专家组音频层面3(moving picture experts group audio layer-3,MP3)格式、乐器数字接口(musical instrument digital interface,MIDI)格式、视窗媒体音频(windows mediaaudio,WMA)格式、真实音频(RealAudio)格式、高级音频编码(advanced audio coding,AAC)格式、自适应多速率(adaptive multi rate,AMR)格式。
4)本申请实施例所涉及的压缩,是指运用相应的数字信号处理技术,在不损失音频数据中的有用信息量,或所引入损失可忽略的条件下,用于降低音频数据的码率的过程。其中,压缩可以具有相应的逆变换,称为解压缩。
5)本申请所涉及的无线通道,又可以称为无线信道或无线频道,是指以无线信号作为传输媒体的数据信号传送通道,可以理解为以辐射无线电波为传输方式的无线电信道,或者也可以理解为无线数据传输的通道。
另外,需要理解的是,本申请实施例中的术语“至少一个”是指一个或者多个,“多个”是指两个或两个以上,以及“至少一路”是指一路或者多路,“多路”是指两路或两路以上。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B的情况,其中A,B可以是单数或者复数。字符“/”一般表示前后关联对象是一种“或”的关系。单数表达形式“一个”、“一种”、“所述”、“上述”、“该”和“这一”旨在也包括例如“一个或多个”这种表达形式,除非其上下文中明确地有相反指示。以及,除非有相反的说明,本申请实施例提及“第一”、“第二”等序数词是用于对多个对象进行区分,不用于限定多个对象的顺序、时序、优先级或者重要程度。例如,第一格式化码流数据和第二格式化码流数据,只是为了区分不同的格式化码流数据,而并不是表示这两个格式化码流数据的优先级或者重要程度等的不同。
在本申请实施例中描述的参考“一个实施例”或“一些实施例”等意味着在本申请的一个或多个实施例中包括结合该实施例描述的特定特征、结构或特点。由此,在本说明书中的不同之处出现的语句“在一个实施例中”、“在一些实施例中”、“在其他一些实施例中”、“在另外一些实施例中”等不是必然都参考相同的实施例,而是意味着“一个或多个但不是所有的实施例”,除非是以其他方式另外特别强调。术语“包括”、“包含”、“具有”及它们的变形都意味着“包括但不限于”,除非是以其他方式另外特别强调。
请参考图3所示,为本申请实施例提供的一种音频数据传输方法的流程示意图。其中,该方法可以应用于图1或者图2所示的通信系统或者类似的通信系统中。如图3所示,以执行主体为发送装置为例,其中,发送装置可以是UE、MS、手机、平板电脑、带无线收发功能的电脑、VR终端、AR终端或者具有通信模块且可以对音频数据进行压缩、编码以及格式化的码流转换的通信芯片等装置。其中,该方法流程包括:
S201、获取对应至少一路音频数据的公共分量的第一格式化码流数据。
在一些实施例中,发送装置可以通过多种方式获取至少一路音频数据。比如,发送装置可以获取至少一个收音装置采集得到的至少一路音频数据,和/或,获取至少一个存储介质存储的至少一路音频数据。换言之,至少一路音频数据来自至少一个收音装置,和/或,来自至少一个存储介质。比如,至少一路音频数据来自至少一个收音装置,或者,至少一路音频数据来自至少一个存储介质,或者,至少一路音频数据中的一部分音频数据来自至少一个收音装置,另一部分音频数据来自至少一个存储介质。其中,一个存储介质可以存储一路或者多路音频数据,至少一个存储介质可以为与发送装置连接的外部存储介质,或者为发送装置内部设置的存储介质,本申请实施例对此不作具体限定。当然,发送装置除了可以通过至少一个收音装置和/或至少一个存储介质获取至少一路音频数据之外,还可以通过其他方式获取至少一路音频数据,例如发送装置可以获取其他装置通过无线空口传输的至少一路音频数据。具体的,收音装置可以为麦克风,或者为具有麦克风的其他装置。其中,至少一个收音装置可以为同一类型的收音装置,也可以是不同类型的收音装置,本申请实施例对此不进行限定。
在一些实施例中,发送装置获得至少一路音频数据后,可以对至少一路音频数据进行处理,得到对应至少一路音频数据的公共分量的第一格式化码流数据。
下面具体介绍发送装置获取对应至少一路音频数据的公共分量的第一格式化码流数据的过程。如图4所示,该过程可以包括:
S301、对至少一路音频数据进行处理,得到至少一路音频数据对应的公共分量。
在一些实施例中,发送装置可以通过对至少一路音频数据进行变换域转换以及去冗余处理,得到至少一路音频数据对应的公共分量。比如,发送装置可以将至少一路音频数据进行变换域转换,得到至少一路变换域音频数据。之后,发送装置可以将至少一路变换域音频数据进行去冗余处理,用于去除至少一路音频数据中的每一路音频数据单独存在的冗余性。之后,发送装置可以将去冗余处理后的至少一路变换域音频数据进行相加后,得到至少一路音频数据对应的公共分量,用于去除至少一路音频数据之间存在的冗余性。其中,将去冗余处理后的至少一路变换域音频数据进行相加,可以理解为将至少一路变换域音频数据对应的数值(例如采样值或者模拟/数字转换后得到的数值等)进行相加。作为一种示例,发送装置可以将去冗余处理后的至少一路变换域的音频数据进行相加后,提取去冗余处理后的至少一路变换域的音频数据的平均值,作为至少一路音频数据的公共分量,或者,提取去冗余处理后的至少一路变换域音频数据的和与相应系数的乘积,作为至少一路音频数据的公共分量,或者,或者提取去冗余处理后的至少一路变换域音频数据的数学期望值,作为至少一路音频数据的公共分量等。
其中,本申请实施例中,发送装置将至少一路变换域音频数据进行去冗余处理的方式可以包括但不限于:在将至少一路变换域音频数据进行去冗余处理的过程中,通过设定一个阈值,将至少一路变换域音频数据中的每一路变换域音频数据中低于该阈值的数据强制设置为零;或者,设置几个阈值,并将这几个阈值设置为几个离散等级,之后,将至少一路变换域音频数据中的每一路变换域音频数据和几个不同阈值进行比较,可以确定至少一路变换域音频数据中的每一路变换域音频数据所对应的离散等级,并按照相应的离散等级对至少一路变换域音频数据中的每一路变换域音频数据进行去冗余处理。其中,上述阈值是用于控制至少一路音频数据中的每个音频数据单独进行去冗余处理后的失真程度。
其中,本申请实施例中,至少一路音频数据可以采用不同的变换域进行转换,即至少一路音频数据中的每一路音频数据转换的变换域可以相同也可以不相同,本申请实施例对此不作限定。其中,变换域转换可以包括但不限于:离散傅里叶变换(discrete fouriertransform,DFT)、离散余弦变换(discrete cosine transform,DCT)、离散正弦变换(discrete sine transform,DST)离散小波变换(discrete wavelet transformation,DWT)、离散哈特莱变换(discrete hartley transform,DHT)、离散W变换(discrete Wtransform,DWT)等。
本申请实施例中,通过将至少一路音频数据进行变换域转换以及去冗余处理,获取至少一路音频数据对应的公共分量,可以降低至少一路音频数据中的每一路音频数据所占用的字节数,进一步的可以有效节省传输至少一路音频数据时所使用的无线资源。
S302、对至少一路音频数据对应的公共分量进行压缩和/或编码,得到对应至少一路音频数据的公共分量的第一格式化码流数据。
在一些实施例中,发送装置得到至少一路音频数据对应的公共分量后,可以通过多种方式得到对应至少一路音频数据的公共分量的第一路格式化码流数据。比如,发送装置可以对至少一路音频数据对应的公共分量进行压缩处理后,得到第一个格式化码流数据,或者,发送装置还可以对至少一路音频数据对应的公共分量进行编码处理后,得到第一格式化码流数据,或者,发送装置还可以对至少一路音频数据对应的公共分量进行压缩和编码处理后,得到第一格式码流数据。具体的,发送装置可以采用相应的音频格式对压缩和/或编码后的至少一路音频数据对应的公共分量进行格式化的码流转换,得到对应至少一路音频数据的公共分量的第一格式化码流数据。
本申请实施例中,通过提取至少一路音频数据对应的公共分量,相较于传输至少一路音频数据进行处理后得到统一的格式化码流数据(包含至少一份公共分量)而言,无需传输至少一份公共分量对应的第一格式化码流数据,只需要传输一份公共分量的第一格式化码流数据即可,可以有效节省发送装置传输至少一路音频数据时所使用的无线资源。
S202、获取对应至少一路音频数据的至少一路第二格式化码流数据。其中,至少一路第二格式化码流数据是基于至少一路音频数据以及公共分量得到的。
在一些实施例中,发送装置获取至少一路音频数据对应的公共分量后,可以基于至少一路音频数据以及所述公共分量,获取对应至少一路音频数据的至少一路第二格式化码流数据。
下面具体介绍发送装置获取对应至少一路音频数据的至少一路第二格式化码流数据的过程。如图5所示,该过程可以包括:
S401、基于至少一路音频数据以及所述公共分量,得到至少一路子音频数据。
在一些实施例中,发送装置提取至少一路音频数据对应的公共分量后,可以得到至少一路子音频数据,即至少一路子音频数据为至少一路音频数据中的每一路音频数据减去公共分量后的剩余音频数据。作为一种示例,以至少一路音频数据包括A路音频数据和B路音频数据,音频信息A1来自A路音频数据,音频信息B1来自B路音频数据为例。若A路音频数据和B路音频数据的公共分量为音频信息A1和音频信息B1的平均值,那么A路音频数据对应的子音频数据a,即为音频信息A1减去该平均值后得到的数值的绝对值,B路音频数据对应的子音频数据b,即为音频信息B1减去该平均值后得到的数值的绝对值。
其中,至少一路音频数据与至少一路子音频数据的数目可以相同,也可以不相同,本申请实施例对此不作限定。当至少一路音频数据与至少一路子音频数据的数目相同时,至少一路音频数据与至少一路子音频数据一一对应。或者,当至少一路音频数据与至少一路子音频数据的数目不相同时,至少一路音频数据中的一路音频数据可以对应至少一路子音频数据中的两路子音频数据,或者,至少一路音频数据中的两路音频数据对应至少一路子音频数据中的一路子音频数据。例如,可以将至少一路音频数据中的一路音频数据提取公共分量后的剩余音频数据复制成两份,得到两路子音频数据,或者,还可以将至少一路音频数据中的两路音频数据提取公共分量后的剩余音频数据进行处理,得到一路子音频数据等。
S402、对至少一路子音频数据分别进行执行编码以及格式化的码流转换,或者分别执行格式化的码流转换,得到对应至少一路音频数据的至少一路第二格式化码流数据。
在一些实施例中,发送装置得到至少一路子音频数据后,可以对至少一路子音频数据分别执行格式化的码流转换,得到至少一路第二格式化码流数据。其中,发送装置可以通过多种方式对至少一路子音频数据分别执行格式化的码流转换。比如,发送装置可以对至少一路子音频数据分别执行编码后进行格式化的码流转换,或者对至少一路子音频数据分别只执行格式化的码流转换。
其中,发送装置对至少一路子音频数据中的至少两路子音频数据执行的编码方式和/或格式化的码流转换方式不同。比如,以至少一路子音频数据包括子音频数据a、子音频数据b、子音频数据c和子音频数据d为例,发送装置可以采用参数编码方式对子音频数据a进行编码,以及采用MP3格式对编码后的子音频数据a进行码流的转换,得到子音频数据a对应的第二格式化码流数据;采用波形编码方式对子音频数据b进行编码,以及采用MP3格式对编码后的子音频数据b进行码流的转换,得到子音频数据b对应的第二格式化码流数据;采用波形编码方式对子音频数据c进行编码,以及采用CD格式对编码后的子音频数据c进行码流的转换,得到子音频数据c对应的第二格式化码流数据;采用WAVE格式对子音频数据d只进行码流的转换,得到子音频数据d对应的第二格式化码流数据。
其中,在步骤S402中,发送装置还可以对至少一路子音频数据进行压缩处理。比如,发送装置可以对至少一路子音频数据分别进行压缩以及编码后执行格式化的码流转换,或者进行压缩后执行格式化的码流转换。在具体的实现过程中,发送装置可以采用不同的压缩方式(例如采用不同的压缩比)对至少一路子音频数据进行压缩处理,即至少一路子音频数据中的每一路子音频数据对应的压缩比可以相同,也可以不相同,本申请实施例对此不作限定。
本申请实施例中,由于至少一路第二格式化码流数据为基于至少一路音频数据以及公共分量得到的,相较于现有的发送装置对至少一路音频数据进行处理得到统一的格式化码流数据而言,可以降低至少一路第二格式码流数据所占用的字节数,进一步的可以有效节省传输至少一路第二格式码流数据时所使用的无线资源。
需要说明的是,本申请实施例对步骤S201和步骤S202的执行顺序不作具体限定,比如,发送装置可以先执行步骤S201,再执行步骤S202,或者先执行步骤S202,再执行步骤S201,或者同时执行步骤S201和步骤S202。
需要说明的是,上述第一格式化码流数据以及上述至少一路第二格式化码流数据,是以发送装置基于至少一路音频数据进行处理得到的为例。在另外一些实施例中,上述第一格式化码流数据以及上述至少一路第二格式化码流数据,还可以是其他装置基于至少一路音频数据进行处理得到的,即发送装置可以接收来自其他装置发送的第一格式化码流数据以及至少一路第二格式化码流数据。本申请实施例不对发送装置获取第一格式化码流数据以及至少一路第二格式化码流数据的具体方式进行限定。
需要说明的是,在上述实施例中是以至少一路音频数据包括至少两路音频数据为例。本申请实施例中,当至少一路音频数据包括一路音频数据时,发送装置只需获取一路格式化码流数据即可,可以理解为由于一路音频数据并不涉及到提取公共分量,发送装置只需获取这一路音频数据对应的一路格式化码流数据即可。
S203、发送第一格式化码流数据以及至少一路第二格式化码流数据。
在一些实施例中,发送装置获取对应至少一路音频数据的公共分量的第一格式化码流数据以及至少一路第二格式化码流数据后,可以向多个接收装置发送第一格式化码流数据以及至少一路第二格式化码流数据。在具体的实现过程中,发送装置可以通过至少一个无线通道发送第一格式化码流数据以及至少一路第二格式化码流数据。
其中,在本申请实施例中,发送装置通过至少一个无线通道发送第一格式化码流数据和至少一路第二格式化码流数据的方式可以有多种。比如,发送装置可以采用广播方式通过至少一个无线通道发送第一格式化码流数据以及至少一路第二格式化码流数据。例如,发送装置可以采用广播的方式将第一格式化码流数据和至少一路第二格式化码流数据广播给多个接收装置。或者,发送装置可以采用广播方式通过至少一个无线通道发送第一格式化码流数据,以及采用单播的方式通过至少一个无线通道发送至少一路第二格式化码流数据。
其中,至少一个无线通道和至少一路第二格式化码流数据可以存在逻辑映射关系,该逻辑映射关系可以是发送装置与多个接收装置预先约定的。比如,当至少一路第二格式化码流数据包括N(为正整数)路第二格式化码流数据时,至少一个无线通道的数量为N+1,此时,N+1个无线通道可以是无线逻辑通道和/或无线物理通道,例如,N+1个无线通道可以为无线逻辑通道,或者N+1个无线通道为无线物理通道,或者N+1个无线通道中的一部分无线通道为无线逻辑通道,另一个部分无线通道为无线物理通道,其中,一个无线物理通道可以承载多个无线逻辑通道。例如,发送装置可以采用单播方式通过N+1个无线通道中的N个无线通道,点对点的将N路第二格式化码流数据发送给多个接收装置,可以采用广播方式通过N+1个无线通道中的一个无线通道将第一格式化码流数据发送给多个接收装置,其中,当N+1无线通道为无线逻辑通道时,N+1无线通道可以承载在至少一个无线物理通道上。或者,发送装置可以采用广播方式通过N+1个无线通道将至少一路第二格式化码流数据和第一格式化码流数据发送给多个接收装置。
本申请实施例中,由于至少一路第二格式化码流数据是基于至少一路音频数据以及公共分量得到的,相较于现有的对至少一路音频数据进行处理得到的统一格式化码流数据而言,可以降低至少一路第二格式码流数据所占用的字节数,从而可以有效节省发送装置传输至少一路第二格式化码流数据所使用的无线资源。
请参考图6所示,为本申请实施例提供的一种音频数据传输方法的流程实示意图。其中,该方法可以应用于图1或者图2所示的通信系统或者类似的通信系统中。如图6所示,以执行主体为单个接收装置为例,其中,接收装置可以是UE、MS、手机、平板电脑、带无线收发功能的电脑、VR终端、AR终端或者具有通信模块且可以对音频数据进行解压缩、解码以及格式化码流的逆转换的通信芯片等装置。其中,该方法流程包括:
S501、接收对应至少一路音频数据的公共分量的第一格式化码流数据。
在一些实施例中,若在上述S203中,发送装置是采用广播方式通过至少一个无线通道发送对应至少一路音频数据的公共分量的第一格式化码流数据,那么接收装置可以通过至少一个无线通道中的一个无线通道接收发送装置广播的第一格式化码流数据。其中,若至少一路音频数据的数量为N(为正整数),那么至少一个无线通道的数量可以为N+1。
其中,至少一个无线通道中传输第一格式化码流数据的无线通道,可以是无线逻辑通道或者无线物理信道。若该无线通道为无线逻辑通道,该无线通道可以与传输至少一路第二格式化码流数据的无线通道承载在同一个无线物理信道上。
作为一种示例,若传输第一路格式化码流数据的无线通道为无线物理信道,当接收装置识别到至少一个无线通道中的无线通道a传输的格式化码流数据为第一格式化码流数据,那么接收装置可以接收无线通道a传输的格式化码流数据。若传输第一路格式化码流数据的无线通道为无线逻辑信道,与传输至少一路第二格式化码流数据的无线通道承载在同一个无线物理信道如无线通道b上,若接收装置识别到无线通道b传输的编号为i的格式化码流数据为第一格式化码流数据,那么接收装置可以接收无线通道b中传输的编号为i的格式化码流数据。
其中,在本申请实施例中,至少一路音频数据来自至少一个收音装置,或者,来自至少一个存储介质,或者来自其他装置,本申请实施例对此不作具体限定。其中,一个存储介质可以存储一路或者多路音频数据。具体的,收音装置可以为麦克风,或者为具有麦克风的其他装置。其中,至少一个收音装置可以为同一类型的收音装置,也可以是不同类型的收音装置,本申请实施例对此不进行限定。
S502、接收对应至少一路音频数据的至少一路第二格式化码流数据。其中,至少一路第二格式化码流数据是基于至少一路音频数据以及所述公共分量得到的。
在一些实施例中,若在上述S203中,发送装置是采用广播的方式通过至少一个无线通道发送对应至少一路音频数据的至少一路第二格式化码流数据,那么接收装置可以通过至少一个无线通道,接收至少一路第二格式化码流数据中自己所需的第一路第二格式化码流数据。比如,若至少一路第二格式化码流数据的数量为N,那么至少一个无线通道的数量为N+1。接收装置可以通过至少一个无线通道中的N个无线通道传输的N路第二格式化码流数据的标识,识别N路第二格式化码流数据。其中,N个无线通道可以是无线逻辑通道和/或无线物理信道。
作为一种示例,若至少一个无线通道为无线逻辑通道,至少一路第二格式化码流数据的标识可以包括但不限于以下中的至少一个:至少一路第二格式化码流数据各自对应的编号,至少一路第二格式化码流数据各自对应的数据包的头部字段等。若至少一个无线通道为无线物理通道,至少一路第二格式化码流数据的标识可以包括但不限于以下中的至少一个:传输至少一路第二格式化码流数据的无线通道各自对应的频点、时隙、频带、编码等。可以理解为,至少一个无线通道可以通过采用时分复用、频分复用以及码分复用等技术进行区别,或者以至少一个无线通道各自对应的频点进行区分。以至少一个无线通道通过频点进行区分为例,至少一路第二格式化码流数据的标识可以为频点,接收装置可以对应一个频点,那么接收装置可以接收该频点对应的无线通道传输的一路第二格式化码流数据。
在另外一些实施例中,若在上述S203中,发送装置是采用单播的方式通过至少一个无线通道发送对应至少一路音频数据的至少一路第二格式化码流数据,那么接收装置可以接收发送装置通过至少一个无线通道中的相应的无线通道发送的至少一路第二格式化码流数据中的第一路第二格式化码流数据。比如,若至少一个无线通道中的第二无线通道传输的第一路第二格式化码流数据为接收装置所需的,那么接收装置可以通过第二无线通道接收自己所需的第一路第二格式化码流数据,即至少一个无线通道与多个接收装置存在逻辑映射关系。比如,多个接收装置的数目与至少一路第二格式化码流数据域的数目相同,例如,当至少一路第二格式化码流数据包括N路第二格式化码流数据时,即当多个接收装置包括N个接收装置时,至少一个无线通道的数量为可以N+1,其中,N为正整数。可以理解为,接收装置可以通过与接收装置对应的至少一个无线通道中的第二无线通道,接收自己所需的至少一路第二格式化码流数据中的第一路第二格式化码流数据。
本申请实施例中,由于至少一路第二格式化码流数据是基于至少一路音频数据以及公共分量得到的,相较于现有的对至少一路音频数据进行处理得到进行统一的格式化码流数据而言,可以降低至少一路第二格式码流数据所占用的字节数,可以节省接收装置接收至少一路第二格式化码流数据中的第一路第二格式化码流数据时所使用的无线资源,有利于降低接收装置的功耗。
S503、获取至少一路音频数据中的第一路音频数据。
在一些实施例中,接收装置接收第一路第二格式化码流数据和第一格式化码流数据后,可以对第一路第二格式化码流数据和第一格式化码流数据进行相应的处理,得到自己所需的至少一路音频数据中的第一路音频数据。
下面具体介绍接收装置获取至少一路音频数据中的第一路音频数据的过程。如图7所示,该过程可以包括:
S601、对至少一路第二格式化码流数据中的第一路第二格式化码流数据以及第一格式化码流数据执行解码以及格式化的码流逆转换,或者执行格式化的码流逆转换,得到至少一路音频数据中的第一路音频数据对应的第一路子音频数据以及至少一路音频数据对应的公共分量。
其中,本申请实施例中,至少一路第二格式化码流数据对应的编码方式和/或格式化的码流转换方式不同。
在一些实施例中,接收装置对第一路第二格式化码流数据以及第一格式化码流数据执行格式化的码流逆转换的方式可以有多种。比如,若第一格式化码流数据是通过对至少一路音频数据对应的公共分量执行编码以及格式化的码流转换时,接收装置接收到第一格式化码流数据后,可以对第一格式化码流数据执行解码以及格式化的码流逆转换,得到至少一路音频数据对应的公共分量。或者,若第一格式化码流数据是通过对至少一路音频数据对应的公共分量只执行格式化的码流转换时,接收装置接收到第一格式化码流数据后,可以对第一格式化码流数据执行格式化的码流逆转换,得到至少一路音频数据对应的公共分量。接收装置对第一路第二格式化码流数据执行格式化的码流逆转换的方式,与对第一格式化码流数据执行格式化的码流逆转换的方式相同或者类似,在此不再赘述。接收装置对自己所需的第二格式化码流数据进行格式化的码流逆转换后,可以得到第一路子音频数据。
本申请实施例中,接收装置只需对自己所需的第一路第二格式化码流数据以及第一格式化码流数据,执行解码以及格式化的码流逆转换或者执行格式化的码流逆转换处理,即可得到第一路音频数据对应的第一路子音频数据以及至少一路音频数据对应的公共分量,无需对至少一路第二格式化码流数据中的所有第二格式化码流数据执行解码以及格式化的逆转换处理或者执行格式化的码流逆转换处理,从而可以降低接收装置的功耗,另外对接收装置的性能要求不高,有利于降低接收装置的成本。
其中,在步骤S601中,若接收装置接收到的第一路第二格式化码流数据是对第一路子音频数据进行压缩后得到的,和/或,接收装置接收到的第一格式化码流数据是对至少一路音频数据对应的公共分量进行压缩后得到。那么,接收装置对第一路第二格式化码流数据以及第一格式化码流数据执行格式化的码流逆转换之前,还需对第一路第二格式化码流数据和/或第一格式化码流数据进行解压缩处理。其中,第一路第二格式化码流数据和第一格式化码流数据对应的压缩方式可以相同也可以不相同,本申请实施例对此不作限定。其中,对应至少一路音频数据的至少一路第二格式化码流数据对应的压缩方式可以相同或者不同。
S602、对第一路子音频数据和至少一路音频数据对应的公共分量进行处理,得到至少一路音频数据中的第一路音频数据。
在一些实施例中,接收装置获取至少一路音频数据对应的公共分量和第一路子音频数据后,可以对至少一路音频数据对应的公共分量和第一路子音频数据进行处理,得到自己所需的第一路音频数据。比如,接收装置可以基于第一路子音频数据和至少一路音频数据对应的公共分量进行变换域的逆转换处理,得到第一路音频数据。其中,在本申请实施例中,变换域的逆转换可以包括但不限于:离散傅里叶逆变换(inverse discrete fouriertransform,IDFT)、离散余弦逆变换(inverse discrete cosine transform,IDCT)、离散正弦逆变换(inverse discrete sine transform,IDST)、离散小波逆变换(inversediscrete wavelet transformation,IDWT)、离散哈特莱逆变换(inverse discretehartley transform,IDHT)、离散W逆变换(inverse discrete W transform,IDWT)等。
本申请实施例中,接收装置只需对自己所需的第一路第二格式化码流数据以及第一格式化码流数据,执行解码以及格式化的码流逆转换或者执行格式化的码流逆转换处理,即可得到至少一路音频数据中自己所需的第一路音频数据,无需对至少一路第二格式化码流数据中的所有第二格式化码流数据,执行解码以及格式化的逆转换处理或者执行格式化的码流逆转换处理得到至少一路音频数据后,再从至少一路音频数据中获取自己所需的第一路音频数据,从而可以降低接收装置的功耗,另外对接收装置的性能要求不高,有利于降低接收装置的成本。
应理解,本申请实施例中,发送装置和接收装置可以执行本申请实施例中的部分或全部步骤,这些步骤仅是示例,本申请实施例还可以执行其它步骤或者各种步骤的变形。此外,各个步骤可以按照本申请实施例呈现的不同的顺序来执行,并且有可能并非要执行本申请实施例中的全部步骤。
在本申请的各个实施例中,如果没有特殊说明以及逻辑冲突,不同的实施例之间的术语和/或描述具有一致性、且可以相互引用,不同的实施例中的技术特征根据其内在的逻辑关系可以组合形成新的实施例。
上述主要从发送装置与多个接收装置之间的交互的角度对本申请实施例提供的方案进行了介绍。应理解,上述发送装置、接收装置为了实现上述功能,其包含了执行各个功能相应的硬件结构和/或软件模块。本领域技术人员应该很容易意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,本申请能够以硬件或硬件和计算机软件的结合形式来实现。某个功能究竟以硬件还是计算机软件驱动硬件的方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
本申请实施例可以根据上述方法示例对发送装置或者接收装置进行功能模块的划分,例如,可以对应各个功能划分各个功能模块,也可以将两个或两个以上的功能集成在一个处理模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。需要说明的是,本申请实施例中对模块的划分是示意性的,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
在采用集成的单元(模块)的情况下,图8示出了本申请实施例提供的一种发送装置的结构示意图。如图8所示,发送装置800可以包括:收发单元801和处理单元802。
其中,收发单元801,用于支持发送装置800与其他装置的通信,例如与至少一个收音装置或者多个接收装置之间的通信。处理单元802,用于对接收装置800的动作进行控制管理,例如,处理单元802用于支持发送装置800执行图4中的过程S301和S302以及图5中的过程S401、S402,和/或用于本文所描述的技术的其它过程。
可选的,发送装置800还可以包括存储单元803,用于存储发送装置800的程序代码和/或数据。具体的,可以参考如下描述:
处理单元802,用于获取对应至少一路音频数据的公共分量的第一格式化码流数据;获取对应所述至少一路音频数据的至少一路第二格式化码流数据;其中,所述第一格式化码流数据以及所述至少一路第二格式化码流数据可以是处理单元802接收来自其他装置发送的,也可以是处理单元802基于所述至少一路音频数据进行处理得到的;
收发单元801,用于发送所述第一格式化码流数据以及所述至少一路第二格式化码流数据;
其中,所述至少一路第二格式化码流数据是基于所述至少一路音频数据以及所述公共分量得到的。
在一种可能的设计中,所述收发单元801可以具体用于:通过至少一个无线通道发送所述第一格式化码流数据以及所述至少一路第二格式化码流数据。
在一种可能的设计中,所述至少一路第二格式化码流数据包括N路第二格式化码流数据,所述至少一个无线通道的数量为N+1,所述N为正整数。
在一种可能的设计中,所述第一格式化码流数据是对所述公共分量进行压缩和/或编码得到的;和/或,所述至少一路第二格式化码流数据是对基于所述至少一路音频数据以及所述公共分量得到的至少一路子音频数据进行压缩和/或编码得到的。
在一种可能的设计中,所述收发单元801可以具体用于:向多个接收装置发送所述第一格式化码流数据以及所述至少一路第二格式化码流数据。
在一种可能的设计中,所述公共分量是通过对所述至少一路音频数据进行变换域转换以及去冗余处理得到的。
在一种可能的设计中,若所述第一格式化码流数据以及所述至少一路第二格式化码流数据为处理单元802基于所述至少一路音频数据进行处理得到的,所述处理单元802可以具体用于:对基于所述至少一路音频数据以及所述公共分量得到的至少一路子音频数据分别执行编码以及格式化的码流转换,或者分别执行格式化的码流转换,得到所述至少一路第二格式化码流数据;其中,对所述至少一路子音频数据中的至少两路子音频数据执行的编码方式和/或格式化的码流转换方式不同。
本申请这里不对至少一路音频数据的具体来源进行限定。比如所述至少一路音频数据可以来自至少一个收音装置(可以为麦克风,或者具有麦克风的其他装置),或者,可以来自至少一个存储介质。
本申请这里不对至少一路音频数据的具体格式进行限定。比如,所述至少一路音频数据的格式可以包括但不限于:CD格式、WAV格式、AIFF格式、MPEG格式、MPEG-4格式、FLAC格式、MP3格式、MIDI格式、WMA格式、RealAudio格式、AAC格式、AMR格式中的至少一个。
应理解,发送装置800中的各个模块的操作和/或功能分别为了实现图3到图5所示的音频数据传输方法的相应流程,为了简洁,在此不再赘述。
在采用集成的单元(模块)的情况下,图9示出了本申请实施例提供的一种发送装置的结构示意图。如图9所示,发送装置900可以包括至少一个处理器901和存储器902。所述存储器902存储一个或多个计算机程序,例如存储发送装置900必要的一个或多个计算机程序。所述至少一个处理器901用于支持发送装置900实现上述音频数据传输方法,例如,当所述存储器902存储的一个或多个计算机程序被所述至少一个处理器901执行时,使得所述发送装置900可以实现图3-图5所示的音频数据传输方法的实施例的任意一种可能,和/或用于实现本文所描述的其他实施例。
在采用集成的单元(模块)的情况下,图10示出了本申请实施例提供的一种发送装置的结构示意图。如图10所示,发送装置1000包括至少一个处理器1001;所述至少一个处理器1001用于与存储器(其中,存储器可以为发送装置1000的内部或者外部存储器)耦合,并在读取所述存储器中的计算机程序指令之后,执行所述计算机程序指令以实现图3-图5所示的音频数据传输方法的实施例的任意一种可能,和/或用于实现本文所描述的其他实施例。
基于与上述方法实施例相同构思,本申请实施例中还提供一种发送装置,所述发送装置包括执行上述音频数据传输方法的方法实施例,或者方法实施例的任意一种可能的实现方式的模块/单元。这些模块/单元可以通过硬件实现,也可以通过硬件执行相应的软件实现。
在采用集成的单元(模块)的情况下,图11示出了本申请实施例提供的一种接收装置的结构示意图。如图11所示,接收装置1100可以包括:收发单元1101和处理单元1102。
其中,收发单元1101用于支持接收装置1100与其他装置的通信,例如与发送装置的通信。处理单元1102,用于对接收装置1100的动作进行控制管理,例如,处理单元1102用于支持接收装置1100执行图7中的过程S601、S602,和/或用于本文所描述的技术的其它过程。
可选的,接收装置1100还可以包括存储单元1103,用于存储接收装置1100的程序代码和/或数据。具体的,可以参考如下描述:
收发单元1101,用于接收对应至少一路音频数据的公共分量的第一格式化码流数据;接收对应所述至少一路音频数据的至少一路第二格式化码流数据;
处理单元1102,用于获取所述至少一路音频数据中的第一路音频数据;
其中,所述至少一路第二格式化码流数据是基于所述至少一路音频数据以及所述公共分量得到的。
在一种的可能设计中,所述收发单元1101可以具体用于:通过至少一个无线通道接收所述第一格式化码流数据以及所述至少一路第二格式化码流数据。
在一种的可能设计中,所述至少一路第二格式化码流数据包括N路第二格式化码流数据,所述至少一个无线通道的数量为N+1,所述N为正整数。
在一种的可能设计中,所述第一格式化码流数据是对所述公共分量进行压缩和/或编码得到的;和/或,所述至少一路第二格式化码流数据是对基于所述至少一路音频数据以及所述公共分量得到的至少一路子音频数据进行压缩和/或编码得到的。
在一种的可能设计中,所述处理单元1102可以具体用于:对所述至少一路第二格式化码流数据中的第一路第二格式化码流数据以及所述第一格式化码流数据执行解码以及格式化的码流逆转换,或者执行格式化的码流逆转换,得到所述第一路音频数据。
本申请这里不对至少一路音频数据的具体来源进行限定。比如,所述至少一路音频数据可以来自至少一个收音装置(可以为麦克风,或者具有麦克风的其他装置),或者,可以来自至少一个存储介质。
本申请这里不对至少一路音频数据的具体格式进行限定。比如,所述至少一路音频数据的格式可以包括但不限于:CD格式、WAV格式、AIFF格式、MPEG格式、MPEG-4格式、FLAC格式、MP3格式、MIDI格式、WMA格式、RealAudio格式、AAC格式、AMR格式中的至少一个。
应理解,接收装置1100中的各个模块的操作和/或功能分别为了实现图6和图7所示的音频数据传输方法的相应流程,为了简洁,在此不再赘述。
在采用集成的单元(模块)的情况下,图12示出了本申请实施例提供的一种接收装置的结构示意图。如图12所示,接收装置1200可以包括至少一个处理器1201和存储器1202;所述存储器1202存储一个或多个计算机程序,例如用于存储接收装置1200必要的一个或多个计算机程序。所述至少一个处理器1201用于支持接收装置1200实现上述音频数据传输方法,例如,当所述存储器1202存储的一个或多个计算机程序被所述至少一个处理器1201执行时,使得所述接收装置1200可以实现图6、图7所示的音频数据传输方法的实施例的任意一种可能,和/或用于实现本文所描述的其他实施例。
在采用集成的单元(模块)的情况下,图13示出了本申请实施例提供的一种接收装置的结构示意图。如图13所示,接收装置1300包括至少一个处理器1301;所述至少一个处理器1301用于与存储器(其中,存储器可以为接收装置1300的内部或者外部的存储器)耦合,并在读取所述存储器中的计算机程序指令之后,执行所述计算机程序指令可以实现图6、图7所示的音频数据传输方法的实施例的任意一种可能,和/或用于实现本文所描述的其他实施例。
基于与上述方法实施例相同构思,本申请实施例中还提供一种接收装置,所述接收装置包括执行上述音频数据传输方法的方法实施例,或者方法实施例的任意一种可能的实现方式的模块/单元。这些模块/单元可以通过硬件实现,也可以通过硬件执行相应的软件实现。
基于与上述方法实施例相同构思,本申请实施例中还提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被计算机上运行时,使得该计算机执行上述音频数据传输方法的方法实施例、方法实施例的任意一种可能的实现方式,例如执行图3-图7所示的音频数据传输方法的实施例的任意步骤,和/或执行本文所描述的技术的其它过程。
基于与上述方法实施例相同构思,本申请实施例中还提供一种程序产品,当所述程序产品在计算机上运行时,使得该计算机执行上述音频数据传输方法的方法实施例、方法实施例的任意一种可能的实现方式,例如执行图3-图7所示的音频数据传输方法的实施例的任意步骤,和/或执行本文所描述的技术的其它过程。
基于与上述方法实施例相同构思,本申请实施例中还提供一种芯片,该芯片可以包括至少一个处理器和接口;所述接口可以为代码/数据读写接口,所述接口用于将计算机执行指令(计算机执行指令存储在存储器中,可能直接从存储器读取,或可能经过其他器件)提供至所述至少一个处理器;所述至少一个处理器用于执行所述计算机执行指令,以实现上述音频数据传输方法的方法实施例、方法实施例的任意一种可能的实现方式,例如执行图3-图7所示的音频数据传输方法的实施例的任意步骤,和/或执行本文所描述的技术的其它过程。
本申请实施例还提供一种智能座舱产品,所述智能座舱产品包括上述发送装置和/或上述接收装置。
本申请实施例还提供一种智能设备或者运输工具,所述智能设备包括上述发送装置和/或上述接收装置,所述运输工具包括上述发送装置和/或上述接收装置。具体的,所述智能设备可以为机器人等,所述运输工具可以为智能汽车、网联汽车、无人机或无人运输车等。
应理解,本申请实施例中的处理器或处理单元(如图8至图11所示的处理器或处理单元)可以是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述音频数据传输方法的方法实施例的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器可以是通用中央处理器(central processing unit,CPU),通用处理器,数字信号处理(digital signal processing,DSP),专用集成电路(applicationspecific integrated circuits,ASIC),现场可编程门阵列(field programmable gatearray,FPGA)或者其他可编程逻辑器件、晶体管逻辑器件、硬件部件或者其任意组合;也可以是实现计算功能的组合,例如包括一个或多个微处理器组合,DSP和微处理器的组合等等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
应理解,本申请实施例中的存储器或存储单元可以是易失性存储器或非易失性存储器,或可包括易失性和非易失性存储器两者。其中,非易失性存储器可以是只读存储器(read-only memory,ROM)、可编程只读存储器(programmable ROM,PROM)、可擦除可编程只读存储器(erasable PROM,EPROM)、电可擦除可编程只读存储器(electrically EPROM,EEPROM)或闪存。易失性存储器可以是随机存取存储器(random access memory,RAM),其用作外部高速缓存。通过示例性但不是限制性说明,许多形式的RAM可用,例如静态随机存取存储器(static RAM,SRAM)、动态随机存取存储器(dynamic RAM,DRAM)、同步动态随机存取存储器(synchronous DRAM,SDRAM)、双倍数据速率同步动态随机存取存储器(double datarate SDRAM,DDR SDRAM)、增强型同步动态随机存取存储器(enhanced SDRAM,ESDRAM)、同步连接动态随机存取存储器(synchlink DRAM,SLDRAM)和直接内存总线随机存取存储器(direct rambus RAM,DR RAM)。应注意,本申请描述的系统和方法的存储器旨在包括但不限于这些和任意其它适合类型的存储器。
本申请实施例中所描述的各种说明性的逻辑单元和电路可以通过通用处理器,数字信号处理器,专用集成电路(application specific integrated circuit,ASIC),现场可编程门阵列(field programmable gate array,FPGA)或其它可编程逻辑装置,离散门或晶体管逻辑,离散硬件部件,或上述任何组合的设计来实现或操作所描述的功能。通用处理器可以为微处理器,可选地,该通用处理器也可以为任何传统的处理器、控制器、微控制器或状态机。处理器也可以通过计算装置的组合来实现,例如数字信号处理器和微处理器,多个微处理器,一个或多个微处理器联合一个数字信号处理器核,或任何其它类似的配置来实现。
本申请实施例中所描述的方法或算法的步骤可以直接嵌入硬件、处理器执行的软件单元、或者这两者的结合。软件单元可以存储于RAM、闪存、ROM、EPROM、EEPROM、寄存器、硬盘、可移动磁盘、CD-ROM或本领域中其它任意形式的存储媒介中。示例性地,存储媒介可以与处理器连接,以使得处理器可以从存储媒介中读取信息,并可以向存储媒介存写信息。可选地,存储媒介还可以集成到处理器中。处理器和存储媒介可以设置于ASIC中,ASIC可以设置于通信设备(如发送装置、接收装置等)中,例如可以设置于通信设备中的不同的部件中。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机程序或指令。在计算机上加载和执行所述计算机程序或指令时,全部或部分地执行本申请实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机程序或指令可以存储在计算机可读存储介质中,或者通过所述计算机可读存储介质进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是集成一个或多个可用介质的服务器等数据存储设备。所述可用介质可以是磁性介质,例如,软盘、硬盘、磁带;也可以是光介质,例如,DVD;还可以是半导体介质,例如,固态硬盘(solid state disk,SSD)。
本申请实施例是参照实施例所涉及的方法、装置、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管结合具体特征对本申请实施例进行了描述,显而易见的,在不脱离本申请实施例的精神和范围的情况下,可对其进行各种修改和组合。相应地,本说明书和附图仅仅是所附权利要求所界定的本申请实施例的示例性说明,且视为已覆盖本申请实施例范围内的任意和所有修改、变化、组合或等同物。
Claims (36)
1.一种音频数据传输方法,其特征在于,所述方法包括:
获取对应至少一路音频数据的公共分量的第一格式化码流数据;
获取对应所述至少一路音频数据的至少一路第二格式化码流数据;
发送所述第一格式化码流数据以及所述至少一路第二格式化码流数据;
其中,所述至少一路第二格式化码流数据是基于所述至少一路音频数据以及所述公共分量得到的。
2.如权利要求1所述的方法,其特征在于,所述发送所述第一格式化码流数据以及所述至少一路第二格式化码流数据,包括:
通过至少一个无线通道发送所述第一格式化码流数据以及所述至少一路第二格式化码流数据。
3.如权利要求2所述的方法,其特征在于,所述至少一路第二格式化码流数据包括N路第二格式化码流数据,所述至少一个无线通道的数量为N+1,所述N为正整数。
4.如权利要求1-3任一项所述的方法,其特征在于,所述第一格式化码流数据是对所述公共分量进行压缩和/或编码得到的;和/或
所述至少一路第二格式化码流数据是对基于所述至少一路音频数据以及所述公共分量得到的至少一路子音频数据进行压缩和/或编码得到的。
5.如权利要求4所述的方法,其特征在于,所述发送所述第一格式化码流数据以及所述至少一路第二格式化码流数据,包括:
向多个接收装置发送所述第一格式化码流数据以及所述至少一路第二格式化码流数据。
6.如权利要求1-5任一项所述的方法,其特征在于,所述公共分量是通过对所述至少一路音频数据进行变换域转换以及去冗余处理得到的。
7.如权利要求6所述的方法,其特征在于,所述获取对应所述至少一路音频数据的至少一路第二格式化码流数据,包括:
对基于所述至少一路音频数据以及所述公共分量得到的至少一路子音频数据分别执行编码以及格式化的码流转换,或者分别执行格式化的码流转换,得到所述至少一路第二格式化码流数据;
其中,对所述至少一路子音频数据中的至少两路子音频数据执行的编码方式和/或格式化的码流转换方式不同。
8.如权利要求1-7任一项所述的方法,其特征在于,所述至少一路音频数据来自至少一个收音装置,或者,来自至少一个存储介质。
9.如权利要求8所述的方法,其特征在于,所述至少一路音频数据的格式包括CD格式、WAV格式、AIFF格式、MPEG格式、MPEG-4格式、FLAC格式、MP3格式、MIDI格式、WMA格式、RealAudio格式、AAC格式、AMR格式中的至少一个。
10.一种音频数据传输方法,其特征在于,包括:
接收对应至少一路音频数据的公共分量的第一格式化码流数据;
接收对应所述至少一路音频数据的至少一路第二格式化码流数据;
获取所述至少一路音频数据中的第一路音频数据;
其中,所述至少一路第二格式化码流数据是基于所述至少一路音频数据以及所述公共分量得到的。
11.如权利要求10所述的方法,其特征在于,所述接收对应至少一路音频数据的公共分量的第一格式化码流数据以及所述至少一路第二格式化码流数据,包括:
通过至少一个无线通道接收所述第一格式化码流数据以及所述至少一路第二格式化码流数据。
12.如权利要求11所述的方法,其特征在于,所述至少一路第二格式化码流数据包括N路第二格式化码流数据,所述至少一个无线通道的数量为N+1,所述N为正整数。
13.如权利要求10-12任一项所述的方法,其特征在于,所述第一格式化码流数据是对所述公共分量进行压缩和/或编码得到的;和/或
所述至少一路第二格式化码流数据是对基于所述至少一路音频数据以及所述公共分量得到的至少一路子音频数据进行压缩和/或编码得到的。
14.如权利要求13所述的方法,其特征在于,所述获取所述至少一路音频数据中的第一路音频数据,包括:
对所述至少一路第二格式化码流数据中的第一路第二格式化码流数据以及所述第一格式化码流数据执行解码以及格式化的码流逆转换,或者执行格式化的码流逆转换,得到所述第一路音频数据。
15.如权利要求10-14任一项所述的方法,其特征在于,所述至少一路音频数据来自至少一个收音装置,或者,来自至少一个存储介质。
16.如权利要求15所述的方法,其特征在于,所述至少一路音频数据的格式包括CD格式、WAV格式、AIFF格式、MPEG格式、MPEG-4格式、FLAC格式、MP3格式、MIDI格式、WMA格式、RealAudio格式、AAC格式、AMR格式中的至少一个。
17.一种发送装置,其特征在于,包括:
处理单元,用于获取对应至少一路音频数据的公共分量的第一格式化码流数据以及对应所述至少一路音频数据的至少一路第二格式化码流数据;和
收发单元,用于发送所述第一格式化码流数据以及所述至少一路第二格式化码流数据;
其中,所述至少一路第二格式化码流数据是基于所述至少一路音频数据以及所述公共分量得到的。
18.如权利要求17所述的发送装置,其特征在于,所述收发单元用于:
通过至少一个无线通道发送所述第一格式化码流数据以及所述至少一路第二格式化码流数据。
19.如权利要求18所述的发送装置,其特征在于,所述至少一路第二格式化码流数据包括N路第二格式化码流数据,所述至少一个无线通道的数量为N+1。
20.如权利要求17-19任一项所述的发送装置,其特征在于,所述第一格式化码流数据是对所述公共分量进行压缩和/或编码得到的;和/或
所述至少一路第二格式化码流数据是对基于所述至少一路音频数据以及所述公共分量得到的至少一路子音频数据进行压缩和/或编码得到的。
21.如权利要求20所述的发送装置,其特征在于,所述收发单元用于:
向多个接收装置发送所述第一格式化码流数据以及所述至少一路第二格式化码流数据。
22.如权利要求17-21任一项所述的发送装置,其特征在于,所述公共分量是通过对所述至少一路音频数据进行变换域转换以及去冗余处理得到的。
23.如权利要求22所述的发送装置,其特征在于,所述处理单元用于:
对基于所述至少一路音频数据以及所述公共分量得到的至少一路子音频数据分别执行编码以及格式化的码流转换,或者分别执行格式化的码流转换,得到所述至少一路第二格式化码流数据;
其中,对所述至少一路子音频数据中的至少两路子音频数据执行的编码方式和/或格式化的码流转换方式不同。
24.如权利要求17-23任一项所述的发送装置,其特征在于,所述至少一路音频数据来自至少一个收音装置,或者,来自至少一个存储介质。
25.如权利要求24所述的发送装置,其特征在于,所述至少一路音频数据的格式包括CD格式、WAV格式、AIFF格式、MPEG格式、MPEG-4格式、FLAC格式、MP3格式、MIDI格式、WMA格式、RealAudio格式、AAC格式、AMR格式中的至少一个。
26.一种接收装置,其特征在于,包括:
收发单元,用于接收对应至少一路音频数据的公共分量的第一格式化码流数据;接收对应所述至少一路音频数据的至少一路第二格式化码流数据;
处理单元,用于获取所述至少一路音频数据中的第一路音频数据;
其中,所述至少一路第二格式化码流数据是基于所述至少一路音频数据以及所述公共分量得到的。
27.如权利要求26所述的接收装置,其特征在于,所述收发单元用于:
通过至少一个无线通道接收所述第一格式化码流数据以及所述至少一路第二格式化码流数据。
28.如权利要求27所述的接收装置,其特征在于,所述至少一路第二格式化码流数据包括N路第二格式化码流数据,所述至少一个无线通道的数量为N+1。
29.如权利要求26-28任一项所述的接收装置,其特征在于,所述第一格式化码流数据是对所述公共分量进行压缩和/或编码得到的;和/或
所述至少一路第二格式化码流数据是对基于所述至少一路音频数据以及所述公共分量得到的至少一路子音频数据进行压缩和/或编码得到的。
30.如权利要求29所述的接收装置,其特征在于,所述处理单元用于:
对所述至少一路第二格式化码流数据中的第一路第二格式化码流数据以及所述第一格式化码流数据执行解码以及格式化的码流逆转换,或者执行格式化的码流逆转换,得到所述第一路音频数据。
31.如权利要求26-30任一项所述的接收装置,其特征在于,所述至少一路音频数据来自至少一个收音装置,或者,来自至少一个存储介质。
32.如权利要求31所述的接收装置,其特征在于,所述至少一路音频数据的格式包括CD格式、WAV格式、AIFF格式、MPEG格式、MPEG-4格式、FLAC格式、MP3格式、MIDI格式、WMA格式、RealAudio格式、AAC格式、AMR格式中的至少一个。
33.一种通信装置,其特征在于,包括:至少一个处理器和存储器;
所述存储器存储一个或多个计算机程序;
当所述存储器存储的一个或多个计算机程序被所述至少一个处理器执行时,使得所述通信装置执行如权利要求1-9任一所述的方法,或者使得所述通信装置执行如权利要求10-16任一所述的方法。
34.一种芯片,其特征在于,包括至少一个处理器和接口;
所述接口,用于为所述至少一个处理器提供计算机执行指令;
所述至少一个处理器用于执行所述计算机执行指令,实现如权利要求1-9中任一项所述的方法,或者实现如权利要求10-16中任一项所述的方法。
35.一种计算机存储介质,其特征在于,所述计算机可读存储介质用于存储计算机程序,当所述计算机程序在计算机上运行时,使得所述计算机执行如权利要求1-9任一所述的方法,或者使得所述计算机执行如权利要求10-16任一所述的方法。
36.一种通信系统,其特征在于,包括如权利要求17-25中任意一项所述的发送装置、权利要求26-32中任意一项所述的接收装置。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/CN2020/091647 WO2021232376A1 (zh) | 2020-05-21 | 2020-05-21 | 一种音频数据传输方法及相关装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112740708A true CN112740708A (zh) | 2021-04-30 |
CN112740708B CN112740708B (zh) | 2022-07-22 |
Family
ID=75609542
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202080005026.9A Active CN112740708B (zh) | 2020-05-21 | 2020-05-21 | 一种音频数据传输方法及相关装置 |
Country Status (4)
Country | Link |
---|---|
US (1) | US20230072286A1 (zh) |
EP (1) | EP4138396A4 (zh) |
CN (1) | CN112740708B (zh) |
WO (1) | WO2021232376A1 (zh) |
Citations (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1149795A (zh) * | 1995-11-02 | 1997-05-14 | 邝冬英 | 多媒体数字传输广播系统 |
US20030014136A1 (en) * | 2001-05-11 | 2003-01-16 | Nokia Corporation | Method and system for inter-channel signal redundancy removal in perceptual audio coding |
CN101027717A (zh) * | 2004-03-25 | 2007-08-29 | Dts公司 | 无损多通道音频编解码器 |
CN101053017A (zh) * | 2004-11-04 | 2007-10-10 | 皇家飞利浦电子股份有限公司 | 多通道音频信号的编码和解码 |
CN101151659A (zh) * | 2005-03-30 | 2008-03-26 | 皇家飞利浦电子股份有限公司 | 可扩缩多通道音频编码 |
AU2008314029A1 (en) * | 2007-10-17 | 2009-04-23 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio coding using downmix |
CN101433099A (zh) * | 2006-01-05 | 2009-05-13 | 艾利森电话股份有限公司 | 多声道环绕声的个性化解码 |
CN101635145A (zh) * | 2008-07-24 | 2010-01-27 | 华为技术有限公司 | 编解码方法、装置和系统 |
US20100239096A1 (en) * | 2007-10-24 | 2010-09-23 | Jae-Jin Jeon | Apparatus and method for generating binaural beat from stereo audio signal |
CN101944362A (zh) * | 2010-09-14 | 2011-01-12 | 北京大学 | 一种基于整形小波变换的音频无损压缩编码、解码方法 |
CN102138177A (zh) * | 2008-07-30 | 2011-07-27 | 法国电信 | 多通道音频数据的重构 |
WO2012020828A1 (ja) * | 2010-08-13 | 2012-02-16 | 株式会社エヌ・ティ・ティ・ドコモ | オーディオ復号装置、オーディオ復号方法、オーディオ復号プログラム、オーディオ符号化装置、オーディオ符号化方法、及び、オーディオ符号化プログラム |
EP2786594A1 (en) * | 2011-11-30 | 2014-10-08 | Nokia Corporation | Signal processing for audio scene rendering |
CN105071897A (zh) * | 2015-07-03 | 2015-11-18 | 东北大学 | 一种网络实时音频会话媒体数据多径冗余传输方法 |
US9820073B1 (en) * | 2017-05-10 | 2017-11-14 | Tls Corp. | Extracting a common signal from multiple audio signals |
US20180190300A1 (en) * | 2017-01-03 | 2018-07-05 | Nokia Technologies Oy | Adapting A Distributed Audio Recording For End User Free Viewpoint Monitoring |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8050203B2 (en) * | 2004-12-22 | 2011-11-01 | Eleven Engineering Inc. | Multi-channel digital wireless audio system |
CN101448152B (zh) * | 2007-11-28 | 2013-01-02 | 华为终端有限公司 | 多路视频处理方法及系统、终端和媒体服务器 |
CN101924914A (zh) * | 2010-07-21 | 2010-12-22 | 深圳市九洲电器有限公司 | 一种切换电视频道的方法、系统及装置 |
CN102301730B (zh) * | 2011-07-18 | 2014-02-19 | 华为技术有限公司 | 多路音视频传输和处理方法、装置及系统 |
CN103428483B (zh) * | 2012-05-16 | 2017-10-17 | 华为技术有限公司 | 一种媒体数据处理方法及设备 |
KR102614577B1 (ko) * | 2016-09-23 | 2023-12-18 | 삼성전자주식회사 | 전자 장치 및 그 제어 방법 |
CN110138513B (zh) * | 2019-03-26 | 2020-12-29 | 视联动力信息技术股份有限公司 | 一种数据传输方法和视联网系统 |
-
2020
- 2020-05-21 EP EP20937031.1A patent/EP4138396A4/en active Pending
- 2020-05-21 CN CN202080005026.9A patent/CN112740708B/zh active Active
- 2020-05-21 WO PCT/CN2020/091647 patent/WO2021232376A1/zh unknown
-
2022
- 2022-11-17 US US17/989,395 patent/US20230072286A1/en active Pending
Patent Citations (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1149795A (zh) * | 1995-11-02 | 1997-05-14 | 邝冬英 | 多媒体数字传输广播系统 |
US20030014136A1 (en) * | 2001-05-11 | 2003-01-16 | Nokia Corporation | Method and system for inter-channel signal redundancy removal in perceptual audio coding |
CN101027717A (zh) * | 2004-03-25 | 2007-08-29 | Dts公司 | 无损多通道音频编解码器 |
CN101053017A (zh) * | 2004-11-04 | 2007-10-10 | 皇家飞利浦电子股份有限公司 | 多通道音频信号的编码和解码 |
CN101151659A (zh) * | 2005-03-30 | 2008-03-26 | 皇家飞利浦电子股份有限公司 | 可扩缩多通道音频编码 |
CN101433099A (zh) * | 2006-01-05 | 2009-05-13 | 艾利森电话股份有限公司 | 多声道环绕声的个性化解码 |
AU2008314029A1 (en) * | 2007-10-17 | 2009-04-23 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio coding using downmix |
US20100239096A1 (en) * | 2007-10-24 | 2010-09-23 | Jae-Jin Jeon | Apparatus and method for generating binaural beat from stereo audio signal |
CN101635145A (zh) * | 2008-07-24 | 2010-01-27 | 华为技术有限公司 | 编解码方法、装置和系统 |
CN102138177A (zh) * | 2008-07-30 | 2011-07-27 | 法国电信 | 多通道音频数据的重构 |
WO2012020828A1 (ja) * | 2010-08-13 | 2012-02-16 | 株式会社エヌ・ティ・ティ・ドコモ | オーディオ復号装置、オーディオ復号方法、オーディオ復号プログラム、オーディオ符号化装置、オーディオ符号化方法、及び、オーディオ符号化プログラム |
CN101944362A (zh) * | 2010-09-14 | 2011-01-12 | 北京大学 | 一种基于整形小波变换的音频无损压缩编码、解码方法 |
EP2786594A1 (en) * | 2011-11-30 | 2014-10-08 | Nokia Corporation | Signal processing for audio scene rendering |
CN105071897A (zh) * | 2015-07-03 | 2015-11-18 | 东北大学 | 一种网络实时音频会话媒体数据多径冗余传输方法 |
US20180190300A1 (en) * | 2017-01-03 | 2018-07-05 | Nokia Technologies Oy | Adapting A Distributed Audio Recording For End User Free Viewpoint Monitoring |
US9820073B1 (en) * | 2017-05-10 | 2017-11-14 | Tls Corp. | Extracting a common signal from multiple audio signals |
Non-Patent Citations (2)
Title |
---|
HAIYAN SHU: "Normalization of LPC residue for random access frame in audio coding", 《2011 IEEE WORKSHOP ON APPLICATIONS OF SIGNAL PROCESSING TO AUDIO AND ACOUSTICS (WASPAA)》 * |
张瑞生: "多路立体声音频编码系统的设计与实现", 《中国优秀硕士学位论文全文数据库》 * |
Also Published As
Publication number | Publication date |
---|---|
EP4138396A4 (en) | 2023-07-05 |
EP4138396A1 (en) | 2023-02-22 |
WO2021232376A1 (zh) | 2021-11-25 |
CN112740708B (zh) | 2022-07-22 |
US20230072286A1 (en) | 2023-03-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11081117B2 (en) | Methods, apparatus and systems for encoding and decoding of multi-channel Ambisonics audio data | |
TWI466102B (zh) | 用以使經編碼音訊資料之錯誤消隱的方法和裝置 | |
US20200013426A1 (en) | Synchronizing enhanced audio transports with backward compatible audio transports | |
US20210193156A1 (en) | Methods and apparatus for determining for decoding a compressed hoa sound representation | |
US20200120438A1 (en) | Recursively defined audio metadata | |
US10986456B2 (en) | Spatial relation coding using virtual higher order ambisonic coefficients | |
US11081116B2 (en) | Embedding enhanced audio transports in backward compatible audio bitstreams | |
EP3987514A1 (en) | Correlating scene-based audio data for psychoacoustic audio coding | |
US10621995B2 (en) | Methods, apparatus and systems for decoding a higher order ambisonics (HOA) representation of a sound or soundfield | |
CN110880949A (zh) | 一种蓝牙通信方法、装置和系统 | |
CN112740708B (zh) | 一种音频数据传输方法及相关装置 | |
EP3987515B1 (en) | Performing psychoacoustic audio coding based on operating conditions | |
EP3987516B1 (en) | Coding scaled spatial components | |
US10727858B2 (en) | Error resiliency for entropy coded audio data | |
US7620543B2 (en) | Method, medium, and apparatus for converting audio data | |
US20200402523A1 (en) | Psychoacoustic audio coding of ambisonic audio data | |
TWI762949B (zh) | 用於丟失消隱之方法、用於解碼Dirac經編碼音訊場景之方法及對應電腦程式、丟失消隱設備及解碼器 | |
US10573331B2 (en) | Cooperative pyramid vector quantizers for scalable audio coding | |
US10586546B2 (en) | Inversely enumerated pyramid vector quantizers for efficient rate adaptation in audio coding | |
EP4354430A1 (en) | Three-dimensional audio signal processing method and apparatus | |
WO2022258036A1 (zh) | 编解码方法、装置、设备、存储介质及计算机程序 | |
US10559315B2 (en) | Extended-range coarse-fine quantization for audio coding | |
CN116940983A (zh) | 变换空间音频参数 | |
CN117769740A (zh) | 一种音频信号编解码方法及装置、通信系统、通信设备、存储介质 | |
CN116508098A (zh) | 量化空间音频参数 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |