CN109215670B - 音频数据的传输方法、装置、计算机设备和存储介质 - Google Patents

音频数据的传输方法、装置、计算机设备和存储介质 Download PDF

Info

Publication number
CN109215670B
CN109215670B CN201811109869.4A CN201811109869A CN109215670B CN 109215670 B CN109215670 B CN 109215670B CN 201811109869 A CN201811109869 A CN 201811109869A CN 109215670 B CN109215670 B CN 109215670B
Authority
CN
China
Prior art keywords
data
bit stream
attenuation
preset
wavetable
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811109869.4A
Other languages
English (en)
Other versions
CN109215670A (zh
Inventor
袁念德
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xi'an Fengyu Information Technology Co ltd
Original Assignee
Xi'an Fengyu Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xi'an Fengyu Information Technology Co ltd filed Critical Xi'an Fengyu Information Technology Co ltd
Priority to CN201811109869.4A priority Critical patent/CN109215670B/zh
Publication of CN109215670A publication Critical patent/CN109215670A/zh
Application granted granted Critical
Publication of CN109215670B publication Critical patent/CN109215670B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • G10L19/07Line spectrum pair [LSP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • G10L19/038Vector quantisation, e.g. TwinVQ audio

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

本发明提供的音频数据的传输方法、装置、计算机设备和存储介质,通过发送端根据预设的编码方法分别对波表数据、衰减数据和音符表数据进行编码处理后得到比特流数据,然后将该比特流数据发送给接收端,接收端通过接收发送端发送的比特流数据,并根据预设的解码方法对该比特流数据进行解码分析后得到波表数据、衰减数据和音符表数据,然后根据该波表数据、衰减数据和音符表数据合成音频数据,这样,可以实现在低比特数字通信过程中任意音色的音效传输,使得音效合成方法有较好的灵活性,得到的音效种类丰富,从而大大满足了用户需求。

Description

音频数据的传输方法、装置、计算机设备和存储介质
技术领域
本申请涉及低比特率数字通信技术领域,特别是涉及一种音频数据的传输方法、装置、计算机设备和存储介质。
背景技术
在低比特率数字通信中,声码器通常基于分析-合成模型原理实现,即在发送端提取语音信号的特征参数,在接收端根据这些特征参数重新合成出语音信号。
为了实现将特定音效从发送端直接传输到接收端,常用的音效合成方法为基于硬波表的合成方法,该方法是预先在发送端和接收端均存储相同的波表和衰减数据,在信道中传输时,发送端只需发送波表类型,接收端根据波表类型,从内存中获取与波表类型对应的波表和衰减数据,接收端使用该波表类型对应的波表和衰减曲线合成特定音效。
然而,上述基于硬波表的合成方法灵活性较差,得到的音效比较单一,无法满足用户需求。
发明内容
基于此,有必要针对上述基于硬波表的合成方法由于灵活性较差,得到的音效比较单一,从而无法满足用户需求的技术问题,提供一种音频数据的传输方法、装置、计算机设备和存储介质。
第一方面,本发明提供一种音频数据的传输方法,包括:
根据预设的编码方法分别对波表数据、衰减数据和音符表数据进行编码处理,得到比特流数据;所述波表数据包括采样音频数据,所述衰减数据用于表示所述采样音频数据的衰减方式,所述音符表数据包括所述采样音频数据的属性信息;
将所述比特流数据发送给接收端,以使所述接收端根据所述比特流数据合成音频数据。
在其中的一个实施例中,所述根据预设的编码方法分别对波表数据进行编码处理,包括:
采用预设的线性预测编码LPC方法和矢量量化方法,对所述波表数据进行编码处理。
在其中的一个实施例中,所述采用预设的线性预测编码LPC方法和矢量量化方法,对所述波表数据进行编码处理,包括:
采用预设的线性滤波器模型对所述波表数据进行LPC分析,得到LPC参数;
将所述LPC参数转换为线谱对LSP参数;
采用预设的三级矢量量化方法对所述LSP参数进行量化,得到量化后的波表数据。
在其中的一个实施例中,所述根据预设的编码方法对所述衰减数据进行编码处理,包括:
采用预设的拟合方法对所述衰减数据进行处理,获取所述衰减数据对应的传输参数;
对所述传输参数进行量化处理,得到量化后的衰减数据。
在其中的一个实施例中,所述拟合方法为二次函数拟合方法。
在其中的一个实施例中,所述对所述传输参数进行量化处理,得到量化后的衰减数据,包括:
对所述传输参数进行一级矢量量化处理,得到所述量化后的衰减数据。
在其中的一个实施例中,所述音符表数据包括所述采样音频数据中每个音符的偏移时间、音阶、强度和长度中的至少一个。
在其中的一个实施例中,所述比特流数据包括第一比特流数据和第二比特流数据,所述第一比特流数据包括编码后的波表数据和编码后的衰减数据,所述第二比特流数据包括编码后的音符表数据;
所述将所述比特流数据发送给接收端,包括:
将所述第一比特流数据和所述第二比特流数据分别发送给所述接收端。
在其中的一个实施例中,所述将所述第一比特流数据和所述第二比特流数据分别发送给所述接收端,包括:
采用至少两个长度大于预设长度阈值的第一时间帧发送所述第一比特流数据;
采用第二时间帧发送所述第二比特流数据;所述第二时间帧为时序上位于所述第一时间帧之后的时间帧。
在其中的一个实施例中,所述比特流数据包括帧标识,所述帧标识用于指示当前传输所述比特流数据的时间帧是否为语音帧;
若所述当前传输所述比特流数据的时间帧为非语音帧,则所述比特流数据还包括表标识,所述表标识用于指示所述比特流数据为波表数据或音符表数据。
在其中的一个实施例中,所述根据预设的编码方法分别对波表数据、衰减数据和音符表数据进行编码处理,得到比特流数据之前,所述方法还包括:
根据预设的采样频率和长度对原始音频数据进行采样,得到所述采样音频数据。
第二方面,本发明提供一种音频数据的传输方法,包括:
接收发送端发送的比特流数据;
根据预设的解码方法对所述比特流数据进行解码分析,得到波表数据、衰减数据和音符表数据;
根据所述波表数据、所述衰减数据和所述音符表数据,合成音频数据。
在其中的一个实施例中,所述音符表数据包括所述采样音频数据中每个音符的偏移时间、音阶、强度和长度中的至少一个。
在其中的一个实施例中,所述比特流数据包括第一比特流数据和第二比特流数据,所述第一比特流数据包括编码后的波表数据和编码后的衰减数据,所述第二比特流数据包括编码后的音符表数据;
所述接收发送端发送的比特流数据,包括:
分别接收所述发送端发送的所述第一比特流数据和所述第二比特流数据。
在其中的一个实施例中,所述分别接收所述发送端发送的所述第一比特流数据和所述第二比特流数据,包括:
在至少两个长度大于预设长度阈值的第一时间帧接收所述第一比特流数据;
在第二时间帧接收所述第二比特流数据;所述第二时间帧为时序上位于所述第一时间帧之后的语音帧。
在其中的一个实施例中,所述比特流数据包括帧标识,所述帧标识用于指示当前传输所述比特流数据的时间帧是否为语音帧;
若所述当前传输所述比特流数据的时间帧为非语音帧,则所述比特流数据还包括表标识,所述表标识用于指示所述比特流数据为波表数据或音符表数据。
第三方面,本发明提供一种音频数据的传输装置,包括:
处理模块,用于根据预设的编码方法分别对波表数据、衰减数据和音符表数据进行编码处理,得到比特流数据;所述波表数据包括采样音频数据,所述衰减数据用于表示所述采样音频数据的衰减方式,所述音符表数据包括所述采样音频数据的属性信息;
发送模块,用于将所述比特流数据发送给接收端,以使所述接收端根据所述比特流数据合成音频数据。
第四方面,本发明提供一种音频数据的传输装置,包括:
接收模块,用于接收发送端发送的比特流数据;
解码模块,用于根据预设的解码方法对所述比特流数据进行解码分析,得到波表数据、衰减数据和音符表数据;
合成模块,用于根据所述波表数据、所述衰减数据和所述音符表数据,合成音频数据。
第五方面,本发明提供一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时用于实现以下步骤:
根据预设的编码方法分别对波表数据、衰减数据和音符表数据进行编码处理,得到比特流数据;所述波表数据包括采样音频数据,所述衰减数据用于表示所述采样音频数据的衰减方式,所述音符表数据包括所述采样音频数据的属性信息;
将所述比特流数据发送给接收端,以使所述接收端根据所述比特流数据合成音频数据。
第六方面,本发明提供一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时用于实现以下步骤:
接收发送端发送的比特流数据;
根据预设的解码方法对所述比特流数据进行解码分析,得到波表数据、衰减数据和音符表数据;
根据所述波表数据、所述衰减数据和所述音符表数据,合成音频数据。
第七方面,本发明提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时用于实现以下步骤:
根据预设的编码方法分别对波表数据、衰减数据和音符表数据进行编码处理,得到比特流数据;所述波表数据包括采样音频数据,所述衰减数据用于表示所述采样音频数据的衰减方式,所述音符表数据包括所述采样音频数据的属性信息;
将所述比特流数据发送给接收端,以使所述接收端根据所述比特流数据合成音频数据。
第八方面,本发明提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时用于实现以下步骤:
接收发送端发送的比特流数据;
根据预设的解码方法对所述比特流数据进行解码分析,得到波表数据、衰减数据和音符表数据;
根据所述波表数据、所述衰减数据和所述音符表数据,合成音频数据。
本申请提供的音频数据的传输方法、装置、计算机设备和存储介质,通过发送端根据预设的编码方法分别对波表数据、衰减数据和音符表数据进行编码处理后得到比特流数据,然后将该比特流数据发送给接收端,接收端通过接收发送端发送的比特流数据,并根据预设的解码方法对该比特流数据进行解码分析后得到波表数据、衰减数据和音符表数据,然后根据该波表数据、衰减数据和音符表数据合成音频数据,从而实现在低比特数字通信过程中任意音色的音效传输,使得音效合成方法有较好的灵活性,得到的音效种类丰富,从而大大满足了用户需求。
附图说明
图1为一个实施例中音频数据的传输方法的应用环境结构示意图;
图2为一个实施例中音频数据的传输方法的流程示意图;
图2.1为一个实施例提供的一种波表数据的波形示意图;
图2.2为一个实施例提供的一种衰减数据的波形示意图;
图3为一个实施例中音频数据的传输方法的流程示意图;
图4为一个实施例中音频数据的传输方法的流程示意图;
图5为一个实施例中提供的一端音效示意图;
图6为一个实施例中音频数据的传输方法的流程示意图;
图7为一个实施例中音频数据的传输装置的结构示意图;
图8为一个实施例中音频数据的传输装置的结构示意图;
图9为一个实施例中音频数据的传输装置的结构示意图;
图10为一个实施例中音频数据的传输装置的结构示意图;
图11为一个实施例中音频数据的传输装置的结构示意图;
图12为一个实施例中音频数据的传输装置的结构示意图;
图13为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请提供的音频数据的传输方法,可以应用于如图1所示的音频数据的传输系统的应用环境中。其中,发送端和接收端均可以为终端、服务器、计算机设备等,发送端和接收端还可以是一个设备的两个模块。发送端与接收端进行通信,例如:发送端将音频数据通过编码算法进行编码生成比特流中,接收端再从比特流中恢复音频数据,这样就可以实现在低比特数字通信过程中进行音频传输。
本申请实施例提供一种音频数据的传输方法、系统、装置、计算机设备和存储介质,旨在解决传统技术中基于硬波表的合成方法由于灵活性较差,得到的音效比较单一,从而无法满足用户需求的技术问题。下面将通过实施例并结合附图具体地对本申请的技术方案以及本申请的技术方案如何解决上述技术问题进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。需要说明的是,下述图2至图4中所示实施例的执行主体为发送端,图5至6中所示实施例的执行主体为接收端。
在一个实施例中,如图2所示,提供了一种音频数据的传输方法,本实施例涉及的是发送端根据预设的编码方法分别对波表数据、衰减数据和音符表数据进行编码处理,得到比特流数据并将其发送给接收端的具体过程。如图2所示,该方法包括:
S101、根据预设的编码方法分别对波表数据、衰减数据和音符表数据进行编码处理,得到比特流数据;波表数据包括采样音频数据,衰减数据用于表示采样音频数据的衰减方式,音符表数据包括采样音频数据的属性信息。
本实施例中,波表数据包括采样音频数据,该采样音频数据可以是对原始音频数据进行采样得到的音频数据,例如:如图2.1所示为一段预先采样好的波表数据,其中,横坐标表示时刻,纵坐标表示的是振幅,该波表数据可以表示采样音频数据中每个时刻的振幅大小。衰减数据表示采样音频数据的衰减方式,其可以是按照预先设定的衰减速率衰减,例如:如图2.2所示为一段预先设置的衰减数据,其中横坐标表示时刻,纵坐标表示振幅。音符表数据包括所述采样音频数据的属性信息,其可以是一段音效依时间排列的音符,以及每个音符播放的时间,其中,每个音符可以是由预先采样好的音符采样数据通过不同的播放速率并按照给定的衰减速率产生的。其中,波表数据、衰减数据和音符表可以是用户提前采样后存储在flash中,也可以是实时获取的,本实施例对以上波表数据、衰减数据和音符表的采样方式、存储方式以及具体表示形式不做限定。
示例性的,预设的编码方法可以为线性预测编码(linear predictive coding,LPC)编码方法、矢量量化方法、码本量化方法等。例如,采用线性滤波器模型对波表数据进行LPC系数分析,对分析后的LPC系数进行矢量量化;也可以采用矢量量化方法对衰减数据和音符表数据进行量化。此外,由于该需要编码的波表数据是提前采样的、是已知频率和幅度的波形,所以发送端可以通过调整编码模块的参数省去清浊判决、增益检测、基音检测等无关步骤。
示例性的,音符表可以是对每段音效由按时间顺序排列的音符组成,可选地,音符表数据包括所述采样音频数据中每个音符的偏移时间、音阶、强度和长度中的至少一个。表1为本实施例提供的一种音符表数据,如表1所示,每个音符采用14bit表示。如表1所示,可以使用2bit表示偏移时间,范围为0-3,单位为5毫秒。使用6bit表示音符的音阶,即频率,音阶的范围为0-63,其中63代表空闲音符,0-62代表不同的音高。使用2bit表示每个音符的强度,共分4个等级,不同的强度对应的音符起始幅度。使用4bit表示音符的长短,对应衰减速度的不同。
表1
内容 Bit数
偏移时间 2
音阶 6
强度 2
长短 4
S102、将比特流数据发送给接收端,以使接收端根据比特流数据合成音频数据。
基于上述步骤S101中发送端根据预设的编码方法分别对波表数据、衰减数据和音符表数据进行编码处理后得到比特流数据,发送端将该比特流数据发送给接收端,接收端接收到该比特流数据后,按照预先设置的与发送端的编码方法适配的解码方法,从比特流数据中解码出波表数据、衰减数据和音符表数据,然后按照音频数据的合成规则,根据波表数据、衰减数据和音符表数据合成需要的音频数据。
本实施例提供的一种音频数据的传输方法,通过发送端根据预设的编码方法分别对波表数据、衰减数据和音符表数据进行编码处理后得到比特流数据,然后将该比特流数据发送给接收端,以使所述接收端根据所述比特流数据合成音频数据,由于发送端直接将波表数据、衰减数据和音符表数据进行编码形成比特流数据发送给接收端,发送端可以根据实际需求实时的发送各种音效对应的波表数据、衰减数据和音符表数据,使得接收端可以根据波表数据、衰减数据和音符表数据灵活的合成各种音效,得到的音效种类丰富,从而大大满足了用户需求。
可选地,在图2所示实施例的基础上,根据预设的编码方法分别对波表数据进行编码处理,包括:采用预设的LPC方法和矢量量化方法,对波表数据进行编码处理。
在本实施例中,预设的LPC方法可以是采用N阶线性滤波器来实现,矢量量化方法可以采用三级码本矢量量化方法、四级码本矢量量化方法等。可选地,如图3所示,上述步骤“采用预设的LPC方法和矢量量化方法,对波表数据进行编码处理”的一种可能的实现方式包括以下步骤:
S201、采用预设的线性滤波器模型对波表数据进行LPC分析,得到LPC参数。
本实施例中,发送端可以采用预设的线性滤波器模型对该波表数据进行LPC分析,也可以是其他方式,本实施例对此不做限定。其中,预设的线性滤波器模型可以是10阶线性滤波器模型,基于该10阶线性滤波器模型,发送端得到LPC参数。
S202、将LPC参数转换为LSP参数。
本实施例中,基于上述步骤S201中,发送端根据预设的线性滤波器模型得到的LPC参数,将该LPC参数转换为LSP参数,其中将该LPC参数转换为LSP参数的方式可以参照现有的转换方法,本实施例不做限定。
S203、采用预设的三级矢量量化方法对LSP参数进行量化,得到量化后的波表数据。
基于上述步骤S202中,发送端得到的LSP参数,对该LSP参数进行量化,其中对该LSP参数量化的方式可以是采用预设的三级矢量量化方法对该LSP进行量化,例如,采用预设的7-6-6比特的三级矢量量化码本对该LSP参数进行量化,可以量化为15bit,或者,采用预设的四级矢量量化码本对该LSP参数进行量化等。对于该LSP参数的量化也可以采用其他方式,本实施例对此不做限定。该LSP参数的量化值即为量化后的波表数据。可选地,发送端对波表数据的编码可以复用声码器的编码模块中的LPC参数分析和量化模块。
本实施例提供的一种音频数据的传输方法,通过采用预设的线性滤波器模型对所述波表数据进行LPC分析,并得到LPC参数,然后将所述LPC参数转换为LSP参数,再采用预设的三级矢量量化方法对所述LSP参数进行量化,最终得到量化后的波表数据,由于要编码的波表数据为已知频率和幅度的波形,可以通过调整编码模块的参数省去清浊判决、增益检测、基音检测等无关步骤,该编码方式简单,易于实现,不论是硬件还是软件的成本均比较低。
图4为一个实施例中音频数据的传输方法的流程示意图,该方法涉及的是衰减数据的编码过程。如图4所示,步骤“根据预设的编码方法对衰减数据进行编码处理”的一种可能的实现方式包括以下:
S301、采用预设的拟合方法对衰减数据进行处理,获取衰减数据对应的传输参数。
本实施例中,发送端可以采用预设的拟合方法对衰减数据进行处理,也可以采用其他方式,本实施例对此不做限定。可选地,该拟合方法可以为二次函数拟合方法,例如:对衰减数据使用二次函数(y=ax2+bx+c)进行拟合,获取传输的衰减参数,也可以是其他拟合方法,本实施例对此不做限定。S302、对所述传输参数进行量化处理,得到量化后的衰减数据。
在本实施例中,基于上述步骤S301中获取的衰减数据处理过程中对应的传输参数,发送端对该传输参数进行量化处理,得到量化后的衰减数据。可选地,对传输参数进行量化处理,得到量化后的衰减数据,包括:对该传输参数进行一级矢量量化处理,得到量化后的衰减数据。例如:对衰减数据使用二次函数拟合(y=ax2+bx+c),其中,传输参数为a、b、c,使用一级矢量量化方法对传输参数a、b、c进行量化,得到8bit的量化结果即为量化后的衰减数据。
本实施例提供的一种音频数据的传输方法,通过采用预设的拟合方法对衰减数据进行处理,并获取该衰减数据对应的传输参数,再对该传输参数进行量化处理,然后得到量化后的衰减数据,从而使得低比特数字通信中可以传输任意音色音效,使得音效合成方法有较好的灵活性,得到的音效比较丰富,从而大大满足了用户需求。
在一个实施例中,发送端可以在不同的时间帧上发送比特流数据,例如,若比特流数据包括第一比特流数据和第二比特流数据,其中第一比特流数据包括编码后的波表数据和编码后的衰减数据,第二比特流数据包括编码后的音符表数据;可选地,上述步骤S102“将所述比特流数据发送给接收端”包括:将所述第一比特流数据和所述第二比特流数据分别发送给所述接收端。
本实施例中,发送端可以在同一个时间帧将第一比特流数据和第二比特流数据分别发送给接收端,发送端也可以在不同的时间帧将第一比特流数据和第二比特流数据分别发送给接收端。例如,发送端在前两个时间帧发送第一比特流数据,在第四个时间帧发送第二比特流数据。
可选地,步骤“将第一比特流数据和第二比特流数据分别发送给接收端”包括:采用至少两个长度大于预设长度阈值的第一时间帧发送所述第一比特流数据;再采用第二时间帧发送所述第二比特流数据;所述第二时间帧为时序上位于所述第一时间帧之后的时间帧。
本实施例中,可以在每次音效传输的起始,采用至少2个长度大于20ms的语音帧发送第一比特流数据,然后接收端根据此两帧编码数据合成40ms的波表数据,包含320个采样点,5个周期。其中,使用两个20ms帧传输波表数据和衰减数据,每20ms数据携带160点的波表数据,衰减数据可以在第二个20ms帧中传输。然后在之后的语音帧中发送第二比特流数据。可选地,第二时间帧的长度为20ms,每20ms的48bit传输最多3个音符表数据,当某个20ms内不满3个音符表数据时传输空闲数据。
本实施例提供的音频数据的传输方法,通过对比特流数据分为包括编码后的波表数据和编码后的衰减数据的第一比特流数据,和包括编码后音符表数据的第二比特流数据,然后发送端将该第一比特流数据和第二比特流数据分别发送给接收端,这样,在发送的时候采用至少两个长度大于预设长度阈值的第一时间帧发送所述第一比特流数据,第二时间帧发送所述第二比特流数据,从而使得接收端可以准确的判断该语音信号的类型,从而方便实现在低比特数字通信中可以传输任意音色音效,使得音效合成方法有较好的灵活性,得到的音效比较丰富,从而大大满足了用户需求。
可选地,上述比特流数据包括帧标识,该帧标识用于指示当前传输比特流数据的时间帧是否为语音帧;若当前传输所述比特流数据的时间帧为非语音帧,则比特流数据还包括表标识,该表标识用于指示比特流数据为波表数据或音符表数据。
例如,在2400bps的传输速率下,如果对语音信号按照20ms分帧,每一帧对应48bit。从48bit中分配至少1bit用来表示该帧是语音帧还是非语音帧。当传输音效时(非语音),从剩下的47bit中再分配1bit用以表示该帧代表的是波表数据还是音符表。其中,该帧标识可以是固定标识,也可以其他标识,其中,该固定标识可以是阿拉伯数字组成,也可以是英文字母组成,还可以是阿拉伯数字与英文字母的组合,本实施例对该帧标识不做限定,只要能区分该时间帧是否为语音帧即可。对应的,该表标识本实施例也不做限定,可以是阿拉伯数字组成,也可以是英文字母组成,还可以是阿拉伯数字与英文字母的组合。
可选地,在图2所示实施例的基础上,S101“根据预设的编码方法分别对波表数据、衰减数据和音符表数据进行编码处理,得到比特流数据”之前,该方法还包括:根据预设的采样频率和长度对原始音频数据进行采样,得到采样音频数据。
在本实施例中,为了满足波表数据通过声码器编码,可以先对原始音频信号进行预处理,例如:根据8Khz的采样频率和16bit的长度与原始音频信号进行采样,得到波表数据,则波表采样的音符频率为125hz。
本申请提供的实施例中,可选地,上述发送端根据预设的编码方法分别对波表数据、衰减数据和音符表数据进行编码处理,得到比特流数据之前,该方法还包括:根据预设的采样频率和长度对原始音频数据进行采样,得到所述采样音频数据。其中,该预设的采样频率和长度本实施例对此不做限定,只要符合实际需求即可,基于该预设的采样频率和长度,发送端对原始的音频数据进行波表数据采样、衰减数据采样和音符表数据采样,以便之后发送端对该三个采样数据进行编码处理。
图5为本实施例提供的一端音效示意图,表2为本实施例提供的另一种音符表数据,下面以图5和表2为例,详细说明本申请实施例提供的音频数据的传输方法。在本实施例中,按照标准音阶,1对应261hz,2对应293hz,3对应329hz,按照编码规则,使用数字12代表标准音阶的6(la),其对应440hz。假设每个音符间隔为0.5秒,前四个音符对应的音符表如表2所示,第一个20ms帧传输音符1,偏移时间为0,第26个帧传输第二个音符,偏移为0,依次类推。
表2
Figure BDA0001808806300000151
Figure BDA0001808806300000161
在一个实施例中,如图5所示,提供了一种音频数据的传输方法,本实施例涉及的是接收端根据比特流数据对比特流数据解码分析,并得到波表数据、衰减数据和音符表数据的具体过程。如图6所示,该方法包括:
S401、接收发送端发送的比特流数据。
本实施例中,比特流数据可以是发送端根据预设的编码方法,分别对波表数据、衰减数据和音符表数据进行编码处理后得到比特流数据。基于上述S102中发送端发送的比特流数据,接收端接收该比特流数据。
S402、根据预设的解码方法对所述比特流数据进行解码分析,得到波表数据、衰减数据和音符表数据。
基于上述步骤S401中接收端接收的比特流数据,接收端根据预设的解码方法对该比特流数据进行解码分析,从比特流数据中恢复发送端发送过来的波表数据、衰减数据和音符表数据。
S403、根据所述波表数据、所述衰减数据和所述音符表数据,合成音频数据。
基于上述步骤S402中接收端根据发送端发送的比特流数据中恢复的波表数据、衰减数据和音符表数据合成音频数据。
本实施例提供的音频数据的传输方法,接收端通过接收发送端发送的比特流数据,并根据预设的解码方法对该比特流数据进行解码分析后得到波表数据、衰减数据和音符表数据,然后根据该波表数据、衰减数据和音符表数据合成音频数据,这样,接收端从比特流数据中恢复波表数据、衰减曲线和音符表数据,合成完整的音频数据,从而使得发送端发送的具有丰富音色的音效可以完整的传输出来,实现在低比特数字通信过程中任意音色的音效传输,使得音效合成方法有较好的灵活性,得到的音效种类丰富,大大满足了用户需求。
可选地,在一个实施例中,上述音符表数据包括所述采样音频数据中每个音符的偏移时间、音阶、强度和长度中的至少一个。
在一个实施例中,比特流数据包括第一比特流数据和第二比特流数据,所述第一比特流数据包括编码后的波表数据和编码后的衰减数据,所述第二比特流数据包括编码后的音符表数据;上述步骤S401“接收发送端发送的比特流数据”包括:分别接收所述发送端发送的所述第一比特流数据和所述第二比特流数据。
可选地,步骤“分别接收所述发送端发送的所述第一比特流数据和所述第二比特流数据”,包括:在至少两个长度大于预设长度阈值的第一时间帧接收所述第一比特流数据;在第二时间帧接收所述第二比特流数据;所述第二时间帧为时序上位于所述第一时间帧之后的语音帧。
可选地,上述比特流数据包括帧标识,所述帧标识用于指示当前传输所述比特流数据的时间帧是否为语音帧;若所述当前传输所述比特流数据的时间帧为非语音帧,则所述比特流数据还包括表标识,所述表标识用于指示所述比特流数据为波表数据或音符表数据。其中,该帧标识可以是固定标识,也可以其他标识,其中,该固定标识可以是阿拉伯数字组成,也可以是英文字母组成,还可以是阿拉伯数字与英文字母的组合,本实施例对该帧标识不做限定,只要能区分该时间帧是否为语音帧即可。对应的,该表标识本实施例也不做限定,可以是阿拉伯数字组成,也可以是英文字母组成,还可以是阿拉伯数字与英文字母的组合。
需要说明的是,图6所示的接收端对应的音频数据的传输方法的实现原理和有益效果,可以参照图2-图5实施例中的发端端对应的音频数据的传输方法的实现原理和有益效果,此处不再赘述。
应该理解的是,虽然图2-6的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2-6中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图7为一实施例提供的一种音频数据的传输装置结构示意图,如图7所示,该装置包括:处理模块10、发送模块11。
处理模块10,用于根据预设的编码方法分别对波表数据、衰减数据和音符表数据进行编码处理,得到比特流数据;所述波表数据包括采样音频数据,所述衰减数据用于表示所述采样音频数据的衰减方式,所述音符表数据包括所述采样音频数据的属性信息;
发送模块11,用于将所述比特流数据发送给接收端,以使所述接收端根据所述比特流数据合成音频数据。
上述实施例提供的音频数据的传输装置,其实现原理和技术效果与上述方法实施例类似,在此不再赘述。
在一个实施例中,上述处理模块10具体用于采用预设的线性预测编码LPC方法和矢量量化方法,对所述波表数据进行编码处理。
在一个实施例中,图8为一实施例提供的一种音频数据的传输装置结构示意图,如图8所示,处理模块10包括分析子单元101、转换子单元102和第一量化子单元103,其中:
分析子单元101,用于采用预设的线性滤波器模型对所述波表数据进行LPC分析,得到LPC参数;
转换子单元102,用于将所述LPC参数转换为LSP参数;
第一量化子单元103,用于采用预设的三级矢量量化方法对所述LSP参数进行量化,得到量化后的波表数据。
上述实施例提供的音频数据的传输装置,其实现原理和技术效果与上述方法实施例类似,在此不再赘述。
在一个实施例中,处理模块10根据预设的编码方法对所述衰减数据进行编码处理,具体包括:处理模块10具体用于采用预设的拟合方法对所述衰减数据进行处理,获取所述衰减数据对应的传输参数;对所述传输参数进行量化处理,得到量化后的衰减数据。
在一个实施例中,所述拟合方法可以为二次函数拟合方法。
在一个实施例中,处理模块10对所述传输参数进行量化处理,得到量化后的衰减数据,包括,处理模块10对所述传输参数进行一级矢量量化处理,得到量化后的衰减数据。
在一个实施例中,所述音符表数据包括所述采样音频数据中每个音符的偏移时间、音阶、强度和长度中的至少一个。
在一个实施例中,所述比特流数据包括第一比特流数据和第二比特流数据,所述第一比特流数据包括编码后的波表数据和编码后的衰减数据,所述第二比特流数据包括编码后的音符表数据;所述发送模块11具体用于将所述第一比特流数据和所述第二比特流数据分别发送给所述接收端。
上述实施例提供的音频数据的传输装置,其实现原理和技术效果与上述方法实施例类似,在此不再赘述。
在一个实施例中,图9为一实施例提供的一种音频数据的传输装置结构示意图,如图9所示,上述发送模块11包括:第一发送子单元111和第二发送子单元112,其中:
第一发送子单元111,用于采用至少两个长度大于预设长度阈值的第一时间帧发送所述第一比特流数据;
第二发送子单元112,用于采用第二时间帧发送所述第二比特流数据;所述第二时间帧为时序上位于所述第一时间帧之后的时间帧。
可选地,本实施例中,比特流数据包括帧标识,所述帧标识用于指示当前传输所述比特流数据的时间帧是否为语音帧;若所述当前传输所述比特流数据的时间帧为非语音帧,则所述比特流数据还包括表标识,所述表标识用于指示所述比特流数据为波表数据或音符表数据。
在一个实施例中,如图10所示,本装置还包括采样模块12,用于根据预设的采样频率和长度对原始音频数据进行采样,得到所述采样音频数据。
上述实施例提供的音频数据的传输装置,其实现原理和技术效果与上述方法实施例类似,在此不再赘述。
在一个实施例中,图11为一实施例提供的一种音频数据的传输装置结构示意图,如图11所示,该装置包括:接收模块13、解码模块14和合成模块15。
接收模块13,用于接收发送端发送的比特流数据;
解码模块14,用于根据预设的解码方法对所述比特流数据进行解码分析,得到波表数据、衰减数据和音符表数据;
合成模块15,用于根据所述波表数据、所述衰减数据和所述音符表数据,合成音频数据。
上述实施例提供的音频数据的传输装置,其实现原理和技术效果与上述方法实施例类似,在此不再赘述。
可选地,上述实施例中音符表数据包括所述采样音频数据中每个音符的偏移时间、音阶、强度和长度中的至少一个。
在一个实施例中,接收模块13具体用于分别接收所述发送端发送的所述第一比特流数据和所述第二比特流数据。
在一个实施例中,参见图12,接收模块13可以包括:第一接收子单元131,用于在至少两个长度大于预设长度阈值的第一时间帧接收所述第一比特流数据;第二接收子单元132,用于在第二时间帧接收所述第二比特流数据;所述第二时间帧为时序上位于所述第一时间帧之后的语音帧。
可选地,本实施例中比特流数据包括帧标识,所述帧标识用于指示当前传输所述比特流数据的时间帧是否为语音帧;若所述当前传输所述比特流数据的时间帧为非语音帧,则所述比特流数据还包括表标识,所述表标识用于指示所述比特流数据为波表数据或音符表数据。
上述实施例提供的音频数据的传输装置,其实现原理和技术效果与上述方法实施例类似,在此不再赘述。
关于音频数据的传输装置的具体限定可以参见上文中对于音频数据的传输方法的限定,在此不再赘述。上述音频数据的传输装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是终端,其内部结构图可以如图13所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口、显示屏和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种设备的调试方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
本领域技术人员可以理解,图13中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时用于实现以下步骤:
根据预设的编码方法分别对波表数据、衰减数据和音符表数据进行编码处理,得到比特流数据;所述波表数据包括采样音频数据,所述衰减数据用于表示所述采样音频数据的衰减方式,所述音符表数据包括所述采样音频数据的属性信息;
将所述比特流数据发送给接收端,以使所述接收端根据所述比特流数据合成音频数据。
上述实施例提供的计算机设备,其实现原理和技术效果与上述方法实施例类似,在此不再赘述。
在一个实施例中,提供一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时用于实现以下步骤:
接收发送端发送的比特流数据;
根据预设的解码方法对所述比特流数据进行解码分析,得到波表数据、衰减数据和音符表数据;
根据所述波表数据、所述衰减数据和所述音符表数据,合成音频数据。
上述实施例提供的计算机设备,其实现原理和技术效果与上述方法实施例类似,在此不再赘述。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时用于实现以下步骤:
根据预设的编码方法分别对波表数据、衰减数据和音符表数据进行编码处理,得到比特流数据;所述波表数据包括采样音频数据,所述衰减数据用于表示所述采样音频数据的衰减方式,所述音符表数据包括所述采样音频数据的属性信息;
将所述比特流数据发送给接收端,以使所述接收端根据所述比特流数据合成音频数据。
上述实施例提供的计算机可读存储介质,其实现原理和技术效果与上述方法实施例类似,在此不再赘述。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时用于实现以下步骤:
接收发送端发送的比特流数据;
根据预设的解码方法对所述比特流数据进行解码分析,得到波表数据、衰减数据和音符表数据;
根据所述波表数据、所述衰减数据和所述音符表数据,合成音频数据。
上述实施例提供的计算机可读存储介质,其实现原理和技术效果与上述方法实施例类似,在此不再赘述。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。

Claims (20)

1.一种音频数据的传输方法,其特征在于,所述传输方法包括:
根据预设的编码方法分别对波表数据、衰减数据和音符表数据进行编码处理,得到比特流数据;所述波表数据包括采样音频数据,所述衰减数据用于表示所述采样音频数据的振幅的衰减方式,所述音符表数据包括所述采样音频数据的属性信息;
将所述比特流数据发送给接收端,以使所述接收端根据所述比特流数据合成音频数据。
2.根据权利要求1所述的方法,其特征在于,所述根据预设的编码方法分别对波表数据进行编码处理,包括:
采用预设的线性预测编码LPC方法和矢量量化方法,对所述波表数据进行编码处理。
3.根据权利要求2所述的方法,其特征在于,所述采用预设的线性预测编码LPC方法和矢量量化方法,对所述波表数据进行编码处理,包括:
采用预设的线性滤波器模型对所述波表数据进行LPC分析,得到LPC参数;
将所述LPC参数转换为线谱对LSP参数;
采用预设的三级矢量量化方法对所述LSP参数进行量化,得到量化后的波表数据。
4.根据权利要求1-3任一项所述的方法,其特征在于,所述根据预设的编码方法对所述衰减数据进行编码处理,包括:
采用预设的拟合方法对所述衰减数据进行处理,获取所述衰减数据对应的传输参数;
对所述传输参数进行量化处理,得到量化后的衰减数据。
5.根据权利要求4所述的方法,其特征在于,所述拟合方法为二次函数拟合方法。
6.根据权利要求4所述的方法,其特征在于,所述对所述传输参数进行量化处理,得到量化后的衰减数据,包括:
对所述传输参数进行一级矢量量化处理,得到所述量化后的衰减数据。
7.根据权利要求1-3任一项所述的方法,其特征在于,所述音符表数据包括所述采样音频数据中每个音符的偏移时间、音阶、强度和长度中的至少一个。
8.根据权利要求1-3任一项所述的方法,其特征在于,所述比特流数据包括第一比特流数据和第二比特流数据,所述第一比特流数据包括编码后的波表数据和编码后的衰减数据,所述第二比特流数据包括编码后的音符表数据;
所述将所述比特流数据发送给接收端,包括:
将所述第一比特流数据和所述第二比特流数据分别发送给所述接收端。
9.根据权利要求8所述的方法,其特征在于,所述将所述第一比特流数据和所述第二比特流数据分别发送给所述接收端,包括:
采用至少两个长度大于预设长度阈值的第一时间帧发送所述第一比特流数据;
采用第二时间帧发送所述第二比特流数据;所述第二时间帧为时序上位于所述第一时间帧之后的时间帧。
10.根据权利要求1-3任一项所述的方法,其特征在于,所述比特流数据包括帧标识,所述帧标识用于指示当前传输所述比特流数据的时间帧是否为语音帧;
若所述当前传输所述比特流数据的时间帧为非语音帧,则所述比特流数据还包括表标识,所述表标识用于指示所述比特流数据为波表数据或音符表数据。
11.根据权利要求1-3任一项所述的方法,其特征在于,所述根据预设的编码方法分别对波表数据、衰减数据和音符表数据进行编码处理,得到比特流数据之前,所述方法还包括:
根据预设的采样频率和长度对原始音频数据进行采样,得到所述采样音频数据。
12.一种音频数据的传输方法,其特征在于,所述传输方法包括:
接收发送端发送的比特流数据;
根据预设的解码方法对所述比特流数据进行解码分析,得到波表数据、衰减数据和音符表数据;所述波表数据包括采样音频数据,所述衰减数据用于表示所述采样音频数据的振幅的衰减方式,所述音符表数据包括所述采样音频数据的属性信息;
根据所述波表数据、所述衰减数据和所述音符表数据,合成音频数据。
13.根据权利要求12所述的方法,其特征在于,所述音符表数据包括所述采样音频数据中每个音符的偏移时间、音阶、强度和长度中的至少一个。
14.根据权利要求12或13所述的方法,其特征在于,所述比特流数据包括第一比特流数据和第二比特流数据,所述第一比特流数据包括编码后的波表数据和编码后的衰减数据,所述第二比特流数据包括编码后的音符表数据;
所述接收发送端发送的比特流数据,包括:
分别接收所述发送端发送的所述第一比特流数据和所述第二比特流数据。
15.根据权利要求14所述的方法,其特征在于,所述分别接收所述发送端发送的所述第一比特流数据和所述第二比特流数据,包括:
在至少两个长度大于预设长度阈值的第一时间帧接收所述第一比特流数据;
在第二时间帧接收所述第二比特流数据;所述第二时间帧为时序上位于所述第一时间帧之后的语音帧。
16.根据权利要求12或13所述的方法,其特征在于,所述比特流数据包括帧标识,所述帧标识用于指示当前传输所述比特流数据的时间帧是否为语音帧;
若所述当前传输所述比特流数据的时间帧为非语音帧,则所述比特流数据还包括表标识,所述表标识用于指示所述比特流数据为波表数据或音符表数据。
17.一种音频数据的传输装置,其特征在于,所述传输装置包括:
处理模块,用于根据预设的编码方法分别对波表数据、衰减数据和音符表数据进行编码处理,得到比特流数据;所述波表数据包括采样音频数据,所述衰减数据用于表示所述采样音频数据的振幅的衰减方式,所述音符表数据包括所述采样音频数据的属性信息;
发送模块,用于将所述比特流数据发送给接收端,以使所述接收端根据所述比特流数据合成音频数据。
18.一种音频数据的传输装置,其特征在于,所述传输装置包括:
接收模块,用于接收发送端发送的比特流数据;
解码模块,用于根据预设的解码方法对所述比特流数据进行解码分析,得到波表数据、衰减数据和音符表数据;所述波表数据包括采样音频数据,所述衰减数据用于表示所述采样音频数据的振幅的衰减方式,所述音符表数据包括所述采样音频数据的属性信息;
合成模块,用于根据所述波表数据、所述衰减数据和所述音符表数据,合成音频数据。
19.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至16中任一项所述方法的步骤。
20.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至16中任一项所述的方法的步骤。
CN201811109869.4A 2018-09-21 2018-09-21 音频数据的传输方法、装置、计算机设备和存储介质 Active CN109215670B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811109869.4A CN109215670B (zh) 2018-09-21 2018-09-21 音频数据的传输方法、装置、计算机设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811109869.4A CN109215670B (zh) 2018-09-21 2018-09-21 音频数据的传输方法、装置、计算机设备和存储介质

Publications (2)

Publication Number Publication Date
CN109215670A CN109215670A (zh) 2019-01-15
CN109215670B true CN109215670B (zh) 2021-01-29

Family

ID=64985436

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811109869.4A Active CN109215670B (zh) 2018-09-21 2018-09-21 音频数据的传输方法、装置、计算机设备和存储介质

Country Status (1)

Country Link
CN (1) CN109215670B (zh)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1271216A (zh) * 1999-04-16 2000-10-25 松下电器产业株式会社 语音声音通信系统
JP2000332862A (ja) * 1999-05-24 2000-11-30 Nec Telecom Syst Ltd 携帯電話機及びその着信音の作成並びに発生方法
JP2002215142A (ja) * 2001-01-17 2002-07-31 Dainippon Printing Co Ltd 音響信号の符号化方法
CN1898724A (zh) * 2003-12-26 2007-01-17 松下电器产业株式会社 语音/乐音编码设备及语音/乐音编码方法
CN101004908A (zh) * 2006-11-28 2007-07-25 吕硕 音阶旋律编码
CN101939781A (zh) * 2008-01-04 2011-01-05 杜比国际公司 音频编码器和解码器
US20140114652A1 (en) * 2012-10-24 2014-04-24 Fujitsu Limited Audio coding device, audio coding method, and audio coding and decoding system
CN107077858A (zh) * 2014-07-28 2017-08-18 弗劳恩霍夫应用研究促进协会 使用具有全带隙填充的频域处理器以及时域处理器的音频编码器和解码器

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3139602B2 (ja) * 1995-03-24 2001-03-05 日本電信電話株式会社 音響信号符号化方法及び復号化方法
JP5471138B2 (ja) * 2009-08-06 2014-04-16 大日本印刷株式会社 音素符号変換装置および音声合成装置

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1271216A (zh) * 1999-04-16 2000-10-25 松下电器产业株式会社 语音声音通信系统
JP2000332862A (ja) * 1999-05-24 2000-11-30 Nec Telecom Syst Ltd 携帯電話機及びその着信音の作成並びに発生方法
JP2002215142A (ja) * 2001-01-17 2002-07-31 Dainippon Printing Co Ltd 音響信号の符号化方法
CN1898724A (zh) * 2003-12-26 2007-01-17 松下电器产业株式会社 语音/乐音编码设备及语音/乐音编码方法
CN101004908A (zh) * 2006-11-28 2007-07-25 吕硕 音阶旋律编码
CN101939781A (zh) * 2008-01-04 2011-01-05 杜比国际公司 音频编码器和解码器
US20140114652A1 (en) * 2012-10-24 2014-04-24 Fujitsu Limited Audio coding device, audio coding method, and audio coding and decoding system
CN107077858A (zh) * 2014-07-28 2017-08-18 弗劳恩霍夫应用研究促进协会 使用具有全带隙填充的频域处理器以及时域处理器的音频编码器和解码器

Also Published As

Publication number Publication date
CN109215670A (zh) 2019-01-15

Similar Documents

Publication Publication Date Title
CN100362568C (zh) 用于预测量化有声语音的方法和设备
KR101036965B1 (ko) 음성 믹싱 방법 및 그 방법을 이용하는 다지점 회의 서버와 컴퓨터 판독가능 기록 매체
CN100454389C (zh) 声音编码设备和声音编码方法
US6807526B2 (en) Method of and apparatus for processing at least one coded binary audio flux organized into frames
TW563094B (en) Method and apparatus for high performance low bit-rate coding of unvoiced speech
CN112767954B (zh) 音频编解码方法、装置、介质及电子设备
US5623575A (en) Excitation synchronous time encoding vocoder and method
CN104934036B (zh) 音频编码装置、方法以及音频解码装置、方法
EP0523979A2 (en) Low bit rate vocoder means and method
JP2010170142A (ja) ビットレートスケーラブルなオーディオデータストリームを生成する方法および装置
US7016832B2 (en) Voiced/unvoiced information estimation system and method therefor
US10607624B2 (en) Signal codec device and method in communication system
CN110838894A (zh) 语音处理方法、装置、计算机可读存储介质和计算机设备
JP2006171751A (ja) 音声符号化装置及び方法
CN112767955B (zh) 音频编码方法及装置、存储介质、电子设备
CN109215670B (zh) 音频数据的传输方法、装置、计算机设备和存储介质
KR20030025092A (ko) 음성패킷 변환을 위한 lsp 파라미터 변환장치 및 방법
KR100467326B1 (ko) 추가 비트 할당 기법을 이용한 음성 부호화 및 복호화를위한 송수신기
US5717819A (en) Methods and apparatus for encoding/decoding speech signals at low bit rates
EP1298647B1 (en) A communication device and a method for transmitting and receiving of natural speech, comprising a speech recognition module coupled to an encoder
CN103503065A (zh) 用于衰减低精确度重构的信号区域的方法和解码器
Chazan et al. Low bit rate speech compression for playback in speech recognition systems
US7295974B1 (en) Encoding in speech compression
KR0175250B1 (ko) 보코더의 톤 검출회로 및 방법
Phan et al. Implementation and evaluation of low-speed speech compression LPC and MELP algorithms

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant