CN101478616A - 一种即时语音通信方法 - Google Patents
一种即时语音通信方法 Download PDFInfo
- Publication number
- CN101478616A CN101478616A CNA2008101885346A CN200810188534A CN101478616A CN 101478616 A CN101478616 A CN 101478616A CN A2008101885346 A CNA2008101885346 A CN A2008101885346A CN 200810188534 A CN200810188534 A CN 200810188534A CN 101478616 A CN101478616 A CN 101478616A
- Authority
- CN
- China
- Prior art keywords
- speech
- coding
- network
- voice
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
网络上的语音通信技术即网络电话技术在现代科技领域的应用日趋深入,对网络语音通信质量的要求也越来越高,这样就需要优质的语音编码技术与高效的网络传输技术的有机结合。根据语音通信模块与网络传输模块的整合,设计优质的网络语音传输技术。在此背景下研究并设计了一个网络语音通信的软件平台。本发明通过将音频数据中不同码率的数据采用针对的编码处理方法,然后将处理后的数据发送给接收端,这样音频数据处理方法保证了对整个语音码率范围内的数据进行处理,从而保证了通常码率的语音传输中出现的失真现象。本设计应用Socket编程技术完成网络通信的功能模块,有效地降低了网络传输中的延迟。
Description
技术领域
本软件给用户提供了一种方法,可以对满足高保真语音通信的质量。
背景技术
目前,现代信息技术的发展及应用越来越广泛,网络上的语音通信技术即网络电话技术在现代科技领域的应用也日趋深入,对网络语音通信质量的要求也越来越高,这样就需要优质的语音编码技术与高效的网络传输技术的有机结合。消费者对网络电话的最基本的要求是通话清晰,目前网络的语音通信软件普遍存在传输延迟与失真的问题。
影响网络即时通信的话音质量因素有很多,其中带宽和网络环境的是原因之一,而语音编解码技术和落地运营商的选择(话音的落地路由的质量)也是影响话音质量的关键因素。
发明内容
本发明的目的是针对现有问题的上述不足,优化了MPEG-4语音编码算法。并将其整合在网络通信模块,以降低了信号延迟,减小了信号的失真。
本发明的一种即时语音通信方法,主要针对用于局域网办公环境的语音通信进行优化,其特征在包含以下步骤:
步骤1:音频信号采集,即使用录音设备对声音的激励信号进行采集,并通过windows自带的windows API函数完成对音频数据的采样、量化等基本处理;
步骤2:语音编码,即首先将输入的音频数据进行分频处理,并将不同码率的音频数据分块,采用不同码率的音频编码方法将语音数据编码处理;
步骤3:语音信息传输,即通过网络将音频数据分帧传输至接收端;
步骤4:语音解码,即以帧为单位进行,主要对码流进行解码;
步骤5:音频回放,即针对解码后所得的相应参数,根据语音产生原理,合成语音。
通过本发明的这种方法可以实现的有益效果有:优化的编码算法减小了语音信号的失真,有效降低了传输的延迟。这是一款专用于要求高清网络语音通信的用户,提供给用户在进行网络语音传输过程中失真小、延迟小的高保真语音通信质量。软件包括了一个可执行文件、高效网络传输技术Socket传输模块、及优化的高保真语音编码算法MPEG-4。通过在网络传输模块中写入对语音编码模块的应用程序,将两大模块结合,进而完成音频通信功能。
附图说明
图1:即时语音通信流程图;
图2:优化语音编码流程;
图3:网络通信流程。
具体实施方式
下面结合附图对本发明进行更详细的阐述。
如图1所示,一个完整的音频通信程序要完成以下工作:
语音信息的采集、音频数据的编码、将处理后的音频数据进行压缩打包发送、接收音频数据、音频数据的解码、语音信息的输出。
为了使本发明的目的、技术方案即优点更加清楚明白,以下结合上述通信工程,给出具体实例,对本发明进行进一步的详细说明。
1.音频信息的采集。录音设备对声音的激励信号进行采集,输出设备对对解码后的激励信号进行回放。音频的采集和回放两个基本处理过程采用直接、高效的波形输出方法,这种方法包含在Windows机制之下,更具推广性。音频采集及回放部分使用windows API函数,完成对音频数据的基本处理,如采样,量化等。
2.音频数据的编码与解码。经过音频采集模块进行初步处理后的数据难以保证高保真的通信要求。通过语音编码模块对音频数据进行深度处理。
如图2所示,左侧是本发明音频数据的编码流程图、右侧是本发明音频数据的解码流程图。由于音频数据的编码和解码流程近似,所以此处进行对比说明。
首先将输入的音频数据进行分频处理,并将不同码率的音频数据分块,采用不同码率的音频编码方法将语音数据编码处理,将处理后的音频数据分帧,传输至网络传输模块。
本发明标准化了不同码率从2kbit/s到高于64kbit/s范围的音频编码。为了在整个码率范围内实现最好的音频效果,并同时提供额外的函数功能,语音编码技术和通用的音频编码技术同时整和在一个公用的框架中。在低码率的语音编码通过谐音矢量激励编码和码激励线性预测来实现,其中,谐音矢量激励编码用于码流在2kbit/s到4kbit/s的语音编码,码激励线性预测用于码流在2kbit/s到25kbit/s的语音编码。此外谐音矢量激励编码能在其可变码率模式下实现平均码流下降到1.2kbit/s的语音编码。码率在更高情况下应用音频变换编码技术变换编码。通常在这一区域的音频信号的采样码率从8kHz开始。
从低码率的编码开始,逐步向通用音频编码器中加入增强部分。这样一来,编码质量和音频带宽都可以得到提高。编码算法具有一定的抗信道误码的能力,且不会引入大的干扰。另外,如果信道衰减很大,或传输的帧完全丢失,解码器能在最少损失话音质量的情况下隐去所丢失的帧。提供了较低速的高质量的低延迟的语音编码,是当前较理想的编码算法。编码器是基于码激励线性预测声码器模型的。运算的帧长为10ms,相应于抽样率为8kHz的语音数据流的80个样值。对于每10ms的一帧,语音信号经过分析,得到编码参数。
3.音频信号的传输。经过高保真编码算法处理后的音频数据,通过网络传输模块发送至接收端。采用数据报式类型的传输方式。
如图4所示,给出了数据报方式传输的过程。
负责接收连接的服务端Socket模块:该程序作为服务器网络端口。在该模块中,设置缓存中音频的结构与本地计算机具体参数(音频格式、通道数、采样码率等)。
负责接收/发送数据的客户端Socket模块:对套接字的发送数据和接收数据进行消息处理。简单的重载基础类的接收和发送函数。
该模块中,设计了具体的传输协议面向无连接的用户数据报传输协议,形成数据报,校验和用于检查传输中是否出现错误,数据报长度包含五个域的字节数。
4.音频信号的输出。解码是以帧为单位进行,主要是对码流进行解码。解码完成后,得到相应的参数,并根据语音产生的原理,合成语音。其主要部分大致有:参数解码、后滤波处理、丢帧处理。音频的解码过程,在解码器端解出激励信号与合成滤波器参数。重建语音信号是将激励信号通过短时合成滤波器而得到的。
在本发明中,首先将音频数据中按照不同码率进行分块分帧,然后将多个码率帧的音频数据进行编码处理,最后将处理后的数据发送给接收端进行解码和音频数据的回复接收。由此可知,本发明的基本传输单元是不同码率帧。这样就解决了传统的对于音频数据不能进行完整编码的弊端,进而优化了语音传输的失真。
Claims (5)
1.一种即时语音通信方法,主要针对用于局域网办公环境的语音通信进行优化,其特征在包含以下步骤:
步骤1:音频信号采集,即使用录音设备对声音的激励信号进行采集,并通过windows自带的windows API函数完成对音频数据的采样、量化等基本处理;
步骤2:语音编码,即首先将输入的音频数据进行分频处理,并将不同码率的音频数据分块,采用不同码率的音频编码方法将语音数据编码处理;
步骤3:语音信息传输,即通过网络将音频数据分帧传输至接收端;
步骤4:语音解码,即以帧为单位进行,主要对码流进行解码;
步骤5:音频回放,即针对解码后所得的相应参数,根据语音产生原理,合成语音。
2.如权利要求1所述的一种即时语音通信方法,其特征在于,所述语音编码步骤,标准化了从2kbit/s到高于64kbit/s范围的不同码率的音频编码。
3.如权利要求1所述的一种即时语音通信方法,其特征在于,所述语音编码步骤,在低码率的语音编码通过谐音矢量激励编码和码激励线性预测来实现,其中,谐音矢量激励编码用于码流在2kbit/s到4kbit/s的语音编码,码激励线性预测用于码流在2kbit/s到25kbit/s的语音编码;码率在更高情况下应用音频变换编码技术变换编码。
4.如权利要求1所述的一种即时语音通信方法,其特征在于,所述语音编码步骤,从低码率的编码开始,逐步向通用音频编码器中加入增强部分。
5.如权利要求1所述的一种即时语音通信方法,其特征在于,所述语音信息传输步骤,其基本传输单元是不同码率帧。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNA2008101885346A CN101478616A (zh) | 2008-12-19 | 2008-12-19 | 一种即时语音通信方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNA2008101885346A CN101478616A (zh) | 2008-12-19 | 2008-12-19 | 一种即时语音通信方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN101478616A true CN101478616A (zh) | 2009-07-08 |
Family
ID=40839244
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNA2008101885346A Pending CN101478616A (zh) | 2008-12-19 | 2008-12-19 | 一种即时语音通信方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN101478616A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102184033A (zh) * | 2011-05-24 | 2011-09-14 | 成都毕昇教育科技有限公司 | 有声注音输入法 |
CN102904799A (zh) * | 2012-10-12 | 2013-01-30 | 上海量明科技发展有限公司 | 即时通信中图标触发流媒体数据录制的方法及客户端 |
CN104506287A (zh) * | 2014-12-29 | 2015-04-08 | 重庆邮电大学 | 一种td-lte应急通信下的实时语音通信方法 |
CN104795073A (zh) * | 2015-03-26 | 2015-07-22 | 无锡天脉聚源传媒科技有限公司 | 一种音频数据的处理方法及装置 |
CN113593539A (zh) * | 2020-04-30 | 2021-11-02 | 阿里巴巴集团控股有限公司 | 流式端到端语音识别方法、装置及电子设备 |
-
2008
- 2008-12-19 CN CNA2008101885346A patent/CN101478616A/zh active Pending
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102184033A (zh) * | 2011-05-24 | 2011-09-14 | 成都毕昇教育科技有限公司 | 有声注音输入法 |
CN102904799A (zh) * | 2012-10-12 | 2013-01-30 | 上海量明科技发展有限公司 | 即时通信中图标触发流媒体数据录制的方法及客户端 |
CN102904799B (zh) * | 2012-10-12 | 2016-05-04 | 上海量明科技发展有限公司 | 即时通信中图标触发流媒体数据录制的方法及客户端 |
CN104506287A (zh) * | 2014-12-29 | 2015-04-08 | 重庆邮电大学 | 一种td-lte应急通信下的实时语音通信方法 |
CN104795073A (zh) * | 2015-03-26 | 2015-07-22 | 无锡天脉聚源传媒科技有限公司 | 一种音频数据的处理方法及装置 |
CN113593539A (zh) * | 2020-04-30 | 2021-11-02 | 阿里巴巴集团控股有限公司 | 流式端到端语音识别方法、装置及电子设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102057424B (zh) | 用于经编码的音频数据的错误隐藏的方法和装置 | |
US20110044324A1 (en) | Method and Apparatus for Voice Communication Based on Instant Messaging System | |
CN104917671B (zh) | 基于移动终端的音频处理方法和装置 | |
CN1115917C (zh) | 用作因特网电话的增强型无线电电话及实现电话功能的方法 | |
CN1326415C (zh) | 对音频信号进行代码变换的方法、码变换器、网元、无线通信网和通信系统 | |
CN103988486B (zh) | 在多方电话会议的混音中选择活动信道的方法 | |
CN103714823B (zh) | 一种基于综合语音编码的自适应水下通信方法 | |
KR20100017468A (ko) | 음성 인식을 위한 오디오 처리 경로들의 구성을 위한 방법 및 시스템 | |
MXPA04007668A (es) | Comunicacion de voz de inter-sistemas de tandem libre. | |
CN100407708C (zh) | 一种即时通讯中音/视频分享的方法和系统 | |
CN104167210A (zh) | 一种轻量级的多方会议混音方法和装置 | |
CN101123641A (zh) | 基于分布式架构的无线网络电话监听装置的监听方法 | |
CN101478616A (zh) | 一种即时语音通信方法 | |
US20060262851A1 (en) | Method and system for efficient transmission of communication traffic | |
CN103489448A (zh) | 语音数据处理方法及系统 | |
CN104753841B (zh) | 移动终端及利用语音信道传输非语音数据的方法 | |
CN106656274A (zh) | 一种语音传输系统 | |
CN102918589B (zh) | 提供从以低比特率编码和解码的水印的音频或视频信号导出的水印的已解码音频或视频信号 | |
Chinna Rao et al. | Real-time implementation and testing of VoIP vocoders with asterisk PBX using wireshark packet analyzer | |
EP3649643A1 (en) | Normalization of high band signals in network telephony communications | |
CN112637703A (zh) | 一种web端实时对讲系统及对讲方法 | |
US20040100955A1 (en) | Vocoder and communication method using the same | |
CN203289656U (zh) | 一种语音通话装置及系统 | |
CN208063296U (zh) | 一种回音消除测试工具及ip通讯终端回音消除测试系统 | |
CN205595068U (zh) | 无线数字语音基带传输系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
DD01 | Delivery of document by public notice |
Addressee: Sun Leilei Document name: Notification that Application Deemed to be Withdrawn |
|
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |
Open date: 20090708 |