CN101304391A - 一种基于即时通讯系统的语音通话方法及系统 - Google Patents

一种基于即时通讯系统的语音通话方法及系统 Download PDF

Info

Publication number
CN101304391A
CN101304391A CNA2008100682626A CN200810068262A CN101304391A CN 101304391 A CN101304391 A CN 101304391A CN A2008100682626 A CNA2008100682626 A CN A2008100682626A CN 200810068262 A CN200810068262 A CN 200810068262A CN 101304391 A CN101304391 A CN 101304391A
Authority
CN
China
Prior art keywords
voice
modified tone
tone
instant communication
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA2008100682626A
Other languages
English (en)
Inventor
李大龙
郑全战
盛馥钟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CNA2008100682626A priority Critical patent/CN101304391A/zh
Publication of CN101304391A publication Critical patent/CN101304391A/zh
Priority to PCT/CN2009/071931 priority patent/WO2010000161A1/zh
Priority to US12/913,358 priority patent/US20110044324A1/en
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/04Real-time or near real-time messaging, e.g. instant messaging [IM]
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/0018Speech coding using phonetic or linguistical decoding of the source; Reconstruction using text-to-speech synthesis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/003Changing voice quality, e.g. pitch or formants
    • G10L21/007Changing voice quality, e.g. pitch or formants characterised by the process used
    • G10L21/013Adapting to target pitch
    • G10L2021/0135Voice conversion or morphing

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本发明适用于通信领域,提供了一种基于即时通讯系统的语音通话方法及系统,所述方法包括下述步骤:即时通讯客户端A向即时通讯客户端B发送变调语音通话请求,接收到即时通讯客户端B返回的变调语音通话应答后,建立与即时通讯客户端B之间的变调语音通话通道;即时通讯客户端A对输入的原始语音信号进行变调处理,得到变调语音;即时通讯客户端A通过所述变调语音通话通道将所述变调语音发送至即时通讯客户端B。本发明将即时通讯系统中采集到的语音信号先进行语音变调处理,实现了基于即时通讯系统的变调语音通话,为基于即时通讯场合下的语音通信带来极大的娱乐效果,给传统即时通讯服务带来新的增值服务增长点,增加用户对即时通讯产品的依赖性,从而提升产品竞争力。

Description

一种基于即时通讯系统的语音通话方法及系统
技术领域
本发明属于通信领域,尤其涉及一种基于即时通讯系统的语音通话方法及系统。
背景技术
随着即时通讯技术的发展,即时通讯系统除具备基本的即时通讯功能外,还具有其他诸多附加功能,如语音通话功能。使用即时通讯系统进行语音通话已经成为一般社会大众所使用的沟通工具之一,但是现有的语音通话双方只能采用自己原来的声音进行通话,不能改变通话者的原始语音,功能比较单一,不能隐藏通话方的身份,缺乏新颖性、娱乐性,不能满足用户的个性化需求。
现在还没有基于即时通讯系统的变调语音通话方法。
发明内容
本发明实施例的目的在于提供一种基于即时通讯系统的变调语音通话方法,旨在解决现在还没有基于即时通讯系统的变调语音通话方法的问题。
本发明实施例是这样实现的,一种基于即时通讯系统的语音通话方法,所述方法包括下述步骤:
即时通讯客户端A向即时通讯客户端B发送变调语音通话请求,接收到即时通讯客户端B返回的变调语音通话应答后,建立与即时通讯客户端B之间的变调语音通话通道;
即时通讯客户端A对输入的原始语音信号进行变调处理,得到变调语音;
即时通讯客户端A通过所述变调语音通话通道将所述变调语音发送至即时通讯客户端B。
本发明实施例的另一目的在于提供一种基于即时通讯系统的语音通话系统,所述系统包括:
请求发送单元,接收用户输入的变调语音通话请求信息,向通话对方发送变调语音通话请求,接收返回的变调语音通话应答,建立变调语音通话通道,生成变调信息并发送;
语音采集单元,采集输入的语音信息,并将采集到的语音信息转化为计算机可以识别和处理的数字语音信息;
变调处理单元,接收到所述请求发送单元发送的变调信息后,将所述语音采集单元得到的数字语音信息进行变调处理,得到与所述数字语音信息对应的变调语音;以及
语音发送单元,通过所述请求发送单元建立的变调语音通话通道发送所述变调处理单元得到的变调语音。
在本发明实施例中,将即时通讯系统中采集到的语音信号先进行语音变调处理,实现了基于即时通讯系统的变调语音通话,为基于即时通讯场合下的语音通信带来极大的娱乐效果,给传统即时通讯服务带来新的增值服务增长点,增加用户对即时通讯产品的依赖性,从而提升产品竞争力,并且为语音通话用户提供崭新的业务体验。
附图说明
图1是本发明实施例提供的基于即时通讯系统的语音通话方法的实现流程图;
图2是本发明另一实施例提供的语音通信通道基于即时通讯系统的语音通话方法的实现流程图;
图3是本发明实施例提供的即时通讯客户端B接收到即时通讯客户端A发送的变调语音通话数据的处理流程图;
图4是本发明实施例提供的基于即时通讯系统的语音通话系统的结构图;
图5是本发明另一实施例提供的基于即时通讯系统的语音通话系统的结构图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
在本发明实施例中,即时通讯客户端A向即时通讯客户端B发送语音变调请求,并与即时通讯客户端B之间建立了变调语音通话通道后,对采集的原始语音进行变调处理,得到与原始语音对应的变调语音,并将该变调语音通过建立的变调语音通话通道发送至即时通讯客户端B,从而实现即时通讯系统中各即时通讯客户端之间的变调语音通话。
图1示出了本发明实施例提供的基于即时通讯系统的语音通话方法的实现流程,详述如下:
1、即时通讯客户端A向即时通讯客户端B发送变调语音通话请求。
2、即时通讯客户端B在接收到即时通讯客户端A发送的变调语音通话请求后,对该变调语音通话请求作出应答,并将应答信息返回至即时通讯客户端A。当即时通讯客户端A接收到即时通讯客户端B返回的变调语音通话应答后,建立与即时通讯客户端B之间的变调语音通话通道。
为了成功建立通话通道,即时通讯客户端A和即时通讯客户端B在即时通讯服务器的协调下,建立变调语音通话通道。当然,即时通讯客户端A可以透明或者非透明地向即时通讯容户端B发送变调语音通话请求。如果即时通讯客户端A透明地向即时通讯客户端B发送变调语音通话请求,此过程即时通讯客户端B界面上不用显示。
3、即时通讯客户端A对采集的原始语音进行变调处理,得到与原始语音对应的变调语音。
在本发明实施例中,提供了多种语音变调方式,如改变语音的音调、性别变声(男声变女声、女声变男声)、年龄变声(青少年的声音变老年人的声音)、将用户原始话音变为某著名人物的声音、在用户声音上加入背景声音(严格意义上,在用户声音上加入背景声音并不属于语音变调处理,而属于混音技术,但本发明所定义的变调语音通话包含此类应用)等。
其中对采集的原始语音进行变调处理,得到与原始语音对应的变调语音的具体过程如下:
A、采集用户输入的语音信息,并将采集的语音信息处理成计算机可以识别和处理的数字语音信息;
B、对该数字语音信息进行变调处理,得到与该数字语音信息对应的变调语音。
在本实施例中,语音变调处理可以使用线性预测(Linear Prediction,LP)分析合成语音模型将数字语音信号分解为谱包络部分(由线性预测编码(Linearpredictive coding,LPC)系数表示)和激励部分(由LPC的残差表示);然后在LPC系数上提取共振峰频率和频谱倾斜参数,再通过矢量量化码书法来实现语音转换。在转换函数的选择上,频率包络转换可以使用矢量量化法,对韵律(主要是基音周期)的转换可以使用时域基音同步叠加(time domain pitchsynchronous overlap-add,TD-PSOLA)算法。
在本实施例中,对原始语音进行变调处理的语音变调方式可以由用户根据提供的语音变调方式向即时通讯客户端A输入用户选择信息,由输入的用户选择信息确定语音变调方式。
为了给传统即时通讯服务带来新的增值服务增长点,即时通讯服务提供商可以将语音变调或其中的部分语音变调方式作为增值服务项目,在本发明实施例中,提供的语音变调方式由变调方用户在即时通讯系统中的授权变调信息确定。在即时通讯客户端A用户选择语音变调方式前,用户通过即时通讯客户端A向服务器发送用户的授权变调方式查询信息,服务器根据该用户在即时通讯系统中的身份标识返回授权变调信息,即该用户可使用的语音变调方式。即时通讯客户端A根据服务器返回的授权变调信息输入用户选择信息。当然,也可以根据用户选择信息、授权变调信息,用其他的业务选择逻辑确定变调方式;当用户只有一种可使用的语音变调方式时,可以只由授权变调信息确定变调方式。
由于语音变调处理是以用户的原始语音信号作为基础的,为了向用户提供更合适的语音变调方式以保证变调后的声音能被通信对方所辨识,作用本发明的另一个优选实施例,对原始语音进行变调处理的语音变调方式还要考虑用户个性特征信息,即主要是用户原始话音中的音段特征。此时,变调方式,根据用户选择信息及用户个性特征信息,或者用户选择信息、授权变调信息及用户个性特征信息,由业务选择逻辑确定。在客户端A接收到用户选择信息后,对用户的原始语音信号进行分析,得到其个性特征信息,当其个性特征信息无法满足语音变调处理的要求时,需要对用户的语音变调方式请求进行修正,例如:某用户原始声音较粗且嘶哑,而其选择的语音变调方式为“低龄儿童”,此时的变调效果会很差(不易为对方识别为“童音”),于是系统应建议用户重新选择语音变调方式。
为了提高通话接收方所听到的话音质量,向用户提供更合适的语音变调方式,作为本发明的又一个优选实施例,语音变调方式确认还要考虑对方语音环境信息。此时,变调方式,根据用户选择信息及对方语音环境信息,或者用户选择信息、授权变调信息及对方语音环境信息,由业务选择逻辑确定。即时通讯客户端B向即时通讯客户端A返回变调语音通话请求应答时,同时返回其自身的语音环境信息。该语音环境信息可以由即时通讯客户端B用户选择,或者由即时通讯客户端B根据麦克风采集到的声音信号分析得到等等。
在本发明实施例中,即时通讯客户端A的语音变调方式可以由授权变调信息、用户个性特征信息、对方语音环境信息等信息的一项或多项及用户选择信息,由业务选择逻辑确定。业务选择逻辑为即时通讯服务提供商所定义,以明确指出何等的授权变调信息、怎样的语音通信环境可以享受多少项变调语音服务(例如:“男声变女声”为一项变调语音服务)等。
在本发明实施例中,由于采集的语音信息中可能包含回音、噪声等不利于处理、传输和辨别的信号,因此,为了达到较好的变调语音通话效果,改善通话接收方所听到的话音质量,在对该数字语音信息进行语音变调处理之前,对数字语音信息进行去噪处理,即进行回音抵消、噪声抑制、信号增益调节等一种或者多种组合的处理。
4、即时通讯客户端A将得到的变调语音通过已经建立的变调语音通话通道发送至即时通讯客户端B。
在本发明实施例中,为了便于传输变调语音,即时通讯客户端A在发送变调语音前,对变调语音进行分组、打包处理,得到变调语音数据包,并将变调语音数据包发送至即时通讯客户端B。
在本发明实施例中,为了降低变调语音数据传输所需要的带宽,为实时变调语音通话创造条件,在对采集的原始语音进行变调处理后,按照预设的编码规则,例如G.729、G.729A、G.723.1等,将得到的与原始语音对应的变调语音进行压缩编码。
在本发明实施例中,为了避免变调语音在网络传输过程中由于丢包、差错等原因造成的信号失真,在对变调语音进行压缩编码后,再利用信道编码技术,对压缩编码后得到的变调语音比特流进行冗余增强处理。
当即时通讯客户端B向即时通讯客户端A发送变调语音通话请求时,其实现流程同上,在此不再赘述。可以理解,即时通讯客户端A和即时通讯客户端B可以进行单向变调语音通话,也可以进行双向变调语音通话。上述语音通话基于有线互联网络或无线互联网络上的即时通讯系统。
如果通讯即时通讯客户端A或者即时通讯客户端B中的任意一方提出中断请求、网络发生故障等时,通话结束,释放变调语音通话通道。
图2示出了本发明实施例提供的当即时通讯客户端A与即时通讯客户端B之间建立语音通信通道,并在即时通讯客户端A与即时通讯客户端B之间进行语音通话方法的实现流程,详述如下:
1、即时通讯客户端A向即时通讯客户端B发送语音通话请求。
2、即时通讯客户端B在接收到即时通讯客户端A发送的语音通话请求后,对该语音通话请求作出应答,并将应答信息返回至即时通讯客户端A。即时通讯客户端A接收到即时通讯客户端B返回的语音通话应答后,建立与即时通讯客户端B之间的语音通话通道。
语音通话通道后,即时通讯客户端A和即时通讯客户端B之间可以使用该语音通话通道进行语音通话。
3、即时通讯客户端A向即时通讯客户端B发送变调语音通话请求。
4、即时通讯客户端B在接收到即时通讯客户端A发送的变调语音通话请求后,对该变调语音通话请求作出应答,并将应答信息返回至即时通讯客户端A。即时通讯客户端A接收到即时通讯客户端B返回的变调语音通话应答后,建立与即时通讯客户端B之间的变调语音通话通道。
变调语音通话通道建立后,可以释放先前建立的语音通话通道。当然,即时通讯客户端A可以透明或者非透明地向即时通讯客户端B发送变调语音通话请求。如果即时通讯客户端A透明地向即时通讯客户端B发送变调语音通话请求,此过程即时通讯客户端B界面上不用显示。
5、即时通讯客户端A对采集的原始语音进行变调处理,得到与原始语音对应的变调语音。
6、即时通讯客户端A将得到的变调语音通过已经建立的变调语音通话通道发送至即时通讯客户端B。
7、通话结束,释放变调语音通话通道。
如果通讯即时通讯客户端A或者即时通讯客户端B中的任意一方提出中断请求、网络发生故障等时,通话结束,释放变调语音通话通道。
其中,即时通讯客户端B接收到即时通讯客户端A发送的变调语音通话数据后,对通话数据的处理流程与普通语音通话中的处理流程相同,处理流程如图3所示,详述如下:
在步骤S301中,通话数据接收、解包;
通过已经建立的变调语音通话通道接收分组通话数据,按照与即时通讯客户端A相同的网络传输协议进行数据包解包,并将分组数据组装,得到压缩码流。
在步骤S302中,将解包后的数据解码为语音信号;
将解包后的压缩码流采用即时通讯客户端A编码运算的逆运算进行解码,得到可被人耳识别的原始语音信号。
在步骤S303中,语音信号增强处理;
由于网络传输、语音信号压缩和语音变调处理等都可能造成信号的失真,需要对解码得到的原始语音信号进行信号增强处理。信号增强处理可以采用卡尔曼滤波法、短时谱幅度的最小均方误差估计法、或者自适应滤波法等。
在步骤S304中,输出增强处理后的语音信号。
通过输出设备,例如耳机、音箱、声卡等将增强处理后的语音信号输出。
为了得到可正确解码的语音比特流,在本发明实施例中,在数据接收、组包后,将解包后的数据进行逆冗余/容错处理,去除即时通讯客户端A加入压缩码流中的冗余信号,修改或者丢弃其中的错误数据。
图4示出了本发明实施例提供的基于即时通讯系统的语音通话系统的结构,为了便于说明,仅示出了与本发明实施例相关的部分。
该系统可以用于各种即时通讯客户端设备,例如计算机、笔记本电脑、个人数字助理(Personal Digital Assistant,PDA)、智能手机等,可以是运行于这些设备内的软件单元、硬件单元或者软硬件相结合的单元,也可以作为独立的挂件集成到这些设备中或者运行于这些设备的应用系统中,其中:
请求发送单元401,接收用户输入的变调语音通话请求信息,向通话对方发送变调语音通话请求,接收返回的变调语音通话应答,建立变调语音通话通道,生成变调信息,并向变调处理单元403发送该变调信息。在本实施例中,变调信息包含用户选择信息、授权变调信息的一项或者两项。
语音采集单元402,采集输入的语音信息,并将采集到的语音信息转化成计算机可以识别和处理的数字语音信息。
变调处理单元403,接收到请求发送单元401发送的变调信息后,将语音采集单元402得到的该数字语音信息进行变调处理,得到与该数字语音信息对应的变调语音。
语音发送单元404,通过请求发送单元401建立的变调语音通话通道发送变调处理单元403得到的变调语音。
在本发明实施例中,变调处理单元403包括:
变调信息接收模块4031,用于接收请求发送单元401发送的变调信息,并将接收到的变调信息输出给业语音变调处理模块4033。
业务逻辑模块4032,生成语音变调的业务选择逻辑,并输出给语音变调处理模块4033。语音变调的业务选择逻辑由即时通讯服务提供商所定义,以明确指出何等的授权变调信息、怎样的语音通信环境可以享受多少项变调语音服务(例如:“男声变女声”为一项变调语音服务)等。
语音变调处理模块4033,接收变调信息接收模块4031输出的变调信息、业务逻辑模块4032输出的业务选择逻辑,由接收到的变调信息、业务选择逻辑确定语音变调方式,将语音采集单元402得到的数字语音信息按照语音变调方式进行变调处理,得到与该数字语音信息对应的变调语音并输出。语音变调处理模块4033根据变调信息中包含的用户选择信息、授权变调信息的一项或者两项,由业务选择逻辑确定语音变调方式。实现方式如上所述,不再赘述。
为了向用户提供更合适的语音变调方式以保证变调后的声音能被通信对方所辨识,作用本发明的一个优选实施例,变调处理单元403还包括:
用户特征获取模块4034,用于从语音采集单元402得到的该数字语音信息中提取用户个性特征,生成用户个性特征信息并输出给语音变调处理模块4033。语音变调处理模块4033解析出接收到的变调信息中包含的用户选择信息、授权变调信息的一项或者两项,结合接收到的用户个性特征信息,由业务选择逻辑确定语音变调方式。
为了提高通话接收方所听到的话音质量,向用户提供更合适的语音变调方式,作为本发明的另一个优选实施例,变调处理单元403还包括:
对方环境获取模块4035,接收请求发送单元401发送的对方语音环境信息并输出给语音变调处理模块4033。在本实施例中,通话对方返回的变调语音通话应答中包含有语音环境信息,请求发送单元401根据接收到语音环境信息生成对方语音环境信息,并输出给语音变调处理模块4033。语音变调处理模块4033解析出接收到的变调信息中包含的用户选择信息、授权变调信息的一项或者两项,结合接收到的对方语音环境信息,由业务选择逻辑确定语音变调方式。
当然,语音变调处理模块4033可以根据接收到的授权变调信息、用户个性特征信息、对方语音环境信息等信息的一项或多项及用户选择信息,由业务选择逻辑确定。
为了达到较好的变调语音通话效果,改善通话接收方所听到的话音质量,作为本发明的再一优选实施例,语音通话系统还包括:
去噪单元405,接收语音采集单元402得到的数字语音信息,进行去噪处理,得到去噪后的数字语音信息。
为了降低变调语音数据传输所需要的带宽,为实时变调语音通话创造条件,作为本发明的再一优选实施例,语音通话系统还包括:
编码单元406,将变调处理单元403得到的变调语音进行压缩编码,得到的变调语音比特流。
为了避免变调语音在网络传输过程中由于丢包、差错等原因造成的信号失真,或者便于传输变调语音,作为本发明的再一优选实施例,语音通话系统还包括:
优化单元407,将变调处理单元403得到的变调语音或者编码单元406得到的变调语音比特流进行冗余增强处理,和/或分组、打包处理,并将处理后的变调语音数据输出给语音发送单元404。
如图4所示,在本实施例中,优化单元包括:
冗余增强处理模块4071,利用信道编码技术,对变调处理单元403得到的变调语音或者编码单元406得到的变调语音比特流进行冗余增强处理,输出处理后的变调语音比特流。
分组、打包模块4072,将接收到的变调语音数据进行分组、打包处理,得到变调语音数据包。分组、打包模块4072可以接收变调处理单元403、编码单元406或者冗余增强处理模块4071输出的变调语音、变调语音比特流。
当然,优化单元可以只包括冗余增强处理模块4071或者分组、打包模块4072。
如图5所示,为了使语音通话系统能够接收处理语音信息,作为本发明的再一优选实施例,语音通话系统还包括:
请求应答单元408,接收变调语音通话请求,并返回变调语音通话应答,生成语音接收触发信息并输出给语音接收单元409。
语音接收单元409,接收到请求应答单元408输出的语音接收触发信息后,接收分组通话数据,按照与通话对方相同的网络传输协议进行数据包解包,并将分组数据组装,得到压缩码流并输出。
解码单元410,将语音接收单元409得到的数据,即压缩码流,解码为语音信号。
语音信号增强处理单元411,将解码单元410得到的数据解码,得到原始语音信号并进行信号增强处理,得到增强处理后的语音信号。
语音输出单元412,将得到的增强处理后的语音信号输出,可以为耳机、音箱、声卡等。
为了改善通话接收方所听到的话音质量,在本发明实施例中,语音通话系统还包括:
逆冗余/容错处理单元413,去除语音接收单元409得到的通话对方加入压缩码流中的冗余信号,修改或丢弃其中的错误数据。
在本发明实施例中,将即时通讯系统中采集到的语音信号先进行语音变调处理,实现了基于即时通讯系统的变调语音通话,为基于即时通讯场合下的语音通信带来极大的娱乐效果,给传统即时通讯服务带来新的增值服务增长点,增加用户对即时通讯产品的依赖性,从而提升产品竞争力。并且为语音通话用户提供崭新的业务体验,例如:用变调语音通话来达到保护用户身份信息的目的。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (13)

1、一种基于即时通讯系统的语音通话方法,其特征在于,所述方法包括下述步骤:
即时通讯客户端A向即时通讯客户端B发送变调语音通话请求,接收到即时通讯客户端B返回的变调语音通话应答后,建立与即时通讯客户端B之间的变调语音通话通道;
即时通讯客户端A对输入的原始语音信号进行变调处理,得到变调语音;
即时通讯客户端A通过所述变调语音通话通道将所述变调语音发送至即时通讯客户端B。
2、如权利要求1所述的方法,其特征在于,所述即时通讯客户端A对输入的原始语音信号进行变调处理,得到变调语音的步骤具体为:
采集输入的原始语音,转化成数字语音信息;
对所述数字语音信息进行变调处理。
3、如权利要求1所述的方法,其特征在于,所述即时通讯客户端A对输入的原始语音信号进行变调处理的变调方式,根据用户选择信息、授权变调信息的一项或者两项,由业务选择逻辑确定。
4、如权利要求3所述的方法,其特征在于,变调方式还根据用户个性特征信息或者对方语音环境信息的一项或者两项,由业务选择逻辑确定。
5、如权利要求3或4所述的方法,其特征在于,所述授权变调方式由服务器根据即时通讯客户端A用户在即时通讯系统中的身份标识返回。
6、如权利要求2所述的方法,其特征在于,在对所述数字语音信息进行语音变调处理的步骤之前,所述方法还包括:
对所述数字语音信息进行去噪处理。
7、如权利要求1所述的方法,其特征在于,在所述即时通讯客户端A对输入的原始语音信号进行变调处理,得到变调语音的步骤之后,所述方法还包括:
对所述变调语音进行压缩编码和/或冗余增强处理。
8、如权利要求1所述的方法,其特征在于,在所述即时通讯客户端A通过所述变调语音通话通道将所述变调语音发送至即时通讯客户端B的步骤之前,所述方法还包括:
对变调语音进行分组、打包处理。
9、一种基于即时通讯系统的语音通话系统,其特征在于,所述系统包括:
请求发送单元,接收用户输入的变调语音通话请求信息,向通话对方发送变调语音通话请求,接收返回的变调语音通话应答,建立变调语音通话通道,生成变调信息并发送;
语音采集单元,采集输入的语音信息,并将采集到的语音信息转化为计算机可以识别和处理的数字语音信息;
变调处理单元,接收到所述请求发送单元发送的变调信息后,将所述语音采集单元得到的数字语音信息进行变调处理,得到与所述数字语音信息对应的变调语音;以及
语音发送单元,通过所述请求发送单元建立的变调语音通话通道发送所述变调处理单元得到的变调语音。
10、如权利要求9所述的语音通话系统,其特征在于,所述变调处理单元包括:
变调信息接收模块,用于接收所述请求发送单元发送的变调信息,并将接收到的所述变调信息输出;
业务逻辑模块,生成语音变调的业务选择逻辑并输出;以及
语音变调处理模块,接收所述变调信息接收模块输出的变调信息、业务逻辑模块输出的业务选择逻辑,由接收到的所述变调信息、业务选择逻辑确定语音变调方式,将所述语音采集单元得到的数字语音信息按照所述语音变调方式进行变调处理,得到与所述数字语音信息对应的变调语音并输出。
11、如权利要求10所述的语音通话系统,其特征在于,所述变调处理单元包括:
用户特征获取模块,用于从所述语音采集单元得到的该数字语音信息中提取用户个性特征,生成用户个性特征信息并输出给所述语音变调处理模块;和/或
对方环境获取模块,接收所述请求发送单元发送的对方语音环境信息并输出给所述语音变调处理模块。
12、如权利要求9所述的语音通话系统,其特征在于,所述语音通话系统还包括:
去噪单元,接收所述语音采集单元得到的数字语音信息,进行去噪处理,得到去噪后的数字语音信息;
编码单元,将所述变调处理单元得到的变调语音进行压缩编码,得到变调语音比特流;或者
优化单元,将所述变调处理单元得到的变调语音或者所述编码单元得到的变调语音比特流进行冗余增强处理,和/或分组、打包处理,并将处理后的变调语音数据输出给所述语音发送单元。
13、如权利要求9至12任一权利要求所述的语音通话系统,其特征在于,所述系统还包括:
请求应答单元,接收变调语音通话请求,并返回变调语音通话应答,生成语音接收触发信息并输出。
语音接收单元,接收到所述请求应答单元输出的语音接收触发信息后,接收分组通话数据,按照与通话对方相同的网络传输协议进行数据包解包,并将分组数据组装,得到压缩码流;
解码单元,将所述语音接收单元得到的数据,解码为语音信号;
语音信号增强处理单元,将所述解码单元得到的数据解码,得到原始语音信号并进行信号增强处理,得到增强处理后的语音信号;以及
语音输出单元,将所述语音信号增强处理单元得到的所述增强处理后的语音信号输出。
CNA2008100682626A 2008-06-30 2008-06-30 一种基于即时通讯系统的语音通话方法及系统 Pending CN101304391A (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CNA2008100682626A CN101304391A (zh) 2008-06-30 2008-06-30 一种基于即时通讯系统的语音通话方法及系统
PCT/CN2009/071931 WO2010000161A1 (zh) 2008-06-30 2009-05-22 一种基于即时通讯系统的语音通话方法及装置
US12/913,358 US20110044324A1 (en) 2008-06-30 2010-10-27 Method and Apparatus for Voice Communication Based on Instant Messaging System

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CNA2008100682626A CN101304391A (zh) 2008-06-30 2008-06-30 一种基于即时通讯系统的语音通话方法及系统

Publications (1)

Publication Number Publication Date
CN101304391A true CN101304391A (zh) 2008-11-12

Family

ID=40114104

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA2008100682626A Pending CN101304391A (zh) 2008-06-30 2008-06-30 一种基于即时通讯系统的语音通话方法及系统

Country Status (3)

Country Link
US (1) US20110044324A1 (zh)
CN (1) CN101304391A (zh)
WO (1) WO2010000161A1 (zh)

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010000161A1 (zh) * 2008-06-30 2010-01-07 腾讯科技(深圳)有限公司 一种基于即时通讯系统的语音通话方法及装置
CN101888607A (zh) * 2010-07-15 2010-11-17 中兴通讯股份有限公司 基于widget实现手机聊天的方法及手机
CN104144097A (zh) * 2013-05-07 2014-11-12 百度在线网络技术(北京)有限公司 语音消息传输系统、发送端、接收端及语音消息传输方法
CN104200824A (zh) * 2014-08-25 2014-12-10 深圳市中兴移动通信有限公司 音频录制方法和装置
CN104376846A (zh) * 2013-08-16 2015-02-25 联想(北京)有限公司 一种语音调节方法、装置和电子设备
CN104780091A (zh) * 2014-01-13 2015-07-15 北京发现角科技有限公司 一种具有语音音频处理功能的即时通信方法和系统
CN104980396A (zh) * 2014-04-03 2015-10-14 北京千橡网景科技发展有限公司 一种用于社交网络的通信方法及系统
CN105304092A (zh) * 2015-09-18 2016-02-03 深圳市海派通讯科技有限公司 一种基于智能终端的实时变声方法
CN106161218A (zh) * 2016-09-28 2016-11-23 乐视控股(北京)有限公司 实时通话中的语音处理方法及装置
CN106406809A (zh) * 2016-12-21 2017-02-15 维沃移动通信有限公司 一种声音信号处理方法及移动终端
CN106506437A (zh) * 2015-09-07 2017-03-15 腾讯科技(深圳)有限公司 一种音频数据处理方法,及设备
CN107731241A (zh) * 2017-09-29 2018-02-23 广州酷狗计算机科技有限公司 处理音频信号的方法、装置和存储介质
CN108417223A (zh) * 2017-12-29 2018-08-17 申子涵 在社交网络中发送变调语音的方法
CN109404685A (zh) * 2018-09-12 2019-03-01 乐歌人体工学科技股份有限公司 增高台
CN111194545A (zh) * 2017-10-09 2020-05-22 深圳传音通讯有限公司 一种移动通讯设备通话时改变原始声音的方法和系统
CN111339442A (zh) * 2020-02-25 2020-06-26 北京声智科技有限公司 线上好友互动方法及装置

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9838784B2 (en) 2009-12-02 2017-12-05 Knowles Electronics, Llc Directional audio capture
US8798290B1 (en) 2010-04-21 2014-08-05 Audience, Inc. Systems and methods for adaptive signal equalization
US9021565B2 (en) * 2011-10-13 2015-04-28 At&T Intellectual Property I, L.P. Authentication techniques utilizing a computing device
US9536540B2 (en) 2013-07-19 2017-01-03 Knowles Electronics, Llc Speech signal separation and synthesis based on auditory scene analysis and speech modeling
CN105208056B (zh) * 2014-06-18 2020-07-07 腾讯科技(深圳)有限公司 信息交互的方法及终端
CN107112025A (zh) 2014-09-12 2017-08-29 美商楼氏电子有限公司 用于恢复语音分量的系统和方法
US20160093307A1 (en) * 2014-09-25 2016-03-31 Audience, Inc. Latency Reduction
DE112016000545B4 (de) 2015-01-30 2019-08-22 Knowles Electronics, Llc Kontextabhängiges schalten von mikrofonen
US9820042B1 (en) 2016-05-02 2017-11-14 Knowles Electronics, Llc Stereo separation and directional suppression with omni-directional microphones
CN109272984A (zh) * 2018-10-17 2019-01-25 百度在线网络技术(北京)有限公司 用于语音交互的方法和装置
US11943621B2 (en) * 2018-12-11 2024-03-26 Texas Instruments Incorporated Secure localization in wireless networks

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW430778B (en) * 1998-06-15 2001-04-21 Yamaha Corp Voice converter with extraction and modification of attribute data
US7333507B2 (en) * 2001-08-31 2008-02-19 Philip Bravin Multi modal communications system
US20050043951A1 (en) * 2002-07-09 2005-02-24 Schurter Eugene Terry Voice instant messaging system
JP2005115896A (ja) * 2003-10-10 2005-04-28 Nec Corp 通信装置及び通信方法
CN1961350A (zh) * 2004-05-27 2007-05-09 皇家飞利浦电子股份有限公司 用于修改消息的方法和系统
CN100440314C (zh) * 2004-07-06 2008-12-03 中国科学院自动化研究所 基于语音分析与合成的高品质实时变声方法
CN100450128C (zh) * 2005-01-14 2009-01-07 华为技术有限公司 一种实现通话中变声的系统及方法
JP3999812B2 (ja) * 2005-01-25 2007-10-31 松下電器産業株式会社 音復元装置および音復元方法
US20060257827A1 (en) * 2005-05-12 2006-11-16 Blinktwice, Llc Method and apparatus to individualize content in an augmentative and alternative communication device
US20060116142A1 (en) * 2006-02-07 2006-06-01 Media Lab Europe (In Voluntary Liquidation) Well Behaved SMS notifications
US7983910B2 (en) * 2006-03-03 2011-07-19 International Business Machines Corporation Communicating across voice and text channels with emotion preservation
CN101046956A (zh) * 2006-03-28 2007-10-03 国际商业机器公司 交互式音效产生方法及系统
CN101175102B (zh) * 2006-11-01 2013-01-09 鸿富锦精密工业(深圳)有限公司 具有音频调变功能的通讯装置及其音频调变的方法
JP5275612B2 (ja) * 2007-07-18 2013-08-28 国立大学法人 和歌山大学 周期信号処理方法、周期信号変換方法および周期信号処理装置ならびに周期信号の分析方法
JP2009122776A (ja) * 2007-11-12 2009-06-04 Internatl Business Mach Corp <Ibm> 仮想世界における情報制御方法および装置
CN101304391A (zh) * 2008-06-30 2008-11-12 腾讯科技(深圳)有限公司 一种基于即时通讯系统的语音通话方法及系统
WO2010120559A2 (en) * 2009-03-31 2010-10-21 Mytalktools.Com Augmentative and alternative communication system with personalized user interface and content

Cited By (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010000161A1 (zh) * 2008-06-30 2010-01-07 腾讯科技(深圳)有限公司 一种基于即时通讯系统的语音通话方法及装置
CN101888607A (zh) * 2010-07-15 2010-11-17 中兴通讯股份有限公司 基于widget实现手机聊天的方法及手机
CN104144097A (zh) * 2013-05-07 2014-11-12 百度在线网络技术(北京)有限公司 语音消息传输系统、发送端、接收端及语音消息传输方法
CN104376846A (zh) * 2013-08-16 2015-02-25 联想(北京)有限公司 一种语音调节方法、装置和电子设备
CN104780091B (zh) * 2014-01-13 2019-06-25 北京发现角科技有限公司 一种具有语音音频处理功能的即时通信方法和系统
CN104780091A (zh) * 2014-01-13 2015-07-15 北京发现角科技有限公司 一种具有语音音频处理功能的即时通信方法和系统
CN104980396A (zh) * 2014-04-03 2015-10-14 北京千橡网景科技发展有限公司 一种用于社交网络的通信方法及系统
CN104200824B (zh) * 2014-08-25 2019-05-03 努比亚技术有限公司 音频录制方法和装置
CN104200824A (zh) * 2014-08-25 2014-12-10 深圳市中兴移动通信有限公司 音频录制方法和装置
CN106506437A (zh) * 2015-09-07 2017-03-15 腾讯科技(深圳)有限公司 一种音频数据处理方法,及设备
CN105304092A (zh) * 2015-09-18 2016-02-03 深圳市海派通讯科技有限公司 一种基于智能终端的实时变声方法
CN106161218A (zh) * 2016-09-28 2016-11-23 乐视控股(北京)有限公司 实时通话中的语音处理方法及装置
CN106406809A (zh) * 2016-12-21 2017-02-15 维沃移动通信有限公司 一种声音信号处理方法及移动终端
CN107731241A (zh) * 2017-09-29 2018-02-23 广州酷狗计算机科技有限公司 处理音频信号的方法、装置和存储介质
CN107731241B (zh) * 2017-09-29 2021-05-07 广州酷狗计算机科技有限公司 处理音频信号的方法、装置和存储介质
CN111194545A (zh) * 2017-10-09 2020-05-22 深圳传音通讯有限公司 一种移动通讯设备通话时改变原始声音的方法和系统
CN108417223A (zh) * 2017-12-29 2018-08-17 申子涵 在社交网络中发送变调语音的方法
CN109404685A (zh) * 2018-09-12 2019-03-01 乐歌人体工学科技股份有限公司 增高台
CN109404685B (zh) * 2018-09-12 2022-04-08 乐歌人体工学科技股份有限公司 增高台
CN111339442A (zh) * 2020-02-25 2020-06-26 北京声智科技有限公司 线上好友互动方法及装置

Also Published As

Publication number Publication date
WO2010000161A1 (zh) 2010-01-07
US20110044324A1 (en) 2011-02-24

Similar Documents

Publication Publication Date Title
CN101304391A (zh) 一种基于即时通讯系统的语音通话方法及系统
Pearce Enabling new speech driven services for mobile devices: An overview of the ETSI standards activities for distributed speech recognition front-ends
JP4003839B2 (ja) インターネット電話通信用拡張型無線電話
US20040267527A1 (en) Voice-to-text reduction for real time IM/chat/SMS
CN101819781B (zh) 通信装置和通信方法
US20070025546A1 (en) Method and apparatus for DTMF detection and voice mixing in the CELP parameter domain
CN103988486B (zh) 在多方电话会议的混音中选择活动信道的方法
EP2245826A1 (en) Method and apparatus for detecting and suppressing echo in packet networks
US8340959B2 (en) Method and apparatus for transmitting wideband speech signals
CN102592591A (zh) 双带语音编码
US20030202641A1 (en) Voice message system and method
CN102144256A (zh) 用于针对矢量量化器的快速最近邻搜索的方法和设备
WO2014194728A1 (en) Voice processing method, apparatus, and system
Sapozhnykov et al. A low-rate data transfer technique for compressed voice channels
TW561451B (en) Audio mixing method and its device
AU4509800A (en) Telephone system and telephone method
CN101478616A (zh) 一种即时语音通信方法
US11581002B2 (en) Communication method, apparatus, and system for digital enhanced cordless telecommunications (DECT) base station
Chinna Rao et al. Real-time implementation and testing of VoIP vocoders with asterisk PBX using wireshark packet analyzer
CN101207500B (zh) 一种音频数据变音方法
CN101867900A (zh) 可携式电子装置间的档案传输方法及系统及储存媒体
CN103686059A (zh) 分布式混音处理方法及系统
US7239253B1 (en) Codec system and method
US7076260B1 (en) Unbalanced coding for cordless telephony
US6801622B1 (en) Devices, software and methods for passing DTMF signals under voice compression

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication

Open date: 20081112