CN101911662A

CN101911662A - 将音频与铃声数据混合的方法及系统

Info

Publication number: CN101911662A
Application number: CN2008801235789A
Authority: CN
Inventors: 张敖成; 贝俊彦; 卡西克·卡纳安; 西瓦·帕万·库马尔·米特纳拉; 惠雅·纳尔逊
Original assignee: Qualcomm Inc
Current assignee: Qualcomm Inc
Priority date: 2007-11-21
Filing date: 2008-11-21
Publication date: 2010-12-08
Also published as: EP2232834A1; US20090131119A1; US8498667B2; WO2009067693A1; JP2011504713A; KR20100094529A; TW200939732A

Abstract

本发明揭示一种用于在现行通信会话期间在通信装置(110)中播放经混合的音频的方法及系统。一种配置允许与在进行中的电话呼叫期间接收的语音音频同时听到铃声音频。在一种配置中，所述装置(110)包括：收发器(130)，其经配置以接收第一音频信号；事件处置器(128)，其经配置以接收通知；存储设备(126)，其经配置以存储至少一个音频文件(124)；处理器(112)，其经配置以基于所述所接收的通知起始将所述存储设备(126)中所存储的音频文件(124)转换为第二音频信号；混合器(120)，其经配置以混合所述第一音频信号及所述第二音频信号以产生经混合的音频信号；及输出装置(122)，其用于输出所述经混合的音频信号。

Description

将音频与铃声数据混合的方法及系统

技术领域

本发明涉及音频处理，且更确切地说涉及允许同时播放至少两个音频信号的音频混合技术。本发明与题为“智能缩放及混合以区分音频源(Intelligent Scaling and Mixing to Differentiate Audio Sources)”的共同待决且共同相关的第11/449,454号专利申请案相关。

背景技术

现代电话手持机现在包含高级音乐特征，其允许用户收听高质量的音乐且还进行电话呼叫和接收来自第三方的电话呼叫。多媒体手持机设计需要灵活的数字音频取样及强大的处理能力以实现高保真品质的音频录制及播放特征。举例来说，例如多段均衡或3D声音处理的复杂音频处理可能变成优化信号以供经由扬声器电话或头戴式受话器播放所必须的。

在当前手持机变得越来越强大时，用户同时在其手持机使用方面需要较大灵活性。为了支持这些新兴的复杂用户模式，所述手持型装置开始需要灵活的数字及模拟接口，所述接口允许在播放模式期间混合不同内容。举例来说，如果检测到传入电话呼叫，则许多当前电话将暂停音乐或视频播放。其它电话将降低音乐或视频的音量并播放音调以警示用户一呼叫正在传入。这些不同数据流通常具有不同取样率，此情况增加了管理这些手持机特征的复杂性。

当蜂窝式电话闲置且接收传入呼叫通知时，所述蜂窝式电话将通常存取待经由电话的扬声器播放的铃声数据。所述铃声数据可为简单音调或复杂乐谱，且其通常由用户选择以既在美感方面令人愉悦又识别呼叫者。然而，当蜂窝式电话的用户已忙于用电话通话时，铃声特征通常不存在。简单音调声音向手机用户指示存在另外的传入呼叫，因为手机无法在不影响进行中的通话的质量的情况下产生复杂声音。

发明内容

本发明中所描述的一个方面是一种在现行通信会话期间在通信装置中播放经混合的音频的方法，所述方法包括：从现行通信会话接收第一音频信号；接收通知；响应于所述通知，起始将经存储的音频文件转换为第二音频信号；混合第一音频信号及第二音频信号以产生经混合的音频信号；及将经混合的音频信号输出到通信装置的输出端。

本发明中所描述的另一方面是一种经配置以在现行通信会话期间播放经混合的音频的通信装置，所述装置包括：收发器，其经配置以接收第一音频信号；事件处置器，其经配置以接收通知；存储设备，其经配置以存储至少一个音频文件；处理器，其经配置以基于所接收的通知起始将存储设备中所存储的音频文件转换为第二音频信号；混合器，其经配置以混合第一音频信号及第二音频信号以产生经混合的音频信号；及输出装置，其用于输出经混合的音频信号。

一个方面是一种在现行通信会话期间在通信装置中播放经混合的音频的方法。此方法包含：从现行通信会话接收第一音频信号；接收通知；响应于所述通知，起始将经存储的音频文件转换为第二音频信号；混合第一音频信号及第二音频信号以产生经混合的音频信号；及将经混合的音频信号输出到通信装置的输出端。

另一方面是一种经配置以在现行通信会话期间播放经混合的音频的通信装置。此装置包含：收发器，其经配置以接收第一音频信号；事件处置器，其经配置以接收通知；存储设备，其经配置以存储至少一个音频文件；处理器，其经配置以基于所接收的通知起始将存储设备中所存储的音频文件转换为第二音频信号；混合器，其经配置以混合第一音频信号及第二音频信号以产生经混合的音频信号；及输出装置，其经配置以输出经混合的音频信号。

又一配置是一种经配置以在现行通信会话期间播放经混合的音频的通信装置，其中所述装置具有：用于从现行通信会话接收第一音频信号的装置；用于接收通知的装置；用于基于所述通知起始将经存储的音频文件转换为第二音频信号的装置；用于混合第一音频信号及第二音频信号以产生经混合的音频信号的装置；及用于将经混合的音频信号输出到通信装置的输出端的装置。

再一配置是一种或一种以上处理器可读存储装置，其具有处理器可读代码，所述处理器可读代码用于对一个或一个以上处理器进行编程以执行在现行通信会话期间在通信装置中播放音频的方法。所述存储装置经编程以执行一方法，所述方法是：从现行通信会话接收第一音频信号；接收通知；响应于所述通知，起始将经存储的音频文件转换为第二音频信号；混合第一音频信号及第二音频信号以产生经混合的音频信号；及将经混合的音频信号输出到通信装置的输出端。

另外一种配置是一种在通信装置中的电路，其经配置以执行在现行通信会话期间播放音频的方法，所述方法是：提供第一可混合的音频信号；接收通知；基于所述所接收的通知，起始将不可混合的音频文件转换为第二可混合的音频信号；混合所述第一可混合的音频信号及所述第二可混合的音频信号以产生经混合的音频信号；及输出所述经混合的音频信号。

附图说明

图1是本发明中的示范性配置的功能框图。

图2是展示同时播放语音信号及MIDI文件的方法的流程图。

图3是展示在一时间周期内分配处理能力的图表。

图4是展示根据本发明中的一种配置的中断优先权的图表。

具体实施方式

一种配置是用于在现行通信会话期间在通信装置中播放经混合的音频的系统及方法。举例来说，一种配置允许向蜂窝式电话的用户播放与传入呼叫相关联的铃声，同时所述电话继续对来自已正发生的电话通话的语音音频进行编码和解码。所述铃声可为简单音符或复杂音乐片断。如下文所论述，本文中所描述的其它配置将铃声的音乐数据与进行中的通话合并，而不会使在通信装置上发生的通话的质量降级。

如所提及，通信装置可为无线蜂窝式电话。另外，通信装置可为个人数字助理(PDA)、个人通信器、基于陆线的电话或配备有通信能力的立体或便携型音乐播放器。另外，通信装置可为使用IP(因特网协议)语音的移动单元，其中所述移动单元可为PDA、移动电话、膝上型计算机、个人计算机等。一般来说，现行通信会话是两个装置之间的数据会话，其中数据正传输到一装置或从一装置传输到另一装置(例如，基站或另一终端)。现行通信会话包括所述装置与另一装置或系统之间的通信链路。现行通信会话的一实例是无线通信系统中的进行中的电话呼叫，例如，当第一无线呼叫者对第二基于地面的呼叫者或无线呼叫者谈话时。

关于混合音频信号，线性重叠的原理首先适用于声波。亦即，当同时播放两个声音时，每一声音产生一声波，且在任何时间点所测量的声音大约等于在所述时间点所述两个波的和。因此，可称混合两个声音产生单个声音，所述单个声音是所述两个输入声音的和。类似地，混合两个音频流(其各自代表一声音)导致单个音频流，所述单个音频流代表所述两个输入声音的和。然而，混合两个不同的音频流可能不止涉及简单的求和。举例来说，在一些配置中，必须首先确保每一音频流处于“可混合的音频格式”。可混合的音频格式包含其中存在代表一系列取样时间点的基本声波形的数据的数据格式。所述格式的一个实例是脉码调制(PCM)。为了混合两个信号，对于两个信号来说，取样时间点相同可能是有利的。此做法简化了所述两个信号的求和。为了实现此效果，可能必须对所述信号中的一者或两者重新取样，亦即，计算不同系列的取样时间点的基本声波形的所述值。

混合也可包含以其它方式改变一个或两个音频流。举例来说，可能必须调整音量(或基本波形的振幅)以便当两个信号混合时避免不良音频效果(例如，限幅)。改变所述音频流中的一者或两者以使得收听者在听到经混合的音频流时可区分所述两个声音可能也是有利的。举例来说，可相对于音频流中的一者使音频流中的另一者衰减以使得可较容易听到所述一者。音频流中的每一者可使其平衡得以调整，以便在右听筒中听到一个音频流且在左听筒中听到另一个音频流。在题为“智能缩放及混合以区分音频源(Intelligent Scaling and Mixing to Differentiate Audio Sources)”的第11/449,454号美国专利申请案中描述又一混合技术。

因为混合可包含将每一数据流设置成可混合的格式，所以混合可包含数据流的合成、解压缩、解码或其它处理。在为进行混合需要以合成为条件的一种类别的不可混合的音频文件格式是例如MIDI(乐器数字接口)的事件驱动文件格式。MIDI格式经设计以用于在例如音乐合成器及PC声卡的电子音乐装置之间发送音乐信息。可在因特网上在MIDI.ORG处找到关于MIDI文件的更多信息。MIDI文件并不含有经数字化的声音，而是含有可由处理器解译并合成为可混合的音频流的一组数字音乐指令(音符)。因为MIDI格式仅含有呈音符形式的指令，所以MIDI文件可能非常小。以MIDI格式存储的音频文件通常具有扩展名.mid或.midi。其它相似或并入有MIDI的特征的格式包含XMF(可扩展音乐格式)或SMAF(合成音乐移动应用格式)。一些事件驱动格式包括用于在特定时间播放所存储的数字音频文件的指令，而不包括用于播放必须在特定时间合成的音符的指令(或除了用于播放必须在特定时间合成的音符的指令之外，还包括用于在特定时间播放所存储的数字音频文件的指令)。这些数字音频文件可包含以可混合的音频文件格式存储的文件。还应注意，可在将两个事件驱动文件中的任一者合成为“可混合的音频格式”之前混合所述两个事件驱动文件，且可在所述混合之后实现所述合成。

另一类别的不可混合的音频文件格式包含例如MP3的经压缩的音频格式，其在输出到混合器或数/模转换器之前需要处理。又一类别的不可混合的音频文件格式包含经编码的音频格式，例如，用以传输语音数据的无线通信应用(例如，EVRC(增强型可变速率编解码器)或GSM(全球移动通信系统))中的经编码的音频格式。

这些不可混合的文件通常可转换为在电子装置内较容易混合的音频格式。一种此类别的可混合的格式包含PCM(脉码调制)及相关格式，例如，ADPCM(自适应PCM)、WAV或AIFF(音频交换文件格式)。

一种配置允许将至少两个不可混合的音频文件转换为两个可混合的音频流并混合所述音频流以产生对用户的经混合的音频输出。将在维持声音的保真度并产生尽可能少的因处理引起的时间延迟的同时实现此效果。举例来说，如果在蜂窝式电话通话期间接收到传入呼叫，则将通话的语音数据与同所述传入呼叫相关联的铃声数据混合将是有利的。经混合的音频流的产生优选极少引起通话或传入呼叫的通知的延迟，且类似地极少引起语音数据及铃声数据的失真。

虽然本发明的一个方面涉及传入呼叫通知，但是可使用如本文中所描述的铃声数据来执行各种其它通知。举例来说，可使用专用铃声在电话通话期间宣告低电池电量状况或传入文本消息的宣告。通知甚至可包含来自用户的播放特定铃声或其它音频文件的指令。举例来说，如果用户正收听MP3文件并希望查阅他/她的当前铃声库。另一配置也可能未能包含所述用户起始的通知。应理解其它配置可利用在电话通话期间发生的任何类型的通知。

在一种配置中，为了在蜂窝式电话正使用时提供铃声音频，处理器将铃声数据合成为可混合的音频信号。如本文中所揭示，此合成优选与蜂窝式电话正在呼叫中执行其正常操作(例如，对语音包进行编码及解码)同时发生。

在继续下文之前，定义在描述本文中所描述的装置的配置时将使用的一些额外术语可能是有帮助的。因此，贯穿此详细描述，以下术语应具有此处归于所述术语的意义：

术语“宣告”或“呼叫宣告”意谓由电信装置执行以指示传入呼叫的感观可感知发生事件。宣告可为媒体文件、特定序列的闪烁或稳定光、振动或任何其它感观可感知机制。

术语“发起装置”意谓发起出站呼叫的电信装置。所述术语发起装置也可与“主叫方”或“发起方”可互换地使用。

术语“接收装置”意谓接收入站呼叫的电信装置。所述术语接收装置也可与“被叫方”或“接收方”可互换地使用。

所述系统包括如下文详细论述的各种模块。如所属领域的技术人员可了解，所述模块中的每一者可包括各种子例程、程序、定义语句及宏。通常单独编译模块中的每一者并将其链接成单个可执行程序。因此，为了方便起见，使用对模块中的每一者的以下描述来描述优选系统的功能性。因此，可将模块中的每一者经受的处理任意地重新分配到其它模块中的一者，一起组合在单个模块中，或使其可在(例如)可共享的动态链接库中获得。

可使用标准编程或工程技术将本文中所揭示的配置实施为方法、设备或制品以产生软件、固件、硬件或其任何组合。如本文中所使用的术语“制品”指实施在硬件或例如光学存储装置及易失性或非易失性存储器装置的计算机可读媒体中的代码或逻辑。所述硬件可包含(但不限于)现场可编程门阵列(FPGA)、专用集成电路(ASIC)、复杂可编程逻辑装置(CPLD)、可编程逻辑阵列(PLA)、微处理器或其它相似处理装置。

图1是本发明的示范性配置的功能框图。此配置包含手机110。所述手机可为任何类型的常规无线电话，例如，由

RESEARCH IN

以及其它公司制造的无线电话。所述手机包括收发器130、处理器112、存储器126、混合器120及扬声器122以及其它。所述收发器130经配置以发送和接收数字信号。在特定配置中，收发器可包括用于无线通信的天线。处理器112可为任何标准或定制设计的微处理器。在一种配置中，处理器包括来自高通(Qualcomm)的MSM(移动台调制解调器)系列的芯片组，例如，MSM 6290或MSM 6800。可在因特网上在qualcomm.com处找到关于这些处理器的更多信息。耦合到所述处理器的(或在一些配置中，所述处理器的一部分)是事件处置器128。所述事件处置器128能够经由小键盘、处理器、收发器或其它能够发送通知并产生导致处理器112采取预定动作的事件的装置来接收来自用户的通知。举例来说，所述事件处置器128可作为函数调用在软件中实施。存储器126可为任何类型的数字存储设备，例如，快闪存储卡或磁性硬盘驱动器。耦合到存储器(或在一些配置中存储在存储器内)的是音频文件库124。可以例如上文所列举的格式的各种格式存储音频文件124。

音频文件124可包括待在接收到由事件处置器128处置的传入呼叫通知后播放的铃声数据。当接收到所述传入呼叫通知时，基于由用户选择的准则来选择适当的音频文件。举例来说，来自工作的手机呼叫可与作为MIDI文件存储在所述音频文件库124中的第一铃声相关联，而来自朋友的电话呼叫可与作为WAV文件存储在所述音频文件库124中的第二铃声相关联。混合器120经配置以将输出提供到扬声器122。混合器120经配置以将两个或两个以上音频流混合在一起，并且将单个音频流输出到扬声器122。可单独实施混合器120或作为处理器的一部分实施混合器120，且可由软件或固件来实现其执行的功能。如上文所提及，为了混合两个音频流，将混合器连接到至少一声码器解码器(vocoder decoder)118及一MIDI合成器116。在一些配置中，声码器解码器118及MIDI合成器116是混合器120的一部分。

声码器解码器118经配置以将与电话呼叫或现行通信会话相关联的语音包(语音数据)解码成可混合的音频格式。所述声码器解码器118对来自例如另一手机或陆线电话的发起装置的传入话音进行解码。MIDI合成器116经配置以基于输入的MIDI文件以可混合的音频格式合成音频信号。MIDI合成器的一个实例是CMX MIDI合成器。也在手机110内的是声码器解码器118，其对来自例如另一手机或陆线电话的发起装置的传入话音进行解码。当输入语音包及MIDI文件时，来自混合器120的经组合的输出允许用户在与另一方的电话通话期间听到MIDI铃声。

图2是展示同时将语音信号及MIDI文件输出到用户的过程200的流程图。当手机具有正在处理的呼叫时，可发生所述过程200。在状态210处，处理器等待接收传入呼叫通知。如果不存在另一传入呼叫的通知，则状态210继续循环。一旦手机收到通知有传入呼叫，便在状态212处从所存储的MIDI文件中选择与所述传入呼叫相关联的适当的铃声数据。

一旦已在状态212处选择适当的铃声数据，则所述过程200移动到决策状态220以确定在手机内是否存在足够可用处理能力来处理语音编码、语音解码及铃声数据的合成。下文关于图3更完整地论述此情况。如果在决策状态220处作出处理器并不具有合成全部量的铃声数据(由于大量处理能力专用于语音编码及/或解码)的能力的确定，则在状态216处修改铃声数据。

在状态216中，系统可减少铃声数据的复杂性以便可使用较少处理器循环来合成所述铃声数据。此做法允许系统维持语音编码及解码处理的保真度，但仍向用户播放所选择的铃声。在一种配置中，在状态216期间，当正由MIDI合成器合成铃声时，系统从所述铃声中移除一个或一个以上音符。因为MIDI文件基本上是组成铃声的音符的文件，所以有可能在将文件作为铃声重建成数字音乐之前从MIDI文件中减少特定音符。典型用户不可能注意到此减少，因为此减少将仅对铃声的总体声音作出极微小的改变。

在一种配置中，音符移除的次序是基于限制移除音符对用户的所感知的影响。举例来说，因为收听者将不会在像相对较大声的音符一样的程度上发现较安静的音符的遗失，所以移除音量较低的音符将对收听者产生较少影响。对于减少铃声的复杂性的另一选择是通过移除(且因此不合成)“释放部分”中的音符。在一铃声中，任何特定音符或音调均可具有若干状态。最初，音符在特定时间周期内可处于“初始”部分中。所述音符接着在特定时间周期内从所述初始部分移动到“持续”部分。所述“持续”部分之后是音符的释放部分。因为与其它部分相比释放部分可能较安静且对于铃声的总体乐曲来说较不重要，所以减少音符的释放部分的持续时间可能不会被用户注意。

预期减少铃声数据的复杂性的另外其它方法。举例来说，可给予例如旋律的特定MIDI音轨高于其它音轨的优先权。如已知的，与例如和音或和声的一次性事件相反，铃声的旋律是音乐事件的线性连续。因此，可用高于和声的保真度来合成旋律，而不破坏铃声的所感知的声音。因此，在一种配置中，移除来自和声或特定和音的音符以便减少铃声的复杂性，而不改变旋律音轨内的音符。

一旦系统通过上文所描述的方法中的一者减少了音乐的复杂性，所述过程200便移动到决策状态218，其中作出是否已将文件减少足够量以允许处理器合成铃声且还对进行中的电话呼叫的语音信号进行解码和编码的确定。如果作出不存在足够的剩余MIPS(每秒百万条指令，处理能力的度量)来以高保真度对语音信号进行解码和编码的确定，则所述过程200返回到状态216，其中采取额外方法来减少铃声的复杂性。然而，如果作出手持机内存在足够的剩余MIPS来对语音进行解码和编码且还合成铃声的确定，则所述过程200移动到状态220，其中合成铃声。

一旦已在状态220处将铃声数据合成为音频信号，便将所述所得音频信号与从声码器解码器接收的输出音频信号混合222。为了将从MIDI合成器接收的音频信号与来自声码器解码器的语音数据混合，对每一数据流重新取样以具有相同取样频率可能是有利的。在一种配置中，在48kHz下对语音及铃声音频信号取样。当然，系统并不限于在任何特定频率下取样。接着经由手机的扬声器播放经混合的声音224。

图3是展示在60毫秒的时间周期内分配手持机中的处理能力的图表，在所述时间周期内，用户正进行电话呼叫且铃声也正试图在同一周期期间播放，从而通知用户有传入呼叫。在手机通话期间，处理器负责语音编码、语音解码及铃声合成以及其它。在特定电话呼叫期间，语音编码/解码可使用的芯片/微处理器/计算机处理能力的最大量取决于正处理的特定编解码器。在任何给定时间使用的此最大量取决于实际编码或解码的信号。举例来说，编码/解码静默耗费极少的处理能力。在图3中，可能需要70％的处理能力的示范性编解码器用于在电话呼叫期间对语音信号进行编码和解码。当此编解码器在使用时，此70％的处理能力专用于语音编码/解码。因此，在接收到通知的情况下，剩余处理能力可用于铃声合成。

当然，编解码器可需要的处理能力的百分比可为除70％以外的数目，且预期在一种配置中，可根据使用的编解码器来动态分配处理能力。在图3中所展示的实例中，在0毫秒与10毫秒之间，大约一半的专用处理能力用于声码器操作。在10毫秒结束时，语音解码已将所接收的不可混合的语音包转换成可混合的音频格式，所述可混合的音频格式可被馈送到数/模转换器并经由扬声器播放。在10毫秒结束时，向电话的用户播放所述经解码的音频。当播放此音频时，在下一10毫秒中，声码器需要大约3/4的专用处理能力来执行语音包编码及解码。在下一10毫秒结束时，将不可混合的语音包解码成可混合的音频格式并向用户播放所述语音包。因此，在0与20毫秒之间，处理器对来自电话通话的语音信号完全编码和解码。在大约20毫秒时，接收传入呼叫通知，从而促使处理器选择适当的铃声数据并开始将其合成为可混合的音频信号。因此系统开始执行10毫秒的语音编码/解码及MIDI合成两者。此外，未使用100％的专用于声码器操作的处理能力，且在此情况下未使用100％的用于铃声合成的剩余处理能力。因为可在来自处理器的可用MIPS内合成第一10毫秒的MIDI铃声数据，所以无需采取任何措施来减少铃声的复杂性。在此10毫秒时间周期结束时，已将不可混合的语音包转换为可混合的音频流，且已将不可混合的铃声数据合成为可混合的音频流。混合此两个流并将其以尽可能少的延迟播放。因此，当在下一10毫秒内合成铃声数据的下一部分时，向用户播放包括语音及铃声音频的经混合的音频流。在30毫秒与40毫秒之间的下一10毫秒中，大量专用声码器处理能力正在使用，且继续发生铃声合成。然而，在此情况下，铃声数据过于复杂以致不能使用可用处理能力来完全合成所述铃声数据。

所述可用处理能力用于尽可能如实地合成10毫秒的铃声数据。如上文所论述，系统可通过上文所描述的方法中的一者或一者以上来减少铃声的复杂性，而非仅合成(例如)第一5毫秒的铃声部分。举例来说，通过从输入到MIDI合成器的数据中移除音符，需要较少的处理能力来将数据合成为音频信号。如上文所论述，音符移除的次序是基于限制丢弃音符的所感知的效果。应认识到，在一种配置中，系统继续减少复杂性以使得铃声的时序不会受进行中的电话通话的损害。因此，虽然可减少铃声的复杂性，但并非合成所述铃声而使得音乐乐曲中具有间隙或跳跃。乐曲仍在其正常时间周期中播放，可依据处理器对语音数据进行编码及解码的繁忙程度而仅或多或少地减少所述乐曲的复杂性。此做法确保铃声维持与用户预期的声音相同的声音而无跳过或噪音。

以许多方式中的任一者执行减少铃声数据的复杂性。在一种配置中，把将在处理能力可用的情况下在给定时间合成的所有音符存储在存储器中，其中给予每一音符设置成开或关的“现行”属性。为了减少复杂性，仅需要将“现行”属性改成关。将对MIDI合成器进行编程以仅合成“现行”属性设置成开的那些音符。

图4是展示根据一种配置的中断优先权的图表。考虑混合器410、音频命令412、声码器解码器414、MIDI合成器416及声码器编码器418间的优先权，混合器410具有最高优先权以确保无噪音播放。第二，音频命令412具有第二优先权，因为其是短小的，且在一些配置中，主处理器需要快速的响应。第三，声码器解码器414具有第三优先权，因为其时序约束可能较严格。MIDI合成器416具有第四优先权，因为其10毫秒的时间分辨率比声码器编码器的20毫秒帧精细。将MIDI合成器设计成不会消耗大于预分配的处理能力的处理能力。否则，声码器编码器的输出可能恶化。

声码器编码器418具有较低优先权。最终，因为所有处理是中断驱动的，所以闲置循环在最上级代码中可能是有利的。在硬件支持MIDI合成的情况下，可存在额外MIDI硬件ISR。MIDI硬件的优先权可与音频命令相同以实现MIDI硬件的最大利用。所述中断用于对处理器执行给定命令系列的次序区分优先次序。举例来说，如果处理器正使用声码器编码器对语音包进行编码且其突然接收到开始MIDI合成的指令，则处理器可在返回使用声码器编码器完成对语音包的编码之前执行MIDI合成(因为其中断优先权较高)。

如上文所提及，一种配置是一种在现行通信会话期间在通信装置中播放经混合的音频的方法，所述方法包括：从现行通信会话接收第一音频信号；接收通知；响应于所述通知，起始将经存储的音频文件转换为第二音频信号；混合第一音频信号及第二音频信号以产生经混合的音频信号；及将经混合的音频信号输出到通信装置的输出端。上文已描述用于执行此方法的步骤的结构。下文论述用于执行所述步骤的额外方式。可由收发器130执行从现行通信会话接收第一音频信号的步骤。收发器130可包含用于接收无线信号的天线或与公共数据网络(例如，因特网)的有线连接。举例来说，处理器112也可经由收发器130来接收第一音频信号。可由事件处置器128执行接收通知的步骤。举例来说，当蜂窝式电话的电池电量低时，处理器112可向事件处置器128产生通知，事件处置器128又指示处理器112从存储器126或音频文件库124中选择适当的音频文件。举例来说，处理器112也可从事件处置器或经由收发器130来接收通知。可由处理器112在其从存储器126或音频文件库124中加载音频文件时执行起始将经存储的音频文件转换为第二音频信号的步骤。存储器126也可在其响应于来自处理器112或事件处置器128的指令将第二音频信号传输到处理器112、混合器120或MIDI合成器116时执行起始转换。可由混合器120执行混合第一音频信号及第二音频信号的步骤。另外，可由处理器112执行此步骤。在混合例如两个MIDI文件的两个事件驱动音频信号的情况下，MIDI合成器116可能能够执行所述混合。可由混合器120执行将经混合的音频信号输出到通信装置的输出端的步骤。通信装置的输出装置可为扬声器122或收发器130。在输出装置为收发器130的情况下，处理器112可能能够执行所述输出步骤。在输出装置为天线的配置中，收发器130可执行所述输出步骤。在混合器120将经混合的音频信号馈送到处理器112以用于进一步处理(例如，在输出到扬声器之前的数/模转换)的配置中，处理器112可执行所述输出步骤。

应注意，所属领域的技术人员将认识到一电路可实施上文所描述的功能中的一些或全部。可能存在一个实施所有功能的电路。也可能存在与一可实施所有功能的第二电路组合的电路的多个区段。大体来说，如果在电路中实施多个功能，则所述电路可为集成电路。使用当前移动平台技术，集成电路可包括至少一个数字信号处理器(DSP)及控制所述至少一个DSP及/或与所述至少一个DSP通信的至少一个ARM处理器。可按区段描述一电路。通常重新使用区段以执行不同功能。

通信装置中的电路可经配置以提供第一可混合的音频信号。同一电路、不同电路或同一或不同电路的第二区段可经配置以接收通知。另外，同一电路、不同电路或同一或不同电路的第三区段可经配置以基于所接收的通知起始将不可混合的音频文件转换为第二可混合的音频信号。经配置以起始转换的电路部分可耦合到接收通知的电路部分，或其可为同一电路。同一或不同电路的第四区段可经配置以混合第一可混合的音频信号及第二可混合的音频信号以产生经混合的音频信号。所述第四区段可有利地耦合到第一区段及第四区段以获得第一及第二可混合的音频信号。或者，第一、第三及第四区段可实施于同一电路中。同一或不同电路的第五区段可经配置以输出经混合的音频信号。所述第五区段可有利地耦合到第四区段，或其可与第四区段实施于同一电路中。

前文描述阐述各种优选配置及其它示范性但非限制性配置。所述描述给出关于所揭示的配置的组合及模式的一些细节。所述配置的所揭示的特征及方面的其它变化、组合、修改、模式及/或应用(包含所属领域的技术人员在阅读本说明书后了解的变化、组合、修改、模式及/或应用)也在本发明的范围内。因此，应仅通过清楚地阅读随附权利要求书来确定本文中所主张的内容的范围。

Claims

1.一种在现行通信会话期间在通信装置中播放经混合的音频的方法，所述方法包括：

从所述现行通信会话接收第一音频信号；

接收通知；

响应于所述通知，起始将经存储的音频文件转换为第二音频信号；

混合所述第一音频信号及所述第二音频信号以产生经混合的音频信号；以及

将所述经混合的音频信号输出到所述通信装置的输出端。

2.根据权利要求1所述的方法，其中所述第一音频信号包括语音数据。

3.根据权利要求1所述的方法，其中所述通知包括传入呼叫的通知。

4.根据权利要求1所述的方法，其中所述通信装置包括电话且所述现行通信会话包括进行中的电话呼叫。

5.根据权利要求1所述的方法，其中所述通信装置是无线蜂窝式电话。

6.根据权利要求1所述的方法，其中所述第二音频文件包括铃声数据。

7.根据权利要求1所述的方法，其中所述第二音频文件包括以事件驱动音频格式存储的文件。

8.根据权利要求7所述的方法，其中所述事件驱动音频格式包括MIDI分量。

9.根据权利要求1所述的方法，其中所述混合包括改变所述音频信号中的至少一者的音频感知特性。

10.根据权利要求1所述的方法，其中所述混合包括对可混合的音频文件中的至少一者重新取样。

11.根据权利要求1所述的方法，其中所述混合包括合成、解压缩或解码。

12.一种经配置以在现行通信会话期间播放经混合的音频的通信装置，所述装置包括：

收发器，其经配置以接收第一音频信号；

事件处置器，其经配置以接收通知；

存储设备，其经配置以存储至少一个音频文件；

处理器，其经配置以基于所述所接收的通知起始将所述存储设备中所存储的音频文件转换为第二音频信号；

混合器，其经配置以混合所述第一音频信号及所述第二音频信号以产生经混合的音频信号；以及

输出装置，其经配置以输出所述经混合的音频信号。

13.根据权利要求12所述的装置，其中所述通信装置包括电话且所述现行通信会话包括进行中的电话呼叫。

14.根据权利要求13所述的装置，其中所述电话包括无线蜂窝式电话。

15.根据权利要求12所述的装置，其中所述输出装置是扬声器。

16.根据权利要求12所述的装置，其中所述处理器、事件处置器及混合器中的至少两者实施在同一单元中。

17.根据权利要求12所述的装置，其中所述处理器进一步经配置以对所接收的语音数据进行解码以提供第一可混合的音频信号。

18.根据权利要求12所述的装置，其中所述通知由所述处理器产生。

19.根据权利要求12所述的装置，其中所述通知包括传入呼叫通知。

20.根据权利要求12所述的装置，其中不可混合的音频文件包括铃声数据。

21.根据权利要求12所述的装置，其中所述混合器经配置以对所述可混合的音频信号中的至少一者重新取样。

22.根据权利要求12所述的装置，其中所述混合器及所述处理器中的至少一者经配置以执行合成、解压缩或解码。

23.一种经配置以在现行通信会话期间播放经混合的音频的通信装置，所述装置包括：

用于从所述现行通信会话接收第一音频信号的装置；

用于接收通知的装置；

用于基于所述通知起始将经存储的音频文件转换为第二音频信号的装置；

用于混合所述第一音频信号及所述第二音频信号以产生经混合的音频信号的装置；以及

用于将所述经混合的音频信号输出到所述通信装置的输出端的装置。

24.一种或一种以上处理器可读存储装置，其具有处理器可读代码，所述处理器可读代码用于对一个或一个以上处理器进行编程以执行在现行通信会话期间在通信装置中播放音频的方法，所述方法包括：

从所述现行通信会话接收第一音频信号；

接收通知；

将所述经混合的音频信号输出到所述通信装置的输出端。

25.根据权利要求24所述的一种或一种以上处理器可读存储装置，其中所述现行通信会话包括进行中的电话呼叫。

26.根据权利要求24所述的一种或一种以上处理器可读存储装置，其中所述通知包括传入电话呼叫的通知。

27.一种在通信装置中的电路，其经配置以执行在现行通信会话期间播放音频的方法，

所述方法包括：

提供第一可混合的音频信号；

接收通知；

基于所述所接收的通知，起始将不可混合的音频文件转换为第二可混合的音频信号；

混合所述第一可混合的音频信号及所述第二可混合的音频信号以产生经混合的音频信号；以及

输出所述经混合的音频信号。

28.根据权利要求27所述的电路，其中所述第一可混合的音频信号包括经解码的语音数据。

29.根据权利要求27所述的电路，其中接收所述通知包括接收传入电话呼叫的通知。