CN1465149B - 发送设备及方法、接收设备及方法和发送/接收设备 - Google Patents

发送设备及方法、接收设备及方法和发送/接收设备 Download PDF

Info

Publication number
CN1465149B
CN1465149B CN028026632A CN02802663A CN1465149B CN 1465149 B CN1465149 B CN 1465149B CN 028026632 A CN028026632 A CN 028026632A CN 02802663 A CN02802663 A CN 02802663A CN 1465149 B CN1465149 B CN 1465149B
Authority
CN
China
Prior art keywords
data
quality
speech
promoted
coding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN028026632A
Other languages
English (en)
Other versions
CN1465149A (zh
Inventor
近藤哲二郎
服部正明
渡辺勉
木村裕人
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Publication of CN1465149A publication Critical patent/CN1465149A/zh
Application granted granted Critical
Publication of CN1465149B publication Critical patent/CN1465149B/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/22Mode decision, i.e. based on audio signal content versus external parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0316Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
    • G10L21/0364Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/18Information format or content conversion, e.g. adaptation by the network of the transmitted or received information for the purpose of wireless delivery to users or terminals

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Telephone Function (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Abstract

一种能够解码高质量声音的发送/接收装置。蜂窝电话1011编码声音数据并且输出编码的声音数据。而且蜂窝电话1011按照以前学习使用的声音数据和新的声音数据输入来学习质量增进数据以改进从蜂窝电话1012输出的声音,并且发送编码的声音数据和质量增进数据。蜂窝电话1012接收从蜂窝电话1011发送的编码的声音数据,并且选择与蜂窝电话1011的电话号码相关的质量增进数据。蜂窝电话1012按照所选择的质量增进数据解码所接收的编码声音数据。本发明可以应用到发送/接收声音的蜂窝电话。

Description

发送设备及方法、接收设备及方法和发送/接收设备
技术领域
本发明涉及发送机、发送方法、接收机、接收方法和收发机,具体涉及用于允许用户在移动电话上以高音调通话的发送机、发送方法、接收机、接收方法和收发机。
背景技术
由于在移动电话上的语音通话中传输带宽受到限制,因此,所接收的语音的质量比用户实际所说的语音的质量大大降级。
为了改善所接收的语音的质量,传统的移动电话对所接收的语音进行信号处理,例如用于调整语音的频谱的滤波。
每个用户具有他或她自己独特的语音特点。如果所接收的语音进行具有相同抽头系数的滤波操作,那么依赖于用户的不同语音频率特点而不能足够地改善语音质量。
发明内容
考虑到上述问题已经开发出本发明,本发明的目的是获得考虑到每个用户的语音特点而改善的语音质量。
本发明的一种发送机包括:编码装置,它编码语音数据,并输出编码的语音数据;学习装置,它根据在过去的学习中使用的语音数据和新输入的语音数据而学习质量增进数据,所述质量增进数据改善在接收编码语音数据的接收方输出的语音质量;发送装置,它发送编码语音数据和质量增进数据,其中,在接收方,利用作为所述质量增进数据的抽头系数、并利用通过对编码的语音数据解码而得到的解码的语音数据,通过执行高质量数据的预测值的预测计算,而改善在接收方输出的语音质量。
本发明的一种发送方法包括:编码步骤,编码语音数据,并输出编码的语音数据;学习步骤,根据在过去的学习中使用的语音数据和新输入的语音数据而学习质量增进数据,所述质量增进数据改善在接收编码语音数据的接收方输出的语音质量;发送步骤,发送编码语音数据和质量增进数据,其中,所述质量增进数据利用作为所述质量增进数据的抽头系数、并利用通过对编码的语音数据解码而得到的解码的语音数据,通过执行高质量数据的预测值的预测计算,而改善在接收方输出的语音质量。
本发明的一种接收机包括:接收装置,它接收编码语音数据;存储装置,它存储质量增进数据以及识别信息,所述质量增进数据改善通过对编码语音数据解码而获得的解码语音数据,所述识别信息识别已经发送编码语音数据的发送方;选择装置,它从在该存储装置中存储的质量增进数据之中选择与已经发送编码语音数据的发送方的识别信息对应相关的质量增进数据;解码装置,它根据由选择装置选择的质量增进数据来解码由接收装置接收的编码语音数据。
本发明的一种接收方法包括:接收步骤,接收编码语音数据;存储步骤,它存储质量增进数据以及识别信息,所述质量增进数据改善通过对编码语音数据解码而获得的解码语音数据,所述识别信息识别已经发送编码语音数据的发送方;选择步骤,从所存储的质量增进数据之中选择与已经发送编码语音数据的发送方的识别信息对应相关的质量增进数据;解码步骤,根据在选择步骤选择的质量增进数据来解码在接收步骤接收的编码语音数据。
本发明的一种收发机包括:编码装置,它编码语音数据,并输出编码的语音数据;学习装置,它根据在过去的学习中使用的语音数据和新输入的语音数据而学习质量增进数据,所述质量增进数据改善在接收编码语音数据的其它收发机输出的语音质量;发送装置,它发送编码语音数据和质量增进数据;接收装置,它接收编码语音数据;存储装置,它存储质量增进数据以及识别信息,所述识别信息识别已经发送编码语音数据的其它收发机;选择装置,它从在该存储装置中存储的质量增进数据之中选择与已经发送编码语音数据的其它收发机的识别信息对应相关的质量增进数据;解码装置,它解码由接收装置接收的编码的语音数据,并利用解码的语音数据、以及作为由选择装置选择的质量增进数据的抽头系数,通过执行高质量数据的预测值的预测计算,而改善解码的语音数据的质量。
在所述收发机中,编码输入的语音数据,并输出编码语音数据。根据在过去的学习中使用的语音数据和新输入的语音数据而学习质量增进数据,所述质量增进数据改善在接收编码语音数据的其它收发机输出的语音质量。随后发送编码语音数据和质量增进数据。接收从其他收发机发送的编码语音数据。选择与已经发送编码语音数据的其他收发机的识别信息对应相关的质量增进数据。根据所选择的质量增进数据,解码所接收的编码语音数据。
附图说明
图1是图解实现本发明的发送系统的一个实施例的方框图。
图2是图解移动电话101的结构的方框图。
图3是图解发送机113的结构的方框图。
图4是图解接收机114的结构的方框图。
图5是图解由接收机114执行的质量增进数据设置处理的流程图。
图6是图解由呼叫方执行的质量增进数据发送处理的第一实施例的流程图。
图7是图解由被呼叫方执行的质量增进数据更新处理的第一实施例的流程图。
图8是由呼叫方执行的质量增进数据发送处理的第二实施例的流程图。
图9是由被呼叫方执行的质量增进数据更新处理的第二实施例的流程图。
图10是图解由呼叫方执行的质量增进数据发送处理的第三实施例的流程图。
图11是图解由被呼叫方执行的质量增进数据更新处理的第三实施例的流程图。
图12是图解由呼叫方执行的质量增进数据发送处理的第四实施例的流程图。
图13是图解由被呼叫方执行的质量增进数据更新处理的第四实施例的流程图。
图14是图解学习单元125的结构的方框图。
图15是图解学习单元125的学习过程的流程图。
图16是图解解码器132的结构的方框图。
图17是图解解码器132的学习过程的流程图。
图18是图解CELP编码器123的结构的方框图。
图19是图解使用CELP编码器123的解码器132的结构的方框图。
图20是图解使用CELP编码器123的学习单元125的结构的方框图。
图21是图解执行向量量化的编码器123的结构的方框图。
图22是图解学习单元125的结构的方框图,其中编码器123执行向量量化。
图23是图解学习单元125的学习过程的流程图,其中编码器123执行向量量化。
图24是图解解码器132的结构的方框图,其中编码器123执行向量量化。
图25是图解解码器132的处理的流程图,其中编码器123执行向量量化。
图26是图解实现本发明的计算机的实施例的结构的方框图。
具体实施方式
图1图解了实现本发明的发送系统的一个实施例(所述系统指的是一组多个逻辑链接的装置,并且是否每个装置的结构实际被包括在单个外壳中不重要)。
在这个发送系统中,移动电话1011和1012分别与基站1021和1022进行无线通信。基站1021和1022分别与交换中心103通信。因此通过基站1021和1022和交换中心103来在移动电话1011和1012之间进行语音通信。基站1021和1022可以是相同的单个基站或不同的基站。
在下面的讨论中,除非必要,移动电话1011和1012的每个由移动电话101表示。
图2图解了图1的移动电话1011的结构。由于移动电话1012与移动电话1011具有相同的结构,因此忽略其结构的讨论。
天线111从移动电话1021和1022之一无线电波,并向调制器/解调器112提供所接收的信号。天线111以无线电波的形式从调制器/解调器112向移动电话1021和1022之一发送信号。调制器/解调器112利用CDMA(码分多址)方法解调来自天线111的信号,并向接收机114提供所产生的解调信号。调制器/解调器112利用CDMA方法调制从发送机113提供的发送数据,然后向天线111提供所产生的调制信号。发送机113执行诸如编码用户语音的预定处理,并向调制器/解调器112提供所产生的调制信号。接收机114从调制器/解调器112接收数据,即解调信号,并将所述信号解码为高音调。
用户通过操作操作单元115来输入呼叫电话号码或预定的命令。响应于输入操作的操作信号被提供到发送机113和接收机114。
在发送机113和接收机114之间在必要时交换信息。
图3图解了图2所示的发送机113的结构。
麦克风121接收用户的语音,并且向A/D(模/数)转换器122输出用户的语音信号作为电子信号。所述A/D转换器122将来自麦克风121的模拟语音信号模数转换为数字语音数据,并且向编码器123和学习单元125输出数字语音数据。
编码器123利用预定的编码方法编码来自A/D转换器122的语音数据,并且向发送器控制器124输出所产生的编码语音数据S1。
发送器控制器124控制后述的由编码器123输出的编码语音数据和由管理单元127输出的质量增进数据。具体而言,发送器控制器124选择后述的由编码器123输出的编码语音数据和由管理单元127输出的质量增进数据等之一,并且在预定的发送定时向调制器/解调器112(图2)输出选择的数据。必要的情况下,除了编码的语音数据和质量增进数据之外,发送器控制器124还输出当用户操作操作单元115时输入的被呼叫电话号码、呼叫方的呼叫电话号码和其他必要信息来作为发送数据。
学习单元125根据在过去的学习过程中使用的语音数据和从A/D转换器122新输入的语音数据来学习质量增进数据,所述质量增进数据改善在接收从编码器123输出的编码语音数据的接收方输出的语音的质量。在学习过程后获得新的质量增进数据时,学习单元125向存储单元126提供质量增进数据。
存储单元126存储从学习单元125提供的质量增进数据。
管理单元127管理存储在存储单元126中的质量增进数据,并同时在必要时参考从接收机114提供的信息。
在如上所述的发送机113中,输入到麦克风121的用户的语音被通过A/D转换器122提供到编码器123和学习单元125。
编码器123编码从A/D转换器122输入的语音数据,并且向发送器控制器124输出所产生的编码语音数据。发送器控制器124向调制器/解调器112(见图2)输出从编码器123提供的编码语音数据来作为发送数据。
同时,学习单元125根据在过去学习过程中使用的语音数据和从A/D转换器122新输入的语音数据来学习质量增进数据,然后向存储单元126提供所产生的质量增进数据以存储到那里。
以这种方式,学习单元125根据不仅新输入的用户的语音数据而且在过去学习过程中使用的语音数据来学习质量增进数据。当用户通过移动电话说得很多的时候,通过编码用户的语音数据而获得的编码语音数据被利用质量增进数据解码为更高质量的语音数据。
管理单元127在预定的定时读取存储在存储单元126中的质量增进数据,并且向发送器控制器124提供所读取的质量增进数据。发送器控制器124在预定的发送定时向调制器/解调器112(见图2)输出来自管理单元127的质量增进数据来作为发送数据。
如上所述,发送机113除了作为用于普通通信的语音的编码语音数据之外还发送质量增进数据。
图4图解了图2的接收机114的结构。
所接收的数据,即从图2的调制器/解调器112输出的解调信号被提供到接收机控制器131。接收机控制器131接收解调的信号。如果所接收的数据时编码的语音数据,则接收机控制器131向解码器132提供编码的语音数据。如果所接收的数据是质量增进数据,则接收机控制器131向管理单元135提供质量增进数据。
所接收的数据除了编码语音数据和质量增进数据之外必要时还包括呼叫电话号码和其它信息。接收机控制器131在必要时向管理单元135和发送机113(的管理单元127)提供这些信息。
解码器132利用从管理单元135提供的质量增进数据来解码从接收机控制器131提供的编码语音数据,产生并向D/A(数/模)转换器133提供高质量语音数据。
D/A转换器133将从解码器132输出的数字语音数据数模转换,并且向扬声器134提供产生的模拟语音信号。扬声器134响应于从D/A转换器133输出的语音信号而输出语音。
管理单元135管理质量增进数据。具体而言,管理单元135在呼叫期间从接收机控制器131接收呼叫电话号码,并且按照所述呼叫电话号码选择存储在存储单元136或缺省数据存储器137中的质量增进数据,并且向解码器132提供所选择的质量增进数据。管理单元135从接收机控制器131接收更新的质量增进数据,并且以更新的质量增进数据来更新存储单元136的存储内容。
由可写入EEPROM(电子可擦除可编程只读存储器)构成的存储单元136存储从管理单元135提供的质量增进数据。在存储之前,质量增进数据对应地与识别已经发送了质量增进数据的呼叫方的识别信息相关,所述识别信息是例如呼叫方的电话号码。
由例如ROM构成的缺省数据存储器137预先存储缺省的质量增进数据。
如上所述,在接收机114中的接收机控制器131在呼叫到达的时候接收所提供的数据,并且向管理单元135提供在所接收的数据中包括的呼叫方的电话号码。管理单元135从接收机控制器131接收呼叫方的电话号码,并且按照图5所示的流程图执行质量增进数据设置处理,用于设置要在语音通信中使用的质量增进数据。
质量增进数据设置处理以步骤S141开始,其中管理单元135对存储单元136搜索呼叫方的电话号码。在步骤S142,管理单元135确定是否在步骤S141找到了呼叫电话号码(是否在存储单元136中存储了呼叫电话号码)。
如果在步骤S142确定找到了呼叫方的电话号码,则算法进行到步骤S143。管理单元135从存储在存储单元136中的质量增进数据选择与呼叫方的电话号码对应相关的质量增进数据,并在解码器132提供和设置质量增进数据。质量增进数据设置处理结束。
如果在步骤S142确定未找到呼叫方的电话号码,则算法进行到步骤S144。管理单元135从缺省数据存储器137读取缺省的质量增进数据(以下称为缺省数据),并且在解码器132中提供和设置所述缺省数据。质量增进数据设置处理因此结束。
在图5所示的实施例中,如果找到呼叫方的电话号码,换句话说,如果呼叫方的电话号码存储在存储单元136中,则在解码器132中设置与呼叫方的电话号码对应相关的质量增进数据。通过操作操作单元115(图2),即使找到呼叫方的电话号码,也可以控制管理单元135来在解码器132中设置缺省数据。
以这种方式在解码器132中设置质量增进数据。当开始向接收机控制器131提供从呼叫方发送的编码语音数据来作为所接收的数据时,从接收机控制器131向解码器132提供编码语音数据。解码器132按照在图5的质量增进数据设置处理中在呼叫到达后立即设置的质量增进数据,即按照与呼叫方的电话号码对应相关的质量增进数据来解码从呼叫方发送然后由接收机控制器131提供的编码语音数据。解码器132因此输出解码的语音数据。从解码器132通过D/A转换器133向扬声器134提供解码的语音数据。
在接收到从呼叫方发送的质量增进数据作为所接收数据时,接收机控制器131向管理单元135提供质量增进数据。管理单元135将从接收机控制器131提供的质量增进数据与已经发送所述质量增进数据的呼叫方的电话号码对应相关,并且在存储单元136中存储质量增进数据。
如上所述,当在呼叫方的发送机113(图3)中的学习单元125学习呼叫方的用户的语音时获得与呼叫方的电话号码对应相关的质量增进数据。质量增进数据被用于将编码的语音数据解码为高质量解码语音数据,所述编码的语音数据的获得是通过编码呼叫方的语音。
在接收机114中的解码器132按照与呼叫方的电话号码对应相关的质量增进数据来解码从呼叫方发送的编码语音数据。所执行的解码处理适用于从呼叫方发送的编码语音数据(所述解码处理取决于发出对应于编码的语音数据的语音的用户的语音特点而变得不同)。
为了利用适合于从呼叫方发送的编码语音数据的解码处理而获得高质量解码语音数据,解码器132必须利用由在呼叫方的发送机113(图3)中的学习单元125学习的质量增进数据来执行解码处理。为此,存储单元136必须存储与呼叫方的电话号码对应相关的质量增进数据。
呼叫方(发送方)的发送机113(图3)执行质量增进数据发送处理以向被呼叫方(接收方)发送通过学习过程获得的更新的质量增进数据。被呼叫方的接收机114按照作为质量增进数据发送处理的结果而发送的质量增进数据执行质量增进数据更新处理以更新存储单元136的存储内容。
下面讨论以移动电话1011作为呼叫方和以移动电话1012作为被呼叫方的质量增进数据发送处理和质量增进数据更新处理。
图6是图解质量增进数据发送处理的第一实施例的流程图。
在作为呼叫方的移动电话1011中,用户操作操作单元115(图2),由此输入作为被呼叫方的移动电话1012的电话号码。发送机113开始质量增进数据发送处理。
质量增进数据发送处理以步骤S1开始,其中在发送机113(图3)中的发送器控制器124作为发送数据输出响应于操作单元115的操作而输入的移动电话1012的电话号码。
移动电话1012的用户响应于来自移动电话1011的呼叫而操作操作单元115,以接通移动电话1012。算法进行到步骤S2。发送器控制器124建立与在被呼叫方的移动电话1012的通信链路。
在步骤S3,管理单元127向发送器控制器124传送更新相关的信息,这个信息表示在存储单元126中存储的质量增进数据的更新状态,并且发送器控制器124选择和输出所述更新相关的信息作为发送数据。算法进行到步骤S4。
当学习单元125学习语音和获得更新的质量增进数据的时候,已经获得质量增进数据的日期和时间(包括年和月信息)与质量增进数据对应相关。然后,质量增进数据被存储在存储单元126中。与质量增进数据对应相关的日期和时间被用做更新相关的信息。
在被呼叫方的移动电话1012从在呼叫方的移动电话1011接收更新相关的信息。当要求更新的质量增进数据的时候,移动电话1012发送对更新的质量增进数据的发送请求,如下所述。在步骤S4,管理单元127确定是否移动电话1012已经发送了发送请求。
如果在步骤S4确定了还没有发送发送请求,换句话说,如果在步骤S4确定在移动电话1011的接收机114中的接收机控制器131还没有从在被呼叫方的移动电话1012接收到发送请求作为所接收的数据,则算法跳过步骤S5而进行到步骤S6。
如果在步骤S4确定已经发送了发送请求,换句话说,如果在步骤S4确定在移动电话1011的接收机114中的接收机控制器131已经从在被呼叫方的移动电话1012接收到发送请求作为所接收的数据,并且所述发送请求被提供到发送机113的管理单元127,则算法进行到步骤S5。管理单元127从存储单元126读取更新的质量增进数据,并将其提供到发送器控制器124。在步骤S5中,发送器控制器124从管理单元127选择更新的质量增进数据,并且发送所述更新的质量增进数据作为发送数据。与更新相关信息一起发送质量增进数据,更新相关信息即利用学习过程获得质量增进数据的日期和时间。
算法从步骤S5进行到步骤S6。管理单元127确定是否在被呼叫方的移动电话1012已经发送了完成准备的报告。
当准备好执行正常的语音通信的时候,被呼叫方的移动电话1011发送完成准备的报告,它指示移动电话1012准备好语音通信。在步骤S6,管理单元127确定是否移动电话1012已经发送了这样的一个完成准备的报告。
如果在步骤S6确定还没有发送所述完成准备的报告,换句话说,如果在步骤S6确定移动电话1011的接收机114中的接收机控制器131还没有从在被呼叫方的移动电话1012接收到完成准备的报告作为所接收的数据,则重复步骤S6。管理单元127等待直到接收到完成准备的报告。
如果在步骤S6确定已经发送所述完成准备的报告,换句话说,如果在步骤S6确定移动电话1011的接收机114中的接收机控制器131已经从在被呼叫方的移动电话1012接收到完成准备的报告作为所接收的数据,并且完成准备的报告被提供到在发送机113中的管理单元127,则算法进行到步骤S7。发送器控制器124选择编码器123的输出,因此使得能够进行语音通信。从编码器123输出的编码语音数据被选择作为发送数据。质量增进数据发送处理结束。
图7图解了质量增进数据更新处理,这个处理是当呼叫方的移动电话1011执行图6所示的质量增进数据发送处理时由被呼叫方的移动电话1012执行的。
响应于呼叫,在被呼叫方的移动电话1012中的接收机114(图4)开始质量增进数据更新处理。
质量增进数据更新处理以步骤S11开始,其中接收机控制器131确定是否移动电话1012响应于用户对操作单元115的操作而进入摘机(off-hook)状态。如果确定移动电话1012未在摘机状态,则重复步骤S11。
如果在步骤S11确定移动电话1012在摘机状态,则算法进行到步骤S12。接收机控制器131与在呼叫方的移动电话1011建立通信链路,然后进行到步骤S13。
呼叫方的移动电话1011发送更新相关信息,这已经与在图6中的步骤S3相关地被描述。在S13,接收机控制器131接收包括更新相关信息的数据,并且向管理单元135传送所接收的数据。
在步骤S14,管理单元135引用从呼叫方的移动电话1011接收的更新相关信息,并且确定是否与呼叫方的移动电话1011的用户相关的更新质量增进数据被存储在存储单元136中。
具体而言,在图1所示的传输系统的通信中,在来自呼叫方的移动电话1011(1012)的呼叫到达被呼叫方的移动电话1012(1011)的时候,发送在呼叫方的移动电话1011的电话号码。接收机控制器131接收电话号码作为所接收的数据,并将这个电话号码提供到管理单元135。管理单元135确定是否存储单元136存储与呼叫方的移动电话1011的电话号码对应相关的质量增进数据,并且如果存储单元136存储了质量增进数据则查看是否所存储的质量增进数据是更新的。在步骤S14,管理单元135于是执行确定。
如果在步骤S14确定存储单元136存储了关于呼叫方的移动电话1011的用户的更新的质量增进数据,换句话说,如在步骤S14确定存储单元136存储与呼叫方的移动电话1011的电话号码对应相关的质量增进数据,并且由与质量增进数据对应相关的更新相关信息表示的日期和时间与在步骤S13接收的更新相关信息表示的那些一致,则没有必要更新与呼叫方的移动电话1011的电话号码对应相关的存储单元136中的质量增进数据。算法跳过步骤S15--步骤S18而进行到步骤S19。
如上参照图6的步骤S5所述,呼叫方的移动电话1011与更新相关信息一起发送质量增进数据。当来自呼叫方的移动电话1011的质量增进数据被存储在存储单元136中的时候,在被呼叫方的移动电话1011中的管理单元135将质量增进数据与和质量增进数据一起被发送的更新相关信息对应相关。在步骤S14,将与存储在存储单元136中的质量增进数据对应相关的更新相关信息和在步骤S13接收的更新相关信息相比较,以确定是否存储在存储单元136中的质量增进数据是更新的。
如果在步骤S14确定存储单元136未存储关于呼叫方的移动电话1011的用户的更新的质量增进数据,换句话说,如果在步骤S14确定存储单元136未存储与呼叫方的移动电话1011的电话号码对应相关的质量增进数据,或者如果即使存储单元136存储了质量增进数据但在步骤S14确定由与质量增进数据对应相关的更新相关信息表示的日期和时间要比由在步骤S13接收的更新相关信息表示的日期和时间要旧,则算法进行到步骤S15。管理单元135确定是否禁止质量增进数据的更新。
用户可以通过操作单元115来设置管理单元135不更新质量增进数据。管理单元135在步骤S15根据是否更新质量增进数据的设置来执行确定。
如果在步骤S15确定禁止质量增进数据的更新,换句话说,如果管理单元135被设置为不更新质量增进数据,则算法跳过步骤S16--步骤S18而进行到步骤S19。
如果在步骤S15确定使能了质量增进数据的更新,换句话说,如果管理单元135被设置更新质量增进数据,则算法进行到步骤S16。管理单元135向在发送机113(图3)中的发送器控制器124提供发送请求以请求呼叫方的移动电话1011发送更新的质量增进数据。以这种方式,在发送机113中的发送器控制器124发送发送请求作为发送数据。
如上参照图6的步骤S4和S5所述,已经接收到发送请求的移动电话1011发送更新的质量增进数据及其更新相关信息。在步骤S17,接收机控制器131接收包含更新的质量增进数据和更新相关信息的数据,并且向管理单元135提供所接收的数据。
在步骤S18,管理单元135将在步骤S17获得的更新的质量增进数据与在呼叫到达时接收的呼叫方的移动电话1011的电话号码以及与质量增进数据一起发送的更新相关信息相关联,然后在存储单元136中存储质量增进数据。因此更新存储单元136的内容。
当与呼叫方的移动电话1011的电话号码对应相关的质量增进数据未存储在存储单元136中的时候,管理单元135使得存储单元136新存储在步骤S17获得的更新的质量增进数据、在呼叫到达时接收的呼叫方的移动电话1011的电话号码和更新相关信息(更新的质量增进数据的更新相关信息)。
当与呼叫方的移动电话1011的电话号码对应相关的质量增进数据(未更新的)被存储在存储单元136中的时候,管理单元135使得存储单元136存储在步骤S17获得的更新的质量增进数据、在呼叫到达时接收的呼叫方的移动电话1011的电话号码和更新相关信息,换句话说,这些信息替换(重写)质量增进数据、电话号码和与存储在存储单元136中的质量增进数据对应相关的更新相关信息。
在步骤S19,管理单元135控制在发送机113中的发送器控制器124,因此使得发送器控制器124发送完成准备的报告作为发送数据,指示完成了语音通信的准备。算法随后进行到步骤S20。
在步骤S20,接收机控制器131被置入语音通信使能状态,其中在被提供的所接收数据中包括的编码的语音数据被输出到解码器132。质量增进数据更新处理因此结束。
图8时图解质量增进数据发送处理的第二实施例的流程图。
以图6所示的流程图中所示的相同的方式,用户操作呼叫方的移动电话1011中的操作单元115(图2)以输入被呼叫方的移动电话1012的电话号码。发送机113开始质量增进数据发送处理。
质量增进数据发送处理以步骤S31开始。在发送机113(图3)中的发送器控制器124作为发送数据输出利用操作单元115输入的移动电话1012的电话号码。因此呼叫移动电话1012
移动电话1012的用户响应于来自移动电话1011的呼叫而操作操作单元115,因此将移动电话1012置入摘机状态。算法进行到步骤S32。发送器控制器124与被呼叫方的移动电话1012建立通信链路,然后进行到步骤S33。
在步骤S33,管理单元127从存储单元126读取更新的质量增进数据,并向发送器控制器124提供更新的质量增进数据。同样在步骤S33,发送器控制器124从管理单元127选择更新的质量增进数据,并发送所选择的质量增进数据作为发送数据。如上所述,质量增进数据被与更新相关信息一起被发送,所述更新相关信息指示日期和时间,在此日期和时间,利用学习过程获得了质量增进数据。
算法从步骤S33向步骤S34进行。如在图6中图解的步骤S6所示,管理单元127确定是否已经从被呼叫方的移动电话1012发送了完成准备的报告。如果确定未发送完成准备的报告,则重复步骤S34。管理单元127等待直到发送完成准备的报告。
如果在步骤S34已经发送了完成准备的报告,则算法进行到步骤S35。如在图6中图解的步骤S7所示,发送器控制器124变得准备好语音通信。质量增进数据发送处理结束。
参照图9所示的流程图讨论当图8所示的呼叫方的移动电话1011执行质量增进数据发送处理时被呼叫方的移动电话1012执行的质量增进数据更新处理。
以图7所示的相同方式,被呼叫方的移动电话1012的接收机114(图4)响应于呼叫而开始质量增进数据更新处理。在步骤S41,接收机控制器131确定是否用户通过操作操作单元115将移动电话1012置入摘机状态。如果确定移动电话1012不在摘机状态,则重复S41。
如果在步骤S41确定移动电话1012在摘机状态,算法进行到步骤S42。以与图7所示的步骤S12相同的方式,建立通信链路,并且算法进行到步骤S43。在步骤S43,接收机控制器131接收包含从呼叫方的移动电话1011发送的更新的质量增进数据的数据,并且向管理单元135提供所接收的数据。
如上参照图8的图解的质量增进数据发送处理所述,在步骤S33,移动电话1011发送更新的质量增进数据和更新相关信息,因此在步骤S43,移动电话1012接收质量增进数据和更新相关信息。
算法进行到步骤S44。以与图7所示的步骤S14相同的方式,管理单元135引用从呼叫方的移动电话1011接收的更新相关信息,因此确定是否存储单元136存储了关于呼叫方的移动电话1011的用户的更新的质量增进数据。
如果在步骤S44确定存储单元136存储了关于呼叫方的移动电话1011的用户的更新的质量增进数据,算法进行到步骤S45。管理单元135丢弃在步骤S43接收的质量增进数据和更新相关信息,然后进行到步骤S47。
如果在步骤S44确定关于呼叫方的移动电话1011的用户的更新的质量增进数据未存储在存储单元136中,则算法进行到步骤S46。以与图7所示的步骤S18相同的方式,管理单元135将在步骤S43获得的更新的质量增进数据与在呼叫到达时接收的呼叫方的移动电话1011的电话号码以及与质量增进数据一起发送的更新相关信息对应相关,然后在存储单元136中存储了质量增进数据。因此更新了存储单元136中的内容。
在步骤S47,管理单元135控制在发送机113中的发送器控制器124,因此使得发送器控制器124作为发送数据发送完成准备的报告,指示移动电话1012准备好语音通信。算法随后进行到步骤S48。
在步骤S48,接收机控制器131被置入语音通信使能状态,其中接收机控制器131向解码器132输出被提供到那里的所接收的数据中包括的编码语音数据。质量增进数据更新处理结束。
在图9的质量增进数据更新处理中,存储单元136的内容被必要地更新,除非关于呼叫方的移动电话1011的用户的更新的质量增进数据被存储在被呼叫方移动电话1012中。
图10是按照质量增进数据发送处理的第三实施例的流程图。
当用户操作呼叫方的移动电话1011中的操作单元115(图2)以输入被呼叫方的移动电话1012的电话号码的时候,发送机113(图3)开始质量增进数据发送处理。在步骤S51,管理单元127搜索向与操作操作单元115时输入的电话号码对应的移动电话1012发送质量增进数据的历史。
当如下所述在步骤S58向被呼叫方发送质量增进数据的时候,管理单元127在内部存储器(未示出)作为质量增进数据的发送历史存储将发送的质量增进数据的更新相关信息与图10所示的实施例中被呼叫方的电话号码对应相关的信息。在步骤S52,管理单元127搜索具有响应于操作单元115的操作而输入的被呼叫方的电话号码的发送历史。
在步骤S52,管理单元127根据在步骤S51的搜索结果确定是否已经向被呼叫方发送了更新的质量增进数据。
如果在步骤S52确定更新的质量增进数据还没有被发送到被呼叫方,换句话说,如果在步骤S52确定没有被呼叫方的电话号码的描述,或如果即使存在电话号码的描述也在步骤S52确定在发送历史中描述的更新相关信息未与更新的质量增进数据的更新相关信息一致,则算法进行到步骤S53。管理单元127设置传送标志以指示是否发送更新的质量增进数据,然后进行到步骤S55。
传送标志是1比特的标志,当置位时为1,或当复位时为0。
如果在步骤S52确定已经向被呼叫方发送了更新的质量增进数据,换句话说,如果在步骤S52确定发送历史包含被呼叫方的电话号码的描述,并且在描述历史中描述的更新相关信息与最新的更新相关信息一致,则算法进行到步骤S54。管理单元127复位传送标志,然后进行到步骤S55。
在步骤S55,发送器控制器124作为发送数据输出响应于操作单元115的操作而输入的被呼叫方的移动电话1012的电话号码,因此呼叫移动电话1012
当移动电话1012的用户响应于来自移动电话1011的呼叫通过操作操作单元115将移动电话1012置入摘机状态的时候,算法进行到步骤S56。发送器控制器124与被呼叫方的移动电话1012建立通信链路,并且算法进行到步骤S57。
在步骤S57,管理单元127确定是否置位(set)传送标志。如果确定未置位传送标志,换句话说,传送标志被复位(reset),则算法跳过步骤S58而进行到步骤S59。
如果在步骤S57确定置位了传送标志,则算法进行到步骤S58。管理单元127从存储单元126读取更新的质量增进数据和更新相关信息,并向发送器控制器124提供更新的质量增进数据和更新相关信息。在步骤S58,发送器控制器124从管理单元127选择和发送更新的质量增进数据和更新相关信息作为发送数据。而且在步骤58,管理单元127将下述信息存储为发送历史,所述信息将已经发送更新的质量增进数据的移动电话1012的电话号码(被呼叫方的电话号码)与更新相关信息对应相关。算法然后进行到步骤S59。
如果移动电话1012的电话号码已经存储在发送历史中,则管理单元127存储已经发送更新的质量增进数据和更新的质量增进数据的更新相关信息的移动电话1012的电话号码,因此重写了已经存储的电话号码和发送历史。
以与图6图解的步骤S6中相同的方式,管理单元127在步骤S59确定是否被呼叫方的移动电话1012已经发送了完成准备的报告。如果确定没有发送完成准备的报告,则重复步骤S59。管理单元127等待直到发送了完成准备的报告。
如果在步骤S59确定已经发送了完成准备的报告,则算法进行到步骤S60。发送器控制器124被置入语音通信使能状态,结束了质量增进数据发送处理。
现在参照图11所示的流程图讨论当执行图10所示的呼叫方的移动电话1011的质量增进数据发送处理的时候执行的移动电话1012的质量增进数据更新处理。
接收机114(图4)响应于呼叫的到达而开始被呼叫方的移动电话1012中的质量增进数据更新处理。
质量增进数据更新处理以步骤S71开始。接收机控制器131确定是否用户操作操作单元115以进入摘机状态。如果确定操作单元115不在摘机状态,则重复步骤S71。
如果在步骤S71确定操作单元115在摘机状态,则算法进行到步骤S72。接收机控制器131与移动电话1011建立通信链路,然后进行到步骤S73。
在步骤S73,接收机控制器131确定是否已经发送了质量增进数据。如果确定还没有发送了质量增进数据,则算法跳过步骤S74和S75进行到步骤S76。
如果在步骤S73确定已经发送了质量增进数据,换句话说,如果确定呼叫方的移动电话1011已经在图10的步骤S58发送了更新的质量增进数据和更新相关信息,则算法进行到步骤S74。接收机控制器131接收包括更新的质量增进数据和更新相关信息的数据,并且向管理单元135通过所接收的数据。
以与图7所示的步骤S18中相同的方式,管理单元135在存储单元136中存储更新的质量增进数据之前将在步骤S74接收的更新的质量增进数据与在呼叫到达时接收的呼叫方的移动电话1011的电话号码以及与质量增进数据一起发送的更新相关信息对应相关。于是更新了存储单元136的内容。
在步骤S76,管理单元135控制在发送机113中的发送器控制器124,因此作为发送数据发送指示被呼叫方的移动电话1012已经准备好语音通信的完成准备的报告。算法然后进行到步骤S77。
在步骤S77,接收机控制器131被使能语音通信,因此结束了质量增进数据更新处理。
在呼叫定时和被呼叫定时执行参照图6-图11讨论的质量增进数据发送处理和质量增进数据更新处理的每个。可以在任何其它定时执行质量增进数据发送处理和质量增进数据更新处理的每个。
图12是示出了在呼叫方的移动电话1011中利用学习过程获得更新的质量增进数据之后由发送机113(图3)执行的质量增进数据发送处理的流程图。
在步骤S81,管理单元127作为电子邮件消息安排更新的质量增进数据及其更新相关信息以及存储在存储单元126中的它自己的电话号码,然后进行到步骤S82。
在步骤S82,管理单元127安排一个通知作为包括更新的质量增进数据、更新相关信息和呼叫方的电话号码的电子邮件(以下称为用于质量增进数据发送的电子邮件)的主题(题目),所述通知指示电子邮件包括更新的质量增进数据。具体来说,管理单元127安排一个“更新通知”作为用于质量增进数据发送的电子邮件的主题。
在步骤S83,管理单元127设置邮件地址作为用于质量增进数据发送的电子邮件的目的地。作为用于质量增进数据发送的电子邮件的目的地的邮件地址可以是以前与其交换电子邮件的邮件地址之一。例如,存储与其交换电子邮件的邮件地址,并且可以安排由用户指定的所有这些邮件地址或一些这些邮件地址。
在步骤S84,管理单元127向发送器控制器124提供质量增进数据发送电子邮件,因此发送这个邮件作为发送数据。质量增进数据发送处理结束。
因此发送的质量增进数据发送电子邮件经由预定服务器被具有被安排作为质量增进数据发送电子邮件的目的地的邮件地址的终端接收。
图13是当由呼叫方的移动电话1011执行图12所示的质量增进数据发送处理时由被呼叫方的移动电话1012执行的质量增进数据更新处理的流程图。在被呼叫方的移动电话1012中,在预定的定时或响应于用户的命令而在预定的邮件服务器上放置了发送电子邮件的请求。响应于所述请求,接收机114(图4)开始质量增进数据更新处理。
在步骤S91,响应于发送电子邮件的请求而从邮件服务器发送的电子邮件被接收机控制器131接收。所接收的数据然后被通过到管理单元135。
在步骤S92,管理单元135确定是否从接收机控制器131提供的电子邮件的主题包括指示所述主题包括更新的质量增进数据的“更新通知”。如果确定电子邮件不是质量增进数据发送电子邮件,则质量增进数据发送处理结束。
如果在步骤S92确定电子邮件的主题时“更新通知”,换句话说,如果确定电子邮件是质量增进数据发送电子邮件,则算法进行到步骤S93。管理单元135获取被安排为质量增进数据发送电子邮件的消息的更新的质量增进数据、更新相关信息和呼叫方的电话号码,然后进行到步骤S94。
以与图7所示的步骤S14相同的方式,管理单元135引用从质量增进数据发送电子邮件获取的更新相关信息和呼叫方的电话号码,并且确定是否在存储单元136存储了关于呼叫方的移动电话1011的用户的更新的质量增进数据。
如果在步骤S94确定在存储单元136存储了关于呼叫方的移动电话1011的用户的更新的质量增进数据,则算法进行到步骤S95。管理单元135丢弃在步骤S93获得的质量增进数据、更新相关信息和电话号码,因此结束了质量增进数据更新处理。
如果在步骤S94确定在存储单元136未存储关于呼叫方的移动电话1011的用户的更新的质量增进数据,则算法进行到步骤S96。以与图7所示的步骤S18中相同的方式,存储单元136存储在步骤S93获得的质量增进数据和更新相关信息以及呼叫方的移动电话1011的电话号码。存储单元136的内容因此被更新,并且完成了质量增进数据更新处理。
图14图解了图3所示的发送机113中的学习单元125的结构。
在图14所示的实施例中,学习单元125作为编码的语音数据学习抽头系数,用于已经由本发明的发明人提出的分类和自适应技术。
分类和自适应技术包括分类处理和自适应处理。利用分类和自适应技术,按照数据的属性来对数据分类,并且对每个类别执行自适应处理。
现在讨论自适应处理,其中具有低音调(pitch)的语音(以下称为低音调语音)被转换为具有高音调的语音(以下称为高音调语音)。
自适应处理线性合成形成低音调语音的语音采样(以下也称为低音调语音采样)和预定的抽头系数,因此确定高音调语音的语音采样的预测值,它具有相对于低音调语音改进的质量优点。低音调语音因此随着其音调被提高而得到改善。
具体而言,一段高音调语音数据是在学习过程中的训练数据,具有降级的语音质量的另一段低音调语音数据是在学习过程中的学习数据。高音调语音y的语音采样(以下也称为高音调语音采样)的预测值E[y]被从线性第一级合成模型确定,所述线性第一级合成模型通过一组几个低音调语音采样(形成低音调语音)x1、x2、...和预定抽头系数w1、w2、...的线性合成来定义。所述预测值E[y]通过下面的方程来表达:
E[y]=w1x1+w2x2+...
                            ...(1)
现在,产生了方程(1)。包括一组抽头系数wj的矩阵W、包括一组学习数据xij的矩阵X和包括一组预测值E[yi]的矩阵Y`被表示如下。
[方程1]
X = x 11 x 12 · · · x 1 J x 21 x 22 · · · x 2 J · · · · · · · · · · · · x I 1 x I 2 · · · x IJ
W = w 1 w 2 · · · w J , Y ` = E [ y 1 ] E [ y 2 ] · · · E [ y J ]
下面的观察方程成立。
XW=Y`...............................(2)
其中矩阵x的元素xij表示在第i行的一组学习数据中的第j列学习数据(用于预测第i行的训练数据yi的一组学习数据),并且矩阵w的元素wj表示抽头系数,它被在所述一组学习数据中的第j列的学习数据相乘。而且,yi表示在第i行的训练数据,并且E[yi]表示在第i行的训练数据的预测值。在方程(1)中,在左边的y表示省略了下标i的矩阵Y的元素yi,在左侧的x1、x2、...表示省略了下标i的矩阵X的元素xij
最小二乘方法被应用到观察方程(2)以确定接近高音调语音采样y的预测值E[y]。现在,包括作为训练数据的一组高音调语音采样的真值y的矩阵Y和包括一组高音调语音采样y的预测值E[y]的余数e(真值的误差)的矩阵E被定义如下:
[方程2]
E = e 1 e 2 · · · e I , Y = y 1 y 2 · · · y I
从方程(2),下面的余数方程成立。
XW=Y+E
(3)
通过使下面的均方误差最小化来确定用于确定接近高音调语音y的预测值E[y]的抽头系数wj
[方程3]
Σ i = 1 I e i 2
如果上述的均方误差对于抽头系数wj的微分为0,则抽头系数wj是最佳值。具体而言,满足下列方程的抽头系数wj是用于确定接近高音调语音采样y的预测值E[y]的最佳值。
[方程4]
e 1 ∂ e 1 ∂ w j + e 2 ∂ e 2 ∂ w j + . . . + e I ∂ e I ∂ w j = 0 , ( j = 1,2 , . . . , J ) - - - ( 4 )
通过将方程(3)对于抽头系数wj微分获得下面的方程。
[方程5]
∂ e i ∂ w 1 = x i 1 , ∂ e i ∂ w 2 = x i 2 , . . . , ∂ e i ∂ w J = x iJ , ( I = 1,2 , . . . , I ) - - - ( 5 )
从方程(4)和(5)得出方程(6)。
[方程6]
Σ i = 1 I e i x i 1 = 0 , Σ i = 1 I e i x i 2 = 0 , . . . Σ i = 1 I e i x iJ = 0 , - - - ( 6 )
考虑到学习数据xij、抽头系数wj、训练数据yi和在余数方程(3)中的余数e,可从方程(6)得出下面的标准方程。
[方程7]
( Σ i = 1 I x i 1 x i 1 ) w 1 + ( Σ i = 1 I x i 1 x i 2 ) w 2 + . . . + ( Σ i = 1 I x i 1 x iJ ) w J = ( Σ i = 1 I x i 1 y i ) ( Σ i = 1 I x i 2 x i 1 ) w 1 + ( Σ i = 1 I x i 2 x i 2 ) w 2 + . . . + ( Σ i = 1 I x i 2 x iJ ) w J = ( Σ i = 1 I x i 2 y i ) · · · ( Σ i = 1 I x iJ x i 1 ) w 1 + ( Σ i = 1 I x iJ x i 2 ) w 2 + . . . + ( Σ i = 1 I x iJ x iJ ) w J = ( Σ i = 1 I x iJ y i ) - - - ( 7 )
如果矩阵(协方差矩阵)A和向量v定义如下,并且如果向量W被方程(1)定义,则标准方程(7)变成(8)。
[方程8]
A = Σ i = 1 I x i 1 x i 1 Σ i = 1 I x i 1 x i 2 · · · Σ i = 1 I x i 1 x iJ Σ i = 1 I x i 2 x i 1 Σ i = 1 I x i 2 x i 2 · · · Σ i = 1 I x i 2 x iJ · · · Σ i = 1 I x iJ x i 1 Σ i = 1 I x iJ x i 2 · · · Σ i = 1 I x iJ x iJ
v = Σ i = 1 I x i 1 y i Σ i = 1 I x i 1 y i · · · Σ i = 1 I x iJ y i
AW=v
(8)
通过安排预定数量的组的学习数据xij和训练数据yi来写入要确定的抽头系数wj的编号J的编号的标准方程(7)。通过求解向量W的方程(8)(为了求取方程(8),矩阵A必须是正则矩阵),可确定最佳抽头系数wj。例如,可以使用扫描方法(sweep method)(高斯-约当消去法(Gauss-Jordanelimination))来求取方程(8)。
在自适应处理中,学习利用学习数据和训练数据对最佳抽头系数wj的确定,并且然后利用抽头系数wj从方程(1)确定接近训练数据y的预测值E[y]。
自适应处理与仅仅内插不同,在所述内插中,以高音调语音再现不包含在低音调语音中的一个分量。对于方程(1),自适应处理看起来仅仅是利用内插滤波器的内插。但是,利用学习过程从训练数据y确定对应于内插滤波器的抽头系数的抽头系数w。于是再现了在高音调语音中包含的分量。自适应处理可以被称为产生语音的创造处理。
在上述的示例中,利用线性第一阶预测来确定高音调语音的预测值。或者,可以利用两个或多个方程来确定预测值。
图14所示学习单元125作为质量增进数据学习在分类和自适应处理中使用的抽头系数。
具体上,缓冲器141被提供了从A/D转换器122(图3)输出的语音数据,并且作为用于学习的数据。缓冲器141在学习过程中暂时存储语音数据作为训练数据。
学习数据发生器142根据存储在缓冲器141中的作为训练数据输入的语音数据而在学习过程中产生学习数据。
学习数据发生器142包括编码器142E和解码器142D。编码器142E具有与在发送机113(图3)中编码器123相同的结构,并且编码存储在缓冲器141中的训练数据,然后象编码器123一样输出编码的语音数据。解码器142D具有与参照图16后述的解码单元161相同的结构,并且利用对应于编码器123的编码方法的解码方法来解码编码语音数据。所产生的解码语音数据被输出作为学习数据。
象在编码器123中一样,在此的训练数据被转换为编码的语音数据,并且编码的语音数据被解码为学习数据。或者,例如通过经由低通滤波器过滤语音数据,作为训练数据的语音数据可以在质量上降级为学习数据。
编码器123可以被用做构成学习数据发生器142的编码器142E。参照图16后述的解码单元161可以被用做解码器142D。
学习数据存储器143暂时在学习数据发生器142中存储从解码器142D输出的学习数据。
预测抽头发生器144将在缓冲器141中存储的训练数据的语音采样连续设置为目标数据,并且从学习数据存储器143读取学习数据的几段学习数据的语音采样以预测目标数据。预测抽头发生器144产生预测抽头(用于确定目标数据的预测值的抽头)。预测抽头被从预测抽头发生器144提供到求和单元147。
分类抽头发生器145从学习数据存储器143读取几段语音采样作为要用于分类目标数据的学习数据,因此产生了分类抽头(用于分类的抽头)。分类抽头被从分类抽头发生器145提供到分类器146。
构成预测抽头或分类抽头的语音采样可以是时间上接近与作为目标数据的训练数据的语音采样对应的学习数据的语音采样的语音采样。
或者,构成预测抽头和分类抽头的语音采样可以是相同的语音采样或不同的语音采样。
分类器146按照来自分类抽头发生器145的分类抽头将目标数据分类,然后向求和单元147输出对应于产生的类别的分类编码。
分类方法可以是ADRC(自适应动态范围编码)方法等。
在ADRC方法中,形成分类抽头的语音采样被ADRC处理,并且按照产生的ADRC编码来确定目标数据的类别。
在K比特ADRC处理中,检测形成分类抽头的语音采样的最大值MAX和最小值MIN。DR=MAX-MIN是局部化的一组动态范围,并且根据动态范围DR来将形成分类抽头的语音采样重新量化为K比特。具体而言,从形成分类抽头的每个语音采样减去最小值MIN,并且将余数值除以(量化)DR/2k。形成分类抽头的K比特语音采样被以预定的顺序以位列来排列,并且被输出为ADRC码。例如,如果利用1比特ADRC处理来处理分类抽头,则从形成那个分类抽头的每个语音采样减去所述最小值MIN,并且将余数值除以最大值MAX和最小值MIN的平均值。以这种方式,每个语音采样变成1比特(二进制化)其中以预定的顺序排列1比特语音采样的位列(bit train)被输出作为ADRC码。
分类器146可以输出形成分类抽头的语音采样的等级分布的格式来作为分类编码。如果假定分类抽头包括N个语音采样,并且每个语音采样允许K比特,则从分类器146输出的分类编码的数量变成(2N)K。分类码的数量变成一个大数量,它随着每个语音采样的比特数量K而以指数增长。
分类器146在分类类别之前最好利用上述的ADRC处理或向量量化来压缩分类抽头的信息量。
求和单元147从缓冲器141读取作为目标数据的训练数据的语音采样,并且对来自预测抽头发生器144的形成预测抽头的学习数据和从分类器146提供的每个类别的作为目标数据的训练数据进行求和处理,并同时在必要时使用在初始元素存储器148和用户元素存储器149的每个中的内容。
求和单元147利用对于对应于从分类器146提供的分类编码的每个类别的预测抽头(学习数据),执行学习数据的相乘(xinxim)和对学习数据的乘积的求和运算(∑)。上述运算的结果是在方程(8)中的矩阵A的一个元素。
求和单元147利用对于对应于从分类器146提供的分类编码的每个类别的预测抽头(学习数据),执行学习数据和训练数据的相乘(xinyi)和对学习数据和训练数据的乘积的求和运算(∑)。上述运算的结果是在方程(8)中的向量v的一个元素。
初始元素存储器148由ROM构成,并且以逐个类别为基础存储方程(8)中的矩阵A的元素和向量v中的元素,它们是通过作为用于学习的数据学习预先准备的未指定数量的扬声器的语音数据来获得的。
用户元素存储器149由例如EEPROM构成,并且逐个类别地存储在求和单元147的在前的学习过程中确定的、在方程(8)中的矩阵A中的元素和在向量v中的元素。
当新输入的语音数据被用于学习过程中时,求和单元147读取在前的学习过程中确定并存储在用户元素存储器149中的、在方程(8)中的矩阵A中的元素和在向量v中的元素。求和单元147然后通过向矩阵A和向量v之一的元素增加元素xinxim或xinyi(通过执行在矩阵A和向量v中的求和运算)来对每个类别写标准方程(8),所述元素xinxim或xinyi是根据新输入的语音数据利用训练数据yi和学习数据xin(xim)而计算的。
求和单元147于是根据不仅新输入的语音数据而且在过去学习过程中使用的语音数据来写标准方程(8)。
如果学习单元125第一次进行学习过程或如果学习单元125进行在用户元素存储器149的清空之后的第一学习过程,则用户元素存储器149不存储由在前的学习过程产生的矩阵A和向量v中的元素。因此仅仅利用用户输入的语音数据来写标准方程(8)。
可能出现这样的一个类别,其中因为输入的语音数据的采样的数量不足而未获得确定抽头系数的需要的数量的标准方程。
初始元素存储器148存储在方程(8)中的在矩阵A中的元素和在向量v中的元素,它们是通过作为用于学习的数据学习预先准备的未指定数量的扬声器的语音数据而获得的。学习单元125在必要时利用存储在初始元素存储器148中的在矩阵A中的元素和在向量v中的元素和从输入的语音数据获得的在矩阵A中和在向量v中的元素。以这种方式,学习单元125防止这样的一个类别发生,即它不具有要求来确定抽头系数的足够数量的标准方程。
求和单元147利用从新输入的语音数据获得的矩阵A中和向量v中的元素和在用户元素存储器149(或初始元素存储器148)中存储的矩阵A中和向量v中的元素新确定对于每个类别的矩阵A中和向量v中的元素。求和单元147然后向用户元素存储器149提供这些元素,因此重写了现有的内容。
求和单元147向抽头系数确定器150提供由对每个类别新确定的在矩阵A中和在向量v中的元素构成的标准方程(8)。
抽头系数确定器150通过求解由求和单元147提供的对于每个类别的标准方程来确定每个类别的抽头系数,并且向存储单元126提供每个类别的抽头系数作为质量增进数据以及更新相关信息,因此以重写的方式在存储单元126中存储这些数据。
图15所示的流程图图解了由图14所示的学习单元125执行学习过程,以学习抽头系数作为质量增进数据。
从A/D转换器122(图3)向缓冲器141提供响应于在语音通信期间或在任何定时由用户说出的语音的语音数据。缓冲器141存储被提供到那里的语音数据。
当用户完成语音通信时,或当从语音的开始过去预定长短的时间时,学习单元125开始对作为新输入的语音数据的在语音通信期间存储在缓冲器141中的语音数据的学习过程,或开始对作为新输入的语音数据的从一系列语音通信的开始到结束存储在缓冲器141中语音数据的学习过程。
在步骤S101,学习数据发生器142首先从训练数据产生学习数据——存储在缓冲器141中的语音数据被作为训练数据,并向学习数据存储器143提供学习数据供存储。所述算法进行到步骤S102。
在步骤S102,预测抽头发生器144将作为存储在缓冲器141中的训练数据的语音采样之一——所述语音采样还没有被作为目标数据——设置作为目标数据,并且读取与目标数据对应的作为学习数据存储在学习数据存储器143中的几个语音采样。预测抽头发生器144产生预测抽头,然后向求和单元147提供该预测抽头。
而且在步骤S102中,分类抽头发生器145象预测抽头发生器144那样产生用于目标数据的分类抽头,并向分类器146提供分类抽头。
在步骤S102中的处理之后,算法进行到步骤S103。分类器146按照来自分类抽头发生器145的分类抽头分类目标数据,并且将产生的分类编码向求和单元147提供。
在步骤S104,求和单元147从缓冲器141读取目标数据,并且利用目标数据和来自预测抽头发生器144的预测抽头来计算在矩阵A和向量v中的元素。求和单元147向在矩阵A和向量v中的元素中的、与来自分类器146的分类编码对应的元素增加从目标数据和预测抽头确定的在矩阵A和向量v中的元素。算法进行到步骤S105。
在步骤S105,预测抽头发生器144确定是否在缓冲器141中存在还没有被当作目标数据的训练数据。如果确定在缓冲器141中存在这样的训练数据,则算法循环回步骤S102。还没有被作为目标数据的训练数据被设置作为新的目标数据,并且重复相同的过程。
如果在步骤S105确定在缓冲器141中不存在还没有被当作目标数据的训练数据,则求和单元147向抽头系数确定器150提供由对于每个类别存储在用户元素存储器149中的在矩阵A和向量v中的元素构成的标准方程(8)。算法然后进行到步骤S106。
在步骤S106,抽头系数确定器150通过求解从求和单元147提供的每个类别的标准方程来确定每个类别的抽头系数。而且在步骤S106,抽头系数确定器150向存储单元126提供每个类别的抽头系数以及更新相关信息,因此以重写的方式在存储单元126中存储这些数据。学习过程结束。
在此学习过程不是在实时地被进行。如果硬件具有高性能,则可以在实时的基础上执行学习过程。
如上所述,学习单元125在语音通信期间或在任何定时根据新输入的语音数据和在过去学习过程中使用的语音数据来进行学习过程。在用户说出更多时,获得了解码接近用户语音的语音的抽头系数。通过在通信对方利用这样的抽头系数解码编码的语音数据,执行适合于用户的语音特点的处理。因此获得具有足够的改进质量的解码语音数据。当用户使用移动电话101更长时间的时候,从通信对方端输出更好质量的语音。
当在发送机113(图3)中的学习单元125被构造为图14所示那样时,质量增进数据是抽头系数。在接收机114(图4)中的存储单元136存储所述抽头系数。在接收机114中的缺省数据存储器137作为缺省数据存储通过求解由存储在图14所示的初始元素存储器148中的元素构成的标准方程而获得的每个类别的抽头系数。
图16图解了在接收机114(图4)中的解码器132中的结构,其中在发送机113(图3)中的学习单元125被构造成图14所示的那样。
解码单元161被提供了从接收机控制器131(图4)输出的编码的语音数据。解码单元161利用与在发送机113(图3)中的编码器123的编码方法对应的解码方法来解码编码的语音数据。产生的解码语音数据被输出到缓冲器162。
缓冲器162暂时存储从解码单元161输出的解码语音数据。
预测抽头发生器163连续将用于改进解码的用于数据的质量的质量增进数据设置为目标数据,并且对存储在缓冲器162中的解码语音数据的几个语音采样安排(产生)预测抽头,所述预测抽头用于利用方程(1)的线性第一阶预测运算确定目标数据的预测值。预测抽头然后被提供到预测单元167。预测抽头发生器163产生与图14所示的学习单元125中的预测抽头发生器144产生的相同的预测抽头。
分类抽头发生器164按照存储在缓冲器162中的解码语音数据的几个语音采样来安排(产生)目标数据的分类抽头,并且向分类器165提供分类抽头。分类抽头发生器164产生与由图14所示的学习单元125中的分类抽头发生器145产生的相同的分类抽头。
分类器165利用来自分类抽头发生器164的分类抽头,象图14所示的学习单元125中的分类器146执行的那样来执行分类,并且象系数存储器166提供产生的分类编码。
系数存储器166在对应于所述类别的地址存储每个类别的抽头系数来作为来自管理单元135的质量增进数据。而且,系数存储器166向预测单元167提供存储在与从分类器165提供的分类编码对应的地址的抽头系数。
预测单元167获取从预测抽头发生器163输出的预测抽头和从系数存储器166输出的抽头系数,并且利用预测抽头和抽头系数进行由方程(1)表示的线性预测计算。预测单元167确定语音质量改进的数据(的预测值)作为目标数据,并且向D/A转换器133(图4)提供语音质量改进的数据。
现在参照图17所示的流程图来讨论图16所示的解码器132的处理。
解码单元161解码从接收机控制器131输出的编码语音数据(图4),然后输出和在缓冲器162中存储产生的解码语音数据。
在步骤S111,预测抽头发生器163将在已经改进了解码语音数据的声音质量的语音质量改进的数据中的、在时间上还没有被作为目标数据的最早的语音采样设置为目标数据,并且通过从缓冲器162读取解码语音数据的几个声音采样来安排预测抽头,然后向预测单元167提供预测抽头。
而且在步骤S111中,分类抽头发生器164通过读取在缓冲器162中存储的解码语音数据相对于目标数据的几个语音采样而安排分类抽头,并且向分类器165提供分类抽头。
在从分类抽头发生器164接收到分类抽头时,分类器165利用分类抽头在步骤S112进行分类。分类器165向系数存储器166提供产生的分类编码,然后算法进行到步骤S113。
在步骤S113,系数存储器166读取存储在对应于从分类器165输出的分类编码的地址的抽头系数,然后向预测单元167提供所读取的抽头系数。算法进行到步骤S114。
在步骤S114,预测单元167获取从系数存储器166输出的抽头系数,并且利用所获取的抽头系数和来自预测抽头发生器163的预测抽头来进行由方程(1)表示的相乘和求和运算,因此产生语音质量改进的数据(的预测值)。
因此获得的语音质量改进的数据通过D/A转换器133(图4)被从预测单元167提供到扬声器134,并且然后从扬声器134输出高质量的数据。
通过学习在训练者和受训者之间的关系而获得抽头系数,其中用户的语音作为训练者,这个语音的编码并且然后被解码的版本作为受训者。用户的语音被从由解码单元161输出的解码的语音数据精确地被预测。扬声器134因此输出与作为语音通信对方的用户的实际语音更接近地相似的语音,即从解码单元161输出的具有高质量的解码的语音数据(图16)。
在步骤S114的处理步骤之后,算法进行到步骤S115。确定是否有要被处理为目标数据的语音质量改进的数据。如果确定存在要作为目标数据的语音质量改进的数据,则再次重复上述的系列步骤。如果在步骤S115确定没有要作为目标数据的语音质量改进的数据,则算法结束。
当在移动电话1011和移动电话1012之间进行语音通信时,移动电话1012使用抽头系数作为与作为图5所示的语音通信对方的移动电话1011的电话号码对应相关的质量增进数据,换句话说,使用移动电话1011的用户的语音数据的学习的数据,如果从移动电话1011向移动电话1012发送的语音是移动电话1011的用户的语音,则移动电话1012利用移动电话1011的用户的抽头系数来进行解码处理,因此输出高质量的语音。
即使从移动电话1011向移动电话1012发送的语音不是移动电话1011的用户的语音,换句话说,即使移动电话1011被除了移动电话1011的用户或拥有者之外的另一个人使用,移动电话1012也利用移动电话1011的用户的抽头系数来执行解码处理。从解码处理获得的语音在质量上不优于从移动电话1011的真正用户(拥有者)的语音获得的语音。总之,如果拥有者使用移动电话1011则移动电话1012输出高音调语音,如果除了移动电话1011的拥有者之外的用户使用移动电话1011则移动电话1012不输出高音调语音。在这个方面,移动电话101起简单个人鉴别的作用。
图18图解了在CELP(编码激励线性预测编码)型移动电话101中构成发送机113(图3)的编码器123的结构。
从A/D转换器122(图3)输出的语音数据被提供到计算器3和LPC(线性预测系数)分析器4。
LPC分析器4将预定的语音采样作为一个帧来逐帧地LPC分析来自A/D转换器122的语音数据,因此得到第P阶线性预测系数α1、α2、...、αP。LPC分析器4向向量量化器5提供具有第P阶线性预测系数αp(p=1,2,...,P)作为元素的特征向量。
向量量化器5存储具有线性预测系数作为其元素的编码向量和与编码对应相关的编码本,并且根据编码本向量量化来自LPC分析器4的特征向量α,然后向编码确定器15输出作为向量量化的结果获得的编码(以下称为A_code)。
向量量化器5向语音合成滤波器6提供作为构成对应于A编码的编码向量α`的元素的线性预测系数α1`、α2`、...、αP`。
作为IIR(无限脉冲相应)型数字滤波器的语音合成滤波器6利用作为IIR滤波器的抽头系数的、来自向量量化器5的线性预测系数αp`(p=1,2,...,P)和作为输入信号的、从计算器14提供的余数信号e来执行语音合成。
在由LPC分析器4执行的LPC分析中,以sn表示当前时间n的语音数据(的采样值),以sn-1、sn-2、...、sn-P表示接近sn的过去P个采样值,并且假定下面的由方程(9)表示的第一阶线性预测组合成立。
sn1sn-12sn-2+...+αPsn-P=en
                                            ...(9)
下面利用过去的P个采样值sn-1、sn-2、...、sn-P表示在当前时间n的采样值sn的预测值(线性预测值)sn`,
sn`=-(α1sn-12sn-2+...+αPsn-P)
                                    ...(10)
因此确定了线性预测系数αp,以便在实际采样值sn和线性预测值sn`之间的均方误差被最小化。
在方程(9)中,{en}(...,en-1,en,en+1,...)是不相关的随机变量。随机变量的平均值是0,并且其方差是σ2
按照方程(9),采样值sn
sn=en-(α1sn-12sn-2+...+αPsn-P)
                                    ...(11)
如果经过Z变换,方程(11)变成方程(12)。
S=E/(1+α1z-12z-2+...+αPz-P)
                            ...(12)
在方程(12)中,S和E分别表示在方程(11)中的sn和en的Z变换版本。
按照方程(9)和(10),en
en=sn-sn`
                        ...(13)
在实际采样值sn和线性预测值sn`之间的差被称为余数信号。
从方程(12),通过将线性预测系数αP设置为IIR滤波器抽头系数和将余数信号en设置为IIR滤波器的输入信号来确定语音数据sn
如上所述,语音合成滤波器6通过将来自向量量化器5的线性预测系数αP`设置为抽头系数,和将从计算器14提供的余数信号e设置为输入信号来计算方程(12),并因此确定语音数据(合成的声音数据)ss。
因为语音合成滤波器6使用线性预测系数αP`作为对应于被获得作为向量量化的结果的编码、而不是被获得作为LPC分析器4的LPC分析的结果的线性预测系数αP的编码向量,因此从语音合成滤波器6输出的合成声音信号一般与从A/D转换器122(图3)输出的语音数据不同。
从语音合成滤波器6输出的合成声音数据ss被提供到计算器3。计算器3从来自语音合成滤波器6的合成声音数据ss减去从A/D转换器122(图3)输出的语音数据S,并且将产生的余数向均方误差计算器7提供。均方误差计算器7对来自计算器3的均方余数(在第k帧中的均方采样值)求和,并且将所产生的均方误差提供到最小均方误差确定器8。
最小均方误差确定器8与从均方误差计算器7输出的均方误差对应相关地存储作为表示长期预测延迟的编码的L码(L_code)、表示增益的编码的G码(G_code)和表示编码字(激励编码本)的编码的I码(I_code),并且输出对应于从均方误差计算器7输出的均方误差的L码、G码和I码。L码被提供到自适应编码本存储器9,G码被提供到增益解码器10,I码被提供到激励编码本存储器11。L码、G码和I码也被提供到编码确定器15。
自适应编码本存储器9存储一个7比特L码和与预定延迟时间对应相关的自适应编码本,并且将从计算器14提供的余数信号e延迟与从最小均方误差确定器8提供的L码对应相关的延迟时间(长期预测延迟)。延迟的余数信号e然后被提供到计算器12。
因为自适应编码本存储器9在输出余数信号e之前将余数信号e延迟了对应于L码的时间,因此输出信号变成接近具有等于延迟时间的周期的信号的信号。那个信号主要作为用于利用线性预测系数在语音合成中产生变成语音的声音的合成信号的驱动信号。L码表示语音的音调周期。按照CELP标准,所述编码是落入从20到146范围的整数值。
增益解码器10存储将G码与预定的增益β和γ对应相关的列表,并且与从最小均方误差确定器8输出的G码对应相关地输出增益α和增益γ。增益β和γ被分别提供到计算器12和13。增益β被称为长期滤波器状态输出增益,增益γ被称为激励编码本增益。
激励编码本存储器11存储9比特的I码和与例如预定的激励信号对应相关的激励编码本,并且向计算器13输出与从最小均方误差确定器8提供的I码对应相关的激励信号。
存储在激励编码本中的激励信号是约等于白噪音的信号,并且变成用于利用线性预测系数在语音合成中主要产生未变成语音的声音的合成信号的驱动信号。
计算器12将来自自适应编码本存储器9的输出信号与从增益解码器10输出的增益β相乘,并且向计算器14输出乘积1。计算器13将激励编码本存储器11的输出信号与从增益解码器10输出的增益γ相乘,并且向计算器14输出乘积n。计算器14对来自计算器12的乘积1和来自计算器13的乘积n求和,并且向语音合成滤波器6和自适应编码本存储器9提供这些乘积的和作为余数信号e。
语音合成滤波器6作为IIR滤波器,它具有从向量量化器5提供的线性预测系数αP`作为抽头系数。语音合成滤波器6过滤输入信号,即从计算器14提供的余数信号e,并且向计算器3提供所产生的合成语音数据。计算器3和均方误差计算器7执行与已经讨论的相同的处理,并且然后将产生的均方误差提供到最小均方误差确定器8。
最小均方误差确定器8确定是否来自均方误差计算器7的均方误差被最小化(为最小)。如果最小均方误差确定器8确定均方误差未被最小化,则最小均方误差确定器8输出L码、G码和L码,然后将重复与已经讨论的相同的处理。
如果最小均方误差确定器8确定均方误差被最小化,则最小均方误差确定器8向编码确定器15输出预定的信号。编码确定器15锁存从向量量化器5提供的A码,并且也连续锁存从最小均方误差确定器8提供的L码、G码和I码。在接收到来自最小均方误差确定器8的确定信号时,编码确定器15将锁存的A码、L码、G码和I码复用,并且输出被相乘的编码作为编码语音数据。
从现在开始,编码语音数据包括A码、L码、G码和I码,即在逐帧的基础上用于解码处理的信息。
参见图18(以及图19和图20),附加到每个变量的码元[k]表示帧的数量,并且在本说明书中被省略。
图19图解了在CELP型移动电话101中构成接收机114(图4)的解码器132的结构。如图所示,与图16所讨论的相同的部件被指定了相同的附图标号。
从接收机控制器131(图4)输出的编码语音数据被提供到DEMUX(去复用器)21。DEMUX 21将编码语音数据去复用为L码、G码、I码和A码,并分别向编码本存储器22、增益解码器23、激励编码本存储器24和滤波器系数解码器25提供L码、G码、I码和A码。
自适应编码本存储器22、增益解码器23、激励编码本存储器24和计算器26-28在结构上分别与图18所示的自适应编码本存储器9、增益解码器10、激励编码本存储器11和计算器12-14相同。与参照图1所讨论的相同的处理被执行。L码、G码、I码被解码为余数信号e。余数信号e被作为输入信号提供到语音合成滤波器29。
滤波器系数解码器25存储与图18所示的向量量化器5中存储的相同的编码本,并且将A码解码为线性预测系数αP`,并且向语音合成滤波器29提供线性预测系数αP`。
具有与图18所示的语音合成滤波器6相同结构的语音合成滤波器29通过将来自滤波系数解码器25的线性预测系数αP`设置为抽头系数和将从计算器28提供的余数信号e设置为输入到那里的信号来计算方程(12)。语音合成滤波器29于是当图18所示的最小均方误差确定器8确定均方误差被最小化时产生合成的声音数据,并且输出所述合成的声音数据作为编码的语音数据。
如上参照图18所讨论的,呼叫方的编码器123以编码的形式作为输入信号向被呼叫方的解码器132发送余数信号和线性预测系数。解码器132将所接收的代码解码为余数信号和线性预测系数。但是,因为解码形式的余数信号和线性预测系数(以下适当地称为解码的余数信号和解码的线性预测系数)包括诸如量化误差的误差,因此解码的余数信号和线性预测系数不能与从对呼叫方的用户语音的LPC分析获得的余数信号和线性预测系数一致。
作为从解码器132的语音合成滤波器29输出的合成声音数据的解码的语音数据在声音质量上被降级,与呼叫方的用户的语音数据相比具有失真。
解码器132执行上述的分类和自适应处理,因此将解码的语音数据转换为接近呼叫方的用户的语音数据的、并且没有失真(失真减少)的语音质量改进的数据。
作为从语音合成滤波器29输出的合成声音数据的解码语音数据被提供到缓冲器162以暂时存储在那里。
预测抽头发生器163连续将作为其质量改进的解码语音数据的语音质量改进的数据设置为目标数据,并且通过从缓冲器162读取解码语音数据的几个语音采样来对于目标数据安排预测抽头,并且向预测单元167提供预测抽头。分类抽头发生器164通过读取存储在缓冲器162中的解码语音数据的几个语音采样来对目标数据安排分类抽头,并且向分类器165提供所述分类抽头。
分类器165利用来自分类抽头发生器164的分类抽头执行分类,然后向系数存储器166提供所产生的分类编码。系数存储器166读取存储在与来自分类器165的分类编码对应的地址的抽头系数,并且向预测单元167提供抽头系数。
预测单元167利用从系数存储器166输出的抽头系数和来自预测抽头发生器163的预测抽头来执行由方程(1)定义的相乘和求和运算,并且然后获取语音质量改进的数据(的预测值)。
因此获得语音质量改进的数据被通过D/A转换器133(图4)从预测单元167输出到扬声器134,并且然后从扬声器134输出高质量的语音。
图20图解了在CELP型移动电话101中的构成发送机113(图3)的学习单元125的结构。如图所示,与参照图14所述的相同的部件被指定了相同的附图标记,并且适当地省略其讨论。
计算器183到编码确定器195在结构上与图18所示的计算器3到编码确定器15相同。计算器183接收从A/D转换器122(图3)输出的语音数据作为用于学习的数据。计算器183到编码确定器195对用于学习的数据执行与图18所示的编码器123执行的相同处理。
当最小均方误差确定器188确定均方误差被最小化时,从语音合成滤波器186输出的合成的声音数据被作为学习数据存储在学习数据存储器143中。
学习数据存储器143到抽头系数确定器150执行参照图14和图15所述的相同的处理。以这种方式,每个类别的抽头系数被产生作为质量增进数据。
在参照图19和图20所述的每个实施例中,预测抽头和分类抽头由从语音合成滤波器29或186输出的合成声音数据构成。如图19和图20中的虚线所示,预测抽头和分类抽头的每个可以包括I码、L码、G码、A码或A码产生的线性预测系数αP、从G码产生的增益β和γ以及从L码、G码、I码或A码获得的其他信息(例如用于确定余数信号e或1/β或n/γ的余数信号e、1和n)中的至少一个。
图21图解了构成发送机113(图3)的编码器123的另一种结构。
在图21所示的实施例中,编码器123利用向量量化编码从A/D转换器122(图3)输出的语音数据。
具体上,从A/D转换器122(图3)输出的语音数据被提供到缓冲器201,用于暂时在那里存储。
向量器202以时间量度依序读取存储在缓冲器201中的语音数据,并逐帧将语音数据向量化,其中预定数量的语音采样被作为1个帧。
向量器202可以通过将语音采样的一个帧直接设置为在向量中的元素而将语音数据向量化。或者,可以通过将语音采样的一个帧进行诸如LPC分析的声音分析和通过将产生的语音特征数量设置为向量的元素而向量化语音数据。为了说明简单,通过将语音采样的一个帧直接设置为向量的元素而向量化语音数据。
向量器202向距离计算器203输出通过将语音采样的一个帧直接设置为其元素而构造的一个向量(以下所述向量也被称为语音向量)。
距离计算器203计算存储在编码本存储器204中的编码本中登记的每个编码向量和来自向量器202的语音向量之间的距离(例如欧几里德(Euclidean)距离),并且向编码确定器205提供对于每个编码向量确定的距离以及与那个编码向量对应相关的编码。
编码本存储器204存储编码本作为后述的通过图22所示的学习单元125的学习过程获得的质量增进数据。距离计算器203计算在那个编码本中登记的每个编码向量和来自向量器202的语音向量之间的距离,并且向编码确定器205提供所述距离和与所述编码向量对应相关的编码。
编码确定器205从自距离计算器203提供的编码向量的距离中检测最短的距离,并且将在所述最短距离中产生的编码向量的编码、即最小化语音向量的量化误差(向量量化误差)确定为对于从量化器202输出的语音向量的向量量化结果。编码确定器205向发送器控制器124(图3)输出作为向量量化的结果的编码作为编码语音数据。
在图21所示的实施例中,距离计算器203、编码本存储器204和编码确定器205构成向量量化器块。
图22示出了构成图3所示的发送机113的学习单元125的结构,其中编码器123的构造如图21所示。
缓冲器211接收和存储从A/D转换器122输出的语音数据。
象图21所示的向量器202一样,向量器212利用存储在缓冲器211中的语音数据来构造语音向量,并且将这个语音向量提供到用户向量存储器213。
由例如EEPROM构成的用户向量存储器213连续存储从向量器212提供的语音向量。由例如ROM构成的初始向量存储器214预先存储由未指定数量的用户的语音数据构成的多个语音向量。
编码本发生器215利用LBG(Linde,Buzo,Gray)算法根据存储在初始向量存储器214和用户向量存储器213中的所有语音向量进行学习过程来产生编码本,并且输出作为学习过程的结果而获得的编码本来作为质量增进数据。
作为从编码本发生器215输出的质量增进数据的编码本被提供到存储单元126(图3),并且与更新相关信息(获得编码本的日期和时间)一起存储在存储单元126中。编码本也被提供到编码器123(图21)以便(以重写形式)写入在编码器123中的编码本存储器204中。
如果图22的学习单元125第一次进行学习过程,或在清空用户向量存储器213之后立即进行学习过程,则用户向量存储器213不存储语音向量。编码本发生器215不能通过仅仅引用用户向量存储器213产生编码本。存储在用户向量存储器213中的语音向量的数量在自移动电话101的使用开始起的初始周期中不是很多。在这种情况下,编码本发生器215可以通过仅仅引用用户向量存储器213来产生编码本,但是利用这样的编码本的向量量化的精确度低(具有大的量化误差)。
如上所述,初始向量存储器214存储多个语音向量。编码本发生器215通过不仅引用用户向量存储器213而且引用初始向量存储器214来防止产生导致低精确度向量量化的编码本。
在编码本产生过程中,在大量的语音向量被存储在用户向量存储器213中之后,编码本发生器215仅仅引用用户向量存储器213而不引用初始向量存储器214。
现在参照图23所示的流程图来讨论用于学习作为质量增进数据的编码本的图22所示的学习单元125的学习过程。
在语音通信或任何定时用户说出的语音数据或语音被从A/D转换器122(图3)提供到缓冲器211,并且缓冲器211存储被提供到那里的语音数据。
当用户结束语音通信时,或当从语音通信开始过去预定时间时,学习单元125开始对新输入的语音数据的学习过程,所述新输入的语音数据是在语音通信期间存储在缓冲器211中的语音数据或从语音通信开始到结束存储在缓冲器211中的语音数据。
向量器212依序读取存储在缓冲器211中的语音数据,并且逐帧向量化语音数据,其中一个帧包括预定数量的语音采样。向量器212向用于补充存储的用户向量存储器213提供作为向量化的结果获得的语音向量。
当完成对存储在缓冲器211中的所有语音数据的向量化时,编码本发生器215在步骤S121确定一个向量y1,它最小化向量y1到存储在用户向量存储器213和初始向量存储器214中的语音向量的距离的和。编码本发生器215将向量y1设置为编码向量y1。然后,算法进行到步骤S122。
在步骤S122,编码本发生器215将当前可获得的编码向量的总数设置为一个变量n,将每个编码向量y1、y2、...、yn划分成两个。具体而言,让Δ表示无穷小的向量,并且编码本发生器215从编码向量yi(i=1,2,...,n)产生向量yi+Δ和yi-Δ,并将向量yi+Δ设置为新的编码向量yi和将向量yi-Δ设置为新的编码向量yn+i
在步骤S123,编码本发生器215将语音向量xj(j=1,2,...,J)(存储在用户向量存储器213和初始向量存储器214中的语音向量的总数)分类成编码向量yi(i=1,2,...,2n),编码向量yi在距离上与语音向量xj最近,然后算法进行到步骤S124。
在步骤S124,编码本发生器215更新编码向量yi以便最小化对于编码向量yi分类的距离的和。可以通过确定这样的多个点的重心来执行更新处理,即对于编码向量yi点的0个或多个语音向量指向的点。换句话说,指向重心的向量最小化对于编码向量yi分类的语音向量的距离的和。如果对于编码向量yi分类的语音向量是0个,则编码向量yi保持不变。
在步骤S125,编码本发生器215确定对于更新的编码向量yi分类的语音向量的距离的和(以下称为相对于编码向量yi的距离的和),然后确定所有编码向量yi的和的总和(以下称为总和)。编码本发生器215确定是否在总和中的改变,即在当前步骤S125中确定的总和(以下称为当前总和)和在步骤S125步骤之前确定的总和(以下称为在前总和)之间的差的绝对值等于或小于预定的阈值。
如果在步骤S125中确定在当前总和和在前总和之间的差的绝对值不小于预定的阈值,换句话说,如果响应于编码向量yi的更新总和大大改变,则算法环回到步骤S123以重复相同的处理。
如果在步骤S125中确定在当前总和和在前总和之间的差的绝对值等于或小于预定的阈值,换句话说,如果响应于编码向量yi的更新总和不改变或改变很小,则算法进行到步骤S126。学习单元125确定是否表示当前可获得的编码向量的总数的变量n等于作为在编码本中预先设置的编码向量的数量(以下也称为所设置编码向量的数量)的N。
如果在步骤S126确定变量n不等于所设置的编码向量的数量N,换句话说,如果确定可获得的编码向量yi的数量不等于所设置的编码向量的数量N,则算法环回到步骤S122。然后重复上述处理。
如果在步骤S126确定变量n等于所设置的编码向量的数量N,换句话说,如果确定可获得的编码向量yi的数量等于所设置的编码向量的数量N,则编码本发生器215输出由N个编码向量yi构成的编码本作为质量增进数据,因此结束了学习过程。
在图23所示的学习过程中,用户向量存储器213存储到现在为止输入的语音向量,并且利用语音向量来更新(产生)编码本。可以按照在步骤S123和S124中的处理利用当前输入的语音向量和已经获得的编码本、即以简单的方式而不是利用过去输入的语音向量来进行编码本的更新。
在这种情况下,在步骤S123,编码本发生器215将语音向量xj(j=1,2,...,J(当前输入的语音向量的总数))分类为距离上最接近语音向量xj的编码向量yi(i=1,2,...,N(在编码本中的编码向量的总数)),然后算法进行到步骤S124。
在步骤S124,编码本发生器215更新编码向量yi以便最小化到被分类为编码向量yi的语音向量的距离的和。可以通过确定这样的多个点的重心来执行这个更新处理,即对于编码向量yi点的0个或多个语音向量指向的各点。让yi`表示更新的编码向量,x1、x2、...、xM-L表示过去输入的并且在更新处理之前对于编码向量yi分类的语音向量,xM-L+1、xM-L+2、...、xM表示对于编码向量yi分类的当前语音向量,并且通过计算方程(14)和(15)来确定在更新之前的编码向量yi和更新处理之后的编码向量yi`。
yi=(x1+x2+...+xM-L)/(M-L)
                            ...(14)
yi`=(xi+x2+...+xM-L+xM-L+1+xM-L+2+...+xM)/M
                                        ...(15)
过去输入的语音向量x1、x2、...、xM-L不被存储。方程(15)被修改如下。
yi`=(x1+x2+...+xM-L+xM-L+1)/M+(xM-L+2+...+xM)/M
=(x1+x2+...+xM-L+xM-L+1)/(M-L)x(M-L)/M
+(xM-L+2+...+xM)/M
                        ...(16)
如果将方程(14)代入方程(16),则产生下面的方程。
yi`=yi x(M-L)/M+(xM-L+2+...+xM)/M
                                        ...(17)
根据方程(17),利用当前输入的语音向量xM-L+1、xM-L+2、...、xM和在已经获得的编码本中的编码向量yi来更新编码向量yi,并且因此确定更新的编码向量yi
因为不必存储过去输入的语音向量,因此小容量的用户向量存储器213可以起作用。用户向量存储器213必须存储除了当前输入的语音向量之外还有到现在为止对于每个编码向量yi分类的语音向量的总数。随着编码向量yi的更新,用户向量存储器213必须更新对于更新的编码向量yi`分类的语音向量的总数。初始向量存储器214必须存储包括未指定数量的语音向量的编码本和对于每个编码向量分类的语音向量的总数,而不是未指定数量的语音向量本身。当图22图解的学习单元125第一次进行学习过程或在清空用户向量存储器213之后立即进行学习过程时,利用存储在初始向量存储器214中的编码本来进行编码本更新。
在图22中图解的实施例中的学习单元125在语音通信或在任何定时对新输入的语音数据和在过去学习过程中使用的语音数据进行图23所示的学习过程。用户进行语音通信更多,则获得更适合于用户的编码本,即减少用户语音的量化误差更多的编码本。通过利用在对方的这样的编码本解码编码语音数据(即执行向量去量化),执行适合于用户的语音特点的处理(向量去量化)。与传统的技术(其中使用从所述未指定数量的用户的语音来获得编码本)相比,产生其质量足够改进的解码的语音数据。
图24图解了在接收机114(图4)中的解码器132的结构,其中在发送机113(图3)中的学习单元125的构造如图22所示。
缓冲器221暂时存储从接收机控制器131(图4)输出的编码语音数据(作为向量量化结果的编码)。向量去量化器222读取存储在缓冲器221中的代码,并且通过引用存储在编码本存储器223中的编码本来进行向量去量化。那个编码因此被解码为语音向量,它随后被提供到逆向量器224。
编码本存储器223存储由管理单元135提供作为质量增进数据的编码本。
当在发送机113(图3)中的学习单元125的构造如图22所示时,质量增进数据是编码本。在接收机114(图4)中的存储单元136于是存储编码本。在接收机114中的缺省数据存储器137作为缺省数据存储利用图22图解的初始向量存储器214存储的语音向量产生的编码本。
逆向量器224将从向量去量化器222输出的语音向量在时间量度上反向量化为语音数据。
现在参照图25所示的流程图来讨论图24所示的解码器132的(解码)处理。
缓冲器221依序以提供到那里的编码来存储编码的语音数据。
在步骤S131,向量去量化器222从存储在缓冲器221中的编码读取旧的和还没有被读取的一个编码作为目标编码,并且向量去量化那个编码。具体上,向量去量化器222在存储在编码本存储器223中的编码本中的编码向量中检测与所述目标编码对应相关的编码向量,并且向逆向量器224输出所述编码向量作为语音向量。
在步骤S132,逆向量器224反向量化来自向量去量化器222的语音向量,因此输出解码的语音数据。算法然后进行到步骤S133。
在步骤S133,向量去量化器222确定是否在缓冲器221中存在还未被设置为目标编码的编码。如果在步骤S133确定在缓冲器221中存在还未被设置为目标编码的编码,则算法环回到步骤S131。向量去量化器222将在存储在缓冲器221中的编码中的一个旧的和还没有被读取的代码设置为新的目标编码,然后重复相同的处理。
如果在步骤S133确定在缓冲器221中不存在还没有被设置为目标编码的代码,则算法结束。
上述的系列处理步骤被利用硬件执行。或者,可以利用软件程序来执行这些步骤。当利用软件程序执行处理步骤时,可以在通用的计算机中安装软件程序。
图26图解了计算机的一个实施例,其中安装了用于执行一系列处理步骤的程序。
所述程序可以被预先存储在作为计算机中设立的存储介质的硬盘405或ROM 403。
或者,可以暂时或永久地在诸如软盘、CD-ROM(光盘只读存储器)、MO(磁光)盘、DVD(数字多用途光盘)、磁盘或半导体存储器的可移动存储介质411中存储所述程序。可以在所谓的封装式软件包中提供可移动存储器411。
可以利用可移动存储介质411来在计算机中安装所述程序。或者,可以从下载站点经由用于数字广播的人造卫星来向计算机无线发送所述程序,或者可以利用诸如LAN(局域网)或因特网的网络以有线的方式向计算机传送所述程序。计算机在通信单元408接收所述程序,并且在内置的硬盘405中安装所述程序。
计算机包括CPU(中央处理器)402。输入/输出接口410通过总线401连接到CPU 402。当CPU 402在用户操作诸如键盘、鼠标或麦克风的输入单元407时通过输入/输出接口410从用户接收命令的时候,CPU 402执行存储在ROM(只读存储器)403中的所述程序。CPU 402通过将存储在硬盘405中的所述程序、经由卫星或网络被发送的并由所述通信单元408接收的和安装在硬盘405中的所述程序、或从装到驱动器409和安装到硬盘405的存储介质411读取的所述程序安装到RAM(随机存取存储器)404而执行所述程序。CPU 402执行按照每个上述的流程图的处理或通过上述的方框图图解的配置执行的处理。CPU 402通过输入/输出接口410从诸如LCD(液晶显示器)或扬声器的输出单元406输出处理的结果,或通过通信单元408发送处理的结果,或将处理的结果存储在硬盘405上。
不要求以流程图中的所述的时间顺序来执行描述用于使得计算机执行多个处理的程序的处理步骤。处理步骤可以并行或单独地被执行(例如并行处理或利用对象的处理)。
可以通过单个的计算机或通过多个计算机以分布处理中来执行所述程序。所述程序可以被传送到远程位置的计算机和由其执行。
在上述的实施例中,被呼叫方在呼叫到达期间使用从呼叫方发送的电话号码来作为识别呼叫方的识别信息。可以向用户分配唯一的ID(标识),并且这个ID可以作为识别信息被发送。
在上述的实施例中,本发明被应用到其中移动电话执行语音通信的系统中。本发明可以被广泛使用在其中执行语音通信的任何系统中。
在图4所示的实施例中,存储单元136和缺省数据存储器137可以由单个的可重写存储器构造。
质量增进数据可以从移动电话1011被上载到未示出的服务器,并且移动电话1012可以在必要时下载质量增进数据。
产业上的应用
在按照本发明的发送机、发送方法和第一程序中,语音数据被编码,并且编码的语音数据被输出。根据过去学习中使用的语音数据和新输入的语音数据来学习质量增进数据,所述质量增进数据改进在接收编码语音数据的接收方输出的语音的质量。编码语音数据和质量增进数据然后被发送。接收方提供高质量的解码语音。
在按照本发明的接收机、接收方法和第一程序中,编码的语音数据被接收,并且选择与已经发送编码语音数据的发送方的识别信息对应相关的质量增进数据。根据所选择的质量增进数据,所接收的编码语音数据被解码。解码的语音的质量高。
在本发明的收发机中,编码输入的语音数据,并且输出编码的语音数据。根据过去学习中使用的语音数据和新输入的语音数据来学习质量增进数据,所述质量增进数据改进在接收编码语音数据的其它收发机输出的语音的质量。编码语音数据和质量增进数据然后被发送。从其他收发机发送的编码语音数据被接收,并且选择与已经发送编码语音数据的其他收发机的识别信息对应相关的质量增进数据。根据所选择的质量增进数据,所接收的编码语音数据被解码。解码的语音的质量高。

Claims (26)

1.一种用于发送输入的语音数据的发送机,包括:
编码装置,它编码语音数据,并输出编码的语音数据;
学习装置,它根据在过去的学习中使用的语音数据和新输入的语音数据而学习质量增进数据,所述质量增进数据改善在接收编码语音数据的接收方输出的语音质量;
发送装置,它发送编码的语音数据和质量增进数据,
其中,在该接收方,利用作为所述质量增进数据的抽头系数、并利用通过对编码的语音数据解码而得到的解码的语音数据,通过执行高质量数据的预测值的预测计算,而改善在该接收方输出的语音质量,
其中,该学习装置执行学习过程以将抽头系数确定为质量增进数据,并且,所述高质量数据是从编码的语音数据解码的语音数据的高质量版本,
其中,该学习装置包括:
低质量数据发生器装置,它产生比第一数据质量低的第二数据,所述第一数据是语音数据;
抽头系数确定器,它计算抽头系数,所述抽头系数统计地最小化在第一数据和第一数据的预测值之间的预测误差,所述第一数据的预测值是通过执行使用抽头系数和第二数据两者作为参数的预测计算而获得的;
分类抽头发生器装置,它产生分类抽头,用于分类作为第一数据的第一目标数据;和
分类器装置,它按照分类抽头来分类第一目标数据以确定第一目标数据的类别,并且
所述抽头系数确定器确定每个类别的抽头系数。
2.按照权利要求1的发送机,还包括管理装置,它管理质量增进数据的发送。
3.按照权利要求2的发送机,其中管理装置管理质量增进数据的发送,以便在发送机和接收方之间建立通信链路之后发送更新的质量增进数据。
4.按照权利要求2的发送机,其中管理装置管理质量增进数据的发送,以便如果接收方请求发送机在发送机和接收方之间建立通信链路之后发送质量增进数据,则发送更新的质量增进数据。
5.按照权利要求2的发送机,还包括历史存储装置,它存储向接收方发送质量增进数据的历史,
其中管理装置根据发送历史确定是否完成向发送方的更新的质量增进数据的发送,和
如果管理装置根据发送历史确定未完成向发送方的更新的质量增进数据的发送,则管理装置管理质量增进数据的发送以便发送更新的质量增进数据。
6.按照权利要求1的发送机,其中低质量数据发生器装置将第一数据编码为编码的语音数据,并且产生通过解码编码语音数据而获得的第二数据。
7.按照权利要求1的发送机,还包括编码本存储装置,用于存储编码本,
其中该编码装置按照存储在编码本存储装置中的预定编码本来向量量化语音数据,并且输出所产生的编码作为编码语音数据。
8.按照权利要求7的发送机,其中学习装置执行学习过程来确定新的编码本作为质量增进数据。
9.一种用于发送输入的语音数据的发送方法,包括:
编码步骤,编码语音数据,并输出编码的语音数据;
学习步骤,根据在过去的学习中使用的语音数据和新输入的语音数据而学习质量增进数据,所述质量增进数据改善在接收编码语音数据的接收方输出的语音质量;
发送步骤,发送编码的语音数据和质量增进数据,
其中,在该接收方,利用作为所述质量增进数据的抽头系数、并利用通过对编码的语音数据解码而得到的解码的语音数据,通过执行高质量数据的预测值的预测计算,而改善在接收方输出的语音质量,
其中,在该学习步骤中,执行学习过程以将抽头系数确定为质量增进数据,并且,所述高质量数据是从编码的语音数据解码的语音数据的高质量版本,
其中,该学习步骤包括:
产生比第一数据质量低的第二数据,所述第一数据是语音数据;
计算抽头系数,其中,确定每个类别的抽头系数,所述抽头系数统计地最小化在第一数据和第一数据的预测值之间的预测误差,所述第一数据的预测值是通过执行使用抽头系数和第二数据两者作为参数的预测计算而获得的;
产生分类抽头,用于分类作为第一数据的第一目标数据;和
按照分类抽头来分类第一目标数据以确定第一目标数据的类别。
10.一种用于接收编码语音数据的接收机,包括:
接收装置,它接收编码语音数据;
存储装置,它存储质量增进数据以及识别信息,所述质量增进数据改善通过对编码语音数据解码而获得的解码语音数据,所述识别信息识别已经发送编码语音数据的发送方;
选择装置,它从在该存储装置中存储的质量增进数据之中选择与已经发送编码语音数据的发送方的识别信息对应相关的质量增进数据;
解码装置,它根据由选择装置选择的质量增进数据来解码由接收装置接收的编码语音数据,
其中,该质量增进数据是抽头系数,所述抽头系数与解码的语音数据一起被使用以执行高质量数据的预测值的预测计算,所述高质量数据是从编码语音数据解码的语音数据的高质量版本,并且
其中该解码装置包括:
解码器,它解码编码的语音数据,并且输出解码的语音数据;
预测单元,通过利用解码的语音数据和抽头系数两者作为参数执行预测计算,来确定高质量数据的预测值。
11.按照权利要求10的接收机,其中存储装置预先存储缺省质量增进数据。
12.按照权利要求11的接收机,还包括确定装置,它根据识别信息来确定存储装置是否存储了与已经发送编码语音数据的发送方对应相关的质量增进数据,
其中如果确定装置确定在存储装置中未存储与所述发送方对应相关的质量增进数据,则选择装置选择缺省的质量增进数据。
13.按照权利要求10的接收机,其中接收装置也接收由发送方发送的质量增进数据,
其中接收机还包括管理装置,它根据由接收装置接收的质量增进数据来管理存储装置的存储内容的更新。
14.按照权利要求13的接收机,其中在建立接收机和发送方之间的通信链路之后,管理装置按照从发送方发送的更新的质量增进数据来更新存储装置的存储内容。
15.按照权利要求14的接收机,其中,管理装置在建立接收机和发送方之间的通信链路之后发送质量增进数据发送请求,请求发送方发送质量增进数据,
并且,响应于所述质量增进数据发送请求,按照从发送方发送的更新的质量增进数据更新存储装置的存储内容。
16.按照权利要求13的接收机,其中管理装置确定存储装置是否存储了更新的质量增进数据,
并且如果存储装置中未存储更新的质量增进数据,则按照从发送方发送的更新的质量增进数据更新存储装置的存储内容。
17.按照权利要求16的接收机,其中存储装置存储关于质量增进数据的更新相关信息,
其中管理装置根据存储在存储装置中的更新相关信息来确定是否存储装置存储更新的质量增进数据。
18.按照权利要求17的接收机,其中所述更新相关信息包括获得质量增进数据的日期和时间。
19.按照权利要求16的接收机,还包括更新禁止装置,它按照从发送方发送的更新的质量增进数据来禁止存储装置的存储内容的更新。
20.按照权利要求10的接收机,其中发送方是电话,并且
其中,发送方的识别信息是作为发送方的电话的电话号码。
21.按照权利要求10的接收机,其中通过产生质量低于第一数据的第二数据来确定抽头系数,所述第一数据是语音数据,
并且还通过计算统计地最小化在第一数据和第一数据的预测值之间的预测误差的抽头系数来确定抽头系数,通过执行使用抽头系数和第二数据两者作为参数的预测计算而获得第一数据的预测值。
22.按照权利要求21的接收机,其中第二数据是通过将第一数据编码为编码语音数据和通过解码编码语音数据而获得的解码的语音数据。
23.按照权利要求10的接收机,其中按照预定的类别来分类抽头系数,
其中该预测单元包括:
分类抽头发生器装置,它产生分类抽头,用于分类作为高质量语音数据的目标数据,所述高质量数据的预测值被确定;
分类器装置,它按照抽头系数来分类目标数据以确定目标数据的类别;
预测装置,它通过利用与目标数据和解码的语音数据的类别对应的抽头系数执行预测计算来确定目标数据的预测值。
24.按照权利要求10的接收机,其中编码语音数据是通过向量量化语音数据而获得的编码,
质量增进数据是用于逆向量化编码的编码本,
解码装置根据编码本通过逆向量化编码来解码该编码的语音数据。
25.一种用于接收编码语音数据的接收方法,包括:
接收步骤,接收编码语音数据;
存储步骤,它存储质量增进数据以及识别信息,所述质量增进数据改善通过对编码语音数据解码而获得的解码语音数据,所述识别信息识别已经发送编码语音数据的发送方;
选择步骤,从所存储的质量增进数据之中选择与已经发送编码语音数据的发送方的识别信息对应相关的质量增进数据;
解码步骤,根据在选择步骤选择的质量增进数据来解码在接收步骤接收的编码语音数据,
其中,该质量增进数据是抽头系数,所述抽头系数与解码的语音数据一起被使用以执行高质量数据的预测值的预测计算,所述高质量数据是从编码语音数据解码的语音数据的高质量版本,和
其中该解码步骤包括:
解码编码的语音数据,并且输出解码的语音数据;
通过利用解码的语音数据和抽头系数两者作为参数执行预测计算,
来确定高质量数据的预测值。
26.一种包括发送机和接收机的收发机,
其中发送机包括:
编码装置,它编码语音数据,并输出编码的语音数据;
学习装置,它根据在过去的学习中使用的语音数据和新输入的语音数据而学习质量增进数据,所述质量增进数据改善在接收编码语音数据的其它收发机输出的语音质量;和
发送装置,它发送编码的语音数据和质量增进数据;
其中所述接收机包括:
接收装置,它接收从其他收发机发送的编码语音数据;
存储装置,它存储质量增进数据以及识别信息,所述识别信息识别已经发送编码语音数据的其它收发机;
选择装置,它从在该存储装置中存储的质量增进数据之中选择与已经发送编码语音数据的其它收发机的识别信息对应相关的质量增进数据;
解码装置,它解码由接收装置接收的编码的语音数据,并利用解码的语音数据、以及作为由选择装置选择的质量增进数据的抽头系数,通过执行高质量数据的预测值的预测计算,而改善解码的语音数据的质量,
其中,该学习装置执行学习过程以将抽头系数确定为质量增进数据,并且,所述高质量数据是从编码的语音数据解码的语音数据的高质量版本,
其中,该学习装置包括:
低质量数据发生器装置,它产生比第一数据质量低的第二数据,所述第一数据是语音数据;
抽头系数确定器,它计算抽头系数,所述抽头系数统计地最小化在第一数据和第一数据的预测值之间的预测误差,所述第一数据的预测值是通过执行使用抽头系数和第二数据两者作为参数的预测计算而获得的;
分类抽头发生器装置,它产生分类抽头,用于分类作为第一数据的第一目标数据;和
分类器装置,它按照分类抽头来分类第一目标数据以确定第一目标数据的类别,并且
所述抽头系数确定器确定每个类别的抽头系数,
其中,该质量增进数据是抽头系数,所述抽头系数与解码的语音数据一起被使用以执行高质量数据的预测值的预测计算,所述高质量数据是从编码语音数据解码的语音数据的高质量版本,并且
其中该解码装置包括:
解码器,它解码编码的语音数据,并且输出解码的语音数据;
预测单元,通过利用解码的语音数据和抽头系数两者作为参数执行预测计算,来确定高质量数据的预测值。
CN028026632A 2001-06-26 2002-06-20 发送设备及方法、接收设备及方法和发送/接收设备 Expired - Fee Related CN1465149B (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP2001192379A JP4711099B2 (ja) 2001-06-26 2001-06-26 送信装置および送信方法、送受信装置および送受信方法、並びにプログラムおよび記録媒体
JP192379/01 2001-06-26
JP192379/2001 2001-06-26
PCT/JP2002/006179 WO2003001709A1 (en) 2001-06-26 2002-06-20 Transmission apparatus, transmission method, reception apparatus, reception method, and transmission/reception apparatus

Publications (2)

Publication Number Publication Date
CN1465149A CN1465149A (zh) 2003-12-31
CN1465149B true CN1465149B (zh) 2010-05-26

Family

ID=19030838

Family Applications (1)

Application Number Title Priority Date Filing Date
CN028026632A Expired - Fee Related CN1465149B (zh) 2001-06-26 2002-06-20 发送设备及方法、接收设备及方法和发送/接收设备

Country Status (6)

Country Link
US (1) US7366660B2 (zh)
EP (1) EP1401130A4 (zh)
JP (1) JP4711099B2 (zh)
KR (1) KR100895745B1 (zh)
CN (1) CN1465149B (zh)
WO (1) WO2003001709A1 (zh)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE10240899A1 (de) * 2002-09-04 2004-03-18 Siemens Ag Teilnehmerseitige Geräteanordnung für Datenübermittlungsdienste und zugehörige Komponenten
US20050053127A1 (en) * 2003-07-09 2005-03-10 Muh-Tian Shiue Equalizing device and method
US8140849B2 (en) * 2004-07-02 2012-03-20 Microsoft Corporation Security for network coding file distribution
US7756051B2 (en) * 2004-07-02 2010-07-13 Microsoft Corporation Content distribution using network coding
US20070033009A1 (en) * 2005-08-05 2007-02-08 Samsung Electronics Co., Ltd. Apparatus and method for modulating voice in portable terminal
WO2007057052A1 (en) * 2005-11-21 2007-05-24 Telefonaktiebolaget Lm Ericsson (Publ) Method and apparatus for improving call quality
JP4437486B2 (ja) * 2006-10-10 2010-03-24 ソニー・エリクソン・モバイルコミュニケーションズ株式会社 音声通信装置、音声通信システム、音声通信制御方法、及び音声通信制御プログラム
KR101394152B1 (ko) * 2007-04-10 2014-05-14 삼성전자주식회사 모바일 단말의 콘텐츠 다운로드 방법, 장치 및 시스템
JP4735610B2 (ja) * 2007-06-26 2011-07-27 ソニー株式会社 受信装置及び方法、プログラム、並びに記録媒体
CN102025454B (zh) * 2009-09-18 2013-04-17 富士通株式会社 预编码矩阵码本的生成方法及装置
CN110503965B (zh) * 2019-08-29 2021-09-14 珠海格力电器股份有限公司 一种调制解调器语音编解码器的选择方法和存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1009428B (zh) * 1988-05-10 1990-09-05 中国人民解放军空军总医院 微型电脑中频治疗仪
JP2000132196A (ja) * 1998-10-23 2000-05-12 Toshiba Corp ディジタル携帯電話及びデータ通信方法

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5432883A (en) * 1992-04-24 1995-07-11 Olympus Optical Co., Ltd. Voice coding apparatus with synthesized speech LPC code book
JP3183944B2 (ja) * 1992-04-24 2001-07-09 オリンパス光学工業株式会社 音声符号化装置
AU675322B2 (en) 1993-04-29 1997-01-30 Unisearch Limited Use of an auditory model to improve quality or lower the bit rate of speech synthesis systems
US5819213A (en) * 1996-01-31 1998-10-06 Kabushiki Kaisha Toshiba Speech encoding and decoding with pitch filter range unrestricted by codebook range and preselecting, then increasing, search candidates from linear overlap codebooks
US5883891A (en) 1996-04-30 1999-03-16 Williams; Wyatt Method and apparatus for increased quality of voice transmission over the internet
JP3874851B2 (ja) * 1996-09-30 2007-01-31 松下電器産業株式会社 音声符号化装置
JP3844031B2 (ja) * 1996-12-26 2006-11-08 ソニー株式会社 画像符号化装置および画像符号化方法、並びに、画像復号装置および画像復号方法
US6160845A (en) * 1996-12-26 2000-12-12 Sony Corporation Picture encoding device, picture encoding method, picture decoding device, picture decoding method, and recording medium
EP0891101B1 (en) 1996-12-26 2002-05-29 Sony Corporation Picture coding device, picture coding method, picture decoding device, picture decoding method, and recording medium
US6202046B1 (en) * 1997-01-23 2001-03-13 Kabushiki Kaisha Toshiba Background noise/speech classification method
JP3557426B2 (ja) 1997-11-19 2004-08-25 株式会社三技協 移動体通信ネットワークの通話品質監視装置
WO2000067091A2 (en) * 1999-04-29 2000-11-09 Spintronics Ltd. Speech recognition interface with natural language engine for audio information retrieval over cellular network
JP4218134B2 (ja) * 1999-06-17 2009-02-04 ソニー株式会社 復号装置及び方法、並びにプログラム提供媒体
US6704711B2 (en) * 2000-01-28 2004-03-09 Telefonaktiebolaget Lm Ericsson (Publ) System and method for modifying speech signals
JP4736266B2 (ja) * 2000-08-09 2011-07-27 ソニー株式会社 音声処理装置および音声処理方法、学習装置および学習方法、並びにプログラムおよび記録媒体
EP1944759B1 (en) 2000-08-09 2010-10-20 Sony Corporation Voice data processing device and processing method
US6650762B2 (en) * 2001-05-31 2003-11-18 Southern Methodist University Types-based, lossy data embedding

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1009428B (zh) * 1988-05-10 1990-09-05 中国人民解放军空军总医院 微型电脑中频治疗仪
JP2000132196A (ja) * 1998-10-23 2000-05-12 Toshiba Corp ディジタル携帯電話及びデータ通信方法

Also Published As

Publication number Publication date
EP1401130A1 (en) 2004-03-24
KR20030046419A (ko) 2003-06-12
EP1401130A4 (en) 2007-04-25
US7366660B2 (en) 2008-04-29
JP4711099B2 (ja) 2011-06-29
WO2003001709A1 (en) 2003-01-03
JP2003005795A (ja) 2003-01-08
KR100895745B1 (ko) 2009-04-30
CN1465149A (zh) 2003-12-31
US20040024589A1 (en) 2004-02-05

Similar Documents

Publication Publication Date Title
CN100583241C (zh) 音频编码设备、音频解码设备、音频编码方法和音频解码方法
US7688922B2 (en) Transmitting apparatus and transmitting method, receiving apparatus and receiving method, transceiver apparatus, communication apparatus and method, recording medium, and program
CN1465149B (zh) 发送设备及方法、接收设备及方法和发送/接收设备
JPH03101423A (ja) 多要素信号を符号化する方法および装置
JP2003504654A (ja) オーディオ信号の符号化効率を向上させる方法
JP2000512777A (ja) “前方”および“後方”lpc分析による音声周波数信号を符号化するための方法および装置
JP4857468B2 (ja) データ処理装置およびデータ処理方法、並びにプログラムおよび記録媒体
KR100819623B1 (ko) 음성 데이터의 처리 장치 및 처리 방법
KR100875783B1 (ko) 데이터 처리 장치
JP2800599B2 (ja) 基本周期符号化装置
US6463409B1 (en) Method of and apparatus for designing code book of linear predictive parameters, method of and apparatus for coding linear predictive parameters, and program storage device readable by the designing apparatus
JP4736266B2 (ja) 音声処理装置および音声処理方法、学習装置および学習方法、並びにプログラムおよび記録媒体
JP4517262B2 (ja) 音声処理装置および音声処理方法、学習装置および学習方法、並びに記録媒体
JP2002062899A (ja) データ処理装置およびデータ処理方法、学習装置および学習方法、並びに記録媒体
CN101099198A (zh) 用于编码模拟信号的方法
CN1239796A (zh) 具有高效、容错、激励向量编码的声码器

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20100526

Termination date: 20130620