CN1602516A - 信号处理系统、信号处理设备和方法、记录介质、以及程序 - Google Patents

信号处理系统、信号处理设备和方法、记录介质、以及程序 Download PDF

Info

Publication number
CN1602516A
CN1602516A CNA038017334A CN03801733A CN1602516A CN 1602516 A CN1602516 A CN 1602516A CN A038017334 A CNA038017334 A CN A038017334A CN 03801733 A CN03801733 A CN 03801733A CN 1602516 A CN1602516 A CN 1602516A
Authority
CN
China
Prior art keywords
signal
input
high fdrequency
fdrequency component
classification code
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA038017334A
Other languages
English (en)
Other versions
CN1302457C (zh
Inventor
近藤哲二郎
服部正明
渡边勉
木村裕人
山元左近
有光哲彦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Publication of CN1602516A publication Critical patent/CN1602516A/zh
Application granted granted Critical
Publication of CN1302457C publication Critical patent/CN1302457C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/14Coding unit complexity, e.g. amount of activity or edge presence estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/18Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a set of transform coefficients
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/48Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using compressed domain processing techniques other than decoding, e.g. modification of transform coefficients, variable length coding [VLC] data or run-length data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/59Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial sub-sampling or interpolation, e.g. alteration of picture size or resolution
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • H04N19/89Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving methods or arrangements for detection of transmission errors at the decoder
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/94Vector quantisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Quality & Reliability (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Picture Signal Circuits (AREA)
  • Facsimile Image Signal Circuits (AREA)
  • Telephonic Communication Services (AREA)

Abstract

一种信号处理系统、信号处理设备和方法、记录介质以及程序,其能够精确地重建那些抑制了高频分量的窄带信号的高频分量。具有低频分量的窄带音频信号通过帧输出部件(11)形成帧,接着通过DCT变换部件(12)频谱变换为频率轴信号。学习表(14)从与分类部件(13)提供的分类码对应的地址中抽取高频分量的频谱数据。通过频谱结合部件(16)将抽取的高频分量的频谱数据与从DCT变换部件(12)输出的低频分量的频谱数据结合,从而输出具有组合的高频分量和低频分量的宽带音频信号。本发明适用于蜂窝电话。

Description

信号处理系统、信号处理设备和方法、记录介质、以及程序
技术领域
本发明涉及信号处理系统、信号处理设备和方法、记录介质、以及程序,本发明尤其涉及这样的信号处理系统、信号处理设备和方法、记录介质、以及程序,其中抑制了高频分量的窄带信号的高频分量被高精度地复原。
背景技术
对于将窄频带的音频信号扩张至宽带的技术,迄今已做出了各种提案。
例如,日本特开平7-36490号公报(以下称作文献1)公开了一种基于输入音频信号频谱的损失谐波分量由算数运算来生成并被附加的方法。
而且,在埼玉大学致日本音响学会的论文(以下称作文献2)中,发表了一种由输入信号的自相关运算来生成有声音端波形、并将其作为高频分量而利用的方法。
此外,日本特开平11-126097号公报和日本特开平11-68515号公报(以下称作文献3)公开了一种以比输入信号更高的抽样频率来进行D/A变换情况的抽样值内插方法。
而且,日本特开平6-118995号公报(以下称作文献4)公开了一种通过在宽带音频信号的向量量化码簿和窄带音频信号的向量量化码簿间建立相关性而复原宽带音频信号的方法。
文献1的技术是这样的:在MP3(运动图片专家组-1,音频层-3)等相对的宽带音频信号中,在音频信号压缩过程中损失的高频信号被预测和附加,例如,当诸如电话音频频带那样极端窄带的信号的带宽扩张2倍时,其适用是很困难的。
而且,文献2的技术是仅对有声音的处理,其问题在于无法复原无声音(子音部)。
文献3的技术是这样的内插滤波器的扩展的技术:在增加抽样频率的抽样值内插处理的情况下,内插抽样值的水准被设定成在观察了数个邻近抽样的变化状况之后被认为是适宜的值,故该技术无法复原损失的频率分量。
文献4的技术,由于将LPC(线性预测系数)分析和合成处理用作处理的核心、而被认为是将声道模型假想成输入信号。因此,将其适用于音乐声音是很困难的。
发明内容
本发明是鉴于以上状况而做出的,目的在于使抑制了高频分量的窄带信号的高频分量能够被高精度地复原。
在本发明的信号处理系统中,第一信号处理设备包括:第一信号输入装置,用来输入具有宽带频率分量的第一信号;第二信号输入装置,用来输入第一信号中的第二信号,第二信号是抑制了高频分量的窄带信号;抽取装置,用来从由第一信号输入装置输入的第一信号中抽取高频分量;第一决定装置,用来基于由第二信号输入装置输入的第二信号来决定每个第一分类码;以及存储装置,用来对于由第一决定装置所决定的第一分类码存储由抽取装置抽取的高频分量;而第二信号处理设备包括:第三信号输入装置,用来输入具有抑制了高频分量的窄带第三信号;第二决定装置,用来基于由第三信号输入装置输入的第三信号来决定第二分类码;合成装置,用来合成存储装置中存储的高频分量和由第三信号输入装置输入的第三信号,该高频分量与第二决定装置所决定的第二分类码相对应;以及输出装置,用来输出由合成装置生成的合成信号。
在本发明的信号处理系统的信号处理方法中,第一信号处理设备包括:第一信号输入控制步骤,用来控制具有宽带频率分量的第一信号的输入;第二信号输入控制步骤,用来控制第一信号中的第二信号的输入,第二信号是抑制了高频分量的窄带信号;抽取步骤,用来从第一信号输入控制步骤中由处理控制其输入的第一信号中抽取高频分量;第一决定步骤,用来基于在第二信号输入控制步骤中由处理控制输入的第二信号来决定各第一分类码;和存储步骤,用来对于在第一决定步骤中由处理所决定的第一分类码存储由抽取步骤的处理抽取的高频分量;而第二信号处理设备包括:第三信号输入控制步骤,用来控制具有抑制了高频分量的窄带第三信号的输入;第二决定步骤,用来基于在第二信号输入控制步骤中由处理控制输入的第三信号来决定第二分类码;合成步骤,用来合成在存储步骤中由处理所存储的高频分量和在第三信号输入控制步骤中由处理控制输入的第三信号,该高频分量与在第二决定步骤中由处理所决定的第二分类码相对应;以及输出控制步骤,用来控制在合成步骤中由处理生成的合成信号的输出。
本发明的第一信号处理设备包括:第一信号输入装置,用来输入具有宽带频率分量的第一信号;第二信号输入装置,用来输入第一信号中的第二信号,第二信号是抑制了高频分量的窄带信号;抽取装置,用来从由第一信号输入装置输入的第一信号中抽取高频分量;决定装置,用来基于由第二信号输入装置输入的第二信号来决定各分类码;以及存储装置,用来对于决定装置所决定的分类码存储由抽取装置抽取的高频分量。
本发明的第一信号处理方法包括:第一信号输入控制步骤,用来控制具有宽带频率分量的第一信号的输入;第二信号输入控制步骤,用来控制第一信号中的第二信号的输入,第二信号是抑制了高频分量的窄带信号;抽取步骤,用来从第一信号输入控制步骤中由处理控制输入的第一信号中抽取高频分量;决定步骤,用来基于在第二信号输入控制步骤中由处理控制输入的第二信号来决定各分类码;以及存储步骤,用来对于决定步骤中由处理所决定的分类码存储在抽取步骤中由处理抽取的高频分量。
本发明的第一记录介质上程序包括:第一信号输入控制步骤,用来控制具有宽带频率分量的第一信号的输入;第二信号输入控制步骤,用来控制第一信号中的第二信号的输入,第二信号是抑制了高频分量的窄带信号;抽取步骤,用来从第一信号输入控制步骤中由处理控制输入的第一信号中抽取高频分量;决定步骤,用来基于在第二信号输入控制步骤中由处理控制输入的第二信号来决定各分类码;和存储步骤,用来对于在决定步骤中由处理所决定的分类码存储在抽取步骤中由处理抽取的高频分量。
本发明的第一程序允许使计算机执行:第一信号输入控制步骤,用来控制具有宽带频率分量的第一信号的输入;第二信号输入控制步骤,用来控制第一信号中的第二信号的输入,第二信号是抑制了高频分量的窄带信号;抽取步骤,用来从第一信号输入控制步骤中由处理控制输入的第一信号中抽取高频分量;决定步骤,用来基于在第二信号输入控制步骤中由处理控制输入的第二信号来决定各分类码;和存储步骤,用来对于在决定步骤中由处理所决定的分类码存储在抽取步骤中由处理抽取的高频分量。
音频信号可输入到本发明的第一信号处理设备中的输入装置。
当输入本发明的第一信号处理设备的信号是音频信号时,决定装置基于由根据等响度特性来加权处理的第二信号可决定分类码。
当输入本发明的第一信号处理设备的信号是音频信号时,决定装置基于音频信号频谱的平均功率电平和最大功率电平的位置可决定分类码。
当输入本发明的第一信号处理设备的信号是音频信号时,决定装置可对于等于或高于由抽取装置抽取的高频分量的最低频率的1/2倍或1/3倍的频率的频谱分量决定分类码。
图像信号可输入到本发明的第一信号处理设备的输入装置。
当输入本发明的第一信号处理设备的信号是图像信号时,决定装置基于图像信号的频谱的交流平均功率电平、直流功率电平和交流分量峰功率电平而可决定分类码。
在本发明的第一信号处理设备的存储装置中,由抽取装置抽取的高频分量可被存储以便相关于特定信息。
本发明的第一信号处理设备的特定信息可以是电话机的电话号码。
还可进一步提供生成装置,用来通过以预定的时间间隔来抽选(decimating)本发明的第一信号处理设备的第一信号而生成第二信号。
本发明的第二信号处理设备包括:信号输入装置,用来输入具有抑制了高频分量的窄带信号;决定装置,用来基于由信号输入装置输入的信号来决定分类码;存储装置,用来存储高频分量;合成装置,用来合成存储装置中存储的高频分量和由信号输入装置输入的信号,该高频分量与决定装置所决定的分类码相对应;和输出装置,用来输出由合成装置生成的合成信号。
本发明的第二信号处理方法包括:信号输入控制步骤,用来控制具有抑制了高频分量的窄带信号的输入;决定步骤,用来基于在信号输入控制步骤中由处理控制输入的信号来决定分类码;存储控制步骤,用来控制高频分量的存储;合成步骤,用来合成在存储步骤中由处理所控制存储的高频分量和在信号输入控制步骤中由处理输入的信号,该高频分量与在决定步骤中由处理所决定的分类码相对应;以及输出控制步骤,用来控制在合成步骤中由处理生成的合成信号的输出。
本发明的第二记录介质上程序包括:信号输入控制步骤,用来控制具有抑制了高频分量的窄带信号的输入;决定步骤,用来基于在信号输入控制步骤中由处理控制输入的信号来决定分类码;存储控制步骤,用来控制高频分量的存储;合成步骤,用来合成在存储步骤中由处理所控制其存储的高频分量和在信号输入控制步骤中由处理输入的信号,该高频分量与在决定步骤中由处理所决定的分类码相对应;以及输出控制步骤,用来控制在合成步骤中由处理生成的合成信号的输出。
本发明的第二程序允许使计算机执行:信号输入控制步骤,用来控制具有抑制了高频分量的窄带信号的输入;决定步骤,用来基于在信号输入控制步骤中由处理控制输入的信号来决定分类码;存储控制步骤,用来控制高频分量的存储;合成步骤,用来合成在存储步骤中由处理所控制存储的高频分量和在信号输入控制步骤中由处理输入的信号,该高频分量与在决定步骤中由处理所决定的分类码相对应;和输出控制步骤,用来控制在合成步骤中由处理生成的合成信号的输出。
音频信号可输入到本发明的第二信号处理设备的输入装置。
当输入本发明的第二信号处理设备的信号是音频信号时,决定装置基于由根据等响度特性加权处理的第二信号可决定分类码。
当输入本发明的第二信号处理设备的信号是音频信号时,决定装置基于音频信号频谱的平均功率电平和最大功率电平的位置可决定分类码。
当输入本发明的第二信号处理设备的信号是音频信号时,决定装置对于等于或大于由抽取装置抽取的高频分量的最低频率的1/2倍或1/3倍的频率的频谱分量决定分类码。
图像信号可输入到本发明的第二信号处理设备的输入装置。
当输入本发明的第二信号处理设备的信号是图像信号时,决定装置基于图像信号的频谱的交流平均功率电平、直流功率电平和交流分量峰功率电平可决定分类码。
在本发明的第二信号处理设备的存储装置中存储的高频分量可以按预定的定时来更新。
在本发明的第二信号处理设备的存储装置中,由抽取装置抽取的高频分量可被存储以便相关于特定信息。
本发明的第二信号处理设备的特定信息可以是电话机的电话号码。
在本发明的信号处理系统和信号处理方法中,第一信号处理设备从宽带频率分量的第一信号中抽取高频分量,基于抑制了高频分量的窄带第一信号中的第二信号来决定第一分类码,并对于各分类码存储高频分量。而在第二信号处理设备中,基于抑制了高频分量的窄带第三信号来决定第二分类码,并通过与对应于第二分类码的高频分量合成而生成第三信号。
在第一信号处理设备和方法、记录介质、以及程序中,从宽带频率分量的第一信号中抽取高频分量,并基于抑制了高频分量的窄带第一信号中的第二信号来决定各分类码。对于各分类码存储高频分量。
在第二信号处理设备和方法、记录介质、以及程序中,基于抑制了高频分量的窄带信号来决定分类码,将对应于分类码的高频分量和具有窄带的信号进行合成,随即生成并输出合成信号。
信号处理设备可以是独立的设备,也可以是一台设备上的进行信号处理的功能块。
附图说明
图1是根据本发明的第一实施例的音频信号宽带化设备的示例性的框图;
图2是表示图1中分类部件的示例性的框图;
图3是说明图1中音频信号宽带化设备的音频信号宽带化处理的流程图;
图4A是表示音频宽带化处理中数据示例的图;
图4B是表示音频宽带化处理中数据示例的图;
图4C是表示音频宽带化处理中数据示例的图;
图5A是说明分类处理的基本原理的图;
图5B是说明分类处理的基本原理的图;
图6是说明图3中步骤S3的分类处理的流程图;
图7是说明声音的等响度曲线的图;
图8是表示对声音做频率校正的A-特性曲线的图;
图9是说明图6中步骤S25的处理的图;
图10是表示音频信号学习设备的示例性的框图;
图11是说明图10的学习设备的学习处理的流程图;
图12A是表示学习处理中音频信号数据示例的图;
图12B是表示学习处理中音频信号数据示例的图;
图12C是表示学习处理中音频信号数据示例的图;
图12D是表示学习处理中音频信号数据示例的图;
图12E是表示学习处理中音频信号数据示例的图;
图12F是表示学习处理中音频信号数据示例的图;
图13是说明图11中步骤S53的分类处理的流程图;
图14根据本发明的第二实施例的图像信号宽带化设备的示例性的框图;
图15是表示图14的分类部件的示例性的框图;
图16A是表示图像信号宽带化处理中数据的示例的图;
图16B是表示图像信号宽带化处理中数据的示例的图;
图16C是表示图像信号宽带化处理中数据的示例的图;
图17是说明图14中图像信号宽带化设备的分类处理的流程图;
图18是说明图17中步骤S92的处理的图;
图19是表示图像信号学习设备的示例性的框图;
图20A是表示学习处理中图像信号数据的示例的图;
图20B是表示学习处理中图像信号数据的示例的图;
图20C是表示学习处理中图像信号数据的示例的图;
图20D是表示学习处理中图像信号数据的示例的图;
图20E是表示学习处理中图像信号数据的示例的图;
图20F是表示学习处理中图像信号数据的示例的图;
图21是说明图19中的学习设备的分类处理的流程图;
图22是根据本发明的第三实施例的传送系统的示例性的框图;
图23是表示图22中蜂窝电话的示例性的框图;
图24是表示图23中发送部件的示例性的框图;
图25是表示图23中接收部件的示例性的框图;
图26是在将学习产生数据表作为固定信息而提供的情形下的图24中编码部件的示例性的框图;
图27是在将学习产生数据表作为固定信息而给予的情形下的图25中解码部件的示例性的框图;
图28是在以预定的定时来更新学习产生数据表的情形下的图24中编码部件的示例性的框图;
图29是在以预定的定时来更新学习产生数据表的情形下的图25中解码部件的示例性的框图;
图30是说明图24中发送部件的发送处理的流程图;
图31是说明图30中步骤S202的内存数据发送处理的流程图;
图32是说明图30中步骤S205的编码处理的流程图;
图33是说明图25中接收部件的接收处理的流程图;
图34是说明图33中步骤S252的内存数据更新处理的流程图;
图35是说明图33中步骤S254的解码处理的流程图;
图36是表示适用本发明的计算机的实施例的示例性的框图。
具体实施方式
图1表示根据本发明的第一实施例的音频信号宽带化设备的示例。
具有低频分量(没有高频分量)的窄带音频信号被输入帧单位划分部件11。输入的音频信号被预定的帧(单位时间)划分成块,并输出至DCT(离散余弦变换)变换部件12。
DCT变换部件12对从帧单位划分部件11输入的时间域上的输入音频信号逐帧地频谱变换成频率域上的信号,并将变换后的信号输出至分类部件13和频谱结合部件16。作为做频谱变换的方法,这里使用的是M-DCT(修改的DCT),该M-DCT使相邻的块彼此重叠一半。
其他上述M-DCT变换的频谱变换包括DFT(离散傅里叶变换)、DCT(离散余弦变换)、FFT(快速傅里叶变换)或LPC等方法。只要是将时间域上的音频信号变换成频率域上的信号,就可以由他们包括。
分类部件13基于输入的频谱信号通过使用分类处理(有关详细将参照图6后述)来算出分类码,并将分类码输出至学习产生数据表14。
学习产生数据表14是将分类码作为地址的表内存,并在分类码地址中存储了通过使用图10来后述的学习设备得到的高频分量的音频信号频谱的向量数据项。学习产生数据表14读取与从分类部件13输入的分类码相对应的高频分量的音频信号频谱的向量数据,并将读取的数据输出至增益调整部件15。
增益调整部件15调整由学习产生数据表14输入的高频分量的音频信号频谱数据的增益,以匹配由频谱结合部件16结合的低频分量的音频信号频谱数据的增益。
频谱结合部件16将由增益调整部件15输入的高频分量的音频信号频谱的向量数据和由DCT变换部件12输入的低频分量的音频信号频谱的向量数据的最终行或后续行相结合,并将结合数据输出至逆DCT变换部件17。
逆DCT变换部件17通过进行M-DCT变换的逆变换而将频率域上的频谱数据变换成时间域上的频谱,并输出至帧结合部件18。
帧结合部件18在输出音频信号前为了不使声音在帧的边界出现不连续而进行重叠帧部分的加法处理。
图2表示图1中分类部件13的详细的示例。
由DCT变换部件12输出的M-DCT变换后的DCT频谱数据被输入功率电平变换部件31。输入的DCT频谱数据被变换成功率电平,并变换成dB(分贝)值,而后输出至加权部件32。
加权部件32对输入的DCT频谱数据实施加权处理、其中考虑了参照图7而后述的等响度特性,并将处理后的数据输出至频谱抽取部件33。
频谱抽取部件33从输入的低频分量的DCT频谱数据中抽取DCT频谱数据,该DCT频谱数据是等于或大于要复原的高频分量的最低频率的1/2或1/3倍的频率的DCT频谱数据,并将抽取的数据输出至子带形成划分部件34。
子带形成划分部件34将频谱抽取部件33所抽取的DCT频谱数据划分成预定数量的子带,并将子带输出至量化部件35。
量化部件35以子带单位来安排划分成子带的DCT频谱数据,得到输入部分中功率电平的平均值(由频谱抽取部件33抽取的),并对此平均值进行量化以生分量类码。而且还得到与最大功率电平对应的子带位置、并基于此而生成分类码。将两个分类码输出至分类码决定部件36。
分类码决定部件36通过对基于由量化部件35输入的功率电平的平均值的分类码和基于最大功率位置的分类码做多元处理(multiplexing),从而生成单个分类码,并将生成的分类码输出至学习产生数据表14(图1)。
其次,参照图3的流程图和图4A至图4C来说明音频信号宽带化设备1的音频宽带化处理。
在步骤S1处,帧单位划分部件11将输入音频信号宽带化设备1的抑制了高频分量的音频信号划分成帧。具体地讲,音频信号对于每一预定的帧(单位时间)而被划分成块。
在步骤S2处,DCT变换部件12对在步骤S1处划分成帧的音频信号做M-DCT变换。图4A表示由1帧中的音频信号的M-DCT变换而得的数据(以下称作DCT频谱数据)。
在步骤S3,分类部件13通过执行参照图6而后述的分类处理来算出分类码。
在步骤S4,学习产生数据表14读取高频分量的DCT向量数据,该高频分量存储于与在步骤S3处从分类部件13输出的分类码相对应的地址处。图4B表示如上述读取的高频分量频谱数据。
在步骤S5,频谱结合部件16将输入音频信号宽带化设备1的音频宽带化处理的低频分量的DCT频谱数据(由图4A中的频谱A1表示的部分)和从学习产生数据表14读取的高频分量频谱数据(由图4B中的频谱B1表示的部分)相结合。换句话讲,如图4C所示,将频谱B1的前端(低频侧)连接至频谱A1的后端(高频侧)。由DCT变换部件12输出的数据的项数是N,而由学习产生数据表14读取的数据项数也是N。所以,结合后的数据项数就是2N。
在步骤S6,逆DCT变换部件17对频谱结合的DCT频谱数据做逆M-DCT变换。
在步骤S7处,帧结合部件18在帧的边界实施重叠的加法处理,并输出所得结果,之后结束音频宽带化处理。此重叠处理阻止音频声音在帧的边界不连续。
以下说明图3的分类处理。
最初,参照图5A和图5B来说明分类处理的基本原理。图5A表示具有带宽为2B0的低频分量和高频分量的教师(supervising)DCT频谱,而图5B表示带宽为B0的仅具有窄带低频分量的学生DCT频谱。
基于窄带信号中所包括的高频分量的量和频谱形状将复原的频率分量间有链接关系的前提,而进行分类处理。换句话讲,在假定模型由音调(pitch)频率及其谐波分量构成的情形下,期望在图5A中约一半带宽2B0的高频带区Q中含有这样的信号:其对应于图5B中约一半带宽B0的高频区P的2倍或3倍的谐波分量。反之,当P区几乎不存在频谱时,期望Q区也存在信号的可能性很低。
其次,参照图6来说明分类处理。
在步骤S21,功率电平形成变换部件31将由DCT变换部件12输入的频谱数据变换成功率电平,进而将该功率电平变换成dB(分贝)值。换句话讲,输入的频谱数据x[k](k=0,1,...,N-1)由下式变换成平均功率电平PWR:
PWR = | x [ k ] | 2 = 1 N Σ i = 0 N - 1 x [ i ] 2
此外,由下式将平均功率电平PWR变换成dB(分贝)值PWRdB
PWRdB=10log10(PWR)
在步骤S22,在加权部件32中对于在步骤S23处计算的功率的分贝值PWRdB,考虑人耳的特性而进行加权处理。
人类主观地感到的音量大小和声压值的关系可由图7所示的等响度曲线表示。这表示具有正常听觉的人所感到相等大小的纯音的声压值和频率的关系。如曲线所示,我们人类的耳朵在低频和高频处的敏感度低。
这种基于人耳的特性而进行频率校正的处理是在步骤S22进行的加权处理。具体地说,对输入信号执行称作A-特性曲线的校正,该A-特性曲线由图8中符号A表示。
在步骤S22进行加权处理后,在步骤S23,频谱抽取部件33从输入的低频分量的频谱数据中抽取等于或大于要复原的高频分量的最低频率的1/2或1/3的频率的频谱数据,并将抽取的数据输出至子带形成划分部件34。这是基于上述分类处理的基本原理而进行的。
换句话讲,作为要复原的高频分量,图5A中Q区的最低频率是fQ。从作为低频分量的图5B的频谱数据中,例如,抽取频率fQ一半的fQ/2以上的P区的频谱。
在步骤S24,子带形成划分部件34将步骤S23处抽取的频谱数据(从图5B中频率fQ/2到频率fQ的频谱数据)划分成预定的数,例如32个子带,并以子带单位来安排频谱数据。
在步骤S25,如图9所示,得到在32个全体子带的平均功率电平PAV和32个子带中分贝功率电平PWRdB最大的子带位置Bn。例如,频谱分贝功率电平的带是例如0至127[dB]。
在步骤S26,分类码决定部件36对基于在步骤S25处输出的平均功率电平PAV的分类码和基于最大功率位置Bn的分类码做多元处理。在图9的例中,基于最大功率位置Bn的分类码可具有从0至31的32个值,而基于平均功率电平PAV的分类码可具有从0至127的128个值。因此,合成的分类码的数量就是32×128=4096。将4096个值中的任意一个作为分类码输出。
除上述以外,模型化频谱形状的方法还可包括检测多个频谱峰的方法、检测频谱倾斜或功率分布的方法和改变子带数量的方法。
其次,参照图10来说明学习设备,其生成对于分类码存储的、要写入音频信号宽带化设备1中学习产生数据表14的高频分量的向量数据项。例如,该学习设备50由产生音频信号宽带化设备1的制造者持有。
最初,准备用作教师信号的其中含有高频分量的宽带音频信号,以及作为学生信号的其中抑制了教师数据的高频分量的窄带音频信号。在图10的示例中,产生学生数据,以便在抽选电路65中通过除去教师数据高频分量而生成的低频分量被抽样抽选减半。
从而,设输入帧单位划分部件66的学生数据的帧长度为N,设输入帧单位划分部件61的教师数据的帧长度为2N。而且此时各帧的数据是同步的。
帧单位划分部件61和帧单位划分部件66、以及DCT变换部件62和DCT变换部件67的功能与图1中帧单位划分部件11和DCT变换部件12的功能是同样的。
高频分量抽取部件63抽取教师数据的频谱的高频侧的那一半,并将抽取的那一半输出至加法部件64。
分类部件68生成与图1中分类部件13处上述的同样的分类码,再计算类的出现频度并输出至积算表69。
积算表69接收由分类部件68输出的分类码作为输入地址,并读取存储在该地址中的DCT向量数据项并将其输出至加法部件64。加法部件64对从高频分量抽取部件63输出的N个高频分量的DCT向量数据项和从积算表69输出的N个DCT向量数据项进行向量加法,并将结果输出至与积算表69输出数据时所使用的分类码地址的位置相同的位置。因为N个DCT向量数据项存储在1个分类码地址处,所以积算表69成为包括(N×分类数)个数据项的表格。而且,以预定的定时,积算表69将存储在其分类码地址处的向量数据项除以由编码参数编码器分类部件68输出的类的出现频度,再将结果输出至学习产生数据表70。
学习产生数据表70存储了从积算表69输出的(N×分类数)个DCT向量数据项。学习产生数据表70的数据项经网络而传送至音频信号宽带化设备1并存储在学习产生数据表14。或者,学习产生数据表70的数据项被写入半导体内存等,并作为音频信号宽带化设备1的学习产生数据表14而设置。
由于学习设备50的分类部件68的构成与音频信号宽带化设备1的分类部件13同样,故图2中分类部件13的结构在必要时参照图10中分类部件68的结构。
其次,参照图11的流程图来说明学习设备50的学习处理。
在步骤S51,教师数据的频谱和学生数据的频谱形成了帧。换句话讲,帧单位划分部件61将输入的教师数据以每一单位时间划分成帧,并每帧抽取2N个样值。抽选电路65通过从教师数据仅抽取低频分量并交替地抽选该低频分量,从而生成学生数据。帧单位划分部件66将学生数据以每单位时间划分成帧,并每帧抽取N个样值。
在步骤S52,DCT变换部件62和DCT变换部件67对教师数据和学生数据分别执行M-DCT变换。图12A表示教师数据被M-DCT变换后而得的DCT频谱数据,而图12B表示学生数据被M-DCT变换后而得的DCT频谱数据。从两者间的比较可以明白图12B的学生数据的DCT频谱对应于图12A的教师数据的M-DCT频谱的低频分量。
在步骤S53,分类部件68通过基于学生数据频谱来执行参照图13后述的分类处理而计算分类码和类的出现频度,并将结果输出至积算表69。
在步骤S54,积算表69读取向量数据项,该数据项存储于由分类部件68输出的分类码对应的地址处。
在步骤S55,高频分量抽取部件63从由DCT变换部件62输入的教师数据中抽取高频分量。图12C表示抽取的高频分量的DCT频谱。这对应于图12A中教师数据的全体DCT频谱中的较高部分R。
在步骤S56,加法部件64对在步骤S54中从积算表69读取的向量数据(图12D所示的数据)和在步骤S55从教师数据抽取的高频分量的向量数据(图12C所示的数据)进行向量加法。图12E表示在步骤S56进行向量加法后而得的DCT频谱数据。
在步骤S57处,加法部件64将在步骤S56处算出的向量数据(图12E所示的数据)存储在与积算表69读取时所使用的分类码地址的位置相同的位置。
在步骤S58,判定学习处理是否结束。当判断学习处理尚未结束时,处理返回步骤S51并重复后续的处理。当判断学习处理已结束时,处理进至步骤S59。
当在步骤S58判断学习处理已结束时,在步骤S59,积算表69通过将存储在其分类码地址的N个向量数据项除以对应的分类码的类的出现频度从而算出向量数据项的平均值,并输出和存储至学习产生数据表70,再结束学习处理。图12F表示存储在一个分类码的地址处的N个向量数据项。
其次,参照图13的流程图来说明图11的步骤S53的分类处理。
尽管由于步骤S71至步骤S76的处理与图6的音频信号宽带化设备的分类处理的步骤S21至步骤S26同样而省略其说明,但处理对基于学生数据的平均功率电平PAV的分类码和基于最大功率Bn的分类码做多元处理。
在步骤S77,分类码决定部件36(与图2的音频信号宽带化设备1同样)增加步骤S76中决定的分类码的计数,并将指示哪个分类码出现了几次的计数值输出至积算表69,再结束分类处理。
如上述,音频信号宽带化设备1的分类处理和学习设备50的分类处理直到算出分类码为止都是彼此相同的。而后,两者的差异仅在于是否计算类的出现频度。
图14表示根据本发明的第二实施例的图像信号宽带化设备的示例。在上述的音频信号宽带化设备1中,输入信号是一维的音频信号并以帧单位被处理,而在图像信号宽带化设备80中,由于输入信号是2维的图像信号,故以块(例如8×8像素)单位而被处理。图14中的块形成划分部件91、DCT变换部件92、分类部件93、学习产生数据表94、结合部件95和逆DCT变换部件96与图1中的帧单位划分部件11、DCT变换部件12、分类部件13、学习产生数据表14、频谱结合部件16和逆DCT变换部件17具有基本同样的功能。因而省略了其说明。图1所示的增益调整部件15和频谱结合部件18由于在图像信号的情形下不一定必要,故被省略。
图15表示图14的分类部件93的详细的示例。
由DCT变换部件92的M-DCT变换而得的DCT数据被输入功率电平形成变换部件101。输入的DCT数据与上述的音频信号宽带化设备1同样被变换成功率电平,进而变换成功率的分贝值。该值被输出至量化部件102。
量化部件102对于DCT块内的DCT数据算出交流分量的平均功率电平,以及与交流分量的峰值对应的DCT数据的位置,并生成基于这两者的分类码输出至分类码决定部件103。
分类码决定部件103基于输入DCT块的量化数据通过分类码做多元处理,从而生成分类码,并将该分类码输出和存储至学习产生数据表94(图14)。
其次,说明图像信号宽带化设备80的图像宽带化处理。由于其流程图与图3的音频信号宽带化设备1同样,故参照图3的流程图来说明。
在步骤S1,由图像信号宽带化设备80将输入图像信号宽带化设备80的抑制了高频分量的图像信号划分成块单位(例如2×2像素)。
在步骤S2,DCT变换部件92对划分成块的图像信号执行M-DCT变换。图16A表示一块的图像信号被M-DCT变换而得的数据(以下称作DCT数据)。
在步骤S3,分类部件93通过执行参照图17后述的分类处理而算出分类码。
在步骤S4,学习产生数据表94读取DCT系数的向量数据项,该向量数据项存储于与在步骤S3由分类部件93输出的分类码相对应的地址处。图16B表示此时读取的具有高频分量的DCT系数的向量数据。
在步骤S5,结合部件95对输入图像信号宽带化设备80的低频分量的DCT数据(图16A)和从学习产生数据表94读取的高频分量的DCT数据(图16B)进行向量加法。图16C表示结合的DCT块数据。
在步骤S6,逆DCT变换部件96对结合的DCT数据做逆M-DCT变换。
由于步骤S7的重叠处理在上述图像信号的情形下不一定必要执行,故不执行步骤S7的处理而终止图像信号的宽带化处理。
其次,参照图17的流程图来说明分类部件93执行的分类处理。
在步骤S91,在功率电平变换部件101中,从DCT变换部件92输入的DCT数据被变换成功率电平,进而变换成功率的分贝值。该处理与上述音频信号的情形同样。
在步骤S92,量化部件102算出DCT块数据的交流平均功率电平和直流功率电平,并检测交流分量峰功率位置。例如,输入了图18所示的具有4×4像素的DCT块BL。各像素的DCT数据项是c[n],其功率的带是0至127[dB]。交流平均功率电平是图18的AC区内的DCT数据项c[1]至c[15]的平均值,直流功率电平是图18的DC区内的DCT数据项c[0]的值。而且,交流分量峰功率位置是DCT数据项c[1]至c[15]内、具有当功率电平最大时的n(1至15的任意之一)。
在步骤S93,分类部件93通过对基于步骤S92中的3个值而得到的分类码做多元处理,从而生成分类码,并将分类码输出至学习产生数据表94,再结束分类处理。在上述的情形下,有128个基于交流平均功率电平的分类码,128个基于直流功率电平的分类码,和15个基于交流分量峰功率位置的分类码。因而,可使用共计128×128×15=245760个分类码中的任意一个。
图19表示学习设备120的示例,其生成要写入图像信号宽带化设备80中学习产生数据表94的高频分量的向量数据项。由于图19中的块形成划分部件131、DCT变换部件132、高频分量抽取部件133、加法部件134、抽选电路135、块形成划分部件136、DCT变换部件137、分类部件138和积算表139与图10中的帧单位划分部件61、DCT变换部件62、高频分量抽取部件63、加法部件64、抽选电路65、帧单位划分部件66、DCT变换部件67、分类部件68和积算表69具有基本同样的结构和功能,因而省略了其说明。
其次,说明学习设备1 20的学习处理。由于其流程图与图11的音频信号宽带化设备1类似,故参照图11的流程图来说明。
在步骤S51,教师数据的DCT数据和学生数据的DCT数据被划分成了块。换句话讲,块形成划分部件131对于每一组2N×2N像素将输入的教师数据划分成块。抽选电路135通过从教师数据仅抽取低频分量并分别在水平方向和垂直方向间隔地抽选该低频分量,从而生成学生数据。块形成划分部件136将学生数据对于每组N×N像素划分成块。
在步骤S52,DCT变换部件132和DCT变换部件137对教师数据和学生数据分别做M-DCT变换。图20A表示教师数据被M-DCT变换后而得的DCT数据(4×4个数据项),而图20B表示学生数据被M-DCT变换后而得的DCT数据(2×2个数据项)。
在步骤S53,分类部件138对作为学生数据的DCT数据执行参照图21后述的分类处理,并算出分类码和类的出现频度,并将结果输出至积算表139。
在步骤S54,积算表139读取向量数据项、其存储于与分类部件138输出的分类码对应的地址处。
在步骤S55,高频分量抽取部件133抽取教师数据的高频分量。图20C表示抽取的高频分量,其相当于图20A的全部教师数据的部分P(4×4像素内除去左上2×2个像素)。
在步骤S56,加法部件134对在步骤S54从积算表139读取的向量数据(图20D所示的数据)和在步骤S55处从教师数据抽取的高频分量的向量数据(图20C所示的数据)进行向量加法。图20E表示在步骤S56进行向量加法后而得的DCT数据。
在步骤S57,加法部件134将在步骤S56算出的向量数据(图20E所示的数据)存储在与积算表139读取时所使用的分类码地址的位置相同的位置。
在步骤S58,判定学习处理是否结束。当判断学习处理尚未结束时,处理返回步骤S51并重复后续的处理。当判断学习处理已结束时,处理进至步骤S59。
当在步骤S58判断学习处理已结束时,在步骤S59,积算表139通过将存储在其分类码地址的(3N×N)个向量数据项除以由分类部件138输出的与分类码对应的类的出现频度、从而算出向量数据项的平均值,并将平均值输出至学习产生数据表140,再结束学习处理。图20F以DCT块的形式表示存储在学习产生数据表140的一个分类码的地址处的(3N×N)个向量数据项。
其次,参照图21的流程图来说明图19中分类部件138进行的分类处理。
由于步骤S101至步骤S103的处理与图17的图像信号宽带化设备的分类处理的步骤S91至步骤S93同样,故省略其说明。换句话讲,计算分类码的处理与图像信号宽带化设备同样地进行。由此处理,基于交流平均功率电平、直流功率电平和交流分量峰功率电平的分类码被多元处理为一个分类码。
在步骤S104,分类码决定部件103将步骤S103处决定的分类码的计数加1,并将指示哪个分类码出现了几次的计数值输出至积算表139,再结束分类处理。
图22表示根据本发明的第三实施例的传送系统(系统指的是多台设备的逻辑的集合,而不问各结构的设备是否在同一机箱中)的结构。
在此传送系统中,蜂窝电话3011和3012与基站3021和3022间进行无线发送和接收,而各基地站3021和3022与交换局303进行发送和接收,结果,蜂窝电话3011和3012间可使用基地站3021和3022和交换局303来进行音频的发送和接收。基地站3021和3022可以是同一基地站,也可以是不同的基地站。
以下除非有必要特别地区别,不然就将蜂窝电话3011和3012记作蜂窝电话301。
图23表示图22中蜂窝电话3011的示例。由于蜂窝电话3012也与以下说明的蜂窝电话3011的结构同样,故省略了其说明。
天线311从基站3021和3022接收无线电波,并将收到的信号提供给调制部件312,同时将来自调制部件312的信号由电波发送至基地站3021或3022。调制部件312使用例如CDMA(码分多址)等方式对来自天线311的信号进行解调,并将得到的解调信号提供给接收部件314。而且,调制部件312使用例如CDMA等方式对从发送部件313供给的发送数据进行调制,并将结果得到的调制信号提供给天线311。发送部件313通过执行输入用户声音的编码等预定的处理而得到发送数据,并将数据提供给调制部件312。接收部件314接收收到的信号即来自调制部件312的解调信号,并解码和输出高音质的音频信号。
当用户输入被叫方的电话号码的预定命令等时,操作部件315被用户操作,并将对应于该操作的操作信号提供给发送部件313和接收部件314。
必要时,信息可在发送部件313和接收部件314间交换。
图24表示图23中发送部件313的示例。
用户的声音输入麦克风321,而麦克风321以电信号的音频信号的形式将用户的声音输出至A/D(模拟/数字)变换部件322。A/D变换部件322对来自麦克风321的模拟的音频信号做A/D变换而成为数字的音频信号,并将数据输出至编码部件323。
编码部件323使用预定的编码方式对来自A/D变换部件322的声音数据进行编码,对分类码进行多元处理,并将得到的编码声音数据输出至发送控制部件324。
管理部件327通过操作部件315的操作而输入的被拨叫方的电话号码、作为拨叫方的蜂窝电话的电话号码和其它必要的信息,并将这些输出至编码部件323和发送控制部件324。
发送控制部件324执行编码部件323输出的编码音频数据和管理部件327输出的数据的发送控制。换句话讲,发送控制部件324选择编码部件323输出的编码音频数据或者管理部件327输出的数据,并将所选数据作为发送数据而输出至调制解调部件312(图23)。
图25表示图23中接收部件314的示例。
收到的数据即图23中调制解调部件312输出的解调信号被提供给接收控制部件331,以及接收控制部件331接收收到的数据。当收到的数据是编码音频数据时,接收控制部件331将编码音频数据提供给解码部件332。或者,当收到的数据是拨叫方的电话号码和其它信息时,接收控制部件331在必要时将此信息提供给管理部件335或发送部件313(的管理部件327)。
解码部件332将由接收控制部件331供给的编码声音数据与分类码分离,或附加高频分量,并将结果得到的解码音频数据提供给D/A(数字/模拟)变换部件333。
D/A变换部件333对解码部件332输出的数字形式的解码音频数据做D/A变换,并将得到的模拟音频信号提供给扬声器334。扬声器334输出与来自D/A变换部件333的音频信号对应的声音。
当收到呼叫时,管理部件335接收发送端的电话号码,并将收到的电话号码提供给解码部件332。
图26和图27分别表示在将学习产生数据表作为固定信息而提供的情形下、编码部件323和解码部件332的示例。
首先,说明图26的编码部件323的结构。
由于帧单位划分部件351和DCT变换部件352的功能与图1中音频信号宽带化设备1的帧单位划分部件11和DCT变换部件12是同样的,故省略了其说明。
高频分量除去部件353将通过除去输入的DCT频谱数据的高频分量而生成低频分量输出至分类部件354和分类码多元处理部件355。压缩率依赖于高频分量的除去率。例如,当频带被压缩掉一半时,数据量也减至1/2。通过将由后述的分类码多元处理部件355进行多元处理的多个字的数据量加到减少的数据量就是最终的数据量。
分类部件354对从高频分量除去部件353输入的低频分量的DCT频谱数据实施与音频信号宽带化设备1的分类部件13的情形下同样的分类处理,并将分类码输出至分类码多元处理部件355。
分类码多元处理部件355对从分类部件354输出的分类码和从高频分量除去部件353输出的低频分量的DCT频谱数据进行多元处理,并将多元处理数据输出至逆DCT变换部件356。通过将分类码与低频分量的DCT频谱数据做多元处理,可以提高分类码的码传送路径上的错误耐性,并通过对在解码部件332(图27)中再度执行分类处理而求得的分类码和多元处理的分类码的一致度进行校验,从而可进行多元处理的分类码的错误检测和校正。
逆DCT变换部件356对输入的分类码和低频分量的DCT频谱数据被多元处理的数据做逆M-DCT变换,并将结果输出至帧结合部件357。
帧结合部件357执行与音频信号宽带化设备1的帧结合部件18的情形下同样的重叠,并将得到的作为编码的视频数据的数据输出至发送控制部件324(图24)。
其次,说明图27的解码部件332的结构。
由于帧单位划分部件371和DCT变换部件372与图1中音频信号宽带化设备1的帧单位划分部件11和DCT变换部件12具有同样的功能,故省略了其说明。
分类码形成分离部件373将多元处理的DCT频谱数据分离成分量类码和低频分量的DCT频谱数据,并将低频分量的DCT频谱数据输出至频谱结合部件376,以及将分类码输出至学习产生数据表374。
学习产生数据表374读取高频分量的DCT频谱数据,该频谱数据存储于与分类码形成分离部件373输出的分类码对应的地址处,并将其输出至增益调整部件375。
增益调整部件375与音频信号宽带化设备1的增益调整部件15同样地对从学习产生数据表374输出的高频分量的DCT频谱数据进行增益调整,以匹配要由频谱结合部件376结合的低频分量频谱的增益,并将结果输出至频谱结合部件376。
频谱结合部件376将由分类码形成分离部件373输出的低频分量的DCT频谱数据和由增益调整部件375输出的高频分量的DCT频谱数据相结合,并将结合数据输出至逆DCT变换部件377。
逆DCT变换部件377对输入的频谱数据做逆M-DCT变换,并将变换后的数据输出至帧结合部件378。
帧结合部件378进行帧重叠,并将结果作为宽带音频信号而输出至D/A变换部件333。
此外,图28和图29分别表示在以下情形下的编码部件323和解码部件332的示例,即:存储高频分量频谱数据的学习产生数据表被存储,从而与每一发送端相关的电话号码和表信息被每次使用而更新。图中,与图26和图27的情形对应的部分被标以同一附图标记,并省略了其说明。
首先,说明图28的编码部件323的结构。
频谱划分部件381将输入的DCT频谱数据划分成高频分量和低频分量,并将高频分量输出至表内存382,而将低频分量输出至分类部件354和分类码多元处理部件355。
分类部件354计算分类码,将该分类码输出至表内存382和分类码多元处理部件355。
表内存382将由频谱划分部件381输入的高频分量的DCT频谱数据存储在与分类部件354输出的分类码对应的地址处。此表内存的内容以预定的定时而传送至后述的解码部件332的表格内存391处。
在具有以上结构的编码部件323中,每当拨叫时,每一通话方的高频分量的DCT频谱数据存储于表内存382中。因为表内存382的内容是一种统计信息,期望随着输入愈多的信息,信息将以分类码为单位而收敛于适宜的偏离。根据此效果,若该内容的使用次数增加,则进行更高精度的解码。图28中的其它部件与图26的情况相同。
其次,说明图29的解码部件332的结构。
表内存391读取高频分量的DCT频谱数据,该频谱数据存储指定为与分类码形成分离部件373输出的分类码对应的地址处,并将其输出至增益调整部件375。
说明在如图28和图29的结构所示的学习产生数据表以与发送端的电话号码相关的形式而存储并以预定的定时来更新的情形下的蜂窝电话301的动作。
首先,参照图30的流程图来说明蜂窝电话3011的发送部件313所进行的发送处理。
在步骤S201,当用户对操作部件315进行操作以输入作为接听断的蜂窝电话3012的电话号码时,管理部件327检测通话的开始。
在步骤S202处,发送部件313执行参照图31后述的内存数据发送处理。换句话讲,发送部件313将存储于表内存382(图28)的高频分量频谱的DCT向量数据发送至接听端的蜂窝电话3012的表内存391(图29),并切换成声音通话。
在步骤S203,麦克风321接收输入的用户声音。
在步骤S204,A/D变换部件322对从麦克风321输入的音频信号做A/D变换,并将变换后的信号作为数字的音频信号而输出至编码部件323。
在步骤S205,编码部件323进行编码处理。其详细情况参照图32而后述。此处理将从A/D变换部件322输入的音频信号划分成高频分量和低频分量,高频分量存储于表格内存382,而低频分量与分类码做多元处理并作为编码音频数据而输出至发送控制部件324。
在步骤S206,发送控制部件324将从编码部件323输入的编码音频数据发送至调制部件312(图23)。
在步骤S207,管理部件327判定通话是否结束。当判定通话尚未结束时,管理部件327将处理返回步骤S203并重复后续的处理。当判定通话已结束时,管理部件327终止发送处理。
其次,参照图31的流程图来说明图30的步骤S202的内存数据发送处理。
在步骤S221,发送控制部件324将通过操作部件315的操作而输入的蜂窝电话3012的电话号码作为发送数据而输出,从而进行对蜂窝电话3012的呼叫。
蜂窝电话3012的用户响应来自蜂窝电话3011的呼叫而对操作部件315进行操作以使蜂窝电话3012设在接听状态,此后,处理进至步骤S222。发送控制部件324与接听端的蜂窝电话3012间确立通信链路,而处理进至步骤S223。
在步骤S223,管理部件327读取存储在编码部件323的表内存382中的数据,并将所读数据提供给发送控制部件324。在步骤S223,发送控制部件324选择来自管理部件327的内存数据,并将数据作为发送数据而发送。内存数据与表达该内存数据的得到日期和时间的更新信息一起发送。
而后,处理从步骤S223进至步骤S224,而管理部件327判定准备完成通知是否已从接听端的蜂窝电话3012发送了。
具体地讲,在接听端的蜂窝电话3012处于通常的声音通话可能的状态后,可以发送表达声音通话的准备已完成的准备完成通知(后述图34的步骤S277)。在步骤S224,判定该准备完成通知是否已从蜂窝电话3012发送了。
当在步骤S224判定准备完成通知尚未发送时,处理返回步骤S224并等待要发送的准备完成通知。
当在步骤S224判定准备完成通知已发送时,处理进至步骤S225,而发送控制部件324通过选择编码部件323的输出以使声音通话成为可能,从而终止内存数据的发送处理。
其次,参照图32的流程图来说明图30的步骤S205的编码处理。
在步骤S231,帧单位划分部件351将A/D变换部件322输入的音频信号划分成帧。此输入的音频信号具有高频分量和低频分量。
在步骤S232,DCT变换部件352对在步骤S231中划分成帧的音频信号做M-DCT变换,并将变换后的信号作为DCT频谱数据而输出至频谱划分部件381。
在步骤S233,频谱划分部件381将DCT频谱数据划分成高频分量和低频分量,并将高频分量输出至表格内存382而将低频分量输出至分类部件354。
在步骤S234处,分类部件354通过蜂窝电话决定分类码,并将该分类码输出至分类码多元处理部件355和表内存382。由于该分类处理与使用图6所述的音频信号宽带化设备1的分类处理是同样的,故省略了其说明。
在步骤S235,表内存382将从频谱划分部件381输入的高频分量的DCT频谱数据存储在与分类部件354输出的分类码对应的地址处。
在步骤S236,分类码多元处理部件355对从分类部件354输入的分类码和从频谱划分部件381输入的低频分量的DCT频谱数据做多元处理,并将多元处理的结果输出至逆DCT变换部件356。
在步骤S237,逆DCT变换部件356对多元处理的低频分量的DCT频谱数据做逆DCT变换。
最后,在步骤S238,帧结合部件357执行重叠以生成编码音频数据。
其次,参照图33来说明响应发送端的蜂窝电话3011执行的图30的发送处理,接听端的蜂窝电话3012的接收部件314执行的接收处理。
在步骤S251,管理部件335使用接收控制部件331来检测无线电波的接收。
在步骤S252,接收部件314执行参照图34后述的内存数据更新处理。换句话讲,接收部件314更新存储于表内存391(图29)的高频分量频谱的DCT向量数据,并切换成声音通话(编码音频数据)。
在步骤S253,在输入接收控制部件331的接收数据被切换成编码音频数据后,接收控制部件331将该编码音频数据输出至解码部件332。
在步骤S254,解码部件332进行解码处理。其详细情况参照图35后述。通过进行这一处理,解码部件332将分类码多元处理的编码音频数据分离分量类码和低频分量。它读取存储于与分类码对应的地址处的高频分量,将所读分量与低频分量结合,并将结合后的分量作为宽带音频信号而输出。
在步骤S255,D/A变换部件333对由解码部件332输入的宽带音频信号做D/A变换,并将变换后的信号输出至扬声器334。在步骤S256,扬声器334输出由D/A变换部件333输入的模拟音频信号。
在步骤S257,管理部件335判定通话是否结束。当判定通话尚未结束时,管理部件335将处理返回步骤S253并重复后续的处理。当判定通话已结束时,管理部件335终止发送处理。
其次,参照图34来说明图33的步骤S252的内存数据更新处理。
在步骤S271,接收控制部件331判定是否通过操作部件315的操作而设成接听状态。当判定未设成接听状态时,处理返回步骤S271。
而且,当在步骤S271处判定已设成接听状态时,处理进至步骤S272,接收控制部件331确立通信链路而处理进至步骤S273。在步骤S273,接收控制部件331接收收到的数据,该数据其包含从发送端的蜂窝电话3011发来的最新内存数据,并将收到的数据提供给管理部件335。
换句话讲,在如上述的图31的内存数据发送处理中,在步骤S223,蜂窝电话3011将最新内存数据与更新信息一道发送。因此,在步骤S273,接收到该内存数据和更新信息。
其后,处理进至步骤S274,管理部件335参照从发送端的蜂窝电话3011接收的更新信息,并判定在解码部件332中是否存储了关于蜂窝电话3011的用户的最新内存数据。
当在步骤S274判定在解码部件332中已存储了关于蜂窝电话3011的用户的最新内存数据时,处理进至步骤S275,管理部件335放弃了在步骤S273处接收的内存数据和更新信息,而后处理进至步骤S277。
而且,当在步骤S274判定在解码部件332中未存储关于蜂窝电话3011的用户的最新内存数据时,处理进至步骤S276。管理部件335通过在步骤S273处得到的最新内存数据以这一形式存储在解码部件332中:即相关于在接听模式下接收的发送端的蜂窝电话3011的电话号码和与内存数据一道发来的更新信息,从而来更新解码部件332的表格内存391的内容。
处理进至步骤S277,管理部件335控制发送部件313的发送控制部件324,以将表达完整声音通话的准备完成的通知作为发送数据而发送,并进至步骤S278。
在步骤S278,接收控制部件331变成声音通话使能状态,其中,提供给它的接收数据所含的编码音频数据被输出至解码部件332,以及再结束内存数据更新处理。
其次,参照图35来说明图33的步骤S254的解码处理。
在步骤S291,帧单位划分部件371将从接收控制部件331输入的编码音频数据划分成帧。
在步骤S292,DCT变换部件372对在步骤S291划分成帧的编码音频数据进行M-DCT变换,并将变换后的信号作为DCT频谱数据而输出分类码形成分离部件373。
在步骤S293,分类码形成分离部件373将DCT频谱数据分离分量类码和低频分量的DCT频谱数据,并将分类码输出至表内存391,并将低频分量输出至频谱结合部件376。
在步骤S294,表内存391向增益调整部件375输出高频分量的DCT频谱数据,其存储于与分类码形成分离部件373输出的分类码相对应的地址处。
在步骤S295,频谱结合部件376对由增益调整部件375进行增益调整后输入的高频分量和由分类码形成分离部件373输入的低频分量进行频谱结合,并将结合后的分量输出至逆DCT变换部件377。
在步骤S296,逆DCT变换部件377对结合后的频谱数据做逆M-DCT变换。
最后,在步骤S297,帧结合部件378执行重叠,并将结果作为宽带音频信号而输出至D/A变换部件333(图25)。
根据图34的内存数据更新处理,存储的内容必须被更新,除非在接听侧的蜂窝电话3012中存储了关于发送端的蜂窝电话3011的用户的最新内存数据。
然而,更新处理不限于此。也可以仅当用户在必要时要求内存数据的更新并且允许该要求时,方才执行更新处理。
而且,在本实施例中,在接听模式下,从发送端发送的电话号码被接听侧作为用来识别发送端的识别信息。然而,有可能将唯一的ID(识别码)分配给用户等,并将该ID用作识别信息。
以上说明了这一情形:即学习产生数据表与发送端的电话号码对应而存储,并以预定的定时来更新。在图26和图27中学习产生数据表374(表内存)被固定的情形下的操作与以下的情形是同样的:即省略图30的步骤S202的内存数据发送处理(图31所示的处理)和图33的步骤S252的内存数据更新处理(图34所示的处理)。
上述连续的处理可由硬件来实现,也可由软件来实现。当该连续的处理由软件来执行时,构成软件的程序被安装在多用途计算机等上面。
所以,图36表示计算机的实施例的示例,该计算机上面安装了用来执行上述连续处理的程序。
该程序可被预记录于计算机内建的记录介质,像硬盘405或ROM 403。
或者,程序可暂时或永远地存储(记录)于非固定盘、CD-ROM(光盘只读存储器)、MO(磁光盘)、DVD(数字万能盘)、磁盘或半导体内存等可移动记录介质411。这种可移动记录介质411可作为所谓包装式软件而提供。
程序不仅可从上述可移动记录介质411安装至计算机,而且程序可以先从下载点经数字卫星广播卫星无线地传送至计算机或经LAN(局域网)或因特网等网络有线地传送至计算机,并由通信部件408接收,然后再安装至内建的硬盘405。
计算机具有内建的CPU(中央处理单元)402。输入输出接口410经总线401连接至CPU 402。当用户通过对由键盘、鼠标和麦克风等构成的输入部件407进行操作而输入指令时,CPU 402根据该指令而执行存储在ROM(只读存储器)403中的程序。或者,CPU402以载入RAM(随机存取存储器)404的形式来执行存储在硬盘405上的程序,该程序是先从卫星或网络传送并由通信部件408接收后再安装至硬盘405的程序,或者先从装入驱动器409的可移动记录介质411读取后再安装至硬盘405的程序。这使得CPU 402执行根据上述流程图的处理,或基于上述框图的结构的处理。CPU 402将该处理结果经输入输出接口410从由LCD(液晶屏)、扬声器等构成的输出部件406输出,或者,由通信部件408发送或将结果记录在硬盘405上面。
在本说明书中,由使计算机执行各种处理的程序而构成的处理步骤未必沿流程图形式的顺序以时间串行方式来执行,而是包括并行或单个地执行的处理(例如,并行处理或基于对象的处理)。
此外,本程序可由1台计算机来处理,也可由多台计算机以分布方式来处理。程序可先传送至远方的计算机再被执行。
在本实施例中,已说明了本发明适用于音频(图像信号)宽带化设备和在蜂窝电话间进行声音通话的传送系统。此外,本发明还可能广泛地适用于固定电话声音、AM(调幅)/FM(调频)无线广播声音、模拟TV(电视)广播接收声音的音质改善等声音通信系统。
在本说明书中,术语系统指的是由多台设备和装置构成的整台机器。
产业上的可利用性
如上述,根据本发明的信号处理系统和信号处理系统的信号处理方法,实现了这样的系统:其中抑制了高频分量的窄带信号的高频分量可被高精度地复原。
如上述,根据本发明的第一信号处理设备、信号处理方法、记录介质和程序,对于另一台信号处理设备,抑制了高频分量的窄带信号的高频分量可被高精度地复原。
如上述,根据本发明的第二信号处理设备、信号处理方法、记录介质和程序,对于另一台信号处理设备,抑制了高频分量的窄带信号的高频分量可被高精度地复原。

Claims (28)

1.一种信号处理系统,包括第一信号处理设备,其中输入信号被处理和存储,以及第二信号处理设备,其中输入信号被处理和输出,
其中:
所述第一信号处理设备包括:
第一信号输入装置,用来输入具有宽带频率分量的第一信号;
第二信号输入装置,用来输入第一信号中的第二信号,第二信号是抑制了高频分量的窄带信号;
抽取装置,用来从由所述第一信号输入装置输入的第一信号中抽取高频分量;
第一决定装置,用来基于由所述第二信号输入装置输入的第二信号来决定每个第一分类码;和
存储装置,用来对于所述第一决定装置所决定的第一分类码存储由所述抽取装置抽取的高频分量;以及
所述第二信号处理设备包括:
第三信号输入装置,用来输入具有抑制了高频分量的窄带第三信号;
第二决定装置,用来基于由所述第三信号输入装置输入的第三信号来决定第二分类码;
合成装置,用来合成在存储装置中存储的高频分量和由所述第三信号输入装置输入的第三信号,该高频分量与所述第二决定装置所决定的第二分类码相对应;以及
输出装置,用来输出由所述合成装置生成的合成信号。
2.一种用于信号处理系统的信号处理方法,该信号处理系统包括:第一信号处理设备,其中输入信号被处理和存储;以及第二信号处理设备,其中输入信号被处理和输出,
其中:
所述第一信号处理设备包括:
第一信号输入控制步骤,用来控制具有宽带频率分量的第一信号的输入;
第二信号输入控制步骤,用来控制第一信号中的第二信号的输入,第二信号是抑制了高频分量的窄带信号;
抽取步骤,用来从第一信号输入控制步骤中由处理控制输入的第一信号中抽取高频分量;
第一决定步骤,用来基于第二信号输入控制步骤中由处理控制输入的第二信号来决定每个第一分类码;和
存储步骤,用来对于第一分类码存储在抽取步骤中由处理抽取的高频分量;和
所述第二信号处理设备包括:
第三信号输入控制步骤,用来控制具有抑制了高频分量的窄带第三信号的输入;
第二决定步骤,用来基于第二信号输入控制步骤中由处理控制输入的第三信号来决定第二分类码;
合成步骤,用来合成在存储步骤中由处理所存储的高频分量和在第三信号输入控制步骤中由处理控制输入的第三信号,该高频分量与在所述第二决定步骤中由处理所决定的第二分类码相对应;以及
输出控制步骤,用来控制在合成步骤中由处理生成的合成信号的输出。
3.一种信号处理设备包括:
第一信号输入装置,用来输入具有宽带频率分量的第一信号;
第二信号输入装置,用来输入第一信号中的第二信号,第二信号是抑制了高频分量的窄带信号;
抽取装置,用来从由所述第一信号输入装置输入的第一信号中抽取高频分量;
决定装置,用来基于由所述第二信号输入装置输入的第二信号来决定每个分类码;和
存储装置,用来对于所述决定装置所决定的分类码存储由所述抽取装置抽取的高频分量。
4.根据权利要求3所述的信号处理设备,其中第一信号和第二信号是音频信号。
5.根据权利要求4所述的信号处理设备,其中所述决定装置基于第二信号来决定分类码,所述第二信号基于等响度特性通过加权来处理。
6.根据权利要求4所述的信号处理设备,其中所述决定装置基于音频信号频谱的平均功率电平和最大功率电平的位置来决定分类码。
7.根据权利要求4所述的信号处理设备,其中对于等于或高于由抽取装置抽取的高频分量的最低频率的1/2倍或1/3倍的频率的频谱分量,所述决定装置决定分类码。
8.根据权利要求3所述的信号处理设备,其中第一信号和第二信号是图像信号。
9.根据权利要求8所述的信号处理设备,其中所述决定装置基于图像信号的频谱的交流平均功率电平、直流功率电平和交流分量峰功率电平来决定分类码。
10.根据权利要求3所述的信号处理设备,其中,在所述存储装置中,由所述抽取装置抽取的高频分量被存储,以便相关于特定信息。
11.根据权利要求10所述的信号处理设备,其中特定信息是电话机的电话号码。
12.根据权利要求3的信号处理设备,进一步包括生成装置,用来通过以预定的时间间隔来抽选第一信号而生成第二信号。
13.一种用于信号处理设备的信号处理方法,在该信号处理设备中输入信号被处理和存储,所述信号处理方法包括:
第一信号输入控制步骤,用来控制具有宽带频率分量的第一信号的输入;
第二信号输入控制步骤,用来控制第一信号中的第二信号的输入,第二信号是抑制了高频分量的窄带信号;
抽取步骤,用来从第一信号输入控制步骤中由处理控制输入的第一信号中抽取高频分量;
决定步骤,用来基于在第二信号输入控制步骤中由处理控制输入的第二信号来决定每个分类码;和
存储步骤,用来对于在决定步骤中由处理所决定的分类码存储在抽取步骤中由处理抽取的高频分量。
14.一种记录介质,具有用于信号处理设备的计算机可读程序,在该信号处理设备中输入信号被处理和存储,其中所述程序包括:
第一信号输入控制步骤,用来控制具有宽带频率分量的第一信号的输入;
第二信号输入控制步骤,用来控制第一信号中的第二信号的输入,第二信号是抑制了高频分量的窄带信号;
抽取步骤,用来从第一信号输入控制步骤中由处理控制输入的第一信号中抽取高频分量;
决定步骤,用来基于在第二信号输入控制步骤中由处理控制输入的第二信号来决定每个分类码;和
存储步骤,用来对于在决定步骤中由处理所决定的分类码存储在抽取步骤中由处理抽取的高频分量。
15.一种用于计算机控制信号处理设备的程序,在该信号处理设备中输入信号被处理和存储,所述程序允许计算机执行:
第一信号输入控制步骤,用来控制具有宽带频率分量的第一信号的输入;
第二信号输入控制步骤,用来控制第一信号中的第二信号的输入,第二信号是抑制了高频分量的窄带信号;
抽取步骤,用来从第一信号输入控制步骤中由处理控制输入的第一信号中抽取高频分量;
决定步骤,用来基于在第二信号输入控制步骤中处理控制输入的第二信号来决定每个分类码;和
存储步骤,用来对于在决定步骤中由处理所决定的分类码存储在抽取步骤中由处理抽取的高频分量。
16.一种信号处理设备包括:
信号输入装置,用来输入具有抑制了高频分量的窄带信号;
决定装置,用来基于由所述信号输入装置输入的信号来决定分类码;
存储装置,用来存储高频分量;
合成装置,用来合成在所述存储装置中存储的高频分量和由所述信号输入装置输入的信号,该高频分量与所述决定装置所决定的分类码相对应;以及
输出装置,用来输出由所述合成装置生成的合成信号。
17.根据权利要求16所述的信号处理设备,其中由所述信号输入装置输入的信号是音频信号。
18.根据权利要求17所述的信号处理设备,其中所述决定装置基于信号来决定分类码,该信号基于等响度特性通过加权来处理。
19.根据权利要求17所述的信号处理设备,其中所述决定装置基于音频信号频谱的平均功率电平和最大功率电平的位置来决定分类码。
20.根据权利要求17所述的信号处理设备,其中对于等于或高于存储在所述存储装置中的高频分量的最低频率的1/2倍或1/3倍的频率的频谱分量,所述决定装置决定分类码。
21.根据权利要求16所述的信号处理设备,其中由所述信号输入装置输入的信号是图像信号。
22.根据权利要求21所述的信号处理设备,其中所述决定装置基于图像信号的频谱的交流平均功率电平、直流功率电平和交流分量峰功率电平来决定分类码。
23.根据权利要求16所述的信号处理设备,其中在所述存储装置中存储的高频分量按预定的定时来更新。
24.根据权利要求16所述的信号处理设备,其中,在所述存储装置中高频分量被存储以便相关于特定信息。
25.根据权利要求24的信号处理设备,其中特定信息是电话机的电话号码。
26.一种用于信号处理设备的信号处理方法,在该信号处理设备中输入信号被处理和存储,所述信号处理方法包括:
信号输入控制步骤,用来控制具有抑制了高频分量的窄带信号的输入;
决定步骤,用来基于在信号输入控制步骤中由处理控制输入的信号来决定分类码;
存储控制步骤,用来控制高频分量的存储;
合成步骤,用来合成在存储步骤中由处理所控制存储的高频分量和在信号输入控制步骤中由处理输入的信号,该高频分量与在决定步骤中由处理所决定的分类码相对应;以及
输出控制步骤,用来控制在合成步骤中由处理生成的合成信号的输出。
27.一种记录介质,具有信号处理设备的计算机可读程序,在该信号处理设备中,输入信号被处理和存储,其中所述程序包括:
信号输入控制步骤,用来控制具有抑制了高频分量的窄带信号的输入;
决定步骤,用来基于在信号输入控制步骤中由处理控制输入的信号来决定分类码;
存储控制步骤,用来控制高频分量的存储;
合成步骤,用来合成在存储步骤中由处理所控制存储的高频分量和在信号输入控制步骤中由处理输入的信号,该高频分量与在决定步骤中由处理所决定的与分类码相对应;以及
输出控制步骤,用来控制在合成步骤中由处理生成的合成信号的输出。
28.一种用于计算机控制信号处理设备的程序,在该信号处理设备中,输入信号被处理和存储,所述程序允许计算机执行:
信号输入控制步骤,用来控制具有抑制了高频分量的窄带信号的输入;
决定步骤,用来基于在信号输入控制步骤中由处理控制输入的信号来决定分类码;
存储控制步骤,用来控制高频分量的存储;
合成步骤,用来合成在存储步骤中由处理所控制存储的高频分量和在信号输入控制步骤中由处理输入的信号,该高频分量与在决定步骤中由处理所决定的分类码相对应;以及
输出控制步骤,用来控制在合成步骤中由处理生成的合成信号的输出。
CNB038017334A 2002-09-12 2003-08-27 信号处理系统、信号处理设备和方法 Expired - Fee Related CN1302457C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP266327/2002 2002-09-12
JP2002266327A JP3879922B2 (ja) 2002-09-12 2002-09-12 信号処理システム、信号処理装置および方法、記録媒体、並びにプログラム

Publications (2)

Publication Number Publication Date
CN1602516A true CN1602516A (zh) 2005-03-30
CN1302457C CN1302457C (zh) 2007-02-28

Family

ID=31986636

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB038017334A Expired - Fee Related CN1302457C (zh) 2002-09-12 2003-08-27 信号处理系统、信号处理设备和方法

Country Status (7)

Country Link
US (2) US7668319B2 (zh)
EP (1) EP1538602B1 (zh)
JP (1) JP3879922B2 (zh)
KR (1) KR101001475B1 (zh)
CN (1) CN1302457C (zh)
DE (1) DE60325741D1 (zh)
WO (1) WO2004025625A1 (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011110031A1 (en) * 2010-09-29 2011-09-15 Huawei Technologies Co.,Ltd. Method and device for encoding high frequency signal, and method and device for decoding high frequency signal
CN101604528B (zh) * 2008-06-13 2013-08-28 索尼株式会社 信息处理设备和方法
CN105761724A (zh) * 2012-03-01 2016-07-13 华为技术有限公司 一种语音频信号处理方法和装置

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3879922B2 (ja) * 2002-09-12 2007-02-14 ソニー株式会社 信号処理システム、信号処理装置および方法、記録媒体、並びにプログラム
DE602004030594D1 (de) * 2003-10-07 2011-01-27 Panasonic Corp Verfahren zur entscheidung der zeitgrenze zur codierung der spektro-hülle und frequenzauflösung
CN101656074B (zh) * 2004-05-14 2013-01-23 松下电器产业株式会社 音频解码装置、音频解码方法以及通信终端和基站装置
US8417515B2 (en) 2004-05-14 2013-04-09 Panasonic Corporation Encoding device, decoding device, and method thereof
EP1638083B1 (en) * 2004-09-17 2009-04-22 Harman Becker Automotive Systems GmbH Bandwidth extension of bandlimited audio signals
JP4899359B2 (ja) * 2005-07-11 2012-03-21 ソニー株式会社 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体
JP5383008B2 (ja) * 2007-07-09 2014-01-08 アルパイン株式会社 音声明瞭度改善システム及び音声明瞭度改善方法
ATE477572T1 (de) * 2007-10-01 2010-08-15 Harman Becker Automotive Sys Effiziente audiosignalverarbeitung im subbandbereich, verfahren, vorrichtung und dazugehöriges computerprogramm
EP2380172B1 (en) 2009-01-16 2013-07-24 Dolby International AB Cross product enhanced harmonic transposition
EP3723090B1 (en) 2009-10-21 2021-12-15 Dolby International AB Oversampling in a combined transposer filter bank
KR101897455B1 (ko) 2012-04-16 2018-10-04 삼성전자주식회사 음질 향상 장치 및 방법
US10008198B2 (en) * 2013-03-28 2018-06-26 Korea Advanced Institute Of Science And Technology Nested segmentation method for speech recognition based on sound processing of brain
KR20150032390A (ko) * 2013-09-16 2015-03-26 삼성전자주식회사 음성 명료도 향상을 위한 음성 신호 처리 장치 및 방법
CN109688531B (zh) * 2017-10-18 2021-01-26 宏达国际电子股份有限公司 获取高音质音频变换信息的方法、电子装置及记录介质

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2779886B2 (ja) * 1992-10-05 1998-07-23 日本電信電話株式会社 広帯域音声信号復元方法
SE501981C2 (sv) * 1993-11-02 1995-07-03 Ericsson Telefon Ab L M Förfarande och anordning för diskriminering mellan stationära och icke stationära signaler
JP3189598B2 (ja) 1994-10-28 2001-07-16 松下電器産業株式会社 信号合成方法および信号合成装置
DE69619284T3 (de) 1995-03-13 2006-04-27 Matsushita Electric Industrial Co., Ltd., Kadoma Vorrichtung zur Erweiterung der Sprachbandbreite
JP2956548B2 (ja) 1995-10-05 1999-10-04 松下電器産業株式会社 音声帯域拡大装置
JPH08278800A (ja) * 1995-04-05 1996-10-22 Fujitsu Ltd 音声通信システム
EP0945852A1 (en) * 1998-03-25 1999-09-29 BRITISH TELECOMMUNICATIONS public limited company Speech synthesis
US6658155B1 (en) * 1999-03-25 2003-12-02 Sony Corporation Encoding apparatus
JP2000305599A (ja) 1999-04-22 2000-11-02 Sony Corp 音声合成装置及び方法、電話装置並びにプログラム提供媒体
US6351733B1 (en) * 2000-03-02 2002-02-26 Hearing Enhancement Company, Llc Method and apparatus for accommodating primary content audio and secondary content remaining audio capability in the digital audio production process
JP4596196B2 (ja) * 2000-08-02 2010-12-08 ソニー株式会社 ディジタル信号処理方法、学習方法及びそれらの装置並びにプログラム格納媒体
JP4538705B2 (ja) * 2000-08-02 2010-09-08 ソニー株式会社 ディジタル信号処理方法、学習方法及びそれらの装置並びにプログラム格納媒体
JP3879922B2 (ja) * 2002-09-12 2007-02-14 ソニー株式会社 信号処理システム、信号処理装置および方法、記録媒体、並びにプログラム

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101604528B (zh) * 2008-06-13 2013-08-28 索尼株式会社 信息处理设备和方法
WO2011110031A1 (en) * 2010-09-29 2011-09-15 Huawei Technologies Co.,Ltd. Method and device for encoding high frequency signal, and method and device for decoding high frequency signal
CN102436820A (zh) * 2010-09-29 2012-05-02 华为技术有限公司 高频带信号编码方法及装置、高频带信号解码方法及装置
CN102436820B (zh) * 2010-09-29 2013-08-28 华为技术有限公司 高频带信号编码方法及装置、高频带信号解码方法及装置
US8924221B2 (en) 2010-09-29 2014-12-30 Huawei Technologies Co., Ltd Method and device for encoding a high frequency signal, and method and device for decoding a high frequency signal
US9161038B2 (en) 2010-09-29 2015-10-13 Huawei Technologies Co., Ltd. Method and device for encoding a high frequency signal, and method and device for decoding a high frequency signal
US9728197B2 (en) 2010-09-29 2017-08-08 Huawei Technologies Co., Ltd. Method and device for encoding a high frequency signal, and method and device for decoding a high frequency signal
US10366697B2 (en) 2010-09-29 2019-07-30 Huawei Technologies Co., Ltd. Method and device for encoding a high frequency signal, and method and device for decoding a high frequency signal
US10902862B2 (en) 2010-09-29 2021-01-26 Crystal Clear Codec, Llc Method and device for encoding a high frequency signal, and method and device for decoding a high frequency signal
US11580998B2 (en) 2010-09-29 2023-02-14 Crystal Clear Codec, Llc Method and device for encoding a high frequency signal, and method and device for decoding a high frequency signal
CN105761724A (zh) * 2012-03-01 2016-07-13 华为技术有限公司 一种语音频信号处理方法和装置
CN105761724B (zh) * 2012-03-01 2021-02-09 华为技术有限公司 一种语音频信号处理方法和装置

Also Published As

Publication number Publication date
KR101001475B1 (ko) 2010-12-14
US7668319B2 (en) 2010-02-23
JP2004102095A (ja) 2004-04-02
DE60325741D1 (de) 2009-02-26
US20100020827A1 (en) 2010-01-28
EP1538602A4 (en) 2007-07-18
JP3879922B2 (ja) 2007-02-14
KR20050037431A (ko) 2005-04-21
US7986797B2 (en) 2011-07-26
US20050073986A1 (en) 2005-04-07
CN1302457C (zh) 2007-02-28
EP1538602A1 (en) 2005-06-08
EP1538602B1 (en) 2009-01-07
WO2004025625A1 (ja) 2004-03-25

Similar Documents

Publication Publication Date Title
CN1302457C (zh) 信号处理系统、信号处理设备和方法
CN1156822C (zh) 音频信号编码方法、解码方法,及音频信号编码装置、解码装置
CN1165891C (zh) 对过采样合成宽带信号进行高频分量恢复的方法与设备
CN1324558C (zh) 编码设备,解码设备以及音频数据分配系统
CN1229775C (zh) 宽带语音和音频信号解码器中的增益平滑
CN1242376C (zh) 声音识别系统、装置、声音识别方法
CN1065382C (zh) 编码方法、译码方法、以及编码装置
CN101048649A (zh) 可扩展解码装置及可扩展编码装置
CN1277180C (zh) 用于适应音频信号的装置和方法
CN1926607A (zh) 多信道音频编码
CN1244676A (zh) 信息处理设备、方法及其存储介质
CN1596030A (zh) 数字音频预补偿
CN1898723A (zh) 信号解码装置以及信号解码方法
CN1208288A (zh) 用于视听设备的信号处理及声象定位装置和方法
CN1871501A (zh) 频谱编码装置、频谱解码装置、音响信号发送装置、音响信号接收装置及其使用方法
CN101067931A (zh) 一种高效可配置的频域参数立体声及多声道编解码方法与系统
CN1922660A (zh) 通信装置和信号编码/解码方法
CN1257639A (zh) 音频信道混合
CN1950686A (zh) 编码装置、解码装置以及编码/解码方法
CN1893607A (zh) 编码、解码设备和方法,图像处理系统和方法及记录介质
CN1270454C (zh) 声音处理装置
CN1898724A (zh) 语音/乐音编码设备及语音/乐音编码方法
CN1216367C (zh) 数据处理装置
CN1679084A (zh) 发送设备和发送方法、接收设备和接收方法、收发器设备、通信设备和方法、记录媒体、和程序
CN1925597A (zh) 图像处理设备、图像处理方法及程序

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20070228

Termination date: 20130827