CN101853659A - 扩频装置、方法、程序及电话终端 - Google Patents

扩频装置、方法、程序及电话终端 Download PDF

Info

Publication number
CN101853659A
CN101853659A CN200910224601A CN200910224601A CN101853659A CN 101853659 A CN101853659 A CN 101853659A CN 200910224601 A CN200910224601 A CN 200910224601A CN 200910224601 A CN200910224601 A CN 200910224601A CN 101853659 A CN101853659 A CN 101853659A
Authority
CN
China
Prior art keywords
characteristic
feature
parameter
characteristic quantity
spread spectrum
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN200910224601A
Other languages
English (en)
Other versions
CN101853659B (zh
Inventor
田代厚史
青柳弘美
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Publication of CN101853659A publication Critical patent/CN101853659A/zh
Application granted granted Critical
Publication of CN101853659B publication Critical patent/CN101853659B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Telephone Function (AREA)

Abstract

本发明涉及生成根据听取周围状况等自动调整的扩频信号的扩频装置、方法、程序及电话终端。本发明的扩频装置根据参数扩展输入语音信号的频带,其特征在于,具有:特征判定单元,其对通过发音来输出扩频后的语音信号的周围声音进行收集,判定该周围声音的特征,并推测该特征的特征量;调整量推测单元,其对特征的特征量和参数进行比较,并推测参数的调整量;实际特征判定单元,其针对输入语音信号判定特征,并推测该特征的实际特征量;和调整量确定单元,其对所述特征量和所述实际特征量进行比较,确定实际调整量,更新参数。

Description

扩频装置、方法、程序及电话终端
技术领域
本发明涉及扩频装置、方法、程序及电话终端,例如,能够适用于对频带受限制的语音信号生成并附加超过该频带上限的信号,并扩展频带。
背景技术
例如,在授受语音信号的电话通信系统中传输的语音信号的频带为0.3kHz~3.4kHz,远比人原本要发出的声音的频带窄。因此,通电话的声音微弱而导致质量差。
针对这种问题,例如像专利文献1记载的技术那样,在接收侧将语音信号的频率扩展到高频侧,以提高质量。
在专利文献1记载的技术中,由接收到的语音信号(低频带信号)生成比其高的频带的语音信号(高频带信号),将高频带信号加到低频带信号上,由此获得宽频带的语音信号。其中,专利文献1记载的技术具有能够通过外部的操作来改变高频带信号对低频带信号的加算比率的特征。
【专利文献1】日本特开2000-134162号公报
但是,在专利文献1记载的技术中,手动操作加算比率的作业量过大,需要熟练的技术,所以存在一般使用者难以操作的问题。
另外,在其他扩频装置中,使用者和电话终端的设置者等能够调整操作与生成的高频带信号相关的特性等。但是,操作者很难进行适当的调整操作。
因此,期待能够生成根据听取环境状况等自动调整后的扩频信号的扩频装置、方法、程序、及电话终端。
发明内容
第一发明提供一种根据参数扩展输入语音信号的频带的扩频装置,其特征在于,所述扩频装置具有:(1)特征判定单元,其对通过发音来输出扩频后的语音信号的周围声音进行收集,判定该周围声音的特征,并推测该特征的特征量;(2)调整量推测单元,其对所述特征的特征量和所述参数进行比较,并推测所述参数的调整量;(3)实际特征判定单元,其针对所述输入语音信号判定特征,并推测该特征的实际特征量;以及(4)调整量确定单元,其对所述特征量和所述实际特征量进行比较,确定实际调整量,更新所述参数。
第二发明提供一种根据参数扩展输入语音信号的频带的扩频装置,其特征在于,所述扩频装置具有:(1)第1特征量推测单元,其对通过发音来输出扩频后的语音信号的周围声音进行收集,判定该周围声音的特征,并推测该特征的特征量;(2)第2特征量推测单元,其将所述周围声音转换为特性与扩频后的语音信号相同的信号,同时使用所述参数推测转换后的所述周围声音的特征量;(3)调整量推测单元,其推测使所述第2特征量推测单元的特征量接近所述第1特征量推测单元的特征量的所述参数,并推测所述参数的调整量;(4)实际特征判定单元,其针对所述输入语音信号判定特征,并推测该特征的实际特征量;以及(5)调整量确定单元,其对所述特征量和所述实际特征量进行比较,确定实际调整量,更新所述参数。
第三发明提供一种根据参数扩展输入语音信号的频带的扩频方法,其特征在于,所述扩频方法执行如下处理:(1)由特征判定单元对通过发音来输出扩频后的语音信号的周围声音进行收集,判定该周围声音的特征,并推测该特征的特征量;(2)由调整量推测单元对所述特征的特征量和所述参数进行比较,并推测所述参数的调整量;(3)由实际特征判定单元针对所述输入语音信号判定特征,并推测该特征的实际特征量;以及(4)由调整量确定单元对所述特征量和所述实际特征量进行比较,确定实际调整量,更新所述参数。
第四发明提供一种根据参数扩展输入语音信号的频带的扩频方法,其特征在于,所述扩频方法执行如下处理:(1)由第1特征量推测单元对通过发音来输出扩频后的语音信号的周围声音进行收集,判定该周围声音的特征,并推测该特征的特征量;(2)由第2特征量推测单元将所述周围声音转换为特性与扩频后的语音信号相同的信号,同时使用所述参数推测转换后的所述周围声音的特征量;(3)由调整量推测单元推测使所述第2特征量推测单元的特征量接近所述第1特征量推测单元的特征量的所述参数,并推测所述参数的调整量;(4)由实际特征判定单元针对所述输入语音信号判定特征,并推测该特征的实际特征量;以及(5)由调整量确定单元对所述特征量和所述实际特征量进行比较,确定实际调整量,更新所述参数。
第五发明提供一种根据参数扩展输入语音信号的频带的扩频程序,其特征在于,所述扩频程序使计算机作为以下单元进行工作:(1)特征判定单元,其对通过发音来输出扩频后的语音信号的周围声音进行收集,判定该周围声音的特征,并推测该特征的特征量;(2)调整量推测单元,其对所述特征的特征量和所述参数进行比较,并推测所述参数的调整量;(3)实际特征判定单元,其针对所述输入语音信号判定特征,并推测该特征的实际特征量;以及(4)调整量确定单元,其对所述特征量和所述实际特征量进行比较,确定实际调整量,更新所述参数。
第六发明提供一种根据参数扩展输入语音信号的频带的扩频程序,其特征在于,所述扩频程序使计算机作为以下单元进行工作:(1)第1特征量推测单元,其对通过发音来输出扩频后的语音信号的周围声音进行收集,判定该周围声音的特征,并推测该特征的特征量;(2)第2特征量推测单元,其将所述周围声音转换为特性与扩频后的语音信号相同的信号,同时使用所述参数推测转换后的所述周围声音的特征量;(3)调整量推测单元,其推测使所述第2特征量推测单元的特征量接近所述第1特征量推测单元的特征量的所述参数,并推测所述参数的调整量;(4)实际特征判定单元,其针对所述输入语音信号判定特征,并推测该特征的实际特征量;以及(5)调整量确定单元,其对所述特征量和所述实际特征量进行比较,确定实际调整量,更新所述参数。
第七发明提供一种电话终端,其特征在于,所述电话终端具有第一或第二发明的扩频装置。
根据本发明,能够生成根据听取周围状况等自动调整后的扩频信号。
附图说明
图1是表示第1实施方式的扩频装置的结构的框图。
图2是表示第1实施方式的扩频特性调整部的具体结构示例的框图。
图3是第1实施方式的参数操作器的参数信息的储存方法的说明图。
图4是表示第2实施方式的扩频装置的结构的框图。
图5是表示第2实施方式的扩频特性调整部的具体结构示例的框图。
图6是表示针对第2实施方式的变形实施方式的结构的框图。
标号说明
100、100A、100B扩频装置;101扩频处理部;102、102A扩频特性调整部;103拨打获取部;104操作部;105接听发音部;106集音部;107拨打转换部;111成分判定器;112噪声电平获取器;113是否更新判定器;114参数调整器;115参数操作器;116接听信号判定器;121窄带信号特性推测器;122宽带信号特性推测器;123宽带特性推测器;124接听信号判定器;125参数调整器。
具体实施方式
(A)第1实施方式
以下,参照附图说明本发明的扩频装置、方法、程序及电话终端的第1实施方式。
第1实施方式提取从接收扩频信号的接听侧输入的信号的噪声成分,根据噪声成分的大小改变扩频时输出的信号成分的大小,结果,得到听取时容易听清楚的声音。
(A-1)第1实施方式的结构
图1是表示第1实施方式的扩频装置的结构的框图。例如,安装了第1实施方式的扩频装置的装置(电话终端)是软电话,在利用CPU和CPU执行的程序来实现扩频装置时,也能够从功能上利用图1的功能框图表示。
在图1中,第1实施方式的扩频装置100具有扩频处理部101、扩频特性调整部102、拨打获取部103、操作部104和接听发音部105。
扩频处理部101在动作信息AI指示扩展动作时,适用参数信息PA,由接听信号TS形成扩频信号ES,在动作信息AI不指示扩展动作时,使接听信号TS直接通过。
关于扩频处理部101适用的扩频方法,例如适用像专利文献1记述的宽带码本、LPC合成和高频带抑制滤波器。该情况时,后面叙述的能够变更的参数信息为高频带抑制滤波器中的滤波形状(频率特性曲线)。另外,关于宽带码本,可以准备激励矢量的功率不同的多个码本,关于参数信息可以适用宽带码本的类型。并且,也可以在LPC合成滤波器的滤波器系数(α)的输入级设置变更滤波器系数的可变电路,把LPC合成滤波器的滤波器系数用作参数信息。
但是,扩频处理部101适用的扩频方法不限于专利文献1记述的方法。例如,也可以是不使用LPC合成的方法、分析并生成虚拟高频带信号来取代宽带码本的方法。其中,关键为高频带信号的特性根据参数的变更而变化的扩频方法。根据适用的扩频方法设定参数信息即可。
接听发音部105可以列举扬声器和头戴机和耳机等,用于通过发音来输出由扩频处理部101提供的扩频信号ES或接听信号TS。
拨打获取部103可以列举装配在电话终端上的麦克风、和安装在头戴机上的麦克风等,用于捕捉附近讲话人的声音,并获得拨打信号RS。其中,拨打信号RS可以是与扩频之前的接听信号TS相同的窄带的信号,也可以是与扩频信号ES相同的宽带的信号。
操作部104用于安装了第1实施方式的扩频装置100的电话终端的使用者进行要将扩频设为有效还是无效的指示操作,并输出表示有效或无效的动作指示信息DI。例如,可以适用通断开关和拨码开关,也可以对键输入部的任一个键分配相应功能,另外,如果是软电话,则还可以适用图标。在第1实施方式中,使用者对扩频指示只能指示有效/无效,不能对高频带信号的特性进行可变操作。
对扩频特性调整部102输入动作指示信息DI、接听信号TS和拨打信号RS,扩频特性调整部102根据这些信息,生成表示是否执行扩频动作的动作信息AI、和在执行扩频动作时规定高频带信号的特性的参数信息PA,并提供给扩频处理部101。
图2是表示这种扩频特性调整部102的具体结构示例的框图。在图2中,具有成分判定器111、噪声电平获取器112、是否更新判定器113、参数调整器114、参数操作器115和接听信号判定器116。
成分判定器111判定所输入的拨打信号RS是否是不包含语音信号的噪声信号。成分判定器111在判定为是噪声信号时,把所输入的拨打信号RS作为判定对象信号JS输出,在判定为不是噪声信号时,不输出判定对象信号JS、或者输出没有意义的判定对象信号JS(例如全部为0)。关于输入信号是否是噪声信号的判定,可以适用公知的噪声判定方法。例如,可以适用下述方法,即,定期(例如间隔10ms)推测拨打信号RS与使其延迟的信号之间的相关函数即自相关函数为最大的延迟时间,在该延迟时间是0.14~1.4ms的范围(利用语音信号表示的范围)之外的时间时,判定为是噪声信号。
噪声电平获取器112计算所输入的判定对象信号(噪声信号)JS的电平。噪声电平获取器112例如获取所输入的判定对象信号(此处为数字信号)JS的预定期间(例如10ms)的平方和,作为噪声电平信息NL。但是,噪声电平信息NL的形成方法不限于此。例如,也可以对判定对象信号JS进行频率分析,并且获取该分析结果中最大的电平及此时的频率,作为噪声电平信息NL。
关于噪声电平获取器112和后面叙述的接听信号判定器116的电平获取,可以每隔预定周期执行,也可以在1次通话中仅获取1次。
是否更新判定器113获取噪声电平信息NL,并与预先设定的阈值比较。是否更新判定器113在噪声电平信息NL超过阈值时,判定为要把扩频处理部101内的高频带抑制滤波器的滤波形状(参数信息)更新为抑制度较小的滤波形状。在从超过阈值的状态变为不超过阈值的状态时,是否更新判定器113判定为要把扩频处理部101内的高频带抑制滤波器的滤波形状(参数信息)更新为抑制度较大的滤波形状。关于阈值可以准备多个。如果阈值是两个,则在超过较小的阈值时,判定为适用把抑制度更新为小一档的参数,在超过较大的阈值时,判定为适用把抑制度更新为小两档的参数。并且,也可以分别具有用于提高抑制度的阈值、和用于降低抑制度的阈值。是否更新判定器113在判定为需要更新参数信息时,把表示通过判定示出的更新后的滤波形状(参数信息)的识别信息、和在判定时使用的噪声电平信息NL,作为是否判定信息JI输出。是否更新判定器113被提供用于规定当前适用的滤波形状(参数信息)的识别信息(例如后面叙述的指针),由此能够获得表示更新后的滤波形状(参数信息)的识别信息。
接听信号判定器116获取接听信号TS,把接听信号TS的噪声电平作为接听信号特性信息SL输出。接听信号判定器116例如与成分判定器111相同地获得不包含声音的期间的信号后,利用与噪声电平获取器112适用的噪声信号电平的计算方法相同的计算方法,求出接听信号TS的噪声电平。
在参数调整器114中,在被提供了是否判定信息JI时,进行以下所述的参数信息的调整动作。在参数调整器114中,将接听信号特性信息SL与是否判定信息JI中包含的噪声电平信息NL进行比较,在噪声电平信息NL大于接听信号特性信息SL的预定倍数(例如1.3倍)时,不执行参数信息的更新,在噪声电平信息NL为接听信号特性信息SL的预定倍数以下时,把是否判定信息JI中包含的参数信息(此处为更新后的滤波形状)的识别信息作为更新指示信息EP输出。
但是,关于在被提供了是否判定信息JI时是否禁止执行更新的判定方法,不限于上述的方法。例如,可以设定禁止执行更新的噪声电平信息NL的下限,也可以对接听信号TS的噪声电平和接听信号特性信息SL双方设定禁止执行更新的下限。并且,还可以根据在是否更新判定器113中使用的判定指标,改变是否禁止执行更新的判定方法。
参数操作器115在被提供了不指示扩展动作的动作指示信息DI时,输出不指示扩展动作的动作信息AI,此时不输出参数信息PA(另外,虽然也可以输出参数信息PA,但扩频处理部101可以忽视该信息)。参数操作器115在被提供了指示扩展动作的动作指示信息DI时,按照下面所述进行动作。参数操作器115更新在被输入了更新指示信息EP的定时输出的参数信息PA,向扩频处理部101输出指示扩展动作的动作信息AI和参数信息PA。例如,参数操作器115按照图3所示,按照扩频处理部101内的高频带抑制滤波器的滤波形状所表示的抑制度的大小顺序,存储多个参数信息,并指示指针POI输出的参数信息。通过变更指针PQI的值,使输出的参数信息PA得到更新。
(A-2)第1实施方式的动作
下面,说明第1实施方式的扩频装置100的动作。
首先,说明通过使用者对操作部104的操作不指示扩频时的动作。
此时,从操作部104输出不指示扩频的动作指示信息DI,从被提供了该动作指示信息DI的扩频特性调整部102,也向扩频处理部101输出不指示扩展频带的动作信息AI。结果,接听信号TS直接通过扩频处理部101,提供给接听发音部105,通过发音来输出。
在扩频特性调整部102的内部,被提供了不指示扩展动作的动作指示信息DI的参数操作器115,输出不指示扩频的动作信息AI。成分判定器111~参数调整器114、接听信号判定器116可以动作也可以不动作。在它们动作时,在参数操作器115中不更新要输出的参数信息PA。并且,对成分判定器111~参数调整器114、接听信号判定器116分配不指示扩频的动作指示信息DI或者动作信息AI,使这些成分判定器111~参数调整器114、接听信号判定器116停止动作。
下面,说明通过使用者对操作部104的操作指示了扩频时的动作。
此时,从操作部104输出指示扩频的动作指示信息DI,从被提供了该动作指示信息DI的扩频特性调整部102,向扩频处理部101输出指示扩展频带的动作信息AI和参数信息PA。在扩频处理部101中设定成为,内部的高频带抑制滤波器根据参数信息PA进行抑制高频带信号。
扩频处理部101在被提供了接听信号TS时,通过扩频形成包含高频带信号的扩频信号ES,提供给接听发音部105,通过发音来输出。在形成扩频信号ES时,高频带信号的抑制程度遵从参数信息PA。
在扩频时,在扩频特性调整部102的内部进行以下动作。
在成分判定器111中,判定所输入的拨打信号RS是否是噪声信号,如果是噪声信号,则作为判定对象信号JS输出给噪声电平获取器112,由噪声电平获取器112获取噪声电平,并向是否更新判定器113提供噪声电平信息NL。在是否更新判定器113中,通过比较噪声电平信息NL和阈值,判定是否需要更新参数信息PA。如果需要更新参数信息PA,则把指示更新后的参数信息PA的信息、和在判定时使用的噪声电平信息NL,作为是否判定信息JI输出给参数调整器114。
在接听信号判定器116中获取接听信号TS的噪声电平,作为接听信号特性信息SL输出给参数调整器114。
在参数调整器114中,在是否判定信息JI中包含的噪声电平信息NL大于接听信号特性信息SL的预定倍时,确定不执行参数的更新,在除此之外的情况时,把规定是否判定信息JI中包含的更新后的参数信息的信息作为更新指示信息EP,输出给参数操作器115。
在提供更新指示信息EP后,由参数操作器115更新提供给扩频处理部101的参数信息PA。并且,在向参数操作器115提供了指示扩频的动作指示信息DI时,从参数操作器115输出指示扩频的动作信息AI。
(A-3)第1实施方式的效果
根据第1实施方式,能够把拨打信号用作表示听取接听信号的环境的信号,并根据听取接听信号的环境自动调整扩频信号。结果,能够与使用者等的操作无关地提高发出扩频信号时的语音质量。
(B)第2实施方式
下面,参照附图说明本发明的扩频装置、方法、程序及电话终端的第2实施方式。
第2实施方式根据拨打信号的窄带信号简单推测扩频信号的特性,并与另外获取的拨打信号的宽带信号进行比较,修正扩频特性。
(B-1)第2实施方式的结构
图4是表示第2实施方式的扩频装置的结构的框图,对与第1实施方式的图1相同、对应的部分,标注相同、对应的标号进行表示。
在图4中,第2实施方式的扩频装置100A具有扩频处理部101、扩频特性调整部102A、拨打获取部103、操作部104、接听发音部105和集音部106。
拨打获取部103、操作部104和接听发音部105与第1实施方式相同,所以省略其说明。
扩频处理部101与第1实施方式相同。下面,说明扩频处理部101具有像专利文献1记述的宽带码本、LPC合成电路、高频带抑制滤波器,参数信息PA是LPC合成时的滤波器系数和宽带码本的情况。
集音部106例如可以列举与构成拨打获取部103的麦克风不同的麦克风等,用于捕捉安装了第2实施方式的扩频装置100A的电话终端的周围声音,并作为终端周围信号QS输出给扩频特性调整部102A。集音部106能够收集的频率范围大于拨打获取部103。换言之,集音部106输出宽带信号(终端周围信号QS),拨打获取部103输出窄带信号(拨打信号RS)。例如,如果拨打获取部103能够收集的频率上限为4kHz,则把集音部106能够收集的频率上限设为8kHz。其中,优选为集音部106的频率上限由扩频处理部101生成,且集音部106的频率上限与由接听发音部105输出的频率上限相同或在其之上。
第2实施方式的扩频特性调整部102A被输入了动作指示信息DI、接听信号TS、拨打信号RS和终端周围信号QS,扩频特性调整部102A根据这些信息生成表示是否要执行扩频动作的动作信息AI、和在执行扩频动作时用于规定高频带信号的特性的参数信息PA,并提供给扩频处理部101。
图5是表示第2实施方式的扩频特性调整部102A的具体结构示例的框图,对与第1实施方式的图2相同、对应的部分,标注相同、对应的标号进行表示。
在图5中,具有窄带信号特性推测器121、宽带信号特性推测器122、宽带特性推测器123、接听信号判定器124、参数调整器125和参数操作器115。参数操作器115与第1实施方式相同,所以省略说明。
窄带信号特性推测器121推测拨打信号RS的信号特性,并作为拨打信号特性信息RL输出。作为窄带信号特性推测器121,例如只要能够适用公知的LPC分析器而进行动作即可。在此,使用拨打信号RS和参数信息PA中的LPC合成时的滤波器系数,生成拨打信号RS的LPC系数CR0,并使用拨打信号RS、参数信息PA中的LPC合成时的滤波器系数、和宽带码本,生成相当于宽带的LPC系数CR1。并且,窄带信号特性推测器121计算对拨打信号RS的平方和进行时间平均后的拨打信号RS的信号功率RP,该计算结果也作为拨打信号特性信息RL的一个要素输出。
宽带信号特性推测器122推测终端周围信号QS的信号特性,并作为终端周围特性信息QL输出。如果窄带信号特性推测器121进行LPC分析,则宽带信号特性推测器122进行与窄带信号特性推测器121相同的LPC分析,但此时不使用宽带码本进行分析。其中,使由窄带信号特性推测器121得到的拨打信号特性信息RL中包含的LPC系数CR0、CR1、和由宽带信号特性推测器122得到的终端周围特性信息QL中包含的LPC系数CQ的次数相同。例如,能够适用10次,但不限于此。
在上述说明中,把由窄带信号特性推测器121和宽带信号特性推测器122推测的信号特性设为LPC系数,但也可以根据扩频处理部101中使用的参数,使用其他特性。例如,通过使用公知的FFT法等求出特定的频率成分,也能够把推测的信号特性设为频率特性。
宽带特性推测器123根据拨打信号特性信息RL和参数信息PA,推测扩频时的特性,并将推测结果与基于终端周围特性信息QL的信号特性进行比较。即,宽带特性推测器123比较由拨打信号特性信息RL、参数信息PA得到的LPC系数,把差分校正值存储为是否判定信息JI。其中,所说差分校正值,指校正相应推测结果与基于终端周围特性信息QL的信号特性的差分的值。在第2实施方式中,设为双方的LPC系数的各个次数的差分中最小的值。但是,不限于此,也可以由设计者任意设定,以便能够获取合适的信号特性的特性值。例如,可以设为LPC系数的各个次数的差分值、LPC系数的各个次数的差分平均、向这些数值乘以任意的转换系数得到的值。并且,也可以不采用LPC系数的差分关系,而把使由窄带信号特性推测器121得到的LPC系数CR1成为由宽带信号特性推测器122得到的LPC系数CQ的高频带码本的差分,作为差分信息。
接听信号判定器124计算接听信号TS的信号功率TP,并作为接听信号特性信息SL输出。
参数调整器125按照后面所述计算调整系数,并与LPC系数的差分校正值相乘,然后作为用于更新LPC系数的参数的更新指示信息EP输出。上述的调整系数利用是否判定信息JI中包含的信号功率PR与接听信号特性信息SL中包含的信号功率TP之比TP/RP表示。
参数操作器115根据来自参数调整器125的更新指示信息EP,更新参数信息PA中的LPC系数。第2实施方式的参数操作器115不存储许多参数信息,而存储每次更新后的参数信息。
(B-2)第2实施方式的动作
下面,说明第2实施方式的扩频装置100A的扩频时的动作。
在第2实施方式中,接听信号TS提供给扩频处理部101时,通过扩频形成包含高频带信号的扩频信号ES,提供给接听发音部105,通过发音来输出。在形成扩频信号ES时,根据由扩频特性调整部102A提供的参数信息PA进行扩频。
电话终端的周围声音被集音部106捕捉到,获得频带比拨打获取部103输出的拨打信号RS宽的信号即终端周围信号QS,并提供给扩频特性调整部102A。还将拨打信号RS和接听信号TS提供给扩频特性调整部102A。
在扩频特性调整部102A中,利用参数信息PA形成拨打信号RS的扩频信号,获得该扩频信号与终端周围信号QS之间的信号特性(在第2实施方式中指LPC系数)的差分校正值,根据拨打信号RS与接听信号TS的功率之比,调整该差分校正值,根据该调整后的差分校正值,修正参数信息PA。在扩频特性调整部102A的内部,按照下面所述进行动作。
由窄带信号特性推测器121推测拨打信号RS的信号特性,并作为拨打信号特性信息RL输出。此时,还计算拨打信号RS的功率RP。并且,由宽带信号特性推测器122推测终端周围信号QS的信号特性,并作为终端周围特性信息QL输出。
在宽带特性推测器123中,根据拨打信号特性信息RL和参数信息PA,推测拨打信号RS的扩频时的特性,将该推测结果与基于终端周围特性信息QL的信号特性进行比较。该比较的结果,计算差分校正值,该差分校正值被存储为是否判定信息JI。并且,是否判定信息JI中也包含拨打信号RS的功率RP。但是,是否判定信息JI有时也可以把调整设为“否”。该情况时,例如,可以把LPC系数的CR1、CQ(或CR1、CQ)转换为公知的LSP系数时的低次(例如,如果总体次数为10次,则设为1~5次)的频率差超过预先设定的频率(例如100Hz)时设为“否”,不执行调整。该情况时,可以对是否判定信息JI输出与第1实施方式相同的没有意义的判定对象信号JS(例如全部为0)。在是高频带码本的差分时,同样,也可以使是否判定信息JI表示调整的“否”。
由接听信号判定器124计算接听信号TS的信号功率TP,并提供给参数调整器125。
在参数调整器125中,将拨打信号功率RP与接听信号功率TP之比作为调整系数,与拨打信号RS的扩频时的推测特性和基于终端周围特性信息QL的信号特性的差分校正值相乘,根据该相乘结果,更新参数信息PA。在第2实施方式中,始终计算调整系数来更新参数系数PA,但也可以按照某一定间隔(例如10秒间隔)来更新,还可以只更新固定的次数(例如在通话开始时更新1次)。
(B-3)第2实施方式的效果
根据第2实施方式,使用拨打信号推测扩频信号的宽带特性,根据该推测结果与从和拨打信号相同的位置得到的宽带信号的差分校正值,能够自动校正扩频信号的特性。结果,能够与使用者等的操作无关地提高发出扩频信号时的语音质量。
(C)其他实施方式
在上述各个实施方式的说明中也涉及了各种变形实施方式,但还可以列举以下示例的变形实施方式。
图6是表示针对第2实施方式的变形实施方式的结构的框图。在变形实施方式的扩频装置100B中,省略了拨打获取部103,通话转换部107根据从集音部106输出的宽带的终端周围信号QS,对高频带进行滤波,由此形成拨打信号RS。其他与第2实施方式相同。
在第1实施方式中,示出了根据噪声电平来调整高频带信号的抑制度的情况,但也可以根据噪声电平信息来设定应该扩展的频率范围。
使用作为基准的频率f1[Hz]、噪声电平信息NL中包含的噪声电平Ln[dBov]、和接听信号特性信息SL中包含的噪声电平信息所包含的噪声电平Ls[dBov],利用式(1)表示应该扩展的频率范围f[Hz]。
F=(Ln-Ls)×fa+f1        ......(1)
其中,fa表示根据电平差转换为频率的系数,例如可以适用12.5。并且,作为基准频率f1,例如可以适用6800Hz。另外,(Ln-Ls)的值在-40~40之间,在(Ln-Ls)的值超过40时替换为40,在(Ln-Ls)的值低于-40时替换为-40。但是,这些数值不限于此,可以由设计者根据环境任意设计。
在上述各个实施方式的说明中,说明了扩频处理部101具有宽带码本和LPC合成电路和高频带抑制滤波器的情况,但扩频处理部101不限于该方式,也可以采取不使用LPC合成的方法、分析并生成虚拟高频带信号来取代宽带码本的方法。并且,该情况时,参数也不限于高频带抑制滤波器的滤波形状和LPC合成时的滤波器系数,可以是其中任一方,也可以适用其他指标。
并且,虽然扩频装置期望根据扩频转换采样率(例如,从8kHz采样信号转换为16kHz采样信号),但不限于该采样频率。并且,也可以是不改变样频率,而只增大信号中包含的频率成分的范围的扩频处理。

Claims (7)

1.一种根据参数扩展输入语音信号的频带的扩频装置,其特征在于,
所述扩频装置具有:
特征判定单元,其对通过发音来输出扩频后的语音信号的周围声音进行收集,判定该周围声音的特征,并推测该特征的特征量;
调整量推测单元,其对所述特征的特征量和所述参数进行比较,并推测所述参数的调整量;
实际特征判定单元,其针对所述输入语音信号判定特征,并推测该特征的实际特征量;以及
调整量确定单元,其对所述特征量和所述实际特征量进行比较,确定实际调整量,更新所述参数。
2.一种根据参数扩展输入语音信号的频带的扩频装置,其特征在于,
所述扩频装置具有:
第1特征量推测单元,其对通过发音来输出扩频后的语音信号的周围声音进行收集,判定该周围声音的特征,并推测该特征的特征量;
第2特征量推测单元,其将所述周围声音转换为特性与扩频后的语音信号相同的信号,同时使用所述参数推测转换后的所述周围声音的特征量;
调整量推测单元,其推测使所述第2特征量推测单元的特征量接近所述第1特征量推测单元的特征量的所述参数,并推测所述参数的调整量;
实际特征判定单元,其针对所述输入语音信号判定特征,并推测该特征的实际特征量;以及
调整量确定单元,其对所述特征量和所述实际特征量进行比较,确定实际调整量,更新所述参数。
3.一种根据参数扩展输入语音信号的频带的扩频方法,其特征在于,
所述扩频方法执行如下处理:
由特征判定单元对通过发音来输出扩频后的语音信号的周围声音进行收集,判定该周围声音的特征,并推测该特征的特征量;
由调整量推测单元对所述特征的特征量和所述参数进行比较,并推测所述参数的调整量;
由实际特征判定单元针对所述输入语音信号判定特征,并推测该特征的实际特征量;以及
由调整量确定单元对所述特征量和所述实际特征量进行比较,确定实际调整量,更新所述参数。
4.一种根据参数扩展输入语音信号的频带的扩频方法,其特征在于,
所述扩频方法执行如下处理:
由第1特征量推测单元对通过发音来输出扩频后的语音信号的周围声音进行收集,判定该周围声音的特征,并推测该特征的特征量;
由第2特征量推测单元将所述周围声音转换为特性与扩频后的语音信号相同的信号,同时使用所述参数推测转换后的所述周围声音的特征量;
由调整量推测单元推测使所述第2特征量推测单元的特征量接近所述第1特征量推测单元的特征量的所述参数,并推测所述参数的调整量;
由实际特征判定单元针对所述输入语音信号判定特征,并推测该特征的实际特征量;以及
由调整量确定单元对所述特征量和所述实际特征量进行比较,确定实际调整量,更新所述参数。
5.一种根据参数扩展输入语音信号的频带的扩频程序,其特征在于,
所述扩频程序使计算机作为以下单元进行工作:
特征判定单元,其对通过发音来输出扩频后的语音信号的周围声音进行收集,判定该周围声音的特征,并推测该特征的特征量;
调整量推测单元,其对所述特征的特征量和所述参数进行比较,并推测所述参数的调整量;
实际特征判定单元,其针对所述输入语音信号判定特征,并推测该特征的实际特征量;以及
调整量确定单元,其对所述特征量和所述实际特征量进行比较,确定实际调整量,更新所述参数。
6.一种根据参数扩展输入语音信号的频带的扩频程序,其特征在于,
所述扩频程序使计算机作为以下单元进行工作:
第1特征量推测单元,其对通过发音来输出扩频后的语音信号的周围声音进行收集,判定该周围声音的特征,并推测该特征的特征量;
第2特征量推测单元,其将所述周围声音转换为特性与扩频后的语音信号相同的信号,同时使用所述参数推测转换后的所述周围声音的特征量;
调整量推测单元,其推测使所述第2特征量推测单元的特征量接近所述第1特征量推测单元的特征量的所述参数,并推测所述参数的调整量;
实际特征判定单元,其针对所述输入语音信号判定特征,并推测该特征的实际特征量;以及
调整量确定单元,其对所述特征量和所述实际特征量进行比较,确定实际调整量,更新所述参数。
7.一种电话终端,其特征在于,所述电话终端具有权利要求1或2所述的扩频装置。
CN200910224601XA 2009-03-30 2009-11-20 扩频装置、方法、程序及电话终端 Active CN101853659B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2009082690A JP5126145B2 (ja) 2009-03-30 2009-03-30 帯域拡張装置、方法及びプログラム、並びに、電話端末
JP2009-082690 2009-03-30

Publications (2)

Publication Number Publication Date
CN101853659A true CN101853659A (zh) 2010-10-06
CN101853659B CN101853659B (zh) 2012-05-30

Family

ID=42784262

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200910224601XA Active CN101853659B (zh) 2009-03-30 2009-11-20 扩频装置、方法、程序及电话终端

Country Status (3)

Country Link
US (1) US8484037B2 (zh)
JP (1) JP5126145B2 (zh)
CN (1) CN101853659B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10051368B2 (en) 2012-08-03 2018-08-14 Samsung Electronics Co., Ltd Mobile apparatus and control method thereof

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2360687A4 (en) * 2008-12-19 2012-07-11 Fujitsu Ltd VOICE BAND EXTENSION DEVICE AND VOICE BAND EXTENSION METHOD
JP5338962B2 (ja) * 2012-10-23 2013-11-13 沖電気工業株式会社 帯域拡張装置、方法及びプログラム、並びに、電話端末
US9258428B2 (en) 2012-12-18 2016-02-09 Cisco Technology, Inc. Audio bandwidth extension for conferencing

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4099879B2 (ja) * 1998-10-26 2008-06-11 ソニー株式会社 帯域幅拡張方法及び装置
US6539355B1 (en) * 1998-10-15 2003-03-25 Sony Corporation Signal band expanding method and apparatus and signal synthesis method and apparatus
JP4792613B2 (ja) * 1999-09-29 2011-10-12 ソニー株式会社 情報処理装置および方法、並びに記録媒体
SE522553C2 (sv) * 2001-04-23 2004-02-17 Ericsson Telefon Ab L M Bandbreddsutsträckning av akustiska signaler
BR0311601A (pt) * 2002-07-19 2005-02-22 Nec Corp Aparelho e método decodificador de áudio e programa para habilitar computador
JP4018571B2 (ja) * 2003-03-24 2007-12-05 富士通株式会社 音声強調装置
US8712768B2 (en) * 2004-05-25 2014-04-29 Nokia Corporation System and method for enhanced artificial bandwidth expansion
ATE429698T1 (de) * 2004-09-17 2009-05-15 Harman Becker Automotive Sys Bandbreitenerweiterung von bandbegrenzten tonsignalen
WO2006132054A1 (ja) * 2005-06-08 2006-12-14 Matsushita Electric Industrial Co., Ltd. オーディオ信号の帯域を拡張するための装置及び方法
US8311840B2 (en) * 2005-06-28 2012-11-13 Qnx Software Systems Limited Frequency extension of harmonic signals
EP1772855B1 (en) * 2005-10-07 2013-09-18 Nuance Communications, Inc. Method for extending the spectral bandwidth of a speech signal
US7546237B2 (en) * 2005-12-23 2009-06-09 Qnx Software Systems (Wavemakers), Inc. Bandwidth extension of narrowband speech
EP1947644B1 (en) * 2007-01-18 2019-06-19 Nuance Communications, Inc. Method and apparatus for providing an acoustic signal with extended band-width
JP2008197247A (ja) * 2007-02-09 2008-08-28 Yamaha Corp 音声処理装置
US7912729B2 (en) * 2007-02-23 2011-03-22 Qnx Software Systems Co. High-frequency bandwidth extension in the time domain

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10051368B2 (en) 2012-08-03 2018-08-14 Samsung Electronics Co., Ltd Mobile apparatus and control method thereof

Also Published As

Publication number Publication date
US20100246803A1 (en) 2010-09-30
CN101853659B (zh) 2012-05-30
JP5126145B2 (ja) 2013-01-23
US8484037B2 (en) 2013-07-09
JP2010237288A (ja) 2010-10-21

Similar Documents

Publication Publication Date Title
EP2396958B1 (en) Controlling an adaptation of a behavior of an audio device to a current acoustic environmental condition
RU2585987C2 (ru) Устройство и способ обработки речевого/аудио сигнала
US7366663B2 (en) Measuring a talking quality of a telephone link in a telecommunications network
US8107657B2 (en) Hearing aid and a method for enhancing speech intelligibility
CN1750124B (zh) 带限音频信号的带宽扩展
JP4809454B2 (ja) 発話推定による回路起動方法及び回路起動装置
CN105979197B (zh) 基于啸叫音自动识别的远程会议控制方法及装置
CN102572646B (zh) 一种在耳机听音乐状态下的消噪方法及设备
EP1887831A2 (en) Method, apparatus and program for estimating the direction of a sound source
EP2624254A1 (en) Audio processing device and audio processing method for de-reverberation
US20090265169A1 (en) Techniques for Comfort Noise Generation in a Communication System
SG173064A1 (en) Hearing aid and a method of detecting and attenuating transients
AU3336101A (en) Time-domain noise suppression
JPH08506434A (ja) 通信システムにおける伝送ノイズ低減
JP2002237785A (ja) 人間の聴覚補償によりsidフレームを検出する方法
CN101853659B (zh) 扩频装置、方法、程序及电话终端
RU2411595C2 (ru) Улучшение разборчивости речи в мобильном коммуникационном устройстве путем управления работой вибратора в зависимости от фонового шума
CN100499694C (zh) 测试语音质量的方法及装置
CN1332374C (zh) 控制用来传送语音的信号中可能有害的信号的方法与系统
Möller et al. Telephone speech quality prediction: towards network planning and monitoring models for modern network scenarios
JP2016038513A (ja) 音声切替装置、音声切替方法及び音声切替用コンピュータプログラム
KR20060119729A (ko) 잡음 레벨 추정 방법 및 그 장치
CN109040473B (zh) 终端音量调节方法、系统和手机
JP6197367B2 (ja) 通話装置及びマスキング音生成プログラム
US20210099797A1 (en) Echo suppression device, echo suppression method, and echo suppression program

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant