JP2010217543A - 音処理装置およびプログラム - Google Patents

音処理装置およびプログラム Download PDF

Info

Publication number
JP2010217543A
JP2010217543A JP2009064621A JP2009064621A JP2010217543A JP 2010217543 A JP2010217543 A JP 2010217543A JP 2009064621 A JP2009064621 A JP 2009064621A JP 2009064621 A JP2009064621 A JP 2009064621A JP 2010217543 A JP2010217543 A JP 2010217543A
Authority
JP
Japan
Prior art keywords
component
frequency
unit
acoustic signal
local peak
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2009064621A
Other languages
English (en)
Other versions
JP5387076B2 (ja
Inventor
Yasuo Yoshioka
靖雄 吉岡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yamaha Corp
Original Assignee
Yamaha Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yamaha Corp filed Critical Yamaha Corp
Priority to JP2009064621A priority Critical patent/JP5387076B2/ja
Publication of JP2010217543A publication Critical patent/JP2010217543A/ja
Application granted granted Critical
Publication of JP5387076B2 publication Critical patent/JP5387076B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

【課題】原音の調波構造を有効に維持したまま高域成分や低域成分を補充または補強する。
【解決手段】ピッチ検出部36は、音響信号VINのピッチF0を検出する。成分区分部44は、音響信号VINの周波数スペクトルSAを局所的ピークPQ毎に単位成分Qに区分する。成分付加部62は、
ピッチ検出部36が検出したピッチF0の整数倍の周波数fRに局所的ピークPRが位置する付加成分Rを単位成分Qから生成して周波数スペクトルSAに付加する。振幅調整部642は付加成分Rの振幅を調整し、位相調整部644は付加成分Rの位相を調整する。
【選択図】図1

Description

本発明は、音声や楽音などの音響を表す音響信号を処理する技術に関する。
電話網などの通信網による伝送時やCDなどの記録媒体に対する収録時に帯域が制限された音響信号について高域成分や低域成分を補充(補完)する技術が従来から提案されている。例えば特許文献1には、オーバーサンプリング後の音響信号から非線形回路およびハイパスフィルタで生成した高域成分を音響信号に混合する技術が開示されている。
特開2003−15695号公報
しかし、特許文献1の技術のもとで生成される高域成分と原音の音響信号とでは調波構造(倍音構造)が相違するから、原音の特性を維持したまま高域成分や低域成分を補充することは困難である。以上の事情に鑑みて、本発明は、原音の調波構造を有効に維持したまま高域成分や低域成分を補充または補強することを目的とする。
以上の課題を解決するために、本発明に係る音処理装置は、音響信号のピッチを検出するピッチ検出手段と、音響信号の周波数スペクトルを局所的ピーク毎に単位成分に区分する成分区分手段と、ピッチ検出手段が検出したピッチの整数倍の周波数に局所的ピークが位置する付加成分を単位成分から生成して周波数スペクトルに付加する成分付加手段とを具備する。例えば、音響信号が所定の制限帯域に制限されている場合、成分付加手段は、制限帯域の高域側および低域側の少なくとも一方に付加成分を付加する。
以上の構成においては、音響信号のピッチの整数倍の周波数に局所的ピークが位置する付加成分が音響信号の周波数スペクトルに付加されるから、音響信号の調波構造を有効に維持しながら音響信号の特定の成分(典型的には高域成分や低域成分)を補充(補完)または補強(強調)することが可能である。また、付加成分は、音響信号の周波数スペクトルを局所的ピーク毎に区分した単位成分を利用して生成されるから、音響信号とは無関係の成分(例えば正弦波成分)を音響信号の周波数スペクトルに付加する構成と比較して、音響信号の特性に類似する周波数スペクトルを付加成分の付加で生成できるという利点もある。
本発明の好適な態様において、成分付加手段は、ピッチ検出手段が検出したピッチの整数倍にあたる複数の周波数の各々に付加成分を付加する。以上の態様においては、音響信号の周波数スペクトルに複数の付加成分が付加されるから、音響信号の調波構造を維持するという効果は格別に顕著となる。
本発明の好適な態様に係る音処理装置は、局所的ピークの周波数が高い付加成分ほど局所的ピークの振幅が小さくなるように複数の付加成分の各々の振幅を調整する振幅調整手段を具備する。以上の態様においては、高域側の付加成分の局所的ピークほど小さい振幅に設定されるから、高域側ほど振幅が減少するという音響の一般的な傾向を反映した自然な周波数スペクトルを生成することが可能である。更に好適な態様において、振幅調整手段は、音響信号の周波数スペクトルの複数の局所的ピークのうち周波数が最高または最低の局所的ピークを通過する直線または曲線の線上に各付加成分の局所的ピークが位置するように、複数の付加成分の各々の振幅を調整する。以上の態様においては、音響信号の周波数スペクトルの局所的ピークを通過する包絡線の線上に各付加成分の局所的ピークが位置するから、単位成分が分布する帯域と付加成分が付加された帯域とにわたって包絡線を連続させることが可能である。
本発明の好適な態様に係る音処理装置は、単位成分の局所的ピークの周波数と当該単位成分に対応する付加成分の局所的ピークの周波数との差異(周波数軸上における単位成分の移動量)に応じて当該付加成分の位相を調整する位相調整手段を具備する。以上の態様においては、単位成分と付加成分との周波数の差異に応じて付加成分の位相が調整されるから、付加成分の局所的ピークにて位相が連続する自然な音響を生成することが可能である。
本発明の好適な態様に係る音処理装置は、音響信号が調波音および非調波音の何れに該当するかを判定する判定手段を具備し、成分区分手段は、調波音の周波数スペクトルについては局所的ピーク毎に単位成分を特定し、非調波音の周波数スペクトルについては所定の帯域内の非調波成分を特定し、成分付加手段は、調波音の周波数スペクトルには、音響信号のピッチの整数倍の周波数に局所的ピークが位置する付加成分を単位成分から生成して付加し、非調波音の周波数スペクトルには非調波成分を付加する。以上の態様においては、音響信号が調波音と非調波音とに判別され、非調波音については音響信号の周波数スペクトルの調波構造(局所的ピーク)を前提としない方法で特定された非調波成分が音響信号の周波数スペクトルに付加されるから、音響信号に調波音の区間と非調波音の区間とが混在する場合であっても適切に処理できるという利点がある。
また、以上の各態様に係る音処理装置は、音響信号の処理に専用されるDSP(Digital Signal Processor)などのハードウェア(電子回路)によって実現されるほか、CPU(Central Processing Unit)などの汎用の演算処理装置とプログラムとの協働によっても実現される。本発明に係るプログラムは、音響信号のピッチを検出するピッチ検出処理と、音響信号の周波数スペクトルを局所的ピーク毎に単位成分に区分する成分区分処理と、ピッチ検出処理出検出したピッチの整数倍の周波数に局所的ピークが位置する付加成分を単位成分から生成して周波数スペクトルに付加する成分付加処理とをコンピュータに実行させる。以上のプログラムによれば、本発明に係る音処理装置と同様の作用および効果が奏される。本発明のプログラムは、コンピュータが読取可能な記録媒体に格納された形態で利用者に提供されてコンピュータにインストールされるほか、通信網を介した配信の形態でサーバ装置から提供されてコンピュータにインストールされる。
本発明の第1実施形態に係る音処理装置のブロック図である。 音処理装置の動作を説明するための概念図である。 振幅調整部の動作を説明するための概念図である。 位相調整部の動作を説明するための概念図である。 本発明の第2実施形態に係る音処理装置のブロック図である。 第2実施形態の動作のフローチャートである。 第2実施形態の動作を説明するための概念図である。
<A:第1実施形態>
図1は、本発明の第1実施形態に係る音処理装置100Aのブロック図である。図1に示すように、音処理装置100Aには信号供給装置12と放音機器14とが接続される。信号供給装置12は、音声や楽音などの音響の時間波形を表す音響信号VINを音処理装置100Aに供給する。例えば、記録媒体(例えば光ディスク)から音響信号VINを取得する再生装置や、電話網などの通信網から音響信号VINを受信する通信装置(電話機)が、信号供給装置12として採用される。
音響信号VINの帯域は所定の範囲に制限(帯域制限)されている。図2の部分(A)には原音(音響信号VINの生成前)の周波数スペクトルS0が例示され、図2の部分(B)には音響信号VINの周波数スペクトルSAが例示されている。図2の部分(A)に示すように、原音のうち周波数fa_Lをを下回る成分と周波数fa_Hを上回る成分とが抑制または除去されたうえで音響信号VINが生成される。すなわち、音響信号VINの周波数スペクトルSAが分布する帯域は、周波数fa_Lから周波数fa_Hまでの帯域(以下「制限帯域」という)Baに制限される。具体的には、信号供給装置12が再生装置である場合、音響信号VINの制限帯域Baは例えば0Hzから22.05kHzまでの範囲に制限され、信号供給装置12が通信装置である場合、音響信号VINの制限帯域Baは、例えば300Hzから3500Hzまでの範囲に制限される。
音処理装置100Aは、制限帯域Baの外側の成分(低域成分および高域成分)を音響信号VINに付加(補充)することで、制限帯域Baよりも広い帯域(以下「拡張帯域」という)Bbに分布する音響信号VOUTを生成する装置(帯域拡張装置)である。図2の部分(C)に示すように、帯域Bbは、周波数fb_Lから周波数fb_Hにわたる周波数帯域である。周波数fb_Lは制限帯域Baの下限の周波数fa_Lを下回り、周波数fb_Hは制限帯域Baの上限の周波数fa_Hを上回る。音処理装置100Aが生成した音響信号VOUTは、放音機器14(例えばスピーカやヘッドホン)に供給されることで音波として再生される。
図1に示すように、音処理装置100Aは、演算処理装置22と記憶装置24とで構成されるコンピュータシステムである。記憶装置24は、演算処理装置22が実行するプログラム26や演算処理装置22が使用するデータを記憶する。半導体記録媒体や磁気記録媒体などの公知の記録媒体が記憶装置24として任意に採用される。
演算処理装置22は、記憶装置24に格納されたプログラム26を実行することで、音響信号VINから音響信号VOUTを生成するための複数の機能(オーバーサンプリング部32,周波数分析部34,ピッチ検出部36,ピーク検出部42,成分区分部44,成分付加部62,調整部64,逆変換部66)を実現する。なお、演算処理装置22の各要素を複数の集積回路に分散的に搭載した構成や、音響信号VINの処理に専用される電子回路(DSP)が各要素を実現する構成も採用される。
オーバーサンプリング部32は、周波数fs0でサンプリングされた音響信号VINを周波数fs1(fs1>fs0)でオーバーサンプリングする。周波数fs1は、音響信号VOUTに要求される帯域の上限値(図2の部分(C)の周波数fb_H)の2倍を上回る周波数に設定される。図1の周波数分析部34は、オーバーサンプリング部32による処理後の音響信号VINを時間軸上で区分した複数のフレームの各々について周波数スペクトルSA(振幅スペクトルおよび位相スペクトル)を生成する。周波数スペクトルSAの生成には、高速フーリエ変換などの公知の技術が任意に採用される。図2の部分(B)に例示したように、周波数スペクトルSAは制限帯域Ba内に分布する。
図1のピッチ検出部36は、周波数スペクトルSAを利用して音響信号VINのピッチ(基本周波数)F0をフレーム毎に検出する。ピッチF0の検出には公知の技術が任意に採用される。なお、ピッチ検出部36が音響信号VINからピッチF0を検出する構成(ピッチF0の検出に周波数スペクトルSAを利用しない構成)も採用され得る。
人間の音声や楽器の演奏音(楽音)は、調波構造(倍音構造)を持つ音響(以下「調波音」という)である。図2の部分(B)に示すように、調波音を表す音響信号VINの周波数スペクトルSA(複数の周波数ビンの集合)のうちピッチF0の整数倍にあたる各周波数(倍音の周波数)fQには、振幅が極大となる複数(M個)の局所的ピークPQが存在する。図1のピーク検出部42は、各フレームの周波数スペクトルSAから複数の局所的ピークPQを検出する。局所的ピークPQの検出には公知の技術が任意に採用される。例えば、相隣接する複数(例えば4個)の周波数ビンのうち振幅が最大のピークを局所的ピークPQとして特定する方法が好適である。
図1の成分区分部44は、周波数スペクトルSAを周波数軸上で局所的ピークPQ毎に複数(M個)の単位成分Qに区分する。図2の部分(B)に示すように、各単位成分Qは、ピーク検出部42が検出した局所的ピークPQの周波数fQと当該周波数fQの前後の周波数とを含む帯域内のスペクトル成分(振幅スペクトルおよび位相スペクトル)である。例えば、周波数軸上で隣合う2個の局所的ピークPQの中点を境界として単位成分Qが画定される。
図1の成分付加部62は、図2の部分(C)に示すように、単位成分Qから生成した複数の付加成分R(RL,RH)を音響信号VINの周波数スペクトルSAに付加することで各フレームの周波数スペクトルSBを生成する。付加成分Rは、単位成分Qを複製したスペクトル成分(振幅スペクトルおよび位相スペクトル)である。したがって、付加成分Rは、単位成分Qの局所的ピークPQに対応する局所的ピークPRを含む。
具体的には、成分付加部62は、図2の部分(C)に示すように、周波数スペクトルSAのうち制限帯域Baの高域側の帯域(周波数fa_Hから周波数fb_Hまでの帯域)BH内にmH個の付加成分RHを付加し、制限帯域Baの低域側の帯域(周波数fa_Lから周波数fb_Lまでの帯域)BL内にmL個の付加成分RLを付加する。したがって、周波数fb_Lから周波数fb_Hまでの拡張帯域Bbにわたってスペクトル成分(単位成分Qおよび付加成分R)が分布する周波数スペクトルSBが生成される。
付加成分R(RL,RH)は、周波数スペクトルSAの単位成分Qを周波数軸に沿って移動させた成分である。具体的には、成分付加部62は、図2の部分(C)に矢印で示すように、周波数スペクトルSAのM個の単位成分Qのうち高域側から計数してmH個(図2では3個)の単位成分Qを高域側に移動させたmH個の付加成分RHを生成し、M個の単位成分Qのうち低域側から計数してmL個(図2では2個)の単位成分Qを低域側に移動させたmL個の付加成分RLを生成する。
付加成分Rは、ピッチ検出部36が検出したピッチF0の整数倍(n倍)の各周波数fRに当該付加成分Rの局所的ピークPRが位置するように配置される(fR=n・F0)。具体的には、成分付加部62は、制限帯域Baの高域側の帯域BHのうちピッチF0の整数倍にあたるmH個の周波数fRの各々に局所的ピークPRが位置するようにmH個の付加成分RHを配置する。付加成分RHの個数mHは、帯域BH内に存在する周波数fRの個数に相当する。同様に、成分付加部62は、制限帯域Baの低域側の帯域BLのうちピッチF0の整数倍にあたるmL個の周波数fRの各々に局所的ピークPRが位置するようにmL個の付加成分RLを配置する。付加成分RLの個数mLは、帯域BL内に存在する周波数fRの個数に相当する。図2に示すように、付加成分RLがピッチF0の基音成分に相当する場合(n=1)もある。
図1の調整部64は、各付加成分Rを調整する。図1に示すように、調整部64は、振幅調整部642と位相調整部644とを含んで構成される。振幅調整部642は、各付加成分Rの振幅(振幅スペクトル)を調整する。具体的には、振幅調整部642は、局所的ピークPRの周波数fRが高い付加成分Rほど局所的ピークPRの振幅(強度)が低くなるように各付加成分Rの振幅を調整する。
図3は、振幅調整部642による処理を説明するための概念図である。図3には、振幅調整部642による処理前の付加成分Rの振幅スペクトルAM0が破線で図示され、振幅調整部642による処理後の付加成分Rの振幅スペクトルAM1が実線で図示されている。図2の部分(C)や図3に示すように、振幅調整部642は、包絡線E(EH,EL)の線上に各付加成分Rの局所的ピークPRが位置するように各付加成分Rの振幅を調整する。例えば、調整前の振幅スペクトルAM0の局所的ピークPRの振幅α0と、当該局所的ピークPRの周波数fRにおける直線E上の振幅(すなわち、調整後の局所的ピークPRの振幅)α1との差分(以下「振幅調整量」という)Δαを想定すると(Δα=α1−α0)、振幅調整部642は、調整前の付加成分Rの振幅スペクトルAM0における各周波数での振幅αに振幅調整量Δαを加算することで、当該周波数での調整後の振幅αNEWを算定する(αNEW=α+Δα)。
包絡線Eは、周波数の増加とともに数値(振幅)が減少するように選定された直線または曲線である。例えば、周波数が1オクターブだけ増加すると振幅が6dBだけ低下するように傾きを選定した直線が包絡線E(EH,EL)として好適である。図2の部分(C)に示すように、包絡線EHは、周波数スペクトルSAのM個の局所的ピークPQのうち周波数が最大の局所的ピークPQを通過するように設定される。したがって、単位成分Qが存在する制限帯域Ba内と付加成分Rが存在する帯域BH内とで包絡線(EH)を連続させる(ひいては聴感的に自然な音響を生成する)ことが可能である。同様に、包絡線ELは、M個の局所的ピークPQのうち周波数が最小の局所的ピークPQを通過するように設定される。したがって、帯域BL内と制限帯域Ba内とで包絡線(EL)を連続させることが可能である。
図1の位相調整部644は、付加成分Rの位相(位相スペクトル)を調整する。図4は、位相調整部644による処理を説明するための概念図である。図4には、位相調整部644による調整前の付加成分Rの位相スペクトル(すなわち、単位成分Qの位相スペクトル)PH0が破線で図示され、位相調整部644による調整後の付加成分Rの位相スペクトルPH1が実線で図示されている。図4に示すように、位相調整部644は、調整前の位相スペクトルPH0における各周波数での位相Ψに位相調整量ΔΨを加算することで位相スペクトルPH1の当該周波数での位相ΨNEWを算定する(ΨNEW=Ψ+ΔΨ)。
位相調整量ΔΨは、単位成分Qの局所的ピークPQの周波数fQと当該単位成分Qを移動した付加成分Rの局所的ピークPRの周波数fRとの差分(すなわち、周波数軸上における単位成分Qの移動量)に応じて設定される。具体的には、位相調整部644は、以下の数式(1)の演算で付加成分R毎に位相調整量ΔΨを算定する。なお、数式(1)の記号Δtは、フレームの周期(相前後するフレームの時間差)を意味する。
ΔΨ=2π(fR−fQ)Δt ……(1)
以上のように周波数fQと周波数fRとの差分(fR−fQ)に応じて位相調整量ΔΨを算定すれば、付加成分Rの局所的ピークPRの周波数にて位相を連続させることが可能である。
成分付加部62は、振幅調整部642および位相調整部644による調整後の付加成分Rを各周波数fRに付加した周波数スペクトルSBをフレーム毎に生成して順次に図1の逆変換部66に出力する。逆変換部66は、成分付加部62が生成した各フレームの周波数スペクトルSBを逆フーリエ変換で時間領域の信号に変換し、相前後する各フレームの変換後の信号を時間軸上で連結することで音響信号VOUTを生成する。
以上の形態においては、音響信号VINのピッチF0の整数倍の周波数fRに局所的ピークPRが位置する付加成分Rが音響信号VINの周波数スペクトルSAに付加されるから、音響信号VIN(原音)の調波構造を有効に維持しながら制限帯域Baを拡張帯域Bbに拡張することが可能である。
また、付加成分Rは、音響信号VINの周波数スペクトルSAを区分した単位成分Qを利用して生成されるから、音響信号VINとは無関係の成分(例えば正弦波成分)を音響信号VINの周波数スペクトルSAに付加する構成と比較して、音響信号VINと音響信号VOUTとの特性の乖離を抑制する(音響信号VINの特性が維持された音響信号VOUTを生成する)ことが可能である。更に、所定の帯域幅にわたって分布する単位成分Qが処理の単位とされるから、局所的ピークPQに加えて局所的ピークPQの周囲の帯域の成分も付加成分Rに反映される。音響信号VINの特徴(例えば声質)は局所的ピークPQの周囲の帯域の成分に現れる場合がある。したがって、音響信号VINの特徴を忠実に維持した音響信号VOUTを生成できるという格別の効果も実現される。
<B:第2実施形態>
第1実施形態では音響信号VINが調波音(調波構造を持つ音響)を表す場合を想定したが、実際の音響信号VINには、調波音の区間と非調波音の区間とが混在し得る。本発明の第2実施形態は、調波音および非調波音の双方について制限帯域Baを適切に拡張するための形態である。なお、以下の各態様において作用や機能が第1実施形態と同等である要素については、以上と同じ符号を付して各々の詳細な説明を適宜に省略する。
図5は、第2実施形態に係る音処理装置100Bのブロック図である。音処理装置100Bは、第1実施形態の音処理装置100Aに判定部72を追加した構成である。判定部72は、音響信号VINが調波音および非調波音の何れに該当するかをフレーム毎に判定する。非調波音は、明確な調波構造を持たない音響(例えば、空調設備の動作音や人混み内での雑踏音などの暗騒音)である。判定部72による判定の方法は任意である。例えば、判定部72は、ピッチ検出部36がピッチF0を検出できたフレームを調波音と判定し、有意なピッチF0が検出されないフレーム(すなわち、調波構造の基音が明確に特定できないフレーム)を非調波音と判定する。なお、判定部72による判定の周期は任意である。
図6は、音処理装置100Bによる処理(判定部72による処理に関連する部分)のフローチャートである。図6の処理はフレーム毎に順次に実行される。図6の処理が開始すると、判定部72は、今回のフレームの音響信号VINが調波音および非調波音の何れに該当するかを判定する(ステップS1)。
音響信号VINが調波音に該当すると判定部72が判定した場合には、第1実施形態と同様の動作で拡張帯域Bbの音響信号VOUTが生成される。すなわち、ピーク検出部42による局所的ピークPQの検出後に成分区分部44が周波数スペクトルSAを局所的ピークPQ毎に単位成分Qに区分し(ステップS2)、単位成分Qに応じた付加成分Rを調整部64による処理後に周波数スペクトルSAに付加することで成分付加部62が周波数スペクトルSBを生成する(ステップS3)。したがって、第1実施形態と同様の効果が実現される。
他方、音響信号VINが非調波音に該当すると判定部72が判定した場合には、調波音とは異なる処理で周波数スペクトルSBが生成される(ステップS4,ステップS5)。図7は、非調波音について周波数スペクトルSBを生成する方法の概念図である。図7の部分(A)には、制限帯域Baに制限された音響信号VINの周波数スペクトルSAが図示され、図7の部分(B)には、ステップS5で生成される周波数スペクトルSBが図示されている。
図7の部分(A)に示すように、成分区分部44は、周波数スペクトルSAのうち所定の帯域幅にわたるスペクトル成分(周波数スペクトルSAの部分または全部)を非調波成分U(UL,UH)として特定する(ステップS4)。例えば、成分区分部44は、周波数スペクトルSAのうち制限帯域Baの上限の周波数fa_Hから低域側にわたる所定の帯域幅wHのスペクトル成分を非調波成分UHとして特定し、周波数スペクトルSAのうち制限帯域Baの下限の周波数fa_Lから高域側わたる所定の帯域幅wLのスペクトル成分を非調波成分ULとして特定する。
帯域幅wHや帯域幅wLの選定の方法は任意であるが、例えば、制限帯域Baの高域側に付加される帯域BHの帯域幅を非調波成分UHの帯域幅wHとする構成や、制限帯域Baの低域側に付加される帯域BLの帯域幅を非調波成分ULの帯域幅wLとする構成が好適である。図7の部分(A)から把握されるように非調波音の周波数スペクトルSAには局所的ピークPQが現れないから、非調波成分U(UL,UH)は周波数スペクトルSAの特徴点(例えば局所的ピークPQ)とは無関係に選定される。
図7の部分(B)に示すように、成分付加部62は、成分区分部44が特定した非調波成分U(UL,UH)を周波数スペクトルSAに付加することで、周波数fb_Lから周波数fb_Hまでの拡張帯域Bbに分布する周波数スペクトルSBを生成する(ステップS5)。すなわち、成分付加部62は、非調波成分UHを制限帯域Baの高域側(帯域BH)に付加し、非調波成分ULを制限帯域Baの低域側(帯域BL)に付加する。また、振幅調整部642は、非調波成分UHの振幅を包絡線EHに沿うように調整し、非調波成分ULの振幅を包絡線ELに沿うように調整する。包絡線EHは、周波数の増加とともに数値(振幅)が減少するように選定された直線または曲線であり、包絡線ELは、周波数の増加とともに数値が増加するように選定された直線または曲線である。非調波音は調波構造を持たないから、非調波音について位相調整部644による位相の調整は実行されない。
以上の形態においては、音響信号VINが調波音と非調波音とに判別され、非調波音については調波構造(局所的ピークPQや単位成分Q)を前提としない方法で周波数スペクトルSBが生成される。したがって、音響信号VINに調波音の区間と非調波音の区間とが混在する場合であっても、拡張帯域Bbにわたる周波数スペクトルSBを双方の区間について適切に生成できるという利点がある。
<C:変形例>
以上に例示した各形態は様々に変形され得る。変形の具体的な態様を以下に例示する。なお、以下の例示から任意に選択された2以上の態様は適宜に併合され得る。
(1)変形例1
付加成分Rの生成に利用される単位成分Qの選定の方法は任意である。例えば、付加成分Rが配置される周波数fRの1/k倍(kは2以上の自然数)の周波数の近傍に局所的ピークPQが位置する単位成分Qを当該付加成分Rの生成に利用する構成や、制限帯域Ba内の低域側から選択された単位成分Qを高域側の付加成分RHの生成に利用する構成(あるいは制限帯域Ba内の高域側の単位成分Qを付加成分RLの生成に利用する構成)も採用される。また、1個の単位成分Qから1個の付加成分Rが生成される構成は本発明において必須ではない。例えば、1個の単位成分Qを複製することで複数の付加成分Rを生成する構成や、複数の単位成分Qを混合することで1個の付加成分Rを生成する構成も採用される。
(2)変形例2
振幅調整部642や位相調整部644は適宜に省略される。すなわち、単位成分Qを複製しただけの付加成分RをピッチF0の整数倍の周波数fRに配置することで周波数スペクトルSBを生成する構成も本発明の範囲に含まれる。また、単位成分Qから付加成分Rを生成する方法は任意である。例えば、単位成分Qに所定の処理(例えばフィルタ処理)を実行することで付加成分Rを生成する構成も採用される。
(3)変形例3
以上の各形態においては複数の付加成分RHと複数の付加成分RLとを周波数スペクトルSAに付加したが、制限帯域Baの高域側の帯域BH内に1個の付加成分RHのみを付加する構成や、低域側の帯域BL内に1個の付加成分RLのみを付加する構成も採用される。また、帯域BHおよび帯域BLの一方のみに付加成分Rを付加する構成も本発明の範囲に含まれる。
(4)変形例4
付加成分Rの付加の方法は適宜に変更される。例えば、周波数スペクトルSAのうち制限帯域Baの外側に微小なスペクトル成分が残存している場合に、当該スペクトル成分を除去ないし抑圧したうえで周波数fRの近傍に付加成分Rを付加する構成も採用される。
(5)変形例5
包絡線E(EH,EL)を設定する方法は任意である。例えば、音響信号VINの制限帯域Ba内の包絡線を拡張(高帯域化)することで包絡線Eが設定され得る。制限帯域Ba内の包絡線(狭帯域スペクトル包絡)の広帯域化には線形写像が好適に利用される。包絡線の線形写像については、例えば、中藤良久,津島峰生,則松武志,“スペクトル線形写像による帯域制限音声の広帯域化”,電子情報通信学会論文誌 D-II Vol.J83-D-II No.11 p.2246-2254,2000年11月に開示された方法を利用できる。
(6)変形例6
周波数分析部34や逆変換部66は適宜に省略される。例えば、記憶装置24に格納された周波数スペクトルSAや通信網から受信した周波数スペクトルSAから拡張帯域Bbの周波数スペクトルSBを生成する構成や、成分付加部62が生成した周波数スペクトルSBを音処理装置100とは別個の装置の逆変換部66に提供することで音響信号VOUTを生成する構成も採用される。
(7)変形例7
以上の各形態においては、制限帯域Baに制限された音響信号VINを音処理装置100(100A,100B)で処理したが、音響信号VINの帯域が制限されていること(あるいは、音処理装置100による処理で帯域が拡大すること)は本発明において必須ではない。例えば、帯域が制限されていない音響信号VINのうち低域側の帯域BLや広域側の帯域BHに付加成分Rを付加することで、音響信号VINのうちの低域側や広域側の成分を強調することが可能である。すなわち、音響信号VINの所定の帯域内の成分を補強する装置(エンハンサ,エキサイタ)としても本発明の音処理装置を利用できる。
100A,100B……音処理装置、12……信号供給装置、14……放音機器、22……演算処理装置、24……記憶装置、32……オーバーサンプリング部、34……周波数分析部、36……ピッチ検出部、42……ピーク検出部、44……成分区分部、62……成分付加部、64……調整部、642……振幅調整部、644……位相調整部、66……逆変換部、72……判定部。

Claims (5)

  1. 音響信号のピッチを検出するピッチ検出手段と、
    前記音響信号の周波数スペクトルを局所的ピーク毎に単位成分に区分する成分区分手段と、
    前記ピッチ検出手段が検出したピッチの整数倍の周波数に局所的ピークが位置する付加成分を前記単位成分から生成して前記周波数スペクトルに付加する成分付加手段と
    を具備する音処理装置。
  2. 前記成分付加手段は、前記ピッチ検出手段が検出したピッチの整数倍にあたる複数の周波数の各々に付加成分を付加し、
    局所的ピークの周波数が高い付加成分ほど局所的ピークの振幅が小さくなるように、複数の付加成分の各々の振幅を調整する振幅調整手段
    を具備する請求項1の音処理装置。
  3. 前記単位成分の局所的ピークの周波数と当該単位成分に対応する付加成分の局所的ピークの周波数との差異に応じて当該付加成分の位相を調整する位相調整手段
    を具備する請求項1または請求項2の音処理装置。
  4. 前記音響信号が調波音および非調波音の何れに該当するかを判定する判定手段を具備し、
    前記成分区分手段は、調波音の周波数スペクトルについては局所的ピーク毎に単位成分を特定し、非調波音の周波数スペクトルについては所定の帯域内の非調波成分を特定し、
    前記成分付加手段は、調波音の周波数スペクトルには、前記音響信号のピッチの整数倍の周波数に局所的ピークが位置する付加成分を前記単位成分から生成して付加し、前記非調波音の周波数スペクトルには前記非調波成分を付加する
    請求項1から請求項3の何れかの音処理装置。
  5. 音響信号のピッチを検出するピッチ検出処理と、
    前記音響信号の周波数スペクトルを局所的ピーク毎に単位成分に区分する成分区分処理と、
    前記ピッチ検出処理出検出したピッチの整数倍の周波数に局所的ピークが位置する付加成分を前記単位成分から生成して前記周波数スペクトルに付加する成分付加処理と
    をコンピュータに実行させるプログラム。
JP2009064621A 2009-03-17 2009-03-17 音処理装置およびプログラム Expired - Fee Related JP5387076B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009064621A JP5387076B2 (ja) 2009-03-17 2009-03-17 音処理装置およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009064621A JP5387076B2 (ja) 2009-03-17 2009-03-17 音処理装置およびプログラム

Publications (2)

Publication Number Publication Date
JP2010217543A true JP2010217543A (ja) 2010-09-30
JP5387076B2 JP5387076B2 (ja) 2014-01-15

Family

ID=42976470

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009064621A Expired - Fee Related JP5387076B2 (ja) 2009-03-17 2009-03-17 音処理装置およびプログラム

Country Status (1)

Country Link
JP (1) JP5387076B2 (ja)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003108197A (ja) * 2001-07-13 2003-04-11 Matsushita Electric Ind Co Ltd オーディオ信号復号化装置およびオーディオ信号符号化装置
JP2003255998A (ja) * 2002-02-27 2003-09-10 Yamaha Corp 歌唱合成方法と装置及び記録媒体
JP2004266358A (ja) * 2003-02-14 2004-09-24 Oki Electric Ind Co Ltd 帯域復元装置及び電話機
JP2005521907A (ja) * 2002-03-28 2005-07-21 ドルビー・ラボラトリーズ・ライセンシング・コーポレーション 不完全なスペクトルを持つオーディオ信号の周波数変換に基づくスペクトルの再構築

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003108197A (ja) * 2001-07-13 2003-04-11 Matsushita Electric Ind Co Ltd オーディオ信号復号化装置およびオーディオ信号符号化装置
JP2003255998A (ja) * 2002-02-27 2003-09-10 Yamaha Corp 歌唱合成方法と装置及び記録媒体
JP2005521907A (ja) * 2002-03-28 2005-07-21 ドルビー・ラボラトリーズ・ライセンシング・コーポレーション 不完全なスペクトルを持つオーディオ信号の周波数変換に基づくスペクトルの再構築
JP2004266358A (ja) * 2003-02-14 2004-09-24 Oki Electric Ind Co Ltd 帯域復元装置及び電話機

Also Published As

Publication number Publication date
JP5387076B2 (ja) 2014-01-15

Similar Documents

Publication Publication Date Title
JP4286510B2 (ja) 音響信号処理装置及びその方法
JP5336522B2 (ja) 瞬間的事象を有する音声信号の操作装置および操作方法
JP3861770B2 (ja) 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体
US8204239B2 (en) Audio processing method and audio processing apparatus
US8271292B2 (en) Signal bandwidth expanding apparatus
JP5098569B2 (ja) 帯域拡張再生装置
JP2012083790A (ja) 信号処理装置及び信号処理方法、プログラム及び記録媒体、並びに再生装置
JP2013520698A (ja) エンベロープ形状を使用してオーディオ信号を変更する装置及び方法
JP2009300707A (ja) 情報処理装置および方法、並びにプログラム
JP2006251375A (ja) 音声処理装置およびプログラム
WO2016021412A1 (ja) 符号化装置および方法、復号装置および方法、並びにプログラム
JP4760278B2 (ja) 補間装置、オーディオ再生装置、補間方法および補間プログラム
JP7105880B2 (ja) ビート音発生タイミング生成装置
JP2002215195A (ja) 音楽信号処理装置
JP2004198485A (ja) 音響符号化信号復号化装置及び音響符号化信号復号化プログラム
JP5034734B2 (ja) 音処理装置およびプログラム
JP5387076B2 (ja) 音処理装置およびプログラム
JP5609157B2 (ja) 係数設定装置および雑音抑圧装置
JP5397786B2 (ja) かぶり音除去装置
WO2020179472A1 (ja) 信号処理装置および方法、並びにプログラム
JP2002175099A (ja) 雑音抑制方法および雑音抑制装置
JP5103606B2 (ja) 信号処理装置
JP5163606B2 (ja) 音声分析合成装置、及びプログラム
JP4513556B2 (ja) 音声分析合成装置、及びプログラム
JP2017139592A (ja) 音響処理方法および音響処理装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20120120

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20121026

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20121106

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20121220

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130702

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130823

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130910

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130923

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees