JP6730580B2 - 帯域拡張装置および帯域拡張方法 - Google Patents

帯域拡張装置および帯域拡張方法 Download PDF

Info

Publication number
JP6730580B2
JP6730580B2 JP2016000947A JP2016000947A JP6730580B2 JP 6730580 B2 JP6730580 B2 JP 6730580B2 JP 2016000947 A JP2016000947 A JP 2016000947A JP 2016000947 A JP2016000947 A JP 2016000947A JP 6730580 B2 JP6730580 B2 JP 6730580B2
Authority
JP
Japan
Prior art keywords
signal
overtone
unit
harmonic
frequency
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2016000947A
Other languages
English (en)
Other versions
JP2017122792A (ja
Inventor
達也 小野田
達也 小野田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
JVCKenwood Corp
Original Assignee
JVCKenwood Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by JVCKenwood Corp filed Critical JVCKenwood Corp
Priority to JP2016000947A priority Critical patent/JP6730580B2/ja
Priority to US15/389,474 priority patent/US10068580B2/en
Publication of JP2017122792A publication Critical patent/JP2017122792A/ja
Application granted granted Critical
Publication of JP6730580B2 publication Critical patent/JP6730580B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/167Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/93Discriminating between voiced and unvoiced parts of speech signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • G10L19/265Pre-filtering, e.g. high frequency emphasis prior to encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
  • Circuit For Audible Band Transducer (AREA)

Description

本発明は、帯域拡張技術に関し、特に信号の帯域を拡張する帯域拡張装置および帯域拡張方法に関する。
アナログ無線などに代表される狭帯域音声信号、デジタル音声通信に代表される非可逆圧縮された音声信号に対して、音声の了解度の改善、音質向上、騒音に埋もれにくい音質を目的として、音声を出力する際に周波数帯域を拡張する技術が使用されることがある。周波数帯域を拡張するためには、例えば、音声信号をフーリエ変換して周波数領域スペクトルを生成するとともに、周波数領域スペクトルに基づいて高調波スペクトルを生成し、両者を重畳してからフーリエ逆変換がなされる(例えば、特許文献1参照)。
特開2012−208177号公報
周波数帯域を拡張するために、フーリエ変換およびフーリエ逆変換を使用すると、自然な音声の再現が可能になるものの、演算量が多くなるため消費電力も多くなる。無線装置等の通信装置、特にバッテリー駆動の携帯端末においては、周波数帯域の拡張が実行される場合、消費電力を少なくするため演算量が少ない方が望ましい。
本発明はこうした状況に鑑みてなされたものであり、その目的は、周波数帯域を拡張する場合の演算量の増加を抑制する技術を提供することである。
上記課題を解決するために、本発明のある態様の帯域拡張装置は、入力信号に対して所定のサンプリング周波数で1サンプル遅延させた信号との差分を演算して微分値とする微分処理部と、微分処理部において微分値とした信号と、入力信号とを乗算することによって、倍音の信号を生成する倍音演算部と、倍音演算部において生成した倍音の信号をフィルタリングするとともに、倍音演算部により生成される入力信号の周波数に基づいて定まる倍音の信号の振幅値を補完する高域通過フィルタ部と、高域通過フィルタ部においてフィルタリングした倍音の信号と、入力信号とを結合する結合部と、を備える。
本発明の別の態様は、帯域拡張方法である。この方法は、入力信号に対して所定のサンプリング周波数で1サンプル遅延させた信号との差分を演算して微分値とするステップと、微分処理を実行した信号と、入力信号とを乗算することによって、倍音の信号を生成するステップと、生成した倍音の信号をフィルタリングするとともに、倍音演算部により生成される入力信号の周波数に基づいて定まる倍音の信号の振幅値を補完するステップと、フィルタリングした倍音の信号と、入力信号とを結合するステップと、を備える。
なお、以上の構成要素の任意の組合せ、本発明の表現を方法、装置、システム、記録媒体、コンピュータプログラムなどの間で変換したものもまた、本発明の態様として有効である。
本発明によれば、周波数帯域を拡張する場合の演算量の増加を抑制できる。
本発明の実施例1に係る受信装置の構成を示す図である。 図2(a)−(d)は、図1の受信装置において処理される信号のスペクトルを示す図である。 本発明の実施例2に係る受信装置の構成を示す図である。 図3の利得制御部に記憶されるテーブルのデータ構造を示す図である。 本発明の実施例3に係る受信装置の構成を示す図である。
(実施例1)
本発明を具体的に説明する前に、まず概要を述べる。本発明の実施例1は、送信装置からの信号を受信し、受信した信号である音声信号を再生してスピーカから出力する受信装置に関する。特に、受信装置は、受信した信号である音声信号を入力信号として、入力信号に対して周波数帯域を拡張する帯域拡張機能を備える。前述のごとく、周波数帯域を拡張するための演算量の増加を抑制することが望まれる。これに加えて、周波数帯域の拡張において、次のことが望まれてもよい。1つ目は、原音声と、拡張された帯域との相関が高いことである。2つ目は、奇数高調波を重畳せず、偶数高調波のみを重畳することである。これは、一般的に、奇数高調波は耳障りになりやすいとされており、偶数高調波のみを重畳することによって不快感のない音質にするためである。
これに対応するために、本実施例に係る受信装置は、アップサンプリングした音声信号を微分するとともに、アップサンプリングした音声信号と微分結果とを乗算することによって、倍音信号を生成してからHPF(High−Pass Filter)を通過させる。また、受信装置は、HPFを通過させた倍音信号を音声信号に加算することによって、帯域を拡張する。このようにフーリエ変換が使用されないので、演算量の増加が抑制される。また、周波数シフトを使用しないので、原音声との相関が高くなる。さらに、倍音信号が生成されるので、奇数高調波が重畳されない。
図1は、本発明の実施例1に係る受信装置100の構成を示す。受信装置100は、受信部10、AD部12、検波部14、オーバサンプリングLPF部16、微分処理部20、倍音演算部22、HPF部24、調節部26、遅延部28、結合部30、スピーカ32を含む。ここで、オーバサンプリングLPF部16から結合部30は、帯域拡張部200に含まれる。
受信部10は、図示しない送信装置からの信号を受信する。ここでは、送信装置と受信装置100との間の音声通信を対象にしているので、受信した信号には、音声情報が含まれる。このような信号には公知の技術が使用されればよいので、ここでは説明を省略する。受信部10は、音声情報が含まれた信号(以下、「音声信号」という)をAD部12に出力する。
AD部12は、受信部10からの音声信号を入力する。当該音声信号はアナログ信号であり、AD部12は、音声信号に対してアナログ−デジタル変換を実行することによって、デジタル信号の音声信号(以下、これもまた「音声信号」という)を生成する。つまり、AD部12は、音声信号を第1のサンプリング周波数でサンプリングする。第1のサンプリング周波数は、例えば、8kHzに設定される。AD部12は、音声信号を検波部14に出力する。
検波部14は、AD部12からの音声信号を入力する。検波部14は、音声信号を検波する。検波には公知の技術が使用されればよいので、ここでは説明を省略する。検波部14は、検波した音声信号(以下、これもまた「音声信号」という)をオーバサンプリングLPF部16に出力する。図2(a)−(d)は、受信装置100において処理される信号のスペクトルを示す。図2(a)は、検波部14から出力される音声信号のスペクトルの一例を示す。横軸が周波数を示し、縦軸がレベルを示す。ここでは、説明を明りょうにするために、音声信号のスペクトルのうち、1kHz、3kHzの成分だけが示され、他の成分は省略される。図2(b)−(d)は後述し、図1に戻る。
オーバサンプリングLPF部16は、検波部14からの音声信号を入力する。前述のごとく、音声信号のサンプリング周波数は8kHzであるので、サンプリング定理より、4kHzまでの周波数成分を有した音声信号しか表すことができない。帯域を拡張するためには、サンプリング周波数を高くすることによって、帯域拡張成分を有した音声信号を表現できるようにする必要がある。そのため、オーバサンプリングLPF部16は、音声信号に対して、第1のサンプリング周波数よりも高速な第2のサンプリング周波数への変換を実行する。第2のサンプリング周波数は、例えば、16kHzに設定される。具体的に説明すると、オーバサンプリングLPF部16は、8kHzの音声信号の間に「0」値の信号を挿入してから、LPF(Low−Pass Filter)を通過させる。オーバサンプリングLPF部16は、第2のサンプリング周波数に変換した音声信号(以下、これもまた「音声信号」という)を微分処理部20、遅延部28に出力する。
微分処理部20は、オーバサンプリングLPF部16からの音声信号を入力する。微分処理部20は、音声信号に対して微分処理を実行する。具体的に説明すると、微分処理部20は、遅延器と減算器とを含み、遅延器が、音声信号を1サンプル分遅延させ、減算器が、音声信号と、1サンプル遅延させた音声信号との差分を演算する。差分結果が微分値である。なお、微分処理では、1サンプル間の差分を演算するので、低周波であれば値が小さく、高周波であれば値が大きくなるように、周波数特性が変化する。微分処理部20は、微分値を倍音演算部22に出力する。
倍音演算部22は、微分処理部20からの微分値と、オーバサンプリングLPF部16からの音声信号とを入力する。倍音演算部22は、微分値と音声信号とを乗算することによって、倍音の信号(以下、「倍音信号」という)を生成する。ここでは、倍音演算部22の処理をさらに具体的に説明する。倍音演算部22に入力される音声信号f(t)は次のように示される。
f(t)=A×sin(ωt) ・・・(1)
また、倍音演算部22における乗算は、次のように示される。
d(A×sin(ωt))/dt×A×sin(ωt)
=Aω×cos(ωt)×A×sin(ωt)
=Aω×cos(ωt)sin(ωt)
=Aω/2×sin(2ωt) ・・・(2)
倍音演算部22は、倍音信号をHPF部24に出力する。
図2(b)は、倍音演算部22から出力される倍音信号のスペクトルの一例であって、かつ図2(a)に示した音声信号から生成した倍音信号のスペクトルを示す。図示のごとく、図2(a)における1kHz、3kHzの成分が、2kHz、6kHzの成分として示される。また、式(2)におけるAω/2によって、図2(a)における1kHz、3kHzの成分の差よりも、図2(b)における2kHz、6kHzの成分の差が小さくなる。図1に戻る。
HPF部24は、倍音演算部22からの倍音信号を入力する。HPF部24は、倍音信号をフィルタリングすることによって、倍音信号の高周波成分を抽出するための高域通過フィルタである。ここで、HPF部24の遮断周波数は、第1のサンプリング周波数の1/2以下、例えば、4kHzに設定される。そのため、HPF部24は、倍音信号のうちの4kHzよりも高い周波数成分を抽出する。前述のごとく、倍音演算部22における乗算の結果、倍音信号の信号レベルは角周波数ωに依存するので、HPF部24は、この依存性を補完するための特性も有する。HPF部24は、フィルタリングした倍音信号(以下、これもまた「倍音信号」という)を調節部26に出力する。
調節部26は、HPF部24からの倍音信号を入力する。調節部26は、倍音信号のレベルを調節する。ここでは、例えば、式(2)における1/2を補正するための利得によって倍音信号のレベルが調節される。なお、利得は固定値であるとする。調節部26は、レベルを調節した倍音信号(以下、これもまた「倍音信号」という)を結合部30に出力する。図2(c)は、調節部26から出力される倍音信号のスペクトルの一例であって、かつ図2(b)に示した倍音信号に対して、HPF部24、調節部26での処理を実行した倍音信号のスペクトルを示す。図示のごとく、図2(b)における2kHzの成分がHPF部24によって減衰され、6kHzの成分が抽出される。図1に戻る。
遅延部28は、オーバサンプリングLPF部16からの音声信号を入力する。遅延部28は、微分処理部20、倍音演算部22、HPF部24、調節部26での処理期間だけ、音声信号を遅延させる。遅延部28は、遅延させた音声信号(以下、これもまた「音声信号」という)を結合部30に出力する。
結合部30は、調節部26からの倍音信号を入力するとともに、遅延部28からの音声信号を入力する。結合部30は、倍音信号と音声信号とを結合、つまり加算することによって、帯域を拡張した音声信号(以下、「帯域拡張信号」という)を生成する。図2(d)は、結合部30において生成される帯域拡張信号のスペクトルの一例であって、かつ図2(a)と図2(c)とを合成した帯域拡張信号のスペクトルを示す。図示のごとく、1kHz、3kHz、6kHzの成分が含まれる。図1に戻る。結合部30は、帯域拡張信号をスピーカ32に出力する。スピーカ32は、結合部30からの帯域拡張信号を入力する。スピーカ32は、帯域拡張信号をもとにした音声を出力する。
この構成は、ハードウエア的には、任意のコンピュータのCPU、メモリ、その他のLSIで実現でき、ソフトウエア的にはメモリにロードされたプログラムなどによって実現されるが、ここではそれらの連携によって実現される機能ブロックを描いている。したがって、これらの機能ブロックがハードウエアのみ、ソフトウエアのみ、またはそれらの組合せによっていろいろな形で実現できることは、当業者には理解されるところである。
本実施例によれば、音声信号に対して微分処理と乗算処理を実行して倍音信号を生成するので、周波数帯域を拡張する場合の演算量の増加を抑制できる。また、微分処理は、遅延と減算によって構成されるので、処理を簡易にできる。また、低処理負荷、低メモリ容量であるため、低価格向けモバイル機器にも容易に組み込むことができる。また、倍音信号をフィルタリングする際に、倍音信号の生成の際に生じた特性を補正するので、信号の品質を向上できる。また、フーリエ変換を実行しないので、少ない演算量で帯域を拡張できる。
また、倍音信号が生成されるので、奇数高調波を重畳させないことができる。また、奇数高調波が重畳されないので、音声を耳障りになりにくくできる。また、周波数シフトを使用しないので、原音声との相関を高くできる。また、原音声との相関が高くなるので、自然な音声を提供できる。また、HPFの遮断周波数を第1のサンプリング周波数の1/2以下に設定するので、音声信号の成分を除去できる。
(実施例2)
次に、実施例2を説明する。実施例2は、実施例1と同様に、音声信号に対して周波数帯域を拡張する受信装置に関し、受信装置は、音声信号の微分結果と音声信号とを乗算することによって倍音信号を生成する。ここで、音声信号が有声音である場合もあれば、無声音である場合もある。さらに、音声信号が有声音である場合であっても、母音であったり、子音であったりする。このような状況に応じて、倍音信号のレベルを調節する方が望ましい。そのため、これらの状況に応じて、調節部26における利得が制御される。ここでは、これまでとの差異を中心に説明する。
図3は、本発明の実施例2に係る受信装置100の構成を示す。受信装置100は、図1の構成に加えて、有声/無声検出部40、母音/子音検出部42、利得制御部44を含む。また、有声/無声検出部40から利得制御部44も、帯域拡張部200に含まれる。
有声/無声検出部40は、オーバサンプリングLPF部16からの音声信号を入力する。有声/無声検出部40は、音声信号が、有声音であるか、無声音であるかを検出する。具体的に説明すると、有声/無声検出部40は、音声信号を周波数領域に変換し、スペクトル解析を実行することによって、有声音であるか、無声音であるかを検出する。スペクトル解析には公知の技術が使用されればよいので、ここでは説明を省略する。有声/無声検出部40は、検出結果(以下、「有声/無声検出結果」という)を利得制御部44に出力する。
母音/子音検出部42は、オーバサンプリングLPF部16からの音声信号を入力する。母音/子音検出部42は、音声信号が、母音であるか、子音であるかを検出する。具体的に説明すると、母音/子音検出部42は、音声信号を周波数領域に変換し、スペクトル解析を実行することによって、母音であるか、子音であるかを検出する。スペクトル解析には公知の技術が使用されればよいので、ここでは説明を省略する。母音/子音検出部42は、検出結果(以下、「母音/子音検出結果」という)を利得制御部44に出力する。
利得制御部44は、有声/無声検出部40からの有声/無声検出結果を入力するとともに、母音/子音検出部42からの母音/子音検出結果を入力する。利得制御部44は、有声/無声検出結果および母音/子音検出結果とをもとに、調節部26において使用すべき利得を決定する。
図4は、利得制御部44に記憶されるテーブルのデータ構造を示す。図示のごとく、検出結果のそれぞれに利得が対応づけられている。有声/無声検出結果が有声音であり、かつ母音/子音検出結果が母音である場合、利得制御部44は、利得を「B」に決定する。一方、有声/無声検出結果が有声音であり、かつ母音/子音検出結果が子音である場合、利得制御部44は、利得を「A」に決定する。ここで、「A」は「B」よりも大きくされる。つまり、利得制御部44は、母音/子音検出結果が母音である場合の利得よりも、母音/子音検出結果が子音である場合の利得を大きくする。また、有声/無声検出結果が無声音である場合、利得制御部44は、利得を「0」に決定する。そのため、利得制御部44は、有声/無声検出結果が無声音である場合の利得よりも、有声/無声検出結果が有声音である場合の利得を大きくする。図1に戻る。利得制御部44は、利得を調節部26に出力する。
調節部26は、利得制御部44からの利得を入力する。調節部26は、入力した利得によって、HPF部24からの倍音信号のレベルを調節し、レベルを調節した倍音信号を結合部30に出力する。前述のごとく、調節部26からの利得は、有声/無声検出結果および母音/子音検出結果に応じて決定されている。
本実施例によれば、音声信号が有声音であるか、無声音であるかに応じて倍音信号のレベルを調節するので、音声信号の内容に応じたレベルの倍音信号を生成できる。また、無声音である場合の利得よりも、有声音である場合の利得を大きくするので、無声音である場合の雑音の影響を低減できる。また、音声信号が母音であるか、子音であるかに応じて倍音信号のレベルを調節するので、音声信号の内容に応じたレベルの倍音信号を生成できる。また、母音である場合の利得よりも、子音である場合の利得を大きくするので、母音である場合の雑音の影響を低減できる。
(実施例3)
次に、実施例3を説明する。実施例3は、これまでと同様に、音声信号に対して周波数帯域を拡張する受信装置に関し、受信装置は、音声信号の微分結果と音声信号とを乗算することによって倍音信号を生成する。実施例3では、倍音信号に加えて4倍音信号も生成する。ここでは、これまでとの差異を中心に説明する。
図5は、本発明の実施例3に係る受信装置100の構成を示す。受信装置100は、図1の構成に加えて、倍音用微分処理部50、4倍音演算部52、4倍音用HPF部54、4倍音用調節部56を含む。また、倍音用微分処理部50から4倍音用調節部56も、帯域拡張部200に含まれる。
オーバサンプリングLPF部16は、前述のごとく、音声信号に対して、第1のサンプリング周波数よりも高速な第2のサンプリング周波数への変換を実行する。ここでは、4倍音信号の生成を前提とするので、第2のサンプリング周波数は、例えば、32kHzに設定される。オーバサンプリングLPF部16は、第2のサンプリング周波数に変換した音声信号(以下、これもまた「音声信号」という)を微分処理部20、遅延部28に出力する。
倍音用微分処理部50は、倍音演算部22からの倍音信号を入力する。倍音用微分処理部50は、倍音信号に対して微分処理を実行する。微分処理は、微分処理部20と同様になされる。倍音用微分処理部50は、微分値を4倍音演算部52に出力する。4倍音演算部52は、倍音用微分処理部50からの微分値と、倍音演算部22からの倍音信号とを入力する。4倍音演算部52は、微分値と倍音信号とを乗算することによって、4倍音の信号(以下、「4倍音信号」という)を生成する。4倍音演算部52の処理は、倍音演算部22と同様であるので、ここでは説明を省略する。4倍音演算部52は、4倍音信号を4倍音用HPF部54に出力する。
4倍音用HPF部54は、4倍音演算部52からの4倍音信号を入力する。4倍音演算部52は、4倍音信号をフィルタリングすることによって、4倍音信号の高周波成分を抽出するための高域通過フィルタである。ここで、4倍音用HPF部54の遮断周波数は、HPF部24の遮断周波数の2倍、例えば、8kHzに設定される。そのため、4倍音用HPF部54は、4倍音信号のうちの8kHzよりも高い周波数成分を抽出する。4倍音用HPF部54は、HPF部24と同様に、4倍音信号の信号レベルの角周波数ω依存性を補完するための特性も有する。4倍音用HPF部54は、フィルタリングした4倍音信号(以下、これもまた「4倍音信号」という)を4倍音用調節部56に出力する。
4倍音用調節部56は、4倍音用HPF部54からの4倍音信号を入力する。4倍音用調節部56は、調節部26と同様に、4倍音信号のレベルを調節する。4倍音用調節部56は、レベルを調節した4倍音信号(以下、これもまた「4倍音信号」という)を結合部30に出力する。
遅延部28は、オーバサンプリングLPF部16からの音声信号を入力する。遅延部28は、微分処理部20から調節部26、倍音用微分処理部50から4倍音用調節部56での処理期間だけ、音声信号を遅延させる。遅延部28は、遅延させた音声信号(以下、これもまた「音声信号」という)を結合部30に出力する。なお、調節部26においても、倍音用微分処理部50から4倍音用調節部56の処理期間と、HPF部24、調節部26の処理期間との差分の期間だけ、倍音信号が遅延される。
結合部30は、調節部26からの倍音信号、4倍音用調節部56からの4倍音信号、遅延部28からの音声信号を入力する。結合部30は、4倍音信号、倍音信号、音声信号を結合、つまり加算することによって、帯域を拡張した音声信号(以下、「帯域拡張信号」という)を生成する。
本実施例によれば、倍音信号に対して微分処理と乗算処理を実行して4倍音信号を生成するので、周波数帯域を拡張する場合の演算量の増加を抑制できる。また、4倍音信号も結合するので、周波数帯域をさらに拡張できる。また、周波数帯域がさらに拡張されるので、音声の再現性を向上できる。また、4倍音信号なので、奇数高調波を重畳させないことができる。
以上、本発明を実施例をもとに説明した。この実施例は例示であり、それらの各構成要素や各処理プロセスの組合せにいろいろな変形例が可能なこと、またそうした変形例も本発明の範囲にあることは当業者に理解されるところである。
実施例2において、有声/無声検出部40による有声音であるか無声音であるかの検出と、母音/子音検出部42による母音であるか子音であるかの検出とがなされる。しかしながらこれに限らず例えば、いずれか一方だけがなされ、その検出結果をもとに、利得制御部44が利得を決定してもよい。本変形例によれば、構成を簡易にできる。
実施例3において、4倍音信号が生成されている。しかしながらこれに限らず例えば、8倍音信号、16倍音信号が生成されてもよい。この場合、オーバサンプリングLPF部16における第2のサンプリング周波数も向上される。本変形例によれば、音声の再現性をさらに向上できる。
実施例2と実施例3の組合せも有効である。本変形例によれば、実施例2と実施例3の効果が得られる。
10 受信部、 12 AD部、 14 検波部、 16 オーバサンプリングLPF部、 20 微分処理部、 22 倍音演算部、 24 HPF部、 26 調節部、 28 遅延部、 30 結合部、 32 スピーカ、 100 受信装置。

Claims (6)

  1. 入力信号に対して所定のサンプリング周波数で1サンプル遅延させた信号との差分を演算して微分値とする微分処理部と、
    前記微分処理部において微分値とした信号と、前記入力信号とを乗算することによって、倍音の信号を生成する倍音演算部と、
    前記倍音演算部において生成した倍音の信号をフィルタリングするとともに、前記倍音演算部により生成される前記入力信号の周波数に基づいて定まる倍音の信号の振幅値を補完する高域通過フィルタ部と、
    前記高域通過フィルタ部においてフィルタリングした倍音の信号と、前記入力信号とを結合する結合部と、
    を備えることを特徴とする帯域拡張装置。
  2. 前記入力信号は、第1のサンプリング周波数でサンプリングされてから、前記第1のサンプリング周波数よりも高速な第2のサンプリング周波数でサンプリングされており、
    前記高域通過フィルタ部の遮断周波数は、前記第1のサンプリング周波数の1/2以下に設定されることを特徴とする請求項1に記載の帯域拡張装置。
  3. 前記入力信号が、有声音であるか、無声音であるかを検出する有声/無声検出部と、
    前記有声/無声検出部における検出結果に応じた利得によって、前記高域通過フィルタ部においてフィルタリングした倍音の信号のレベルを調節し、レベルを調節した倍音の信号を前記結合部に出力する調節部とをさらに備え、
    前記調節部は、前記有声/無声検出部における検出結果が無声音である場合の利得よりも、前記有声/無声検出部における検出結果が有声音である場合の利得を大きくすることを特徴とする請求項1または2に記載の帯域拡張装置。
  4. 前記入力信号が、母音であるか、子音であるかを検出する母音/子音検出部と、
    前記母音/子音検出部における検出結果に応じた利得によって、前記高域通過フィルタ部においてフィルタリングした倍音の信号のレベルを調節し、レベルを調節した倍音の信号を前記結合部に出力する調節部とをさらに備え、
    前記調節部は、前記母音/子音検出部における検出結果が母音である場合の利得よりも、前記母音/子音検出部における検出結果が子音である場合の利得を大きくすることを特徴とする請求項1から3のいずれかに記載の帯域拡張装置。
  5. 前記倍音演算部において生成した倍音の信号に対して所定のサンプリング周波数で1サンプル遅延させた信号との差分を演算して微分値とする倍音用微分処理部と、
    前記倍音用微分処理部において微分処理を実行した倍音の信号と、前記倍音演算部において生成した倍音の信号とを乗算することによって、4倍音の信号を生成する4倍音演算部と、
    前記4倍音演算部において生成した4倍音の信号をフィルタリングするとともに、前記4倍音演算部により生成される前記倍音の信号の周波数に基づいて定まる倍音の信号の振幅値を補完する4倍音用高域通過フィルタ部とをさらに備え、
    前記結合部は、前記4倍音用高域通過フィルタ部においてフィルタリングした4倍音の信号も結合することを特徴とする請求項1から4のいずれかに記載の帯域拡張装置。
  6. 入力信号に対して所定のサンプリング周波数で1サンプル遅延させた信号との差分を演算して微分値とするステップと、
    微分処理を実行した信号と、前記入力信号とを乗算することによって、倍音の信号を生成するステップと、
    生成した倍音の信号をフィルタリングするとともに、生成される前記入力信号の周波数に基づいて定まる倍音の信号の振幅値を補完するステップと、
    フィルタリングした倍音の信号と、前記入力信号とを結合するステップと、
    を備えることを特徴とする帯域拡張方法。
JP2016000947A 2016-01-06 2016-01-06 帯域拡張装置および帯域拡張方法 Active JP6730580B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2016000947A JP6730580B2 (ja) 2016-01-06 2016-01-06 帯域拡張装置および帯域拡張方法
US15/389,474 US10068580B2 (en) 2016-01-06 2016-12-23 Band expander, reception device, band expanding method for expanding signal band

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016000947A JP6730580B2 (ja) 2016-01-06 2016-01-06 帯域拡張装置および帯域拡張方法

Publications (2)

Publication Number Publication Date
JP2017122792A JP2017122792A (ja) 2017-07-13
JP6730580B2 true JP6730580B2 (ja) 2020-07-29

Family

ID=59226647

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016000947A Active JP6730580B2 (ja) 2016-01-06 2016-01-06 帯域拡張装置および帯域拡張方法

Country Status (2)

Country Link
US (1) US10068580B2 (ja)
JP (1) JP6730580B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019213965A1 (zh) * 2018-05-11 2019-11-14 华为技术有限公司 语音信号的处理方法和移动设备
JP2021072465A (ja) 2019-10-29 2021-05-06 セイコーエプソン株式会社 回路装置、音再生装置及び電子機器

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4005154B2 (ja) * 1995-10-26 2007-11-07 ソニー株式会社 音声復号化方法及び装置
US20070299655A1 (en) * 2006-06-22 2007-12-27 Nokia Corporation Method, Apparatus and Computer Program Product for Providing Low Frequency Expansion of Speech
JP5098569B2 (ja) * 2007-10-25 2012-12-12 ヤマハ株式会社 帯域拡張再生装置
JP2012208177A (ja) 2011-03-29 2012-10-25 Nippon Logics Kk 帯域拡張装置及び音声補正装置
JP6063230B2 (ja) * 2012-12-03 2017-01-18 クラリオン株式会社 歪み音補正補完装置および歪み音補正補完方法
US9454976B2 (en) * 2013-10-14 2016-09-27 Zanavox Efficient discrimination of voiced and unvoiced sounds

Also Published As

Publication number Publication date
JP2017122792A (ja) 2017-07-13
US20170194013A1 (en) 2017-07-06
US10068580B2 (en) 2018-09-04

Similar Documents

Publication Publication Date Title
US9721584B2 (en) Wind noise reduction for audio reception
US20110286604A1 (en) Microphone array device
US9478235B2 (en) Voice signal processing device and voice signal processing method
JP2009104015A (ja) 帯域拡張再生装置
JP2008076988A (ja) 低周波帯域音声復元装置、音声信号処理装置および録音機器
JP2016017982A (ja) 信号処理装置及び信号処理方法
JP5232121B2 (ja) 信号処理装置
JP6730580B2 (ja) 帯域拡張装置および帯域拡張方法
US10147434B2 (en) Signal processing device and signal processing method
JP6669176B2 (ja) 信号処理装置および信号処理方法
JP4906858B2 (ja) 帯域拡張装置及び方法
US10951978B2 (en) Output control of sounds from sources respectively positioned in priority and nonpriority directions
KR100883896B1 (ko) 음성명료도 향상장치 및 방법
JP6155132B2 (ja) 低域補完装置および低域補完方法
US10477314B2 (en) Dynamic audio enhancement using an all-pass filter
JP5241373B2 (ja) 高調波生成装置
JP4803193B2 (ja) オーディオ信号の利得制御装置および利得制御方法
JP2014146942A (ja) ノイズ低減装置、放送受信装置及びノイズ低減方法
JP6371376B2 (ja) 音響装置及び信号処理方法
JP2008216469A (ja) 音声信号処理装置および音声信号処理方法ならびにプログラム
JPWO2008015726A1 (ja) 帯域拡張装置及び方法
JP2008283385A (ja) 雑音抑制装置
US20140219441A1 (en) Voice echo cancellation method and system
JP6226166B2 (ja) 音響再生装置
JP5018427B2 (ja) ノイズリダクション装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20181207

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20191015

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20191105

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20191220

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200602

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200615

R150 Certificate of patent or registration of utility model

Ref document number: 6730580

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150