JP2011227256A - 信号補正装置 - Google Patents

信号補正装置 Download PDF

Info

Publication number
JP2011227256A
JP2011227256A JP2010096267A JP2010096267A JP2011227256A JP 2011227256 A JP2011227256 A JP 2011227256A JP 2010096267 A JP2010096267 A JP 2010096267A JP 2010096267 A JP2010096267 A JP 2010096267A JP 2011227256 A JP2011227256 A JP 2011227256A
Authority
JP
Japan
Prior art keywords
effective
signal
frequency
channel
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2010096267A
Other languages
English (en)
Other versions
JP4922427B2 (ja
Inventor
Masataka Osada
将高 長田
Takashi Sudo
隆 須藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2010096267A priority Critical patent/JP4922427B2/ja
Priority to US13/090,182 priority patent/US8532309B2/en
Publication of JP2011227256A publication Critical patent/JP2011227256A/ja
Application granted granted Critical
Publication of JP4922427B2 publication Critical patent/JP4922427B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G3/00Gain control in amplifiers or frequency changers
    • H03G3/20Automatic control
    • H03G3/30Automatic control in amplifiers having semiconductor devices
    • H03G3/32Automatic control in amplifiers having semiconductor devices the control being dependent upon ambient noise level or sound level
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G5/00Tone control or bandwidth control in amplifiers
    • H03G5/16Automatic control
    • H03G5/165Equalizers; Volume or gain control in limited frequency bands

Landscapes

  • Telephone Function (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

【課題】多様な品質のコンテンツに対して、それぞれのコンテンツの品質に応じた最適な補正処理を施すことが可能な信号補正装置を提供すること。
【解決手段】信号補正装置を次のように構成する。すなわち、一つ以上のチャネルから入力された信号について音質推定を行い各々のチャネルの重要度を示すチャネル重要度情報及び各々の周波数の重要度を示す周波数重要度情報を生成する音質推定部100と、前記チャネル重要度情報及び周波数重要度情報に基づいて、高音質化処理を行う対象の有効チャネル及び有効周波数成分を決定し、該決定に基づいて有効チャネル情報及び有効処理周波数情報を生成する高音質化処理制御部200と、前記有効チャネル情報及び有効処理周波数情報に基づいて、前記有効チャネル且つ有効周波数成分の信号についてのみ高音質化処理を施す高音質化処理部500と、を具備させる。
【選択図】図1

Description

本発明は、音声信号に対して補正処理を施す信号補正装置に関する。
現在、携帯電話機が広く一般に普及している。携帯電話機は屋外で使用する機会が多い為、その使用時においては、例えば交通騒音等の周囲ノイズが、通話に係る音声の聞き取りを阻害してしまうことが多い。このような事情から、近年、出力音声を明瞭化する為の技術が提案されている。
このような出力音声の明瞭化の為の技術としては、例えば特許文献1に次のような技術が開示されている。
すなわち、特許文献1には、受話音声信号を周波数分析して音声スペクトルを算出する音声周波数分析部と、周波数帯域毎に設定された前記音声スペクトルに対する圧縮率に基づいて目標スペクトルを算出する目標スペクトル算出部と、前記音声スペクトルを前記目標スペクトルまで増幅するためのゲイン値を周波数帯域毎に算出するゲイン算出部と、前記各周波数帯域毎のゲイン値から受話音声信号に対するフィルタ処理のフィルタ係数を算出するフィルタ係数算出部と、前記フィルタ係数を設定されて前記受話音声信号に対するフィルタ処理を行うフィルタ部と、を有することを特徴とする受話音声処理装置が開示されている。
この特許文献1に開示されている技術は、再生に係る音声の音量を大きく変化させることなく、音質の劣化及び変化を小さくした上で、音声の明瞭度を改善することを目的としている。
特開2004−61617号公報
ところで、一般にネットコンテンツと称されているインターネット上に存在するコンテンツを利用する機会が、近年、急速に増大している。このネットコンテンツにおいては、その品質(ソース品質)は多様である。ネットコンテンツの品質は、コンテンツ作成者側の収録環境(作成環境)、当該ネットコンテンツをサーバーにアップロードする際のコーデックパラメータ、視聴者側の視聴環境(例えば伝送速度や視聴モード)等の種々の要因に依存するからである。
このように、ネットコンテンツの品質が多様である(均一でない)にも関わらず、特許文献1に開示されている技術に代表されるような従来の技術においては、多様な品質のコンテンツを明瞭化処理対象として想定していない為(品質がほぼ均一である通話音声のみを想定している為)、種々の不具合が生じる。
具体的には、ネットコンテンツにおいては多く存在する低品質なソースを強調してしまうことで、更なる品質劣化を招いたり、過剰な補正処理を施して処理量の増大を招いたりしてしまう。また、明瞭化処理を実行するに当たって、周囲環境の雑音の変化に依って処理を切り替えてはいるが、システム上で動作している他のアプリケーションによる処理負荷を考慮していない為、結果として、当該システムにおいて許容される処理量をオーバーしてしまうこともある。
このような問題点と、今後ネットコンテンツを利用する機会が更に多く見込まれる状況とを鑑みて、ネットコンテンツのように多様な品質のコンテンツを再生することを想定した明瞭化処理が望まれている。
本発明は、前記の事情に鑑みて為されたものであり、多様な品質のコンテンツに対して、それぞれのコンテンツの品質に応じた最適な補正処理を施すことが可能な信号補正装置を提供することを目的とする。
前記の目的を達成するために、本発明の第1の態様による信号補正装置は、
一つ以上のチャネルから入力された信号について音質推定を行い、該音質推定結果に基づいて各々のチャネルの重要度を示すチャネル重要度情報及び各々の周波数の重要度を示す周波数重要度情報を生成する音質推定部と、
前記チャネル重要度情報及び前記周波数重要度情報に基づいて、前記信号のうち高音質化処理を行う対象の有効チャネル及び有効周波数成分を決定し、該決定に基づいて有効チャネル情報及び有効処理周波数情報を生成する高音質化処理制御部と、
前記有効チャネル情報及び前記有効処理周波数情報に基づいて、前記有効チャネル且つ前記有効周波数成分の信号についてのみ高音質化処理を施す高音質化処理部と、
を具備することを特徴とする。
本発明によれば、多様な品質のコンテンツに対して、それぞれのコンテンツの品質に応じた最適な補正処理を施すことが可能な信号補正装置を提供することを目的とする。
本発明の一実施形態に係る信号補正装置の一構成例を示す図。 音質推定部により算出される相互相関Cross_Corの値と、チャネル重要度情報と、を対応付けたテーブルの一例を示す図。 sfbとsfbのバンド境界との対応関係のテーブルの一例を示す図。 sfmと周波数重要度情報とを対応付けたテーブルの一例を示す図。 CPUリソースCPU_availableの値と、システム負荷レベルsys_load_levelと、の関係を説明するテーブルの一例を示す図。 システム負荷レベル情報sys_load_levelと、有効チャネルとして扱うチャネル重要度情報と、有効周波数帯域として扱う周波数重要度情報と、を対応付けたテーブルの一例を示す図。 一実施形態の変形例に係る信号補正装置の概略構成例を示す図。
以下、図面を参照して本発明の実施形態について説明する。
図1は、本発明の一実施形態に係る信号補正装置の一構成例を示す図である。ここでは、本一実施形態に係る信号補正装置を携帯電話機に適用した場合を例にして説明する。ただし、本一実施形態に係る信号補正装置は、携帯電話機に限らず、PCやゲーム機器、音楽プレーヤなど、入力された音を補正して出力することができる装置であれば適用可能である。
本一実施形態に係る信号補正装置を適用した携帯電話機は、CPUやROM、RAM等によって構成されて携帯電話機全体を制御する制御手段、アンテナを介して基地局へ無線信号を送受信する無線通信手段、音声や周囲ノイズ等を集音するマイクロフォン、音を出力するスピーカ、文字や画像を表示するディスプレイ等を有する。
図1に示すように、本一実施形態に係る信号補正装置は、音質推定部100と、高音質化処理制御部200と、システム負荷推定部300と、周囲ノイズ解析部400と、高音質化処理部500と、を具備する。
本一実施形態に係る信号補正装置に入力された入力信号in[k][i](“k”は入力チャネルを示し、“i”はPCMサンプル番号を示す)は、音質推定部100、及び高音質化処理部500に入力される。なお、この入力信号とは、ユーザが視聴中のコンテンツ(例えば無線通信手段によって取得したネットコンテンツや放送波によって受信した放送コンテンツ等)に係る音声信号である。
前記音質推定部100は、有音・無音判定部101と、有効チャネル解析部102と、有効周波数解析部103と、を有する。
前記有音・無音判定部101は、複数の入力チャネルから入力された入力信号in[k][i]について、次式(1)により当該入力信号in[k][i]のパワーP[k]を算出する。
Figure 2011227256
Nはフレームサイズを示している。
有音・無音判定部101は、前記式(1)による算出結果に基づいて、パワーP[n,k]の値と既定の閾値SILENT_THとを比較し、該比較結果に基づいて入力信号in[n,k]が有音であるか無音であるかを判定する。
具体的には、パワーP[n,k]の値が前記閾値SILENT_TH以下の値である場合には、有音・無音判定部101は、入力信号in[n,k]は無音信号であると判定する。他方、パワーP[n,k]の値が前記閾値SILENT_THを越える値の場合には、有音・無音判定部101は、入力信号in[n,k]は有音信号であると判定する。
そして、有音・無音判定部101は、入力信号in[n,k]が無音であると判定した場合には、有音・無音フラグsilent_flg=1を設定する。他方、有音・無音判定部101は、入力信号in[n,k]が有音であると判定した場合には、有音・無音フラグsilent_flg=0を設定する。有音・無音判定部101は、このように設定した有音・無音フラグsilent_flgを、有音・無音情報として高音質化処理制御部200に送信する。
ところで、当該音質推定部100に入力された入力信号in[k][i]は、有音・無音判定部101を経て、有効チャネル解析部102及び有効周波数解析部103に入力される。
前記有効チャネル解析部102は、入力信号の各チャネルの相関に基づく重要度(チャネル重要度情報)を設定する。そのために、有効チャネル解析部102は、まず入力信号[k][i]についてチャネル間の相関解析を行う。具体的には、例えば入力信号がステレオ信号である場合には次式(2)のように、右チャネル信号in[1][i]と左チャネル信号in[2][i]との相互相関Cross_Corを算出する。
Figure 2011227256
そして、有効チャネル解析部102は、算出した相互相関Cross_Corの値に応じて、チャネルの相関が高いほど重要度が低くなるようにチャネル重要度情報を設定する。図2は、相互相関の値とチャネル重要度情報と、を対応付けたテーブルの一例である。このチャネル重要度情報は、後述する高音質化処理の際に参照する情報である。なお、相互相関Cross_Corの値とチャネル重要度情報とを対応付けたテーブルは図2に示す例に限られない。
チャネル重要度情報を設定した有効チャネル解析部102は、チャネル重要度情報と当該チャネルの番号とを高音質化処理制御部200に送信する。具体的には、有効チャネル解析部102は、チャネル重要度情報と当該チャネルの番号とを高音質化処理制御部200に送信する。すなわち、Rをチャネル重要度情報とし、k1,k2を相関チャネル番号とすると、有効チャネル解析部102は、R(k1,k2)を高音質化処理制御部200に送信する。
なお、チャネル間の相関の算出方法としては、上述した相互相関以外の手法、例えば右チャネルと左チャネルとの和信号と差信号との比に基づいて決定する手法を利用しても良いし、一般的な数学的手法を利用しても良い。
前記有効周波数解析部103は、信号の周波数成分ごとに有効成分とノイズ性に応じた重要度(周波数重要度情報)を設定する。
まず、有効周波数解析部103は、入力信号in[k][i]について周波数帯域の有効成分の解析を行う。この有効周波数解析部103は、入力信号in[k][i]のうち信号が欠落している帯域を特定する。
具体的には、例えばAACやMP3等のオーディオコーデックが適用されている入力信号の場合には、高周波数帯域成分において欠落が存在する為、有効周波数解析部103はこの欠落している帯域を特定する。
例えば、入力信号in[k][i]を、FFTによって周波数域に変換した信号の実数部をin_spec_r[k][j]とし、且つ、虚数部をin_spec_i[k][j]とする。さらに、複数のin_spec_r[k][j]とin_spec_i[k][j]とをグループ化したスケールファクターバンド(以降、sfbと称する)を構成する。そして、当該sfb毎にパワー判定を行うことによって、高周波数帯域における信号欠落帯域を特定する。
ここで、sfbのバンド境界は、例えば、ISO/IEC 13818−7に記載されているテーブルを利用してもよいし、他の方法により決定してもよい。図3は、sfbとsfbのバンド境界との対応関係のテーブル一例を示す図である。なお、sfbとsfbのバンド境界との対応関係のテーブルは、図3に示す例に限られない。
sfbのパワー値は、次式によって算出される。
Figure 2011227256
そして、有効周波数解析部103は、高域側のsfb_power[k][SFB_MAX−1]から低域側に順次sfbの識別子bを小さくして、既定の閾値Freq_THと比較していく。なお、SFB_MAXは、sfbの個数を表す。この比較処理において初めてsfb_power[k][b]>Freq_THを満たすときのbの値を、upper_sfbとして保存する。有効周波数解析部103は、上述の処理によって特定されたupper_sfb以上のsfbを、コーデックに起因する欠落帯域であるとみなす。そして、この欠落帯域については、聴取者にとって明瞭度改善の必要がないため、後述のノイズ性の判定に関わらず、周波数重要度情報としては最低レベルの0に設定する。
次に、有効周波数解析部103は、周波数帯域ごとのノイズ性を判定する。ここではノイズ性の判定方法の一例として、スペクトラルフラットネスメジャー(以降、sfmと称する)を利用する例を説明する。sfmはスペクトルの平坦度を測る尺度として次式(3)により算出することができる。
Figure 2011227256
但し、
Figure 2011227256
であり、
Figure 2011227256
である。
ここで、式(3)により算出される値sfm[b]の値が大きいほどスペクトルが平坦であり、ノイズ性が高いと言える。このようなノイズ性の高い信号は、聴取者にとって明瞭度改善の必要性が低いと考えられる。
そこで、前記sfm[b]の値が大きいほど重要度が低くなるように周波数重要度情報を決定する。図4は、sfmと周波数重要度情報とを対応付けたテーブルの一例を示す図である。なお、有効周波数解析部103で判別された欠落帯域については、sfmによる判定に関わらず、周波数重要度情報としては最低レベルの0に設定する。
有効周波数解析部103は、チャネル番号kと周波数帯域番号sfbと共に周波数重要度情報を高音質化処理制御部200に送信する。すなわち、Fを周波数重要度情報とし、kをチャネル番号とし、sfbを周波数帯域番号とすると、有効周波数解析部103は、F(k,sfb)を高音質化処理制御部200に送信する。
前記高音質化処理制御部200は、音質推定部100から送信された有音・無音情報silent_flgと、チャネル重要度情報R(k1,k2)と、周波数重要度情報F(k,sfb)と、システム負荷推定部300から送信されたシステム負荷レベル情報sys_load_levelと、に基づいて、高音質化処理部500が処理すべき有効チャネル及び有効周波数成分を決定する。この高音質化処理制御部200による処理の詳細は、後述する。
前記システム負荷推定部300は、本一実施形態に係る信号補正装置が実装された携帯電話機において、当該携帯電話機が具備するCPUの処理能力を、高音質化処理部500による処理にどの程度占有できるかを推定(判定)する。
具体的には、システム負荷推定部300は、CPU速度取得部301と、プレーヤ種別判定部302と、動作タスク検出部303と、動作時刻取得部304と、を有する。
前記CPU速度取得部301は、前記CPUのCPU速度の値を保持しており、CPU_max(MHz)としてシステム負荷レベル判定部305に送信する。このCPU速度は、本一実施形態に係る信号補正装置が実装された装置/システムが具備するCPUにより決定される値である。
なお、前記CPU速度が動的に変化する値の場合には、CPU速度取得部301は、所定の時間間隔にてCPU速度の値を更新するように構成する。
前記プレーヤ種別判定部302は、コンテンツの再生処理に利用するプレーヤアプリケーションの種別を取得する。また、プレーヤ種別判定部302は、当該プレーヤアプリケーションによってサポートされている高画質化処理とその処理負荷とを予め保持している。
このように構成されているプレーヤ種別判定部302は、当該信号補正装置が実装された装置/システム上で動作しているプレーヤアプリケーションによる高画質化処理の負荷CPU_Player(MHz)を特定し、これをシステム負荷レベル判定部305に送信する。
なお、高画質化処理以外でも当該プレーヤアプリケーションによってサポートされている他の機能がある場合には、その機能についても処理負荷を特定してシステム負荷レベル判定部305に送信するように構成しても勿論よい。
前記動作タスク検出部303は、前記プレーヤアプリケーションに依存しない別のタスク(スレッド)が、当該信号補正装置が実装された装置/システム上で動作している場合に、そのタスク(スレッド)の処理負荷CPU_task(MHz)を検出して、システム負荷レベル判定部305に送信する。
前記システム負荷レベル判定部305は、次式(4)によって、高音質化処理部500により利用可能なCPUリソース(MHz)を算出する。
Figure 2011227256
そして、システム負荷レベル判定部305は、前記式(4)により算出したCPUリソースCPU_availableの値に応じて、システム負荷レベルsys_load_levelを決定し、高音質化処理制御部200に送信する。
図5は、CPUリソースCPU_availableの値と、システム負荷レベルsys_load_levelと、の関係を説明するテーブルの一例を示す図である。なお、このテーブルは、高音質化処理部500の処理内容に応じてシステム毎に任意に決定可能であり、図5に示すテーブルはあくまでも一例である。
システム負荷レベル判定部305は、上述した処理で算出したCPUリソースCPU_availableと図5に示すテーブルとを対照してシステム負荷レベルsys_load_levelを算出し、高音質化処理制御部200に送信する。
前記高音質化処理制御部200は、音質推定部100から送信された有音・無音情報silent_flgと、チャネル重要度情報R(k1,k2)と、周波数重要度情報F(k,sfb)と、システム負荷推定部300から送信されたシステム負荷レベル情報sys_load_levelと、に基づいて、高音質化処理部500が処理すべき有効チャネル及び有効周波数成分を決定する。
さらに、高音質化処理制御部200は、前記決定した有効チャネルを有効チャネルとして扱う旨の有効チャネル情報を生成して高音質化処理部500の有効チャネル分離部501に送信し、且つ、前記決定した有効周波数を有効周波数として扱う旨の有効処理周波数帯域情報を生成して高音質化処理部500の有効周波数成分分離部503に送信する。
より具体的には、この高音質化処理制御部200は、下記の処理を行う。
すなわち、高音質化処理制御部200は、音質推定部100から送信された有音・無音情報がsilent_flg=1に設定されている場合、当該入力信号in[k][i]は無音であると判断し、全チャネルを非有効チャネルとする有効チャネル情報を生成し、且つ、全周波数帯域を非有効周波数帯域とする有効処理周波数帯域情報を生成する。
他方、高音質化処理制御部200は、音質推定部100から送信された有音・無音情報がsilent_flg=0に設定されている場合、当該入力信号in[k][i]は有音であると判断し、システム負荷レベル情報sys_load_levelに基づいて、有効チャネルと有効周波数帯域とを、図6に示すテーブルを参照して設定する。
ここで、図6は、システム負荷レベル情報sys_load_levelと、有効チャネルとして扱うチャネル重要度情報と、有効周波数帯域として扱う周波数重要度情報と、を対応付けたテーブルの一例を示す図である。
なお、図6に示すテーブルは一例であり、同図に示す例に限られない。すなわち、システム負荷レベルが高ければ高いほど、有効チャネルとして扱うチャネル数や処理する有効周波数成分を減じていくという趣旨を逸脱しない範囲内において、当該テーブルを任意に規定して良い。
図6に示す例では、具体的には下記のように規定している。
・システム負荷レベル情報sys_load_levelの値が1である場合、全てのチャネル重要度情報(チャネル重要度情報=1,2,3,4,5)に対応するチャネルを有効チャネルとして設定(全チャネルを有効チャネルとし設定)する。同様に、全ての周波数重要度情報(周波数重要度情報=1,2,3,4,5)に対応する周波数帯域を有効周波数帯域として設定(全周波数帯域を有効周波数帯域として設定)する。そして、それら設定に基づいて、有効チャネル情報及び有効処理周波数帯域情報を生成して高音質化処理部500へ送信する。
・システム負荷レベル情報sys_load_levelの値が2である場合、チャネル重要度情報の値が2,3,4,5に対応するチャネルのみを有効チャネルとして設定する。同様に、周波数重要度情報2,3,4,5に対応する周波数帯域のみを有効周波数帯域として設定する。そして、それら設定に基づいて、有効チャネル情報及び有効処理周波数帯域情報を生成して高音質化処理部500へ送信する。
・システム負荷レベル情報sys_load_levelの値が3,4,5である場合も、同様に図6に示すテーブルに基づいて、有効チャネル及び有効周波数帯域を設定し、有効チャネル情報及び有効処理周波数帯域情報を生成して高音質化処理部500へ送信する。
前記周囲ノイズ解析部400は、時間/周波数変換部401と、マスキング解析部402と、を有する。この周囲ノイズ解析部400は、当該信号補正装置が実装されている装置/システムの周囲環境(ユーザの視聴環境)におけるノイズ(例えば電車、自動車、人ごみの雑踏等による周囲ノイズ)を集音して解析する。
前記時間/周波数変換部401は、マイクによって集音された周囲ノイズPCM信号であるnoise[k][i]を、周波数領域の信号として実数部noise_spec_r[k][j]と虚数部noise_spec_i[k][j]とに変換してマスキング解析部402に出力する。
前記マスキング解析部402は、noise_spec_r[k][i]と、noise_spec_i[k][j]とについてマスキング特性を算出する。ここで、マスキング特性とは、spreading functionと称される関数を信号パワーに畳み込むことで算出される特性である。このspreading functionとは、聴覚フィルタを模擬した特性を持つ関数であり、例えば聴覚心理学概論(B.C.Jムーア著、誠信書房)、ISO/IEC 13818−7、ITU−R1387、3GPP TS 26.403等の文献に詳細に説明されている。なお、このマスキング特性は公知の技術的事項である為、ここでは詳細な説明は省略する。
ここでは一例として、ISO/IEC 13818−7方式を利用する例を説明する。ISO/IEC 13818−7方式では、spreading functionは下記のように定義されている。
Figure 2011227256
ここで、sprdngf()は、spreading functionを示している。b1、b2は、バークスケールと称される尺度のインデックスを示している。詳細には、b1はspreadingを及ぼす信号自身のインデックスを示しており、b2はb1によって影響を与えられる信号のバーク値を示している。
前記spreading functionはバーク尺度に基づいている。従って、各周波数サンプルの周波数値をバーク値に変換する必要がある。例えば、この変換には、次式(5)を利用することができる。
Figure 2011227256
ここで、fは周波数(Hz)を示している。例えばサンプリング周波数が48kHzの入力信号を2048ポイントのFFTによって周波数域に変換する場合は、f=48000/2048×i(Hz)となる。
以降、説明の便宜上、サンプリング周波数インデックスjに対応するバーク値をbark[j]と表記する。
上述の処理により算出した値を用いて、当該入力信号のマスキング特性を次式(6)によって算出する。
Figure 2011227256
ここで、noise_thr[j]は、周囲ノイズPCM信号の周波数インデックスjにおけるマスキング閾値を示している。Nは、FFTポイント数を示している。noise_spec_power[l]は、周波数変換された周囲ノイズPCM信号のパワーを示しており、次式により算出される。
Figure 2011227256
マスキング解析部402は、上述の処理により算出したノイズのマスキング特性noise_thr[j]を、高音質化処理部500に送信する。
前記高音質化処理部500は、有効チャネル分離部501と、時間/周波数変換部502と、有効周波数成分分離部503と、ゲイン算出部504と、補正部505と、周波数成分合成部506と、周波数/時間変換部507と、チャネル合成部508と、を有する。
前記有効チャネル分離部501は、高音質化処理制御部200から送信された有効チャネル情報に基づいて、有効チャネルと判定されたチャネルの入力信号in[k][i]についてはそのまま後段の時間/周波数変換部502に出力し、且つ、有効チャネルでないと判定されたチャネルの入力信号in[k][i]については、例えば次式(7)により和信号(in_M[k][i])と差信号(in_S[k][i])とに変換した後、和信号を有効チャネルとして後段の時間/周波数変換部502に出力し、差信号を非有効チャネルとしてチャネル合成部508に出力する。
具体的には、例えばシステム負荷レベルsys_load_levelが2である場合には、チャネル重要度情報の値が2以上のチャネルが有効チャネルとなる。従って、この場合にはチャネル重要度の値が1のチャネルについては、入力信号in[k][i]を和信号、差信号に変換する。例えば、チャネル重要度情報R(k1,k2)=2(1,2)を変換する為には次式(7)を利用する。
Figure 2011227256
前記時間/周波数変換部502は、有効チャネル分離部501から送信された有効チャネルの入力信号in[k][i]を、周波数領域の信号に変換して有効周波数成分分離部503に出力する。具体的には、この変換には例えばFFTやMDCT等を利用する。
以降の処理においては、有効チャネル分離部501から時間/周波数変換部502に送信された有効チャネルの入力信号in[k][i]に対して共通のアルゴリズムが適用される。従って、周波数領域に変換された信号のうち実数部についてはin_spec_r[i]と表記し、虚数部についてはin_spec_i[i]と表記する。
前記有効周波数成分分離部503は、時間/周波数変換部502から送信された周波数領域に変換された信号の実数部in_spec_r[i]及び虚数部in_spec_i[i]を、高音質化処理制御部200から送信された有効処理周波数帯域情報に基づいて、有効周波数成分と非有効周波数成分とに分離する。そして、有効周波数成分分離部503は、有効周波数成分をゲイン算出部504及び補正部505に送信し、非有効周波数成分を周波数成分合成部506に送信する。
具体的には、例えば周波数領域に変換された信号in_spec[i]に関する周波数重要度F(k,sfb)=3(1,30)の場合、in_spec[sfb_idx[30]]未満の周波数成分を有効周波数成分とし、in_spec[sfb_idx[30]]以上の成分を非有効周波数成分とする。
ここで、sfb_idx[]としては、音質推定部100の有効周波数解析部103が設定したスケールファクターバンドを使用するものとする。
前記ゲイン算出部504は、周囲ノイズ解析部400から送信されたノイズのマスキング特性noise_thr[j]と、有効周波数成分分離部503から送信された有効周波数成分in_spec_r[j]及びin_spec_i[j]と、の比に応じて、有効周波数成分in_spec_r[j]及びin_spec_i[j]に乗算するゲインgain[j]を算出する。具体的には、例えば次式(8)を利用して算出する。
Figure 2011227256
Wは1以上の定数を示している。max(a,b)は、aとbとうち何れか大きい値を返す関数を示している。
前記補正部505は、ゲイン算出部504により算出されたゲインgain[j]を、有効周波数成分分離部503から送信された有効周波数成分in_spec_r[j]、in_spec_i[i]に乗算する。
Figure 2011227256
この補正部505による処理で、周囲ノイズに埋もれてしまっている信号が周波数帯域毎に効果的に増幅されるので、周囲ノイズが大きな雑音環境であっても明瞭な音声を再生出力することができる。この補正部505は、ゲインgain[j]を乗算した信号を周波数成分合成部506に出力する。
前記周波数成分合成部506は、補正部505により増幅された有効周波数成分と、有効周波数成分分離部503から出力された非有効周波数成分と、を合成処理して周波数/時間変換部507に送信する。
前記周波数/時間変換部507は、周波数成分合成部506から出力された信号を、時間領域の信号に変換してチャネル合成部508に送信する。
前記チャネル合成部508は、周波数/時間変換部507により時間領域に変換された信号と、有効チャネル分離部501から出力された非有効チャネルの信号と、を合成処理する。ここで、非有効チャネルの信号とは、上述したように有効チャネル分離部501によって例えば式(7)を利用して変換された差成分in_S[k][i]である。
具体的には、チャネル合成部508は、差成分in_S[k][i]を例えば次式(10)によって各チャネル信号in´[k1][i],in´[k2][i]に変換する。
Figure 2011227256
以上説明したように、本一実施形態によれば、多様な品質のコンテンツに係る入力信号を再生処理する際に、それぞれのコンテンツの品質に応じて最適な音声の明瞭化処理を施すことが可能な信号補正装置を提供することができる。
具体的には、入力信号について音質推定し、該音質推定結果に基づいて入力チャネル毎の重要度と周波数帯域毎の重要度とを段階的に判定し、該判定結果とシステム負荷レベルとに応じて、処理すべき有効チャネル及び有効周波数帯域を、スケーラブル且つ動的に切り替える。これにより、当該信号補正装置が実装されているシステムの負荷レベルの動作制限内で(システム上で許容される処理量を超えることなく)、更に周囲ノイズがある環境であっても明瞭な音質の音声を出力することができる。
換言すれば、入力信号の音質を解析して有効チャネル及び有効周波数帯域を適応的に推定し、該推定結果に基づいて、有効チャネル及び有効周波数帯域に対応する入力信号のみを補正することで、処理量の軽減及び更なる高音質化を達成した補正処理を実現した。
以上、一実施形態に基づいて本発明を説明したが、本一実施形態は上述した態様に限定されるものではなく、例えば下記のように種々の変形及び応用が可能なことは勿論である。
[変形例]
前記一実施形態に係る信号補正装置の音質推定部100による処理及び高音質化処理部500による高音質化処理として、例えば図7に示すような種々の処理を挙げることができる。図7は、本変形例に係る信号補正装置の概略構成例を示す図である。
すなわち、音質推定部100による音質推定処理としては、例えば“周波数特性推定処理”、“サンプリング周波数推定処理”、“ノイズ性推定処理”、“トーン性推定処理”、“ダイナミックレンジ推定処理”、“話速推定処理”、“音量推定処理”、“位相推定処理”、“残響推定処理”、“音像定位推定処理”を挙げることができる。そして、音質推定部100は、これらの推定処理結果を前記高音質化処理制御部200に送信する。
上述の音質推定部100による各種推定処理に対応して、高音質化処理部500には下記の処理を実行する処理部515を設ける。すなわち、処理部515は、有効周波数成分分離部503から送信された有効周波数成分in_spec_r[j]及びin_spec_i[i]について、“周波数特性改善処理”、“時間解像度改善処理”、“ノイズ性改善処理”、“トーン性改善処理”、“ダイナミックレンジ改善処理”、“話速変換処理”、“音量制御処理”、“位相補正処理”、“残響改善処理”、“音像定位改善処理”を、音質推定部100による推定結果に基づいて実行する。
また、図7に示すように周囲ノイズ解析部400による解析対象として、周囲ノイズの“周波数帯域”、“音量”、“ラウドネス”、“マスキング特性”を挙げることができる。
以上説明したように、本変形例によれば、前記一実施形態に係る信号補正装置と同様の効果を奏する信号補正装置を提供することができる。具体的には、本変形例によれば、入力信号の各種特性から入力信号の音質を推定し、該推定した音質に基づいて補正処理すべきチャネル及び周波数帯域等を決定し、該決定に基づいて入力信号の補正処理を実行する。
さらに、上述した実施形態には種々の段階の発明が含まれており、開示した複数の構成要件の適当な組み合わせにより種々の発明が抽出され得る。例えば、実施形態に示す全構成要件からいくつかの構成要件が削除されても、発明が解決しようとする課題の欄で述べた課題が解決でき、発明の効果の欄で述べられている効果が得られる場合には、この構成要件が削除された構成も発明として抽出され得る。
100…音質推定部、 101…有音・無音判定部、 102…有効チャネル解析部、 103…有効周波数解析部、 200…高音質化処理制御部、 300…システム負荷推定部、 301…CPU速度取得部、 302…プレーヤ種別判定部、 303…動作タスク検出部、 304…動作時刻取得部、 305…システム負荷レベル判定部、 400…周囲ノイズ解析部、 401…周波数変換部、 402…マスキング解析部、 500…高音質化処理部、 501…有効チャネル分離部、 502…周波数変換部、 503…有効周波数成分分離部、 504…ゲイン算出部、 505…補正部、 506…周波数成分合成部、 507…時間変換部、 508…チャネル合成部。

Claims (7)

  1. 一つ以上のチャネルから入力された信号についてチャネルの相関に基づいてチャネルの重要度を示すチャネル重要度情報を生成し、信号の周波数帯域ごとのノイズ性に基づいて周波数の重要度を示す周波数重要度情報を生成する音質推定部と、
    前記チャネル重要度情報及び前記周波数重要度情報に基づいて、前記信号のうち高音質化処理を行う対象の有効チャネル及び有効周波数成分を決定し、該決定に基づいて有効チャネル情報及び有効処理周波数情報を生成する高音質化処理制御部と、
    前記有効チャネル情報及び前記有効処理周波数情報に基づいて、前記有効チャネル且つ前記有効周波数成分の信号について高音質化処理を施す高音質化処理部と、
    を具備することを特徴とする信号補正装置。
  2. 当該信号補正装置が実装されているシステムの演算部について、当該信号補正装置による処理に利用可能なリソースを推定するシステム負荷推定部を含み、
    前記高音質化処理制御部は、前記システム負荷推定部による推定結果に基づいて、前記有効チャネル及び前記有効周波数帯域を切り替える
    ことを特徴とする請求項1に記載の信号補正装置。
  3. 前記音質推定部は、前記チャネルのうち任意の2つのチャネル間の相関解析を行って類似性を推定し、類似性が高いほど当該チャネルの重要度を低く設定する
    ことを特徴とする請求項1に記載の信号補正装置。
  4. 前記音質推定部は、周波数帯域ごとの信号のスペクトルが平坦であるほどノイズ性が高いと判定し、ノイズ性が高い周波数帯域の信号には低い重要度となるよう周波数重要度情報を設定する
    ことを特徴とする請求項1に記載の信号補正装置。
  5. 前記音質推定部は、欠落した周波数帯域成分を判定し、欠落した周波数帯域成分については、重要度が最も低くなるよう周波数重要度情報を設定する
    ことを特徴とする請求項1に記載の信号補正装置。
  6. 前記高音質化処理部は、チャネル重要度が低く設定されているチャネルの組みについては、それらを和信号と差信号とに変換し、前記和信号を有効チャネルとして処理し、且つ、前記差信号を非有効チャネルとして処理する
    ことを特徴とする請求項6に記載の信号補正装置。
  7. 当該信号補正装置の周囲ノイズを集音して、該周囲ノイズによるマスキング特性を算出する周囲ノイズ解析部を含み、
    前記高音質化処理部は、前記マスキング特性に基づいて、前記有効チャネル且つ前記有効周波数成分の信号についてゲイン処理を行う
    ことを特徴とする請求項1に記載の信号補正装置。
JP2010096267A 2010-04-19 2010-04-19 信号補正装置 Expired - Fee Related JP4922427B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2010096267A JP4922427B2 (ja) 2010-04-19 2010-04-19 信号補正装置
US13/090,182 US8532309B2 (en) 2010-04-19 2011-04-19 Signal correction apparatus and signal correction method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010096267A JP4922427B2 (ja) 2010-04-19 2010-04-19 信号補正装置

Publications (2)

Publication Number Publication Date
JP2011227256A true JP2011227256A (ja) 2011-11-10
JP4922427B2 JP4922427B2 (ja) 2012-04-25

Family

ID=44788215

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010096267A Expired - Fee Related JP4922427B2 (ja) 2010-04-19 2010-04-19 信号補正装置

Country Status (2)

Country Link
US (1) US8532309B2 (ja)
JP (1) JP4922427B2 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2530835B1 (en) * 2011-05-30 2015-07-22 Harman Becker Automotive Systems GmbH Automatic adjustment of a speed dependent equalizing control system
US20150049221A1 (en) * 2013-08-19 2015-02-19 Motorola Mobility Llc Method and apparatus for pre-processing video frames
US10409930B2 (en) * 2015-09-24 2019-09-10 Harman International Industries, Incorporated Techniques for improving swept sine analyses
KR102522567B1 (ko) * 2018-09-03 2023-04-18 삼성전자주식회사 전자 장치 및 그 동작 방법

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06149292A (ja) * 1992-11-11 1994-05-27 Sony Corp 高能率符号化方法及び装置
JPH0713586A (ja) * 1993-06-23 1995-01-17 Matsushita Electric Ind Co Ltd 音声判別装置と音響再生装置
WO1998046045A1 (fr) * 1997-04-10 1998-10-15 Sony Corporation Procede et dispositif de codage, procede et dispositif de decodage et support d'enregistrement
JP2004046179A (ja) * 2002-07-11 2004-02-12 Samsung Electronics Co Ltd 少計算量で高周波数成分を復元するオーディオデコーディング法及び装置
JP2007081560A (ja) * 2005-09-12 2007-03-29 Sony Corp 雑音低減装置及び雑音低減方法並びに雑音低減プログラムとその電子機器用収音装置
JP2010136236A (ja) * 2008-12-08 2010-06-17 Panasonic Corp オーディオ信号処理装置、オーディオ信号処理方法およびプログラム
JP2011081033A (ja) * 2009-10-02 2011-04-21 Toshiba Corp 信号処理装置、及び携帯端末装置

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6973184B1 (en) * 2000-07-11 2005-12-06 Cisco Technology, Inc. System and method for stereo conferencing over low-bandwidth links
JP2004061617A (ja) 2002-07-25 2004-02-26 Fujitsu Ltd 受話音声処理装置

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06149292A (ja) * 1992-11-11 1994-05-27 Sony Corp 高能率符号化方法及び装置
JPH0713586A (ja) * 1993-06-23 1995-01-17 Matsushita Electric Ind Co Ltd 音声判別装置と音響再生装置
WO1998046045A1 (fr) * 1997-04-10 1998-10-15 Sony Corporation Procede et dispositif de codage, procede et dispositif de decodage et support d'enregistrement
JP2004046179A (ja) * 2002-07-11 2004-02-12 Samsung Electronics Co Ltd 少計算量で高周波数成分を復元するオーディオデコーディング法及び装置
JP2007081560A (ja) * 2005-09-12 2007-03-29 Sony Corp 雑音低減装置及び雑音低減方法並びに雑音低減プログラムとその電子機器用収音装置
JP2010136236A (ja) * 2008-12-08 2010-06-17 Panasonic Corp オーディオ信号処理装置、オーディオ信号処理方法およびプログラム
JP2011081033A (ja) * 2009-10-02 2011-04-21 Toshiba Corp 信号処理装置、及び携帯端末装置

Also Published As

Publication number Publication date
US20110255699A1 (en) 2011-10-20
US8532309B2 (en) 2013-09-10
JP4922427B2 (ja) 2012-04-25

Similar Documents

Publication Publication Date Title
CN106716526B (zh) 用于增强声源的方法和装置
JP4649546B2 (ja) 補聴器
JP7266916B2 (ja) ラウドネスレベルを制御するオーディオ信号処理方法及び装置
JP6073456B2 (ja) 音声強調装置
JP2013102411A (ja) 音声信号処理装置、および音声信号処理方法、並びにプログラム
JP2015050685A (ja) オーディオ信号処理装置および方法、並びにプログラム
US20100128882A1 (en) Audio signal processing device and audio signal processing method
JP2008065090A (ja) ノイズサプレス装置
JP2009175420A (ja) 音補正装置
JP4738213B2 (ja) 利得調整方法及び利得調整装置
JP5136378B2 (ja) 音響処理方法
JP4922427B2 (ja) 信号補正装置
JP4448464B2 (ja) 雑音低減方法、装置、プログラム及び記録媒体
JP5232121B2 (ja) 信号処理装置
JP2009296298A (ja) 音声信号処理装置および方法
JP2008309955A (ja) ノイズサプレス装置
WO2014192675A1 (ja) 信号処理装置及び信号処理方法
EP3896998A1 (en) Systems and methods for providing content-specific, personalized audio replay on customer devices
Chanda et al. Speech intelligibility enhancement using tunable equalization filter
JP6197367B2 (ja) 通話装置及びマスキング音生成プログラム
KR20120016709A (ko) 휴대용 단말기에서 통화 품질을 향상시키기 위한 장치 및 방법
JP2011141540A (ja) 音声信号処理装置、テレビジョン受像機、音声信号処理方法、プログラム、および、記録媒体
CN112153533B (zh) 音频信号的破音消除方法及装置、存储介质、终端
JP2010092057A (ja) 受話音声処理装置及び受話音声再生装置
JP6544182B2 (ja) 音声処理装置、プログラム及び方法

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110906

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111104

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120110

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120203

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150210

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees