JP6669277B2 - 音声ノイズ検出装置、デジタル放送受信装置、及び音声ノイズ検出方法 - Google Patents

音声ノイズ検出装置、デジタル放送受信装置、及び音声ノイズ検出方法 Download PDF

Info

Publication number
JP6669277B2
JP6669277B2 JP2018557717A JP2018557717A JP6669277B2 JP 6669277 B2 JP6669277 B2 JP 6669277B2 JP 2018557717 A JP2018557717 A JP 2018557717A JP 2018557717 A JP2018557717 A JP 2018557717A JP 6669277 B2 JP6669277 B2 JP 6669277B2
Authority
JP
Japan
Prior art keywords
audio signal
audio
unit
noise
component
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018557717A
Other languages
English (en)
Other versions
JPWO2018116944A1 (ja
Inventor
勇哉 西牟田
勇哉 西牟田
高木 和也
和也 高木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Publication of JPWO2018116944A1 publication Critical patent/JPWO2018116944A1/ja
Application granted granted Critical
Publication of JP6669277B2 publication Critical patent/JP6669277B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0232Processing in the frequency domain
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0264Noise filtering characterised by the type of parameter measurement, e.g. correlation techniques, zero crossing techniques or predictive techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/06Receivers
    • H04B1/10Means associated with receiver for limiting or suppressing noise or interference
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/06Receivers
    • H04B1/16Circuits

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Noise Elimination (AREA)
  • Circuits Of Receivers In General (AREA)

Description

この発明は、移動中にデジタル放送を受信するデジタル放送受信装置における音声ノイズの検出を行なう音声ノイズ検出装置に関する。
デジタルテレビやデジタルラジオを移動中に受信して視聴できるデジタル放送受信装置が普及してきており、例えば、自動車の車内で視聴する車載デジタル放送受信装置、又はデジタル放送受信機能を内蔵したカーナビゲーションシステムが近年普及している。
デジタル放送受信装置が自動車等の移動体に搭載される場合、電波受信環境が周辺の環境変化や高速移動における影響を受けるため、デジタル放送受信装置が受信する電波に乱れが発生する場合がある。例えば、デジタル放送受信装置が放送局から遠く離れた場所にある場合、放送局から受信アンテナに届く電波の強度が弱くなる。また、デジタル放送受信装置が高層ビルに囲まれた都市部にある場合、ビル壁における反射の影響により受信電波に不要な干渉波が含まれる。さらに移動中に電波を受信すると、ドップラーシフトの影響を受けて受信信号の振幅変動や位相の時間変動が現れる。
デジタル放送は、送信側で映像データ及び音声データをMPEG(Moving Picture Experts Group)などの圧縮方式で圧縮されたデータについて誤り訂正符号を施して送信される。受信側は送信側で用いた誤り訂正符号を用いて誤り訂正を行なうことで受信データのエラーを訂正することができるが、受信データのエラーが多ければ誤り訂正がしきれない場合がある。このため、送信側で用いた圧縮方式によってこの受信データをデコードする場合、デコード結果に異常が発生してデジタル音声信号の一部がノイズとなって出力されてしまう場合がある。
そこで、デジタル音声信号を周波数領域に変換した周波数スペクトル信号を複数の帯域に分割して、分割した帯域ごとに、ノイズの発生区間を検出し、該当区間の音声信号を補正することで、音声ノイズの影響を低減する方法がある(例えば、特許文献1参照)。
特開2010−249939号公報(第6−36頁、第5図)
しかしながら、特許文献1の方法では、ノイズの検出に周波数のピークを使用しているため、周波数方向に広範囲に強い成分が分布している場合、正しくノイズを検出することができないという問題があった。
この発明は、上述のような課題を解決するためになされたもので、周波数方向に広範囲に強い成分が分布しているようなノイズ成分があるデジタル音声信号に対してもノイズを検出する音声ノイズ検出装置を提供することを目的とする。
この発明に係る音声ノイズ検出装置においては、デジタル音声信号を入力する音声信号入力部と、設定された時間幅に基づいてデジタル音声信号から区間音声信号を生成する区間音声信号生成部と、区間音声信号から周波数スペクトル信号の高域成分を抽出する高域成分抽出部と、周波数スペクトル信号の高域成分から成分値の高い周波数値を抽出し、成分値と周波数値とを乗算した値から音声特徴データを生成する特徴量算出部と、音声特徴データから区間音声信号のノイズ成分を検出する音声ノイズ検出部とを備えることを特徴とするものである。
この発明は、周波数スペクトル信号の高域成分から成分値の高い周波数値を抽出し、成分値及び周波数値を乗算したものから音声特徴データを生成してノイズ成分を検出するので、周波数方向に広範囲に強い成分が分布しているようなノイズ成分があるデジタル音声信号に対してもノイズを検出することができるという効果を奏する。
実施の形態1にかかるデジタル放送受信装置の構成を概略的に示すブロック図である。 実施の形態1にかかる音声ノイズ検出装置の構成を概略的に示すブロック図である。 実施の形態1にかかる区間音声信号生成部の抽出区間とオーバーラップ率の関係を示す図である。 実施の形態1にかかる高域成分抽出部の構成を概略的に示すブロック図である。 サポートベクターマシンでの境界線決定を説明する図である。 実施の形態1にかかる音声信号処理部の構成を概略的に示すブロック図である。 実施の形態1にかかる音声信号処理部の処理の一例を示す図である。 実施の形態1にかかる音声信号処理部の処理の別の例を示す図である。 実施の形態1にかかる音声ノイズ検出処理の一例を示すフローチャートである。 実施の形態2にかかる音声ノイズ検出装置の構成を概略的に示すブロック図である。 実施の形態2にかかる品質情報とオーバーラップ率との関係の一例を示す表である。 実施の形態3にかかるデジタル放送受信装置の構成を概略的に示すブロック図である。 品質情報マップの一例を示すブロック図である。
実施の形態1.
図1は、本実施の形態にかかる音声ノイズ検出装置10を備えたデジタル放送受信装置の構成を概略的に示すブロック図である。デジタル放送受信装置は、音声ノイズ検出装置10と受信部20とデマルチプレクス部30と音声デコード部40と音声信号処理部50と制御部60とを備える。
受信部20は、選局したデジタル放送の電波を受信して復調する。受信部20は、複数のアンテナから受信した信号を復調するものであってもよい。ここで、本実施の形態で扱うデジタル放送は、音声信号を圧縮処理し、圧縮処理されたデータを他のデータ(例えば映像信号を圧縮処理したデータの圧縮)とマルチプレクス処理(多重化処理ともいう)を行なった上でデジタル変調をして送信されるものとする。他のデータとは、例えば映像信号を圧縮処理したデータなどである。このようなデジタル放送として、日本で採用されているデジタルテレビ放送規格であるISDB−T(Integrated Services Digital Broadcasting − Terrestrial)だけでなく、欧州のデジタルテレビ放送規格であるDVB−T(Digital Video Broadcasting − Terrestrial)、中国のデジタルテレビ放送規格であるDTMB(Digital Terrestrial Multimedia Broadcast)、中国のモバイル端末向けの放送規格であるCMMB(China Mobile Multimedia Broadcasting)などを対象としてもよい。また、デジタルラジオ放送規格であるDAB(Digital Audio Broadcast)を対象としてもよいし、他のデジタル放送規格を対象としてもよい。
デマルチプレクス部30は、復調されたデータについてデマルチプレクス処理(分離化処理ともいう)を行ない、音声圧縮データを取得して音声デコード部40へ供給する。
音声デコード部40は、デマルチプレクス部30からの音声圧縮データについてデコード処理(復号化処理ともいう)を行なってデジタル音声信号を生成する。
音声ノイズ検出装置10は、音声デコード部40からのデジタル音声信号を入力として音声信号のノイズ成分を検出する。検出方法については後述する。
音声信号処理部50は、音声デコード部40からのデジタル音声信号について、音声ノイズ検出装置10が検出したデジタル音声信号のノイズ成分の情報を用いてノイズ成分のあった期間について補正を行い、音声出力するデジタル音声信号を生成する。音声信号処理部50の補正については後述する。
制御部60は、受信部20、デマルチプレクス部30、音声デコード部40、音声信号処理部50、音声ノイズ検出装置10の動作及び設定について制御を行う。例えば、選局に必要な情報や、その中からデマルチプレクス処理をするべき情報をそれぞれの構成要素に送信して制御を行う。また、音声デコード部40が設定したラベルを管理している場合、単位音声信号の対応付けを指示する制御信号を音声デコード部40、音声信号処理部50、及び音声ノイズ検出装置10に送信する。
図2は、本実施の形態にかかる音声ノイズ検出装置10の構成を概略的に示すブロック図である。音声ノイズ検出装置10は、音声信号入力部101と音声特徴データ生成部102と音声ノイズ検出部103とを備える。音声特徴データ生成部102は、区間音声信号生成部1021と高域成分抽出部1022と特徴量算出部1023とを有する。また、音声ノイズ検出部103は、ノイズ識別情報記憶領域1031と音声ノイズ検出処理部1032と検出結果記憶領域1033とを有する。ここで、ノイズ識別情報記憶領域1031と検出結果記憶領域1033とは共通の記憶部の中で記憶されるものとして構成されても構わない。
音声信号入力部101は、音声デコード部40からのデジタル音声信号を入力する。
区間音声信号生成部1021は、音声信号入力部101が入力したデジタル音声信号について設定された時間幅に基づいて抽出することによって区間音声信号を生成する。ここで時間幅は、例えばFFT(Fast Fourier Transform)を実施する場合ではサンプリング単位で2の累乗に対応する時間幅で設定すればよい。
また、区間音声信号生成部1021は、デジタル音声信号から区間音声信号を抽出するときに前回の抽出区間と時間方向に重複(オーバーラップ)する区間を設定して抽出しても構わない。つまり、連続する区間音声信号が時間方向にオーバーラップする区間と前記設定された時間幅とに基づいて前記区間音声信号を抽出しても構わない。図3は、区間音声信号生成部1021の抽出区間とオーバーラップ率の関係を示す図である。図3は、入力されたデジタル音声信号に対して時間幅L及びオーバーラップ率R_o(0≦R_o≦0.5)で第1区間、第2区間、及び第3区間と順に抽出する状況を示している。図3に示すように、それぞれの抽出区間の間の重複区間は時間幅Lにオーバーラップ率R_oを乗算した区間となる。
図4は、高域成分抽出部1022の構成を概略的に示すブロック図である。高域成分抽出部1022は、区間音声信号から周波数の高域成分の抽出を行う。高域成分抽出部1022は、低周波領域の成分を除去するハイパスフィルタである高域通過フィルタ10221又は10223と、周波数領域変換部10222とを有し、区間音声信号生成部1021で生成される区間音声信号から、周波数の高域成分のみを抽出する。これにより、周波数スペクトル信号の高域成分、すなわち周波数と対応する電力値(以下、成分値ともいう)とを獲得する。ここで高域成分の抽出は、図4(a)のように、先に低域成分を除去したデジタル音声信号を周波数変換してもよいし、図4(b)のように先に周波数変換を行ってから低域成分を除去してもよい。除去する低域の範囲は、正常な音声信号の成分を抑制することができればよく、例えば、人の音声であれば、主な成分が含まれる4,000Hz以下の周波数領域を抑制すればよい。この場合、高域成分は4,000Hzを超える周波数領域の成分である。つまり、高域成分は人の音声の主な成分が含まれる周波数領域よりも高い周波数領域の成分である。
特徴量算出部1023は、高域成分抽出部1022から受け取った、周波数スペクトル信号の高域成分から特徴量を算出する。特徴量算出部1023は、周波数スペクトル信号から、その電力値が大きい順に上位N個のサンプル(N:自然数)を抽出し、抽出した周波数及び電力値を取得する。そして、それぞれの電力値に周波数で重み付けして音声特徴データである特徴量F_noiseを算出する。
特徴量算出処理の一例を示す。抽出した周波数をDf、電力値をDpとすると、特徴量算出処理では、以下の(1)式にように、N個のサンプルそれぞれの電力値Dpに周波数Dfで乗算した平均を特徴量F_noiseとして算出する。なお、この特徴量の算出は一例であり、周波数で重み付けした電力値であれば、この式だけによるものではない。
Figure 0006669277
このように、音声特徴データ生成部102は、設定された時間幅に基づいてデジタル音声信号を抽出することによって区間音声信号を生成し、区間音声信号に対して周波数スペクトル信号への周波数変換、及び周波数の高域成分の抽出を行い、周波数スペクトル信号から成分値の高い周波数値を抽出し、成分値及び周波数値を乗算したものから区間音声信号における特徴量F_noiseを生成する。
次に音声ノイズ検出部103について説明する。音声ノイズ検出部103は、ノイズ識別情報記憶領域1031と音声ノイズ検出処理部1032と検出結果記憶領域1033とを有し、音声特徴データ生成部102が生成する該当する区間音声信号における特徴量F_noiseから、該当する区間音声信号にノイズがあるかノイズがないかの判定を行う。
ノイズ識別情報記憶領域1031は、ノイズの検出に使用される情報であるノイズ識別情報を記憶する領域であって独立した記憶部の記憶領域であっても共通の記憶部における一部の記憶領域であっても構わない。ここで、ノイズ識別情報とは、特徴量からノイズか否かを判定する識別器の情報である。
音声ノイズ検出処理部1032は、ノイズ識別情報に基づいて特徴量F_noiseからノイズがあるかノイズがないかの判定を行う。
例えば、識別器が線形識別器である場合、識別器は以下の(2)式に示す判別多項式Dで表わされる。
Figure 0006669277
ここで、F_noiseは特徴量、A、及びBは判別多項式Dを構成する係数、Mは特徴量の次元数である。ノイズ識別情報記憶領域1031には判別多項式Dにおける各次元の係数A及び係数Bの情報が記憶される。
判別多項式Dは、例えばサポートベクターマシンとよばれる線形識別器を構築するアルゴリズムによって決定される。サポートベクターマシンでは、ノイズの有無をラベル付けした特徴量、すなわち学習データを用いて、ノイズの有無を識別する判別多項式Dを決定する。
図5は、2次元の特徴量からサポートベクターマシンで2つのクラス(クラス1及びクラス2)に識別する境界線の決定を説明する図である。サポートベクターマシンは、2次元の特徴量から2つのクラスを最適に分離するために、マージン最大化の考えに基づいて境界を決定する。マージン最大化とは、クラス間のマージン(距離)を最大にするというものであり、図5の例では、点X、及び、点Yの双方からの距離が最大となる直線を判別多項式Dとして求める。図5の例であれば、(2)式に示す判別多項式Dに特徴量1及び特徴量2の値を代入し、その値が正であれば直線の上側にあるクラス1、値が負であれば直線の下側にあるクラス2であると判定する。
本実施の形態では、判別多項式Dをサポートベクターマシンによって決定し、音声ノイズ検出処理部1032で使用するために、その係数A及び係数Bをノイズ識別情報としてノイズ識別情報記憶領域1031に事前に記憶する。
音声ノイズ検出処理部1032は、ノイズ識別情報記憶領域1031に保持されたノイズ識別情報である係数A及び係数Bを取得し、(2)式に示す判別多項式Dを計算し、計算結果の正負によってノイズの有無を判定する。
なお、ここではサポートベクターマシンによる線形分離識別面による2クラスの分類を例に取ったが、非線形分離識別面を構築するアルゴリズムを使用してもよいし、ニューラルネットワークなど他のアルゴリズムを使用してもよい。
ノイズ有無の判定は、区間音声信号ごとに行われる。ここで、入力のデジタル音声信号に対応したノイズ検出結果を得るために、入力のデジタル音声信号を分割した区間音声信号全てのノイズ判定が終了するまで検出結果記憶領域1033に検出結果を蓄積し、入力のデジタル音声信号分の検出結果を蓄積した後に、外部に出力する。ノイズ検出結果の蓄積方法は、区間音声信号ノイズ発生区間のみONとなる0又は1で表わす1ビットの信号でもよいし、ノイズ発生区間の開始時刻及び終了時刻のリストであってもよい。
以上のように音声ノイズ検出装置10で検出されたノイズ成分の情報を用いて音声信号処理部50は、音声デコード部40からのデジタル音声信号について、音声ノイズ検出装置10が検出したノイズ成分の情報を用いてノイズ成分のあった期間について補正を行い、音声出力するデジタル音声信号を生成することができる。
図6は、音声信号処理部50の構成を概略的に示すブロック図である。音声信号処理部50は、バッファ制御部501と過去信号記憶領域502と補正音声信号生成部503と音声信号補正部504とを有し、デジタル音声信号から音声ノイズ検出装置10で検出されたノイズ成分に基づく補正を行なう。
バッファ制御部501は、音声デコード部40からのデジタル音声信号を過去信号記憶領域502に記憶し、それに対応するノイズ検出結果から補正を行う際に、記憶したデジタル音声信号を補正音声信号生成部503へ出力する。
過去信号記憶領域502は、音声デコード部40からのデジタル音声信号を記憶する領域であって独立した記憶部の記憶領域であっても共通の記憶部における一部の記憶領域であっても構わない。
補正音声信号生成部503は、過去信号記憶領域502から記憶したデジタル音声信号と、音声ノイズ検出装置10で検出されたノイズ成分の情報とを入力し、ノイズ成分が検出された区間について補正を行うための補正音声信号を生成する。音声信号補正部504は、補正音声信号生成部503から補正音声信号を入力する。音声信号補正部504は、ノイズが検出された区間では、音声デコード部40からのデジタル音声信号を補正音声信号に切り替えて出力し、デジタル音声信号の補正を行う。
図7は、音声信号処理部の処理の一例を示す図である。図7の上図は音声デコード部40からのデジタル音声信号であって、時刻taから時刻tbの区間は音声ノイズ検出装置10においてノイズ成分があると検出した結果を示す。図7の下図は補正音声信号生成部503が音声デコード部40からのデジタル音声信号の時刻taから時刻tbの区間について補正をした補正音声信号を示す。図7のように、ノイズが検出された区間時刻taから時刻tbを振幅のない信号に切り替えたものを補正音声信号として生成する。振幅のない信号は無音信号となる。
図8は、音声信号処理部の処理の別の例を示す図である。図8の上図は音声デコード部40からのデジタル音声信号であって、時刻taから時刻tbの区間は音声ノイズ検出装置10においてノイズ成分があると検出した結果を示す。図8の下図は補正音声信号生成部503が音声デコード部40からのデジタル音声信号の時刻taから時刻tbの区間について補正をした補正音声信号を示す。時刻tcから時刻tdの区間は時刻taから時刻tbの区間と同じ長さ(設定された時間幅)で音声ノイズ検出装置10からノイズ成分がない区間であることが示された区間である。時刻tcから時刻tdの区間はノイズ成分が発生する直前である。図8のように、ノイズ成分がない区間であることが示された区間時刻tcから時刻tdの振幅のないデジタル音声信号をコピーして、ノイズが検出された区間時刻taから時刻tbに差替えたものを補正音声信号として生成する。特に振幅の小さい音が続いているような区間であれば、ノイズ成分が発生する直前のノイズ成分がない区間を繰り返すことで無音信号よりも違和感が軽減するという効果を奏する。
図9は、音声ノイズ検出処理の一例を示すフローチャートである。音声信号入力部101は、音声デコード部40からのデジタル音声信号を入力する(ステップS1)。区間音声信号生成部1021は、音声信号入力部101が入力したデジタル音声信号について設定された時間幅に基づいて抽出することによって区間音声信号を生成する(ステップS2)。高域成分抽出部1022は、区間音声信号から周波数の高域成分の抽出を行う(ステップS3)。
特徴量算出部1023は、高域成分抽出部1022から受け取った、周波数スペクトル信号の高域成分から成分値の高い周波数値を抽出し、成分値と周波数値とを乗算した値から音声特徴データを生成する(ステップS4)。音声ノイズ検出部103は、特徴量算出部1023が生成する該当する区間音声信号における音声特徴データから、該当する区間音声信号にノイズがあるかノイズがないかの判定を行い、区間音声信号のノイズ成分を検出する(ステップS5)。そして、音声信号処理部50は、音声デコード部40からのデジタル音声信号について、音声ノイズ検出部103が検出したノイズ成分の情報を用いてノイズ成分のあった期間について補正を行い、音声出力するデジタル音声信号を生成する(ステップS6)。
以上のように、本実施の形態にかかる音声ノイズ検出装置10は、周波数方向に広範囲に強い成分が分布しているようなノイズ成分がある信号に対してもノイズを検出することができる。また、音声ノイズ検出装置10で検出されたノイズ成分のある区間について補正を行うことで、検出したノイズ成分を出力することなく、デジタル放送受信装置が出力するデジタル音声信号の品質を向上することが可能となる。
また、本実施の形態にかかる音声ノイズ検出装置は、例えば一つのプロセッサーと、RAM(Random Access Memory)又はHDD(Hard Disk Drive)などの記録部とを用いてノイズ検出を行うことができるという効果がある。
実施の形態2.
実施の形態2にかかる音声ノイズ検出装置は、品質情報を入力する品質情報入力部と、入力された品質情報に基づいて区間音声信号生成部で用いるオーバーラップ率を変更するパラメータ決定部とをさらに備える。
図10は、本実施の形態にかかる音声ノイズ検出装置11の構成を概略的に示すブロック図である。音声ノイズ検出装置11は、音声信号入力部101と音声特徴データ生成部102と音声ノイズ検出部103とに加えて、品質情報入力部114とパラメータ決定部115とをさらに備える。符号が同一の構成要素については上述と構成及び作用が同じであるため説明を省略する。
品質情報入力部114は、品質情報を入力する。ここで品質情報は、入力されるデジタル音声信号の品質に関連する情報であって、例えば受信部20が選局して受信したデジタル放送の電波の電波強度、復調時に得られる情報から推定するCNR(Carrier to Noise Ratio)又はSNR(Signal to Noise Ratio)、及びパケットエラーレートなどが挙げられる。
パラメータ決定部115は、入力された品質情報に基づいて区間音声信号生成部1021で設定する抽出区間のオーバーラップ率を設定する。入力された品質情報が悪い受信状態であることを示す値であればあるほどオーバーラップ率を大きく設定する。
図11は、品質情報とオーバーラップ率との関係の一例を示す表である。図11では、入力された品質情報に対して閾値を設定して、品質情報の分類を「良い(G)」又は「悪い(B)」の2値に分類してオーバーラップ率を設定する例を示した。図11では品質情報の分類がG(音声品質:良)の場合はオーバーラップ率を0.0つまりオーバーラップすることなく区間分割するように設定する。一方、品質情報の分類がB(音声品質:悪)の場合はオーバーラップ率を0.5つまり分割する区間の半分は前後それぞれの抽出区間と重複するように設定する。
なお、品質情報の分類は2値に限らず分類数を増やして段階的に設定するようにしても構わないことは明らかであり、品質情報に基づく音声品質が低いときほどオーバーラップ率を高く(オーバーラップ区間を長く)設定して抽出する。また、複数種類の品質情報を入力してそれぞれの閾値で分類した結果の組合せで最終分類結果を決め、最終分類結果に基づいてオーバーラップ率を設定しても構わない。
これらにより、悪い受信状態であればあるほど区間音声信号生成部1021が抽出する重複期間を増やすことでノイズ検出の取りこぼしを削減することができる。
一方、良い受信状態であればあるほど区間音声信号生成部1021が抽出する重複期間を減らすことで効率よくノイズ検出をすることができる。例えば一つのプロセッサーと、RAM(Random Access Memory)又はHDD(Hard Disk Drive)などの記録部とを用いてノイズ検出を行う場合は、ノイズ検出に関連するプロセッサーの負荷を減らすことで他のプロセッサーのプロセス実行に負荷を割り当てることができるという効果がある。
実施の形態3.
実施の形態2にかかる音声ノイズ検出装置が入力する品質情報はデジタル放送受信装置が受信して推定した品質情報であったが、実施の形態3にかかる音声ノイズ検出装置はデジタル放送受信装置の外部から位置情報を入力し、位置情報と品質情報とを対応付けて記憶された品質情報マップに基づいて品質情報を音声ノイズ検出装置へ供給する。
図12は、本実施の形態にかかる音声ノイズ検出装置11を備えたデジタル放送受信装置の構成を概略的に示すブロック図である。デジタル放送受信装置は、音声ノイズ検出装置11と受信部20とデマルチプレクス部30と音声デコード部40と音声信号処理部50と制御部60とに加えて入力部(位置情報入力部ともいう)70と品質情報マップ記憶領域80とを備える。符号が同一の構成要素については上述と構成及び作用が同じであるため説明を省略する。
入力部70は、外部から電波を受信している環境に関する情報を取得する。例えば、デジタル放送受信装置を搭載した車などの移動体から位置情報を取得する。位置情報は、カーナビなどの車載装置が取得するGPS(Global Positioning System)の情報などがある。
入力部70は、外部から位置情報を入力し、品質情報マップ記憶領域80が記憶する品質情報マップに基づいて、入力された位置情報に対応した品質情報を音声ノイズ検出装置11へ品質情報を供給する。
品質情報マップ記憶領域80は、位置情報と品質情報とを対応付けて記憶する領域であって独立した記憶部の記憶領域であっても共通の記憶部における一部の記憶領域であっても構わない。
なお、品質情報は、デジタル放送受信装置を搭載した車などの移動体が実際に受信したときの電波強度、復調時に得られる情報から推定するCNR又はSNR、及びパケットエラーレートなどが挙げられる。
図13は、品質情報マップ記憶領域80で記憶する品質情報マップの一例を示すブロック図である。図13では、品質情報マップは格子状に分割された地図情報であり、各格子に対応する位置での品質情報を有する。各格子が有する品質情報は、例えば前記した「良い(G),悪い(B)」の2値を保持する。
例えば品質情報マップのあるブロックに位置したときにデジタル放送受信装置が受信して得られた品質情報をそのブロック全体での品質情報として品質情報マップ記憶領域80で記憶する。これにより同じブロックの中で異なる位置で受信した場合も以前受信した位置での品質情報を用いて設定することができるので、常時品質情報を推定することなく品質情報を得られる。
また、受信品質の推定が未実施のブロックについて、周辺ブロックにおける品質情報からそのブロックの品質情報を推定して記憶しておくものとしても構わない。さらに、同じブロックの中で受信品質を再度推定した結果と品質情報マップ記憶領域80で記憶されている品質情報とに違いがあった場合は、新しい情報で再記憶するものとしても構わない。
図12では、品質情報マップ記憶領域80をデジタル放送受信装置側に記憶するものとしているが、デジタル放送受信装置がインターネットに接続している場合は、品質情報マップ記憶領域80を外部サーバーなどのクラウドの記憶領域として、入力した位置情報のブロックでの品質情報をインターネット経由で品質情報マップ記憶領域80にアクセスして取得するものとしても所期の目的を果たすことはいうまでもない。
以上実施の形態1〜3において、音声ノイズ検出装置、及びデジタル放送受信装置の一部は、処理回路により実現される。処理回路は、専用のハードウェアであっても、メモリに格納されるプログラムを実行するCPUであってもよい。例えば、図1のうち、受信部20、デマルチプレクス部30、音声デコード部40、音声信号処理部50、及び制御部60の機能をそれぞれ別個の処理回路で実現してもよいし、上記の複数の部分の機能をまとめて一つの処理回路で実現してもよい。
同様に、図2のうち、音声信号入力部101、音声特徴データ生成部102、及び音声ノイズ検出部103の機能をそれぞれ別個の処理回路で実現してもよいし、上記の複数の部分の機能をまとめて一つの処理回路で実現してもよい。
処理回路がCPUの場合、上記の複数の部分の機能は、ソフトウェア、ファームウェア、又はソフトウェアとファームウェアとの組み合わせにより実現される。ソフトウェア又はファームウェアはプログラムとして記述され、メモリに格納される。CPUは、メモリに記憶されたプログラムを読み出して実行することにより、各部の機能を実現する。また、デジタル放送受信装置の上記の複数の部分の機能のうち、一部の機能を専用のハードウェアで実現し、他の一部の機能をソフトウェア又はファームウェアで実現するようにしてもよい。
10,11 音声ノイズ検出装置、 20 受信部、 30 デマルチプレクス部、 40 音声デコード部、 50 音声信号処理部、 60 制御部、 70 入力部、 80 品質情報マップ記憶領域、 101 音声信号入力部、 102 音声特徴データ生成部、 103 音声ノイズ検出部、 114 品質情報入力部、 115 パラメータ決定部、 501 バッファ制御部、 502 過去信号記憶領域、 503 補正音声信号生成部、 504 音声信号補正部、 1021 区間音声信号生成部、 1022 高域成分抽出部、 1023 特徴量算出部、 1031 ノイズ識別情報記憶領域、 1032 音声ノイズ検出処理部、 1033 検出結果記憶領域、 10221、10223 高域通過フィルタ、 10222 周波数領域変換部。

Claims (9)

  1. デジタル音声信号を入力する音声信号入力部と、
    設定された時間幅に基づいて前記デジタル音声信号から区間音声信号を生成する区間音声信号生成部と、
    前記区間音声信号から周波数スペクトル信号の高域成分を抽出する高域成分抽出部と、
    前記周波数スペクトル信号の高域成分から成分値の高い周波数値を抽出し、前記成分値と前記周波数値とを乗算した値から音声特徴データを生成する特徴量算出部と、
    前記音声特徴データから前記区間音声信号のノイズ成分を検出する音声ノイズ検出部と
    を備える音声ノイズ検出装置。
  2. 前記高域成分抽出部は、前記周波数スペクトル信号を入力として低周波領域の成分を除去するハイパスフィルタをさらに有し、
    前記特徴量算出部は、前記ハイパスフィルタの出力から前記成分値の高い周波数値を抽出する
    ことを特徴とする請求項1に記載の音声ノイズ検出装置。
  3. 前記区間音声信号生成部は、連続する前記区間音声信号が時間方向にオーバーラップする区間と前記設定された時間幅とに基づいて前記区間音声信号を生成する
    ことを特徴とする請求項1または請求項2に記載の音声ノイズ検出装置。
  4. 前記時間方向にオーバーラップする区間は、前記デジタル音声信号の品質情報が示す音声品質が低いときほど長く設定される
    ことを特徴とする請求項3に記載の音声ノイズ検出装置。
  5. 受信した電波から復調してデジタル音声信号を生成する受信部と、
    請求項1から請求項3のいずれか1項に記載の音声ノイズ検出装置と、
    前記デジタル音声信号から前記音声ノイズ検出装置で検出されたノイズ成分に基づく補正を行なって生成したデジタル音声信号を出力する音声信号処理部と
    を備えるデジタル放送受信装置。
  6. 受信した電波から復調してデジタル音声信号を生成する受信部と、
    請求項4に記載の音声ノイズ検出装置と、
    前記デジタル音声信号から前記音声ノイズ検出装置で検出されたノイズ成分に基づく補正を行なって生成したデジタル音声信号を出力する音声信号処理部と
    を備え、
    前記受信部は、前記受信部が受信した電波の電波強度、前記復調した信号からCN比を推定した情報、または前記復調した信号から得られるパケットエラーレートを用いて前記品質情報を生成する
    ことを特徴とするデジタル放送受信装置。
  7. 位置情報を入力する位置情報入力部と、
    前記位置情報とその位置での前記品質情報とを対応して記憶する記憶部と
    をさらに備える
    ことを特徴とする請求項6に記載のデジタル放送受信装置。
  8. 前記音声信号処理部は、前記音声ノイズ検出装置が前記区間音声信号のうちノイズ成分があると検出した区間について、無音信号または前記ノイズ成分が発生する直前の前記時間幅のデジタル音声信号に切り替えて補正することを特徴とする
    請求項5から請求項7のいずれか1項に記載のデジタル放送受信装置。
  9. デジタル音声信号を入力する音声信号入力ステップと、
    設定された時間幅に基づいて前記デジタル音声信号から区間音声信号を生成する区間音声信号生成ステップと、
    前記区間音声信号から周波数スペクトル信号の高域成分を抽出する高域成分抽出ステップと、
    前記周波数スペクトル信号の高域成分から成分値の高い周波数値を抽出し、前記成分値と前記周波数値とを乗算した値から音声特徴データを生成する特徴量算出ステップと、
    前記音声特徴データから前記区間音声信号のノイズ成分を検出する音声ノイズ検出ステップと
    を備える音声ノイズ検出方法。
JP2018557717A 2016-12-20 2017-12-14 音声ノイズ検出装置、デジタル放送受信装置、及び音声ノイズ検出方法 Active JP6669277B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2016246500 2016-12-20
JP2016246500 2016-12-20
PCT/JP2017/044832 WO2018116944A1 (ja) 2016-12-20 2017-12-14 音声ノイズ検出装置、デジタル放送受信装置、及び音声ノイズ検出方法

Publications (2)

Publication Number Publication Date
JPWO2018116944A1 JPWO2018116944A1 (ja) 2019-04-11
JP6669277B2 true JP6669277B2 (ja) 2020-03-18

Family

ID=62626395

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018557717A Active JP6669277B2 (ja) 2016-12-20 2017-12-14 音声ノイズ検出装置、デジタル放送受信装置、及び音声ノイズ検出方法

Country Status (2)

Country Link
JP (1) JP6669277B2 (ja)
WO (1) WO2018116944A1 (ja)

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010046954A1 (ja) * 2008-10-24 2010-04-29 三菱電機株式会社 雑音抑圧装置および音声復号化装置
JP2010249940A (ja) * 2009-04-13 2010-11-04 Sony Corp ノイズ低減装置、ノイズ低減方法
JP6059130B2 (ja) * 2013-12-05 2017-01-11 日本電信電話株式会社 雑音抑圧方法とその装置とプログラム

Also Published As

Publication number Publication date
WO2018116944A1 (ja) 2018-06-28
JPWO2018116944A1 (ja) 2019-04-11

Similar Documents

Publication Publication Date Title
US9325554B2 (en) Receiving device, receiving method, and program
JP6812437B2 (ja) 混成無線システムでの自動音声整合化の方法及びそのための装置
JP5257249B2 (ja) 受信装置、受信方法、およびプログラム、並びに受信システム
JP5348490B2 (ja) 信号処理装置および方法、並びに受信システム
JP2011129974A (ja) 受信装置および方法、プログラム、並びに受信システム
JP5278173B2 (ja) 受信装置および方法、プログラム、並びに受信システム
RU2600984C2 (ru) Приемное устройство, способ приема, программа и приемная система
US8941492B2 (en) Receiving apparatus, information processing method and program
JP2011029925A (ja) 受信装置及び方法、プログラム、並びに受信システム
US11502762B2 (en) Signal processing device and image display apparatus including the same
JP6669277B2 (ja) 音声ノイズ検出装置、デジタル放送受信装置、及び音声ノイズ検出方法
JP2012216882A (ja) 受信装置、受信方法、プログラム、および受信システム
US9094635B2 (en) Reception device, reception method, program, and reception system
US8290071B2 (en) Modulating device and method, demodulating device and method, program, and recording medium
JP6778534B2 (ja) Ofdm信号送信装置及びofdm信号受信装置
JPWO2008146431A1 (ja) デジタル放送受信装置
JP2013074328A (ja) 送信装置および送信方法
US8634486B2 (en) Signal receiving apparatus, signal receiving method and signal receiving program
JP2010041571A (ja) 画像処理装置
KR101917724B1 (ko) 잡음에 강인한 공중 음파 통신 시스템 및 그 방법
JP6103589B2 (ja) 通信システム、受信装置、半導体装置及び通信システムにおけるジッタ補正方法
WO2020022293A1 (ja) 信号処理回路および信号処理システム
JP2011171947A (ja) 放送受信装置およびシンボル合成方法
JP6156058B2 (ja) 受信装置、受信方法、並びにプログラム
JP5686248B2 (ja) 受信装置、受信方法、およびプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20181119

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200128

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200210

R151 Written notification of patent or utility model registration

Ref document number: 6669277

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250