JP2019192963A - ノイズ軽減装置、ノイズ軽減方法およびプログラム - Google Patents

ノイズ軽減装置、ノイズ軽減方法およびプログラム Download PDF

Info

Publication number
JP2019192963A
JP2019192963A JP2018079900A JP2018079900A JP2019192963A JP 2019192963 A JP2019192963 A JP 2019192963A JP 2018079900 A JP2018079900 A JP 2018079900A JP 2018079900 A JP2018079900 A JP 2018079900A JP 2019192963 A JP2019192963 A JP 2019192963A
Authority
JP
Japan
Prior art keywords
data
noise
unit
noise reduction
audio
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2018079900A
Other languages
English (en)
Inventor
将光 藤丸
Masamitsu Fujimaru
将光 藤丸
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Olympus Corp
Original Assignee
Olympus Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Olympus Corp filed Critical Olympus Corp
Priority to JP2018079900A priority Critical patent/JP2019192963A/ja
Priority to US16/367,094 priority patent/US20190325003A1/en
Priority to CN201910270311.2A priority patent/CN110392325A/zh
Publication of JP2019192963A publication Critical patent/JP2019192963A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/14Fourier, Walsh or analogous domain transformations, e.g. Laplace, Hilbert, Karhunen-Loeve, transforms
    • G06F17/141Discrete Fourier transforms
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0232Processing in the frequency domain
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2410/00Microphones
    • H04R2410/05Noise reduction with a separate noise microphone

Abstract

【課題】音声データを劣化させることなく、ミュージカルノイズの発生を抑えることができるノイズ軽減装置、ノイズ軽減方法およびプログラムを提供する。【解決手段】ノイズ軽減装置1は、外部から入力された第1の音声データに対して、フーリエ変換を行うことによって周波数毎の振幅データに変換した第1のデータを生成する第1の変換部2と、予め検出したノイズデータを記録するノイズデータ記録部41と、第1のデータからノイズデータを減算することによって第2のデータを生成する減算部3と、第1のデータおよび第2のデータを合成することによって、第3のデータを生成する演算部5と、第3のデータに対して、逆フーリエ変換を行うことによって第2の音声データを生成する第2の変換部6と、を備える。【選択図】図1

Description

本発明は、音声データに含まれるノイズを軽減するノイズ軽減装置、ノイズ軽減方法およびプログラムに関する。
従来、音声データに重畳したノイズを除去する方法として、スペクトル減算法が知られている。このスペクトル減算法は、予めノイズ(雑音)のスペクトル信号に減算係数を乗じたものを、入力音声データに基づく入力スペクトル信号から減算することによって減算スペクトル信号を生成し、この減算スペクトル信号を用いてノイズが軽減された出力スペクトル信号および音声データを生成する。しかしながら、スペクトル減算法では、ノイズを抑制するため、減算係数が大きな値となり、入力音声データに含まれる音声とノイズのレベル差によっては、減算結果がゼロ以下となることで、出力スペクトルが大きく歪み、この歪みが異音、いわゆるミュージカルノイズとして発生する。
上述のミュージカルノイズの発生を防止する方法として、入力音声データに基づく入力スペクトル信号に対して、ノイズのスペクトル信号に所定の係数を逐次変更しながら乗じて得た信号を減算することで生成した減算スペクトル信号と予め取得された暗騒音スペクトル信号とを用いて音声データを生成することで、ミュージカルノイズの発生を防止する技術が知られている(例えば特許文献1参照)。
特開2014−44313号公報
ところで、上述した特許文献1では、バンドごとのノイズのスペクトル信号に係数を乗じ、それぞれの信号の中で一番大きな信号を選択する方法である。上述した特許文献1では、低減対象のノイズが撮像装置におけるレンズの駆動音等であり、小さい目的音に関しては暗騒音が選択されることもあるため、音声データが劣化するという問題点があった。また、最低でも暗騒音程度のスペクトルを保持する方法によりミュージカルノイズの発生を防止するから、小さな目的音や暗騒音のようなノイズレベルが小さいノイズを軽減する場合に課題となっていた。
本開示は、上記に鑑みてなされたものであって、音声データを劣化させることなく、ミュージカルノイズの発生を抑えることができるノイズ軽減装置、ノイズ軽減方法およびプログラムを提供することを目的とする。
上述した課題を解決し、目的を達成するために、本開示に係るノイズ軽減装置は、外部から入力された第1の音声データに対して、フーリエ変換を行うことによって周波数毎の振幅データに変換した第1のデータを生成する第1の変換部と、予め検出したノイズデータを記録するノイズデータ記録部と、前記第1のデータから前記ノイズデータを減算することによって第2のデータを生成する減算部と、前記第1のデータおよび前記第2のデータを合成することによって、第3のデータを生成する演算部と、前記第3のデータに対して、逆フーリエ変換を行うことによって第2の音声データを生成する第2の変換部と、を備えることを特徴とする。
また、本開示に係るノイズ軽減方法は、予め検出したノイズデータを記録するノイズデータ記録部を備えるノイズ軽減装置が実行するノイズ軽減方法であって、外部から入力された第1の音声データに対して、フーリエ変換を行うことによって周波数毎の振幅データに変換した第1のデータを生成する第1の変換ステップと、前記第1のデータから前記ノイズデータを減算することによって第2のデータを生成する減算ステップと、前記第1のデータおよび前記第2のデータを合成することによって、第3のデータを生成する演算ステップと、前記第3のデータに対して、逆フーリエ変換を行うことによって第2の音声データを生成する第2の変換ステップと、を含むことを特徴とする。
また、本開示に係るプログラムは、予め検出したノイズデータを記録するノイズデータ記録部を備えるノイズ軽減装置に、外部から入力された第1の音声データに対して、フーリエ変換を行うことによって周波数毎の振幅データに変換した第1のデータを生成する第1の変換ステップと、前記第1のデータから前記ノイズデータを減算することによって第2のデータを生成する減算ステップと、前記第1のデータおよび前記第2のデータを合成することによって、第3のデータを生成する演算ステップと、前記第3のデータに対して、逆フーリエ変換を行うことによって第2の音声データを生成する第2の変換ステップと、を含むことを特徴とする。
本開示によれば、音声データを劣化させることなく、ミュージカルノイズの発生を抑えることができるという効果を奏する。
図1は、本開示の実施の形態1に係るノイズ軽減装置の機能構成を示すブロック図である。 図2は、本開示の実施の形態1に係るノイズ軽減装置が実行する処理の概要を示すフローチャートである。 図3は、本開示の実施の形態1に係るノイズ軽減装置によるノイズ除去前後の音声データを示す図である。 図4は、本開示の実施の形態2に係る電子機器の機能構成を示すブロック図である。 図5は、本開示の実施の形態2に係るノイズデータ記録部が記録するノイズデータの一例を模式的に示す図である。 図6は、本開示の実施の形態2に係るノイズデータ記録部が記録するノイズデータの別の一例を模式的に示す図である。 図7は、本開示の実施の形態2に係るノイズデータ記録部が記録するノイズデータの別の一例を模式的に示す図である。 図8は、本開示の実施の形態2に係る電子機器が実行する処理の概要を示すフローチャートである。 図9は、本開示の実施の形態2に係る電子機器が実行する動作のタイミングチャートである。 図10は、本開示の実施の形態2に係る設定部が音量検出部によって検出された音量に応じて第1のデータおよび第2のデータの各々に設定する係数の模式的に示す図である。 図11は、第1のデータおよび第2のデータの各々の音量に応じた係数を模式的に示す図である。 図12は、本開示の実施の形態2に係る演算部の演算方法を模式的に示す図である。 図13は、本開示の実施の形態2の変形例に係る設定部が音量検出部によって検出された音量に応じて第1のデータおよび第2のデータの各々に設定する係数を模式的に示す図である。 図14は、本開示の実施の形態3に係る電子機器が実行する処理の概要を示すフローチャートである。 図15は、本開示の実施の形態3に係る電子機器が実行する動作のタイミングチャートである。 図16は、本開示の実施の形態4に係る電子機器が実行する処理の概要を示すフローチャートである。 図17は、本開示の実施の形態4に係る電子機器が実行する動作のタイミングチャートである。
以下、本開示を実施するための形態(以下、「実施の形態」という)を図面とともに詳細に説明する。なお、以下の実施の形態により本開示が限定されるものではない。また、以下の説明において参照する各図は、本開示の内容を理解でき得る程度に形状、大きさおよび位置関係を概略的に示してあるに過ぎない。即ち、本開示は、各図で例示された形状、大きさ、および位置関係のみに限定されるものでない。
(実施の形態1)
図1は、本開示の実施の形態1に係るノイズ軽減装置の機能構成を示すブロック図である。図1に示すノイズ軽減装置1は、例えばマイク等で音声を取得して音声データとして記録するとともに、スピーカ等で音声データを出力するICレコーダ等の音声記録装置、CCD(Charge Coupled Device)やCMOS(Complementary Metal Oxide Semiconductor)等の撮像素子およびスピーカ等によって生成された動画データや画像データを記録するとともに、動画データに対応する動画を表示することができる撮像装置、外部機器からの音声データを再生して出力するヘッドフォン、ネットワークを介して外部のサーバから送信された音声データを再生する再生装置、および、ネットワークを介して外部の装置から送信された音声データを記録するとともに配信を行うサーバ等のいずれかに用いることができる。
図1に示すノイズ軽減装置1は、第1の変換部2と、減算部3と、記録部4と、演算部5と、第2の変換部6と、制御部7とを備える。
第1の変換部2は、制御部7の制御のもと、外部から入力された第1の音声データに対して、フーリエ変換を行うことによって周波数毎の振幅データに変換した第1のデータを生成し、この第1のデータを減算部3および演算部5へ出力する。例えば、第1の変換部2は、フーリエ変換として、離散フーリエ変換や高速フーリエ変換等を行う。第1の変換部2は、例えばDFT(Discrete Fourier Transform)回路またはFFT(Fast Fourier Transform)回路等を用いて構成される。なお、実施の形態1では、フーリエ変換として離散フーリエ変換を行う場合について説明する。
減算部3は、制御部7の制御のもと、第1の変換部2から入力された第1のデータから記録部4が記録するノイズデータを減算することによって第2のデータを算出し、この算出した第2のデータを演算部5へ出力する。ここで、ノイズデータとは、予め無響状態で取得された音声データに対して、フーリエ変換を行うことによって求められた結果を統計計算して求めた統計データである。具体的には、ノイズデータは、複数の音声データに対してフーリエ変換を行うことによって求められた統計値(例えばave+2σ,ave+3σ,ave×1.5,ave×2,max値)など、大きな値とすることで、ノイズ引き残しを起こさない係数を選ぶ。
記録部4は、FlashメモリやSDRAM(Synchronous Dynamic Random Access Memory)等を用いて構成される。記録部4は、減算部3が減算に用いるノイズデータを記録するノイズデータ記録部41と、ノイズ軽減装置1が実行する各種のプログラムを記録するプログラム記録部42と、を有する。
演算部5は、制御部7の制御のもと、第1の変換部2から入力された第1のデータと、減算部3から入力された第2のデータとを合成することによって第3のデータを生成する演算を行い、この第3のデータを第2の変換部6へ出力する。例えば、演算部5は、第1の変換部2から入力された第1のデータと、減算部3から入力された第2のデータと、を所定の比率(例えば1:1)で合成する演算を行うことによって第3のデータを生成する。
第2の変換部6は、演算部5から入力された第3のデータに対して、逆フーリエ変換を行うことによって第2の音声データを生成して出力する。第2の変換部6は、逆フーリエ変換として逆離散フーリエ変換や逆高速フーリエ変換等を行う。第2の変換部6は、例えばIDFT(Inverse Discrete Fourier Transform)回路、IFFT(Inverse Fast Fourier Transform)回路等を用いて構成される。なお、実施の形態1では、フーリエ変換として逆離散フーリエ変換を行う場合について説明する。なお、第1の変換部2、減算部3、演算部5および第2の変換部6の各々は、DSP(Digital Signal Processing)、ASIC(Application Specific Integrated Circuit)およびFPGA(Field Programmable Gate Array)等を用いて構成し、記録部4に記録された各種プログラムを読み込むことにより、上述した機能を発揮するように構成してもよい。
制御部7は、ノイズ軽減装置1を構成する各部を制御する。制御部7は、例えばDSP、FPGAおよびCPU等を用いて構成される。
〔ノイズ軽減装置の処理〕
次に、ノイズ軽減装置1が実行する処理について説明する。図2は、ノイズ軽減装置1が実行する処理の概要を示すフローチャートである。
図2に示すように、まず、第1の変換部2は、外部から入力された第1の音声データに対して、フーリエ変換を行って周波数毎の振幅データに変換した第1のデータを生成する(ステップS1)。
続いて、減算部3は、第1の変換部2から入力された第1のデータから記録部4が記録するノイズデータを減算することによって第2のデータを生成する(ステップS2)。なお、減算部3は、減算結果がマイナスとなる場合には振幅を0とする。
その後、演算部5は、第1の変換部2から入力された第1のデータおよび減算部3から入力された第2のデータを合成することによって第3のデータを生成する(ステップS3)。
続いて、第2の変換部6は、演算部5から入力された第3のデータに対して、逆フーリエ変換を行って第2の音声データを生成して出力する(ステップS4)。ステップS4の後、ノイズ軽減装置1は、本処理を終了する。
図3は、ノイズ軽減装置1によるノイズ除去前後の音声データを示す図である。図3において、横軸が周波数(Hz)を示し、縦軸が音声データのdBを示す。さらに、図3において、曲線L1がノイズ除去前の音声データ(第1の音声データ)を示し、曲線L2がノイズ除去後の音声データ(第2の音声)を示す。図3において、目的音を1kHzとする。
以上説明した実施の形態1によれば、演算部5が第1の変換部2から入力された第1のミュージカルノイズの発生していないデータおよび減算部3から入力されたミュージカルノイズの発生していない、もしくは発生していたとしてもわずかである第2のデータを合成することによって第3のデータを生成するので、音声データの劣化を抑えつつ、ミュージカルノイズの発生を抑えることができる。
また、実施の形態1によれば、ノイズ除去に関し、例えば上述した図3の曲線L1および曲線L2に示すように、1kHzにおいては、ノイズ除去後のSNが6dB改善している。このように、実施の形態1に係るノイズ軽減装置1によれば、目的音を保持しつつ、ミュージカルノイズの発生を抑えノイズを除去することができる。
(実施の形態2)
次に、実施の形態2について説明する。実施の形態2は、上述した実施の形態1に係るノイズ軽減装置1を備える電子機器である。このため、以下においては、実施の形態2に係る電子機器の構成を説明後、実施の形態2に係る電子機器が実行する処理について説明する。なお、上述した実施の形態1に係るノイズ軽減装置1と同一の構成には同一の符号を付して詳細な説明は、省略する。
〔電子機器の構成〕
図4は、実施の形態2に係る電子機器の機能構成を示すブロック図である。図4に示す電子機器100は、音声記録装置、携帯電話、撮像装置、携帯型音声再生装置およびヘッドフォン等を用いて構成される。
図4に示す電子機器100は、音声入力部101と、増幅部102と、AD変換部103と、ゲイン調整部104と、ノイズ軽減部105と、記録処理部106と、記録媒体107と、音量検出部108と、温度検出部109と、操作部110と、記録部111と、表示部112と、制御部113と、を備える。
音声入力部101は、音声を入力してアナログの音声信号(電気信号)に変換し、この音声信号を増幅部102へ出力する。音声入力部101は、指向性マイクまたはステレオマイク等を用いて構成される。
増幅部102は、制御部113の制御のもと、音声入力部101から入力されたアナログの音声信号を所定の増幅率で増幅してAD変換部103へ出力する。増幅部102は、増幅アンプ等を用いて構成される。
AD変換部103は、制御部113の制御のもと、増幅部102から入力されたアナログの音声信号に対してAD変換処理を行って所定のビット数のデジタルの音声データ、例えば16bitや24bitの第1の音声データ(量子化データ)を生成する。AD変換部103は、AD変換回路等を用いて構成される。
ゲイン調整部104は、制御部113の制御のもと、第1の音声データのゲインを調整してノイズ軽減部105へ出力する。ゲイン調整部104は、ゲイン調整回路等を用いて構成される。
ノイズ軽減部105は、制御部113の制御のもと、ゲイン調整部104から入力された第1の音声データに対してノイズを軽減するノイズ軽減処理を行って記録処理部106へ出力する。ノイズ軽減部105は、上述した実施の形態1に係るノイズ軽減装置1の第1の変換部2、減算部3、演算部5および第2の変換部6と、を有する。
記録処理部106は、制御部113の制御のもと、ノイズ軽減部105から入力された第2の音声データを、所定のフォーマットの音声ファイルに格納して記録媒体107に記録する。記録処理部106は、例えばMP3、MAV、AIFF、FLACおよびMPEG4等のいずれかの音声フォーマットの音声ファイルに第2の音声データを格納して記録媒体107へ記録する。記録処理部106は、例えば音声コーディック等を用いて構成される。
記録媒体107は、電子機器100の外部から装着自在であり、記録処理部106から入力された音声ファイル等を記録する。記録媒体107は、例えばメモリカード等を用いて構成される。
音量検出部108は、増幅部102から入力されたアナログの音声信号の電圧値に基づいて、音声の音量を検出し、この検出結果を制御部113へ出力する。音量検出部108は、例えば電圧計や電圧検出回路等を用いて構成される。
温度検出部109は、電子機器100の周囲の温度を検出し、この検出結果を制御部113へ出力する。温度検出部109は、温度センサ等を用いて構成される。
操作部110は、電子機器100に関する各種の操作を指示する指示信号の入力を受け付け、この受け付けた指示信号を制御部113へ出力する。操作部110は、電子機器100に録音の開始を指示する開始信号、録音の終了を指示する終了信号、電子機器100が実行することができる複数のモード(例えば録音モードA,録音モードB等)のいずれかを切り替える切替信号および音声データのゲインを調整する調整信号等の入力を受け付ける。操作部110は、ボタン、スイッチ、トグルスイッチおよびタッチパネル等を用いて構成される。
記録部111は、FlashメモリやSDRAM(Synchronous Dynamic Random Access Memory)等を用いて構成される。記録部4は、減算部3が減算に用いるノイズデータを記録するノイズデータ記録部41Aと、ノイズ軽減装置1が実行する各種のプログラムを記録するプログラム記録部42と、を有する。
図5は、ノイズデータ記録部41Aが記録するノイズデータの一例を模式的に示す図である。図5において、横軸が温度を示し、縦軸がノイズレベルを示し、曲線L10が温度とノイズレベルとの関係を示す。図5の曲線L1に示すように、ノイズデータ記録部41Aは、温度毎にノイズレベルを記録する。なお、図5においては、全ての温度に対してノイズレベルが連続的に対応付けているが、これに限定されることなく、ノイズレベルと温度とを離散的に対等付けて記録してもよい。
図6は、ノイズデータ記録部41Aが記録するノイズデータの別の一例を模式的に示す図である。図6において、横軸がモードの種別を示し、横軸がノイズレベルを示す。図6に示すように、ノイズデータ記録部41Aは、電子機器100が行う複数のモード毎にノイズレベルを記録する。なお、図6では、2つのモードのみであるが、これに限定されることなく、複数のモード、例えば撮影モード、特殊効果撮影モード、動画モード、ライブ録音モードおよび会議モード等のモード毎にノイズデータを記録してもよい。
図7は、ノイズデータ記録部41Aが記録するノイズデータの別の一例を模式的に示す図である。図7において、横軸がゲインを示し、縦軸がノイズレベルを示し、直線L11がゲインとノイズレベルとの関係を示す。図7の直線L11に示すように、ノイズデータ記録部41Aは、ゲイン毎にノイズレベルを記録する。なお、図7においては、ゲインとノイズレベルが連続的に対応付けているが、これに限定されることなく、ノイズレベルとゲインとを離散的に対等付けて記録してもよい。
図4に戻り、電子機器100の構成の説明を続ける。
表示部112は、制御部113の制御のもと、電子機器100に関する各種情報を表示する。例えば、表示部112は、制御部113の制御のもと、電子機器100に関する各種モードやゲインの値等を表示する。表示部112は、液晶や有機EL(Electro Luminescence)等の表示パネルを用いて構成される。
制御部113は、電子機器100の各部を統括的に制御する。制御部113は、例えばCPU、FPGAおよびASIC等を用いて構成される。制御部113は、判定部113aと、設定部113bと、を有する。
判定部113aは、ノイズデータ記録部41が記録するノイズデータから減算部3が用いるノイズレベルを判定する(選択する)。具体的には、判定部113aは、ノイズデータ記録部41が記録するノイズデータと、ゲイン調整部104が第1の音声データに対して調整したゲインと、に基づいて、ゲイン調整部104が第1のデータにゲイン調整を行った際のノイズレベルを判定する(図7を参照)。また、判定部113aは、温度検出部109が検出した温度とノイズデータ記録部41が記録するノイズデータとに基づいて、現在の温度に対応するノイズレベルを判定する(図5を参照)。さらに、判定部113aは、操作部110に応じた設定されたモードの種別と、ノイズデータ記録部41が記録するノイズデータと、に基づいて、操作部110に応じて設定されたモードに応じたノイズレベルを判定する(図6を参照)。なお、判定部113aは、ゲイン調整部104によるゲイン、温度検出部109が検出した温度および操作部110に応じて設定されたモードのいずれか1つを選択してノイズレベルを判定してもよい。もちろん、判定部113aは、ゲイン調整部104によるゲイン、温度検出部109が検出した温度および操作部110に応じて設定されたモードの中でノイズレベルが一番高いもの選択して判定してもよいし、ノイズレベルが一番低いものを選択して判定してもよい。さらに、判定部113aは、ゲイン調整部104によるゲイン、温度検出部109が検出した温度および操作部110に応じて設定されたモードの各々のノイズレベルを平均化したものを選択して判定してもよい。
設定部113bは、第1の音声データの音量に基づいて、演算部5が第1のデータおよび第2のデータの各々に対して乗じる係数を設定する。具体的には、設定部113bは、音声信号の電圧値に基づいて、演算部5が第1のデータおよび第2のデータの各々に対して乗じる係数を設定する。
〔電子機器の処理〕
次に、電子機器100が実行する処理について説明する。図8は、電子機器100が実行する処理の概要を示すフローチャートである。図9は、電子機器100が実行する動作のタイミングチャートである。
図8に示すように、まず、制御部113は、操作部110の電源ボタンが操作され、電子機器100が起動した場合、電子機器100に関する各種の初期設定を行う(ステップS101)。ここで、初期設定とは、記録媒体107に記録された音声ファイルの有無の確認、電池の残量の確認および日時の設定等である。
続いて、操作部110が操作されて開始信号が入力され、音声の録音開始を行う場合(ステップS102:Yes)において、判定部113aは、電子機器100のモードを判定するとともに(ステップS103)、操作部110の操作に応じて設定された電子機器100の録音レベル(ゲイン)を判定し(ステップS104)、かつ、温度検出部109からの検出結果に基づいて、温度を判定する(ステップS105)。このとき、音声入力部101は、録音データの取り込みを行い(ステップS106)、設定部113bは、音量検出部108が検出した音量に応じた係数を設定する(ステップS107)。具体的には、図9に示すように、操作部110の録音ボタンが操作され、開始信号が入力された場合(時刻t)、音声入力部101は、録音データの取り込みを行うとともに、判定部113aは、ノイズデータ記録部41Aが記録するノイズデータと、電子機器100のモード、録音レベル(ゲイン)および温度のいずれか一つ以上と、を用いて減算部3が用いるノイズレベルを判定する(時刻t)。さらに、図9(b)に示すように、A,Bなどのある区間のデータで設定部113bは、音量検出部108が検出した音量に応じた係数(例えば3:7)を設定する(時刻t)。
図10は、設定部113bが音量検出部108によって検出された音量に応じて第1のデータおよび第2のデータの各々に設定する係数の模式的に示す図である。図11は、第1のデータおよび第2のデータの各々の音量に応じた係数を模式的に示す図である。図11において、横軸が音量を示し、縦軸が係数を示す。また、図11において、直線L21が第1のデータに乗じる係数αを示し、直線L22が第2のデータに乗じる係数βを示す。
図10および図11に示すように、設定部113bは、音量が大きくなるほど、第2のデータの比率が大きくなるように係数が設定し、音量が小さくなるほど、第1のデータの比率が大きくなるように設定する。具体的には、図9〜図11に示すように、設定部113bは、音量検出部108が検出した音量に応じた係数、例えば音量検出部108の各回路が出力する「H」の数が3つの場合、第1のデータおよび第2のデータの各々に乗じる係数を3:7に設定する(時刻t)。
図8に戻り、ステップS108以降の説明を続ける。
ステップS108において、減算部3が用いるノイズレベルを変更する場合(ステップS108:Yes)、電子機器100は、後述するステップS116へ移行する。これに対して、減算部3が用いるノイズレベルを変更しない場合(ステップS108:No)、電子機器100は、後述するステップS109へ移行する。
ステップS109において、第1の変換部2は、ゲイン調整部104から入力された第1の音声データに対して、フーリエ変換を行うことによって周波数毎の振幅データに変換した第1のデータを生成し、この第1のデータを減算部3および演算部5へ出力する。具体的には、図9に示すように、第1の変換部2は、ゲイン調整部104から入力された第1の音声データに対して、フーリエ変換を行うことによって周波数毎の振幅データに変換した第1のデータ(第1のデータa)を生成し、この第1のデータを減算部3および演算部5へ出力する(時刻t)。
その後、減算部3は、第1の変換部2から入力された第1のデータ(第1のデータa)から判定部113aの判定結果に応じたノイズデータを減算して第2のデータを生成し(ステップS110)、演算部5は、第1の変換部2から入力された第1のデータおよび減算部3から入力された第2のデータの各々に対して、設定部113bによって設定された係数を乗じることによって合成した第3のデータを生成する(ステップS111)。具体的には、図9に示すように、演算部5は、第1のデータと、第2のデータと、第1のデータおよび第2のデータの各々の係数(例えば3:7)とに基づいて、第3のデータを生成する(時刻t)。この場合、演算部5は、第1のデータに乗じる係数をα、第2のデータに乗じる係数をβとした場合、以下の式(1)によって第3のデータγを生成する。
γ=(第1のデータ×α+第2のデータ×β)/(α+β)・・・(1)
ステップS111の後、第2の変換部6は、演算部5から入力された第3のデータに対して、逆フーリエ変換を行って音声データに変換する。具体的には、図9に示すように、第2の変換部6は、演算部5から入力された第3のデータに対して、逆フーリエ変換を行って音声データに変換する(時刻t)。これにより、ミュージカルノイズを抑制することができる。
続いて、制御部113は、記録処理部106に第2の変換部6によって生成された音声データを記録媒体107に記録させる(ステップS113)。
その後、音声入力部101が取り込んだ音声データが一定量に達した場合(ステップS114:Yes)、電子機器100は、後述するステップS115へ移行する。これに対して、音声入力部101が取り込んだ音声データが一定量に達していない場合(ステップS114:No)、電子機器100は、上述したステップS109へ戻る。
ステップS115において、操作部110が操作され、録音を終了する終了信号が入力された場合(ステップS115:Yes)、電子機器100は、本処理を終了する。これに対して、操作部110が操作され、録音を終了する終了信号が入力されていない場合(ステップS115:No)、電子機器100は、上述したステップS103へ戻る。
ステップS116において、設定部113bは、音量検出部108が検出した音量が変換した場合、演算部5が第1のデータおよび第2のデータを合成する際の係数を音量に応じて更新する。ステップS116の後、電子機器100は、ステップS109へ移行する。この場合、図9および図12に示すように、設定部113bが第1のデータおよび第2のデータの各々に乗じる係数を3:7から7:3に変更する場合、演算部5は、演算する毎に段階的に係数を上げながら第1のデータおよび第2のデータに乗じる係数(3:7→5:5→7:3)を変更しながら第3のデータを生成する(時刻t〜時刻t11)。このように、電子機器100は、録音を終了するまで、上述したステップS103〜ステップS114を繰り返し、その都度、第1のデータおよび第2のデータの各々に対するノイズレベルおよび係数を変更しながら第3のデータを生成するので、変化が滑らかな第3のデータを生成することができるので、音声データの劣化を抑えつつ、違和感なく、ノイズを抑制することができる。
以上説明した実施の形態2によれば、演算部5が第1の変換部2から入力された第1のデータおよび減算部3から入力された第2のデータの各々に対して所定の比率の係数を乗じて重み付けを行うことによって合成した第3のデータを生成するので、音声データを劣化させることなく、ノイズおよびミュージカルノイズの発生を抑えることができる。
また、実施の形態2によれば、演算部5が第1の変換部2から入力された第1のデータおよび減算部3から入力された第2のデータの各々に対して、設定部113bが設定した係数を乗じて重み付けを行うので、変化が滑らかな第3のデータを生成することができ、違和感なく、ノイズを抑制することができる。
また、実施の形態2によれば、減算部3が判定部113aによって判定されたノイズレベルを用いて第1の音声データからノイズデータを削除するので、温度、モードおよびゲイン等の環境に応じて発生するノイズを抑制することができる。
なお、上述した実施の形態2では、音量検出部108が増幅部102から出力される音声信号の電圧値に基づいて、音量を検出していたが、これに限定されることなく、例えば図13に示すように、AD変換部103が出力するデジタルの音声データのデジタル値に基づいて、音量を検出してもよい。
(実施の形態3)
次に、実施の形態3について説明する。実施の形態3は、上述した実施の形態2に係る電子機器100と同一の構成であり、実行する処理が異なる。具体的には、実施の形態3は、リアルタイムで音声データの取り込みを行いつつ、第1のデータおよび第2のデータの各々に乗じる係数をリアルタイムで更新しながら合成する。以下においては、実施の形態2に係る電子機器が実行する処理について説明する。なお、上述した実施の形態2に係る電子機器100と同一の構成には同一の符号を付して詳細な説明を省略する。
〔電子機器の処理〕
図14は、実施の形態3に係る電子機器100が実行する処理の概要を示すフローチャートである。図15は、実施の形態3に係る電子機器が実行する動作のタイミングチャートである。
図14において、ステップS201〜ステップS205は、上述したステップS101〜ステップS105それぞれに対応する。ステップS206およびステップS207は、上述したステップS107およびステップS108それぞれに対応する。この場合、図15に示すように、判定部113aは、ノイズレベルを逐次判定する(例えば時刻t12、t13、t14)。さらに、設定部113bは、係数を例えば3:7で設定する(時刻t13)。
ステップS208において、音声入力部101は、音声データの取り込みを行う。具体的には、図15に示すように、音声入力部101は、音声データの取り込みを逐次行う(例えば時刻t14)。この場合、第1の変換部2は、音声入力部101が取り込んだ音声データに対して第1の変換処理を逐次行う(時刻t14)。さらに、判定部113aは、判定を逐次行うとともに、設定部113bは、係数の判定を行う。さらに、減算部3および演算部5の各々も演算を行う(時刻t15)。この場合において、設定部113bは、音量検出部108が検出した音量が変化した場合、係数を変更する旨の信号(High)を出力する(時刻t16)。
ステップS208〜ステップS213は、上述した図8のステップS109〜ステップS113それぞれに対応する。この場合、図15に示すように、ステップS214およびステップS215は、上述した図8のステップS115およびステップS116それぞれに対応する。この場合、図15に示すように、設定部113bが第1のデータおよび第2のデータの各々に乗じる係数を3:7から7:3に徐々に変更する場合、演算部5は、演算する毎に段階的に係数を上げながら第1のデータおよび第2のデータに乗じる係数(3:7→5:5→7:3)を変更しながら第3のデータを生成する(時刻t16→時刻t17→時刻t18→時刻t19)。これにより、変化が滑らかな第3のデータを生成することができるので、違和感なく、ノイズを抑制することができる。
以上説明した実施の形態3によれば、演算部5が第1の変換部2から入力された第1のデータおよび減算部3から入力された第2のデータの各々に対して、設定部113bが逐次設定した係数を乗じて重み付けを行うので、変化が滑らかな第3のデータを生成することができ、違和感なく、ノイズを抑制することができる。
また、実施の形態3によれば、演算部5が第1の変換部2から入力された第1のデータおよび減算部3から入力された第2のデータの各々に対して所定の比率の係数を乗じて重み付けを行うことによって合成した第3のデータを生成するので、音声データを劣化させることなく、ノイズおよびミュージカルノイズの発生抑えることができる。
(実施の形態4)
次に、実施の形態4について説明する。実施の形態4は、上述した実施の形態3に係る電子機器100と同一の構成であり、実行する処理が異なる。具体的には、上述した実施の形態3に係る電子機器100は、リアルタイムで第1のデータおよび第2のデータの各々に乗じる係数を逐次変更していたが、実施の形態4は、一定時間経過毎に第1のデータおよび第2のデータの各々に乗じる係数を変更する。以下においては、実施の形態4に係る電子機器が実行する処理について説明する。なお、上述した実施の形態3に係る電子機器100と同一の構成には同一の符号を付して詳細な説明を省略する。
〔電子機器の処理〕
図16は、実施の形態4に係る電子機器100が実行する処理の概要を示すフローチャートである。図17は、実施の形態4に係る電子機器100が実行する動作のタイミングチャートである。
図16において、ステップS301〜ステップS315は、上述したステップS201〜ステップS215それぞれに対応する。
ステップS316において、録音開始から一定時間経過した場合(ステップS316:Yes)、電子機器100は、上述したステップS305へ戻る。これに対して、録音開始から一定時間経過していない場合(ステップS316:No)、電子機器100は、上述したステップS308へ戻る。この場合、図17に示すように、設定部113bが一定時間経過する毎に第1のデータおよび第2のデータの各々に乗じる係数を変更し(3:7→5:5→7:3)、演算部5は、設定部113bが係数を変更して設定する毎に、第1のデータおよび第2のデータの各々に乗じる係数をリアルタイムで変更しながら第3のデータを生成する(時刻t22〜時刻t28)。これにより、変化が滑らかな第3のデータを生成することができるので、違和感なく、ノイズを抑制することができる。
以上説明した実施の形態4によれば、設定部113bが一定時間経過毎に係数を判定し、演算部5が第1の変換部2から入力された第1のデータおよび減算部3から入力された第2のデータの各々に対して、設定部113bが設定した係数を乗じて重み付けを行うので、変化が滑らかな第3のデータを生成することができ、違和感なく、ノイズを抑制することができる。
また、実施の形態4によれば、演算部5が第1の変換部2から入力された第1のデータおよび減算部3から入力された第2のデータの各々に対して所定の比率の係数を乗じて重み付けを行うことによって合成した第3のデータを生成するので、音声データを劣化させることなく、ノイズおよびミュージカルノイズの発生を抑えることができる。
(その他の実施の形態)
上述した実施の形態1〜4に開示されている複数の構成要素を適宜組み合わせることによって、種々の形態を形成することができる。例えば、上述した実施の形態1〜4に記載した全構成要素からいくつかの構成要素を削除してもよい。さらに、上述した実施の形態1〜4で説明した構成要素を適宜組み合わせてもよい。
また、実施の形態1〜4では、上述してきた「部」は、「手段」や「回路」などに読み替えることができる。例えば、制御部は、制御手段や制御回路に読み替えることができる。
また、実施の形態1〜4に係るノイズ軽減装置または電子機器に実行させるプログラムは、インストール可能な形式または実行可能な形式のファイルデータでCD−ROM、フレキシブルディスク(FD)、CD−R、DVD(Digital Versatile Disk)、USB媒体、フラッシュメモリ等のコンピュータで読み取り可能な記録媒体に記録されて提供される。
また、実施の形態1〜4に係るノイズ軽減装置または電子機器に実行させるプログラムは、インターネット等のネットワークに接続されたコンピュータ上に格納し、ネットワーク経由でダウンロードさせることにより提供するように構成してもよい。さらに、実施の形態1〜4に係るノイズ軽減装置または電子機器に実行させるプログラムをインターネット等のネットワーク経由で提供または配布するように構成しても良い。
なお、本明細書におけるフローチャートの説明では、「まず」、「その後」、「続いて」等の表現を用いてステップ間の処理の前後関係を明示していたが、本発明を実施するために必要な処理の順序は、それらの表現によって一意的に定められるわけではない。即ち、本明細書で記載したフローチャートにおける処理の順序は、矛盾のない範囲で変更することができる。また、こうした、単純な分岐処理からなるプログラムに限らず、より多くの判定項目を総合的に判定して分岐させてもよい。
以上、本願の実施の形態のいくつかを図面に基づいて詳細に説明したが、これらは例示であり、本発明の開示の欄に記載の態様を始めとして、当業者の知識に基づいて種々の変形、改良を施した他の形態で本発明を実施することが可能である。
1・・・ノイズ軽減装置;2・・・第1の変換部;3・・・減算部;4,111・・・記録部;5・・・演算部;6・・・第2の変換部;7・・・:制御部;41,41A・・・ノイズデータ記録部;42・・・プログラム記録部;100・・・電子機器;101・・・音声入力部;102・・・増幅部;103・・・AD変換部;104・・・ゲイン調整部;105・・・ノイズ軽減部;106・・・記録処理部;107・・・記録媒体;108・・・音量検出部;109・・・温度検出部;110・・・操作部;112・・・表示部;113・・・制御部;113a・・・判定部;113b・・・設定部

Claims (9)

  1. 外部から入力された第1の音声データに対して、フーリエ変換を行うことによって周波数毎の振幅データに変換した第1のデータを生成する第1の変換部と、
    予め検出したノイズデータを記録するノイズデータ記録部と、
    前記第1のデータから前記ノイズデータを減算することによって第2のデータを生成する減算部と、
    前記第1のデータおよび前記第2のデータを合成することによって、第3のデータを生成する演算部と、
    前記第3のデータに対して、逆フーリエ変換を行うことによって第2の音声データを生成する第2の変換部と、
    を備えることを特徴とするノイズ軽減装置。
  2. 前記演算部は、前記第1のデータおよび前記第2のデータの各々に対して所定の比率の係数を乗じて重み付けを行うことによって合成した前記第3のデータを生成することを特徴とする請求項1に記載のノイズ軽減装置。
  3. 前記第1の音声データの音量に基づいて、前記演算部が前記第1のデータおよび前記第2のデータの各々に対して乗じる係数を設定する設定部をさらに備えることを特徴とする請求項2に記載のノイズ軽減装置。
  4. 前記設定部は、
    前記第1の音声データに対応する音声信号の電圧値に基づいて、前記係数を設定することを特徴とする請求項3に記載のノイズ軽減装置。
  5. 音声の入力を受け付けてアナログの音声信号を出力する音声入力部と、
    前記音声入力部が受け付けた音声信号に対して、AD変換を行うことによって前記第1の音声データを生成するAD変換部と、
    をさらに備え、
    前記AD変換部は、前記第1の音声データを所定のビット数で変換することができることを特徴とする請求項3または4に記載のノイズ軽減装置。
  6. 前記ノイズデータは、予め無響状態で取得された音声データに対して、フーリエ変換を行うことによって求められた結果を統計計算して求められた統計データであることを特徴とする請求項1〜5のいずれか一つに記載のノイズ軽減装置。
  7. 前記ノイズデータは、ノイズレベルと温度毎、ノイズレベルと前記第1の音声データに対するゲイン毎またはノイズレベルと当該ノイズ軽減装置が実行可能な複数のモード毎に対応付けられて前記ノイズデータ記録部に記録されていることを特徴とする請求項1〜6のいずれか一つに記載のノイズ軽減装置。
  8. 予め検出したノイズデータを記録するノイズデータ記録部を備えるノイズ軽減装置が実行するノイズ軽減方法であって、
    外部から入力された第1の音声データに対して、フーリエ変換を行うことによって周波数毎の振幅データに変換した第1のデータを生成する第1の変換ステップと、
    前記第1のデータから前記ノイズデータを減算することによって第2のデータを生成する減算ステップと、
    前記第1のデータおよび前記第2のデータを合成することによって、第3のデータを生成する演算ステップと、
    前記第3のデータに対して、逆フーリエ変換を行うことによって第2の音声データを生成する第2の変換ステップと、
    を含むことを特徴とするノイズ軽減方法。
  9. 予め検出したノイズデータを記録するノイズデータ記録部を備えるノイズ軽減装置に、
    外部から入力された第1の音声データに対して、フーリエ変換を行うことによって周波数毎の振幅データに変換した第1のデータを生成する第1の変換ステップと、
    前記第1のデータから前記ノイズデータを減算することによって第2のデータを生成する減算ステップと、
    前記第1のデータおよび前記第2のデータを合成することによって、第3のデータを生成する演算ステップと、
    前記第3のデータに対して、逆フーリエ変換を行うことによって第2の音声データを生成する第2の変換ステップと、
    を含むことを特徴とするプログラム。
JP2018079900A 2018-04-18 2018-04-18 ノイズ軽減装置、ノイズ軽減方法およびプログラム Pending JP2019192963A (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2018079900A JP2019192963A (ja) 2018-04-18 2018-04-18 ノイズ軽減装置、ノイズ軽減方法およびプログラム
US16/367,094 US20190325003A1 (en) 2018-04-18 2019-03-27 Noise reduction apparatus and noise suppressing method
CN201910270311.2A CN110392325A (zh) 2018-04-18 2019-04-04 降噪装置、降噪方法以及记录介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018079900A JP2019192963A (ja) 2018-04-18 2018-04-18 ノイズ軽減装置、ノイズ軽減方法およびプログラム

Publications (1)

Publication Number Publication Date
JP2019192963A true JP2019192963A (ja) 2019-10-31

Family

ID=68236926

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018079900A Pending JP2019192963A (ja) 2018-04-18 2018-04-18 ノイズ軽減装置、ノイズ軽減方法およびプログラム

Country Status (3)

Country Link
US (1) US20190325003A1 (ja)
JP (1) JP2019192963A (ja)
CN (1) CN110392325A (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113936698B (zh) * 2021-09-26 2023-04-28 度小满科技(北京)有限公司 音频数据的处理方法、装置以及电子设备
CN115580806B (zh) * 2022-11-25 2023-03-10 杭州兆华电子股份有限公司 基于滤波器的权重自动计算的耳机降噪方法及降噪耳机

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4356670B2 (ja) * 2005-09-12 2009-11-04 ソニー株式会社 雑音低減装置及び雑音低減方法並びに雑音低減プログラムとその電子機器用収音装置
US8600070B2 (en) * 2009-10-29 2013-12-03 Nikon Corporation Signal processing apparatus and imaging apparatus
WO2011148860A1 (ja) * 2010-05-24 2011-12-01 日本電気株式会社 信号処理方法、情報処理装置、及び信号処理プログラム
JP2015122726A (ja) * 2013-11-25 2015-07-02 株式会社リコー 画像処理装置、画像処理方法及び画像処理プログラム

Also Published As

Publication number Publication date
CN110392325A (zh) 2019-10-29
US20190325003A1 (en) 2019-10-24

Similar Documents

Publication Publication Date Title
JP2006229401A (ja) 電子カメラ、ノイズ低減装置及びノイズ低減制御プログラム
KR101253708B1 (ko) 보청장치의 외부 소음을 차폐하는 방법
US10535363B2 (en) Audio processing apparatus and control method thereof
JP2013065039A (ja) ヘッドホン、ヘッドホンのノイズ低減方法、ノイズ低減処理用プログラム
WO2014017371A1 (ja) 信号処理装置、撮像装置、及び、プログラム
US9402130B2 (en) Wind noise reducing circuit
JP2019192963A (ja) ノイズ軽減装置、ノイズ軽減方法およびプログラム
JP6411780B2 (ja) オーディオ信号処理回路、その方法、それを用いた電子機器
WO2022259589A1 (ja) 耳装着型デバイス、及び、再生方法
JP4787316B2 (ja) デジタル信号処理装置及び倍音生成方法
JP2015114444A (ja) 音声処理装置、音声処理方法
JP4483468B2 (ja) ノイズ低減回路、電子機器、ノイズ低減方法
JP2018074220A (ja) 音声処理装置
JP2006173918A (ja) 音声処理装置及び撮像装置
JP5880753B2 (ja) ヘッドホン、ヘッドホンのノイズ低減方法、ノイズ低減処理用プログラム
JP2000023282A (ja) 音響再生装置
JP2018066963A (ja) 音声処理装置
WO2018198751A1 (ja) ノイズ低減装置、ノイズ低減方法およびプログラム
JP5340127B2 (ja) 音声信号処理装置、音声信号処理装置の制御方法
JP2018207316A (ja) 音声処理装置及びその制御方法
JP2018207313A (ja) 音声処理装置及びその制御方法
JP2019016851A (ja) 音声処理装置、音声処理方法、及びプログラム
JP2009232204A (ja) 信号処理装置、信号処理方法
CN117995214A (zh) 基于主动降噪的数模增益调节方法、装置及音频播放设备
JP6604728B2 (ja) 音声処理装置及び音声処理方法