JP6489163B2 - Noise reduction apparatus, noise reduction method, and program. - Google Patents
Noise reduction apparatus, noise reduction method, and program. Download PDFInfo
- Publication number
- JP6489163B2 JP6489163B2 JP2017122032A JP2017122032A JP6489163B2 JP 6489163 B2 JP6489163 B2 JP 6489163B2 JP 2017122032 A JP2017122032 A JP 2017122032A JP 2017122032 A JP2017122032 A JP 2017122032A JP 6489163 B2 JP6489163 B2 JP 6489163B2
- Authority
- JP
- Japan
- Prior art keywords
- sound
- sudden sound
- sudden
- unit
- determined
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Telephone Function (AREA)
Description
本発明は、雑音を検出し適切な対応を行うための雑音検出装置、雑音検出方法、雑音低
減装置、雑音低減方法、通信装置およびプログラムに関する。
The present invention relates to a noise detection device, a noise detection method, a noise reduction device, a noise reduction method, a communication device, and a program for detecting noise and taking appropriate measures.
雑音環境下での雑音を低減した音声通話を行う通信装置が求められている。また、雑音
環境下においては、雑音の発生を迅速に検出する必要性がある場面も発生する。
There is a need for a communication device that performs voice calls with reduced noise in a noisy environment. In addition, in a noisy environment, there may be scenes where it is necessary to quickly detect the occurrence of noise.
特許文献1には、予め学習した雑音モデルと照合して、雑音を検出および低減する装置
が開示されている。特許文献2には、包絡線に基づく突発性雑音を検出する装置が開示さ
れている。
Patent Document 1 discloses an apparatus that detects and reduces noise by collating with a previously learned noise model. Patent Document 2 discloses an apparatus for detecting sudden noise based on an envelope.
例えば、雑音検出装置や雑音低減装置を、無線通話を行う通信装置として適用した場合
、検出した雑音が通信装置のユーザに対する緊急状態を示す場合があり、迅速な対応が求
められる場合がある。また、検出した雑音に対応して、適切に雑音を低減した音声通信を
行う必要がある。
For example, when a noise detection device or a noise reduction device is applied as a communication device that performs a wireless call, the detected noise may indicate an emergency state for the user of the communication device, and a quick response may be required. In addition, it is necessary to perform voice communication appropriately reducing noise corresponding to the detected noise.
特許文献1においては、メモリ等に保存した雑音標準モデルと周期的な突発音とを照合
しているが、検出される雑音は、周辺環境やパワースペクトルを求める際の分析窓の位置
によっては、標準モデルとは異なることも多い。また、標準雑音との照合は、照合処理に
よる遅延を発生してしまう。また、特許文献2においては、突発音の信号成分に基づいて
突発音を低減しているが、検出される突発音は通話等の音声成分と構成周波数が重なって
おり、周波数成分のみでの突発音検出が困難であるとともに、突発音の低減とともに音声
成分も低減してしまう。
In Patent Document 1, a noise standard model stored in a memory or the like is collated with a periodic sudden sound, but the detected noise depends on the surrounding environment and the position of the analysis window when obtaining the power spectrum. Often different from the standard model. In addition, matching with standard noise causes a delay due to matching processing. In Patent Document 2, sudden sound is reduced based on the signal component of sudden sound, but the detected sudden sound overlaps with the voice component such as a call and the constituent frequency, and the sudden sound is generated only by the frequency component. It is difficult to detect sound, and the sound component is reduced along with the reduction of sudden sound.
本発明はこのような問題点に鑑みなされたものであり、周期的突発音を高精度且つ少な
い遅延時間で検出し、周期性突発音に基づく適切な対応を可能とする、雑音検出装置、雑
音検出方法、雑音低減装置、雑音低減方法、通信装置およびプログラムを提供することを
目的とする。
The present invention has been made in view of such a problem, and detects a periodic sudden sound with high accuracy and a small delay time, and makes it possible to appropriately deal with the periodic sudden sound, and a noise detection device, a noise An object of the present invention is to provide a detection method, a noise reduction device, a noise reduction method, a communication device, and a program.
上記目的を達成するために、本発明に係る雑音検出装置(100)は、入力された音デ
ータに対して所定の時間幅のフレームに区切る処理を行うフレーム処理部(151)、前
記フレーム処理部により区切られたフレームにおける所定以上の振幅値となるピーク位置
を検出する振幅検出部(152)、前記振幅検出部において検出されたピーク位置におけ
るピークの継続時間およびピークの変化量を算出し、突発音を確定する突発音確定部(1
53)、前記突発音確定部により確定された突発音を概形モデル化する概形モデル化部(
154)、前記概形モデル化部によりモデル化された突発音の概形モデルと、前記音声信
号における過去の概形モデルとの相関値を算出し、前記相関値が所定以上であるか否かを
判断する相関値算出部(155)、前記相関値算出部により所定以上の相関値であると判
断された前記突発音の概形モデルと過去の概形モデルとの時間幅に基づき、周期性を備え
る周期性突発音が発生しているか否かを判断する周期性突発音判定部(156)、を備え
ることを特徴とする。
In order to achieve the above object, a noise detection device (100) according to the present invention includes a frame processing unit (151) that performs processing for dividing input sound data into frames having a predetermined time width, and the frame processing unit. An amplitude detection unit (152) for detecting a peak position having an amplitude value greater than or equal to a predetermined value in the frame delimited by, and calculating a peak duration and a peak change amount at the peak position detected by the amplitude detection unit Sudden sound confirmation part (1 to confirm sound)
53), a rough shape modeling unit for rough-modeling the sudden sound determined by the sudden sound determination unit (
154) calculating a correlation value between the sudden sound outline model modeled by the outline modeling unit and the past outline model in the speech signal, and whether the correlation value is equal to or greater than a predetermined value; A correlation value calculation unit (155) that determines the periodicity based on the time width between the rough model of the sudden sound and the past rough model determined to be a correlation value greater than or equal to a predetermined value by the correlation value calculation unit. A periodic sudden sound determination unit (156) for determining whether or not a periodic sudden sound is generated.
また、本発明に係る通信装置は、前記雑音検出装置(100)、前記雑音検出装置(1
00)により検出された周期性突発音の音源情報を算出する突発音区間音圧算出部(25
1)、前記突発音区間音圧算出部(251)により算出された音源情報に基づき周期性突
発音に関する通知を行う通知部(290)、を備えることを特徴とする。
The communication device according to the present invention includes the noise detection device (100) and the noise detection device (1).
The sudden sound interval sound pressure calculating unit (25) that calculates sound source information of the periodic sudden sound detected by (00)
1) and a notification unit (290) for performing notification regarding periodic sudden sound based on the sound source information calculated by the sudden sound section sound pressure calculation unit (251).
また、本発明に係る雑音検出方法は、入力された音データに対して所定の時間幅のフレ
ームに区切る処理を行うフレーム処理ステップ(ステップS001)、前記フレーム処理
ステップにおいて区切られたフレームにおける所定以上の振幅値となるピーク位置を検出
する振幅検出ステップ(ステップS002、ステップS003)、前記振幅検出ステップ
において検出されたピーク位置におけるピークの継続時間およびピークの変化量を算出し
、突発音を確定する突発音確定ステップ(ステップS004、ステップS005)、前記
突発音確定ステップにおいて検出された突発音を概形モデル化する概形モデル化ステップ
(ステップS006)、前記概形モデル化ステップにおいて概形モデル化された突発音の
概形モデルと、前記音声信号における過去の概形モデルとの相関値を算出し、前記相関値
が所定以上であるか否かを判断する相関値算出ステップ(ステップS007、ステップS
008)、前記相関値算出ステップにおいて所定以上の相関値であると判断された前記突
発音の概形モデルと過去の概形モデルとの時間幅に基づき、周期性を備える周期性突発音
が発生しているか否かを判断する周期性突発音判定ステップ(ステップS009)、を備
えることを特徴とする。
In addition, the noise detection method according to the present invention includes a frame processing step (step S001) for performing processing for dividing input sound data into frames having a predetermined time width, and a predetermined amount or more in the frames divided in the frame processing step. Amplitude detection steps (steps S002 and S003) for detecting a peak position that is the amplitude value of the peak, a peak duration and a peak change amount at the peak position detected in the amplitude detection step are calculated, and sudden sound is determined. A sudden sound determination step (steps S004 and S005), a rough modeling step (step S006) for rough modeling of the sudden sound detected in the sudden sound determination step, and a rough shape modeling in the rough shape modeling step The outline model of the sudden sound generated and the audio signal Kicking calculates a correlation value between a previous outline model, the correlation value calculation step of the correlation value is equal to or greater than or equal to a predetermined value (step S007, step S
008), a periodic sudden sound having periodicity is generated based on the time width between the sudden sound outline model and the past outline model determined to be a predetermined correlation value or more in the correlation value calculating step. A periodic sudden sound determination step (step S009) for determining whether or not it is performed.
また、本発明に係るプログラムは、雑音を検出する雑音検出装置(100)が備えるコ
ンピュータ(250)に、入力された音データに対して所定の時間幅のフレームに区切る
処理を行うフレーム処理ステップ、前記フレーム処理ステップにおいて区切られたフレー
ムにおける所定以上の振幅値となるピーク位置を検出する振幅検出ステップ、前記振幅検
出ステップにおいて検出されたピーク位置におけるピークの継続時間およびピークの変化
量を算出し、突発音を確定する突発音確定ステップ、前記突発音確定ステップにおいて検
出された突発音を概形モデル化する概形モデル化ステップ、前記概形モデル化ステップに
おいて概形モデル化された突発音の概形モデルと、前記音声信号における過去の概形モデ
ルとの相関値を算出し、前記相関値が所定以上であるか否かを判断する相関値算出ステッ
プ、前記相関値算出ステップにおいて所定以上の相関値であると判断された前記突発音の
概形モデルと過去の概形モデルとの時間幅に基づき、周期性を備える周期性突発音が発生
しているか否かを判断する周期性突発音判定ステップ、を実行させることを特徴とする。
Further, a program according to the present invention is a frame processing step for performing processing for dividing input sound data into frames of a predetermined time width in a computer (250) included in the noise detection device (100) for detecting noise, An amplitude detection step for detecting a peak position having an amplitude value greater than or equal to a predetermined value in the frame delimited in the frame processing step, calculating a peak duration and a peak change amount at the peak position detected in the amplitude detection step; A sudden sound confirmation step for confirming sudden sound, a rough modeling step for rough modeling of the sudden sound detected in the sudden sound confirmation step, and a summary of sudden sound modeled in rough shape in the rough modeling step The correlation value between the shape model and the past outline model in the audio signal is calculated, and the phase A correlation value calculating step for determining whether or not the value is greater than or equal to a predetermined value, and a time between the rough model of the sudden sound and the past rough model that has been determined to be a correlation value equal to or greater than the predetermined value in the correlation value calculating step A periodic sudden sound determination step for determining whether or not a periodic sudden sound having periodicity is generated based on the width is executed.
また、本発明に係る雑音低減装置(500)は、入力された音声信号に対して所定の時
間幅のフレームに区切る処理を行うフレーム処理部(551)、前記フレーム処理部によ
り区切られたフレームにおける突発音を検出する突発音検出部(552)、前記フレーム
処理部により区切られたフレームが音声区間であるか否かを判断し、音声区間である場合
は音声区間に含まれる音声成分包含量を算出する音声区間判定部(553)、前記突発音
検出部により検出された突発音が周期性を備えるか否かを判断する突発音周期性判定部(
554)、前記突発音周期性判定部により突発音が周期性を備えると判断された場合、前
記音声区間判定部による判定結果に基づき突発音の音圧量調整値を決定する音圧量調整値
決定部(555)、前記音圧量調整値決定部により決定された音圧量調整値によって突発
音の音圧量を調整することにより、突発音を低減する出力レベル調整部(556)、を備
えることを特徴とする。
Further, the noise reduction apparatus (500) according to the present invention includes a frame processing unit (551) that performs processing for dividing an input audio signal into frames having a predetermined time width, and a frame that is divided by the frame processing unit. A sudden sound detection unit (552) for detecting sudden sound determines whether or not the frame delimited by the frame processing unit is a speech section. If the frame is a speech section, the speech component inclusion amount included in the speech section is determined. A voice segment determination unit (553) to be calculated, and a sudden sound periodicity determination unit that determines whether or not the sudden sound detected by the sudden sound detection unit has periodicity (
554), when the sudden sound periodicity determination unit determines that the sudden sound has periodicity, the sound pressure amount adjustment value for determining the sound pressure amount adjustment value of the sudden sound based on the determination result by the voice segment determination unit An output level adjustment unit (556) for reducing sudden sound by adjusting the sound pressure amount of the sudden sound according to the sound pressure amount adjustment value determined by the sound pressure amount adjustment value determining unit; It is characterized by providing.
また、本発明に係る通信装置(600)は、前記雑音低減装置(500)を備え、通話
音声に対して前記雑音低減装置(500)による雑音低減処理を行うことを特徴とする。
The communication device (600) according to the present invention includes the noise reduction device (500), and performs noise reduction processing by the noise reduction device (500) on a call voice.
また、本発明に係る雑音低減方法は、入力された音声信号に対して所定の時間幅のフレ
ームに区切る処理を行うフレーム処理ステップ(ステップS501)、前記フレーム処理
ステップにおいて区切られたフレームにおける突発音を検出する突発音検出ステップ(ス
テップS502)、前記フレーム処理ステップにおいて区切られたフレームが音声区間で
あるか否かを判断し、音声区間である場合は音声区間に含まれる音声成分包含量を算出す
る音声区間判定ステップ(ステップS503〜ステップS505)、前記突発音検出ステ
ップにおいて検出された突発音が周期性を備えるか否かを判断する突発音周期性判定ステ
ップ(ステップS506、ステップS507)、前記突発音周期性判定ステップにおいて
突発音が周期性を備えると判断された場合、前記音声区間判定ステップにおける判定結果
に基づき突発音の音圧量調整値を決定する音圧量調整値決定ステップ(ステップS508
〜ステップS512)、前記音圧量調整値決定ステップにおいて決定された音圧量調整値
によって突発音の音圧量を調整することにより、突発音を低減する出力レベル調整ステッ
プ(ステップS513)、を備えることを特徴とする。
The noise reduction method according to the present invention includes a frame processing step (step S501) for performing processing for dividing an input audio signal into frames having a predetermined time width, and sudden sound generation in the frames divided in the frame processing step. A sudden sound detection step (step S502) for detecting sound, and it is determined whether or not the frame delimited in the frame processing step is a speech section, and if it is a speech section, a speech component inclusion amount included in the speech section is calculated. A voice segment determination step (step S503 to step S505), a sudden sound periodicity determination step (step S506, step S507) for determining whether or not the sudden sound detected in the sudden sound detection step has periodicity, In the sudden sound periodicity determination step, it is determined that the sudden sound has periodicity When the sound pressure amount adjustment value determining step of determining a sound pressure amount adjustment value of the sudden sound based on the determination result of the speech segment determination step (step S508
To step S512), an output level adjustment step (step S513) for reducing sudden sound by adjusting the sound pressure amount of sudden sound according to the sound pressure amount adjustment value determined in the sound pressure amount adjustment value determining step. It is characterized by providing.
また、本発明に係るプログラムは、雑音を低減する雑音低減装置(500)が備えるコ
ンピュータ(550)に、入力された音声信号に対して所定の時間幅のフレームに区切る
処理を行うフレーム処理ステップ、前記フレーム処理ステップにおいて区切られたフレー
ムにおける突発音を検出する突発音検出ステップ、前記フレーム処理ステップにおいて区
切られたフレームが音声区間であるか否かを判断し、音声区間である場合は音声区間に含
まれる音声成分包含量を算出する音声区間判定ステップ、前記突発音検出ステップにおい
て検出された突発音が周期性を備えるか否かを判断する突発音周期性判定ステップ、前記
突発音周期性判定ステップにおいて突発音が周期性を備えると判断された場合、前記音声
区間判定ステップにおける判定結果に基づき突発音の音圧量調整値を決定する音圧量調整
値決定ステップ、前記音圧量調整値決定ステップにおいて決定された音圧量調整値によっ
て突発音の音圧量を調整することにより、突発音を低減する出力レベル調整ステップ、を
実行させることを特徴とする。
Further, the program according to the present invention is a frame processing step for performing processing for dividing an input audio signal into frames of a predetermined time width in a computer (550) provided in the noise reduction device (500) for reducing noise, A sudden sound detection step for detecting a sudden sound in the frame delimited in the frame processing step, and determines whether or not the frame delimited in the frame processing step is a voice interval. A speech section determining step for calculating the included speech component inclusion amount, a sudden sound periodicity determining step for determining whether the sudden sound detected in the sudden sound detecting step has periodicity, and the sudden sound periodicity determining step If it is determined that the sudden sound has periodicity, the determination in the speech segment determination step A sound pressure amount adjustment value determining step for determining a sound pressure amount adjustment value of the sudden sound based on the result, and adjusting a sound pressure amount of the sudden sound by the sound pressure amount adjustment value determined in the sound pressure amount adjustment value determining step Thus, an output level adjustment step for reducing sudden sound is performed.
本発明によれば、周期的突発音を高精度且つ少ない遅延時間で検出し、周期性突発音に
基づく適切な対応を可能とする。
According to the present invention, periodic sudden sound is detected with high accuracy and with a small delay time, and an appropriate response based on periodic sudden sound is made possible.
先ず、本発明に係る雑音検出装置100および雑音検出方法の例について図1から図5
を用いて説明する。
First, an example of a
Will be described.
本発明の実施形態である雑音検出装置100は、例えば後述する通信装置200に内蔵
された状態で、一例として工事現場や災害現場などの環境で用いられることがある。この
ような環境で用いられる通信装置は、例えば地盤圧縮機の動作音や酸素マスクのバイブレ
ーション音など持続性のある突発音により通話音声が阻害されることがある。また、それ
らの突発音の存在が通話者に対する危険を示す場合もある。
The
一例として、消防士が火災現場における活動時に用いる酸素マスクは、酸素を供給する
酸素ボンベの酸素残量が少なくなり圧力が低下すると、酸素マスク内の乱流に起因して酸
素マスクが振動し、周期的な突発音が発生する。このような状態においては、無線装置に
よる通話に周期的突発音が混入し、受話側による音声の聞き取りが困難になってしまう。
さらには、このような周期的突発音の発生が酸素残量の低下を示すため、迅速に把握また
は周囲への通知を行う必要がある。
As an example, the oxygen mask used by firefighters during activities at the fire site, when the oxygen remaining in the oxygen cylinder supplying oxygen decreases and the pressure drops, the oxygen mask vibrates due to turbulent flow in the oxygen mask, Periodic sudden sound is generated. In such a state, periodic sudden sound is mixed in a call made by the wireless device, making it difficult for the receiver to hear the voice.
Furthermore, since the occurrence of such a periodic sudden sound indicates a decrease in the oxygen remaining amount, it is necessary to quickly grasp or notify the surroundings.
図1は、本発明に係る雑音検出装置100のブロック図である。雑音検出装置100は
、通信装置200等に搭載される。雑音検出装置100は、通信装置200等にモジュー
ルとして搭載されてもよく、通信装置200に備えられているCPU(Central Processi
ng Unit)等の処理および通信装置200の構成要素を用いて実現されてもよい。また、
PC(Personal Computer)や携帯端末等により実現されてもよい。
FIG. 1 is a block diagram of a
ng Unit) and the like and the components of the
You may implement | achieve by PC (Personal Computer), a portable terminal, etc.
雑音検出装置100は、主な構成要素として入力部110、出力部120、記憶部13
0、制御部150を備える。これら以外にも雑音検出装置100として機能するために必
要な構成要素を適宜備える。
The
0, a
入力部110は、雑音検出装置100により雑音を検出する対象の音データが入力され
るインターフェースである。具体的には、雑音検出装置100が単体で用いられる場合は
、各種入力端子やマイクロホンであり、雑音検出装置100が通信装置200に内蔵され
る場合は、通信装置200が備えるマイクロホン等から入力された音データが入力される
。入力部110は、入力される音のアナログ信号をデジタルの音データに変換するA/D
コンバータを備えていてもよく、入力される音データをデジタルデータとして制御部15
0に入力させる。
The
A controller may be provided, and the control unit 15 converts the input sound data as digital data.
Let 0 be entered.
出力部120は、雑音検出装置100が検出した雑音に関する情報を出力する。雑音に
関する情報の具体例としては、雑音検出の有無、雑音検出による通知指示等である。出力
部120による出力形態や出力タイミング等は、制御部150により制御される。出力部
120は、雑音検出装置100が単体で用いられる場合は、音声または映像の出力を行う
各種インターフェースを備え、雑音検出装置100が通信装置200に内蔵される場合は
、通信装置200が備える出力インターフェースに情報を出力する。
The
記憶部130は、雑音検出装置100の雑音検出処理に用いる一時的なデータの記憶や
、概形モデル波形等を記憶する。記憶部130は、制御部としてのCPUに付随している
RAM(Random Access Memory)やROM(Read Only Memory)、その他の記憶素子であ
る。また、雑音検出装置100が通信装置200に内蔵されている場合は通信装置200
の記憶部として共用であってもよい。また、制御部150において実行される各種プログ
ラムも記憶部130に記憶される。
The
The storage unit may be shared. Various programs executed in the
制御部150は、雑音検出装置100の構成要素および各種処理のためのプログラムを
実行するCPUやDSP(Digital Signal Processor)等である。雑音検出装置100が
通信装置200に内蔵されている場合は、通信装置200の制御部250と共用であって
もよい。
The
制御部150は、実行されるプログラムによって各種機能を実現する。本実施形態にお
いて制御部150は、フレーム処理部151、振幅検出部152、突発音確定部153、
概形モデル化部154、相関値算出部155、周期性突発音判定部156を実現する。
The
An
フレーム処理部151は、入力部110から入力された雑音を検出する対象の音データ
に対して、所定のサンプル数に従った時間幅で音データをフレームに区切る処理を行う。
The
振幅検出部152は、フレーム処理部151でフレーム化された時間軸の音データを構
成する複数のサンプル点より、振幅値が他のサンプル点と比較して高い値を示すサンプル
点の位置をピーク位置として検出する処理を行う。具体的には、振幅値が所定の閾値以上
である場合のピーク位置を検出する。
The
突発音確定部153は、振幅検出部152において検出されたピーク位置に基づき、振
幅の高い信号が継続する期間と、ピーク位置を基準としたエネルギー変化量を算出し、検
出対象となる突発音を確定する処理を行う。
Based on the peak position detected by the
概形モデル化部154は、突発音確定部153において検出された突発音の時間軸信号
振幅波形から概形モデル波形を生成する処理を行う。
The
相関値算出部155は、概形モデル化部154で生成された概形モデル波形として記憶
している過去のフレームにおける概形モデル波形との相関値を算出する処理を行う。また
、算出した相関値が所定以上の相関値であるか否かを判断する。
The correlation
周期性突発音判定部156は、相関値算出部155において所定以上の相関値であると
判断された概形モデル波形と過去の概形モデル波形との時間幅を算出し、概形モデル波形
が周期性を備えるか否か、すなわち突発音が周期性突発音であるか否かを判断する。また
、周期性突発音判定部156は周期性突発音の発生に伴う周期性突発音モードのオンオフ
を制御する。
The periodic sudden
次に、図2のフローチャートを用いて雑音検出装置100による雑音検出方法について
説明する。
Next, the noise detection method by the
先ず、入力部110に入力された音データに対してフレーム処理部151は所定のサン
プル数の時間幅でフレーム化する処理を行う(ステップS001)。例えば酸素残量が少
なくなった際の酸素マスクが振動することによる周期的突発音は、最も音圧レベルが高い
ピーク位置の立ち上がりから立ち下がりまで約0.1secの時間幅を有する。従って、
このような周期性突発音の存在を検出するためには、各突発音の前後の突発音を含まない
区間を確保し、ピーク位置における振幅の変化量やエネルギー変化量の推移に基づき突発
音を検出する必要がある。このため、検出対象の突発音の存在を把握するための時間幅と
しては、ピーク位置の立ち上がりから立ち下がりまでの約0.1secに対して、0.3
secから0.5secであることが望ましい。
First, the
In order to detect the presence of such a periodic sudden sound, a section that does not include sudden sound before and after each sudden sound is secured, and sudden sound is detected based on the change in amplitude and energy change at the peak position. It needs to be detected. For this reason, the time width for grasping the presence of the sudden sound of the detection target is 0.3 for a period of about 0.1 sec from the rise to the fall of the peak position.
It is desirable to be from 0.5 sec to 0.5 sec.
ステップS001においてフレーム化する時間幅は、上記の時間幅に限らず、検出対象
の突発音や雑音検出装置100を構成するシステムによって変更してもよい。検出対象の
突発音は、物体と物体とが衝突して発する打撃音である場合、衝突する物体によって突発
音の持続時間等が推定されるため、突発音の持続時間の数倍分をフレーム化の時間幅とし
て確保する。
The time width for framing in step S001 is not limited to the above time width, and may be changed depending on the sudden sound to be detected and the system constituting the
次に、振幅検出部152はステップS001においてフレーム化した音データの振幅値
を所定の閾値と比較し(ステップS002)、振幅値が閾値以上であるか否かを判断する
(ステップS003)。ステップS003において、振幅値が閾値以上であると判断され
た場合、振幅検出部152は時間軸上のピーク位置を検出する。
Next, the
ここで、突発音の特徴について図3を用いて説明する。図3(A)は、周期性突発音の
波形例であり、横軸が時間、縦軸が振幅を示している。図3(A)においては、振幅値が
大きい2箇所がそれぞれ突発音である。このように、突発音は他の区間に比べて振幅が大
きいという特徴を有するため、突発音の有無は、平均的な入力信号のエネルギーまたは振
幅値に基づき判断することができる。
Here, the characteristics of the sudden sound will be described with reference to FIG. FIG. 3A shows a waveform example of periodic sudden sound, where the horizontal axis indicates time and the vertical axis indicates amplitude. In FIG. 3 (A), two locations with large amplitude values are sudden sounds respectively. Thus, since sudden sound has a characteristic that the amplitude is larger than that of other sections, the presence or absence of sudden sound can be determined based on the average energy or amplitude value of the input signal.
ステップS002の処理において、振幅検出部152が比較する閾値の例は、図3(A
)においてはThとして示される。閾値Thは、音データが入力されてから解析フレーム
までの平均値から求めるが、例えば解析フレームの中央値や突発音のデータに基づいて予
め設定された値であってもよい。
In the processing of step S002, examples of threshold values that the
) Is shown as Th. The threshold value Th is obtained from the average value from the input of sound data to the analysis frame, but may be a value set in advance based on the median value of the analysis frame or sudden sound data, for example.
また、解析対象の波形が図3(B)のように周辺雑音の影響により閾値以上の波形が多
発する場合や、周辺雑音の振幅値に突発音の振幅値が加算される場合もある。このような
場合、振幅検出部152が比較する閾値Thは、周囲の雑音レベルに応じて調整されても
よい。
In addition, as shown in FIG. 3B, there are cases where the waveform to be analyzed often has a threshold value or more due to the influence of ambient noise, or the amplitude value of sudden sound may be added to the amplitude value of ambient noise. In such a case, the threshold value Th that the
ステップS003において、振幅値が閾値以下であると判断された場合(ステップS0
03:No)、解析対象となるフレームにおいて突発音は無いため、次のフレームを解析
対象としてステップS001の処理に戻る。
If it is determined in step S003 that the amplitude value is equal to or smaller than the threshold value (step S0)
03: No), since there is no sudden sound in the analysis target frame, the process returns to step S001 with the next frame as the analysis target.
ステップS003において、振幅値が閾値以上であると判断された場合(ステップS0
03:Yes)、突発音確定部153は、検出したピーク位置に基づき振幅の高い信号の
継続時間とピーク位置を基準としたエネルギー変化量を算出し、突発音を確定する(ステ
ップS004)。
If it is determined in step S003 that the amplitude value is equal to or greater than the threshold value (step S0)
03: Yes), the sudden
ここで、ステップS004において算出する振幅の高い信号の継続時間について図3を
用いて説明する。突発音は、上述したように他の区間に比べて振幅値が大きいが、図3(
B)のように振幅の大きい周辺雑音が存在する場合、振幅の大きい周辺雑音も突発音であ
ると判断されてしまう。図3(B)の波形は、突発音の周辺雑音として人の声による音声
が含まれている場合の波形である。
Here, the duration of a signal with a high amplitude calculated in step S004 will be described with reference to FIG. As described above, the sudden sound has a larger amplitude value than the other sections.
When ambient noise having a large amplitude is present as in B), the ambient noise having a large amplitude is also determined to be a sudden sound. The waveform in FIG. 3B is a waveform in the case where a voice by human voice is included as a peripheral noise of sudden sound.
図3(A)に示す突発音の継続時間と図3(B)に示す振幅値の大きい音声の継続時間
とを対比すると、音声は振幅のピークから急峻に振幅が低下しているのに対し、突発音の
振幅は振幅のピークからの継続時間が音声より長くなっていることが分かる。また、音声
の成分によっては継続時間が突発音の継続時間より長くなる場合もある。このような場合
においても、ステップS004の処理としては、検出対象の突発音の継続時間を基準とし
て継続時間を比較することにより、検出対象の突発音と周辺雑音としての突発性信号とを
区別することができる。
When the duration of the sudden sound shown in FIG. 3A is compared with the duration of the voice having a large amplitude value shown in FIG. 3B, the voice sharply decreases in amplitude from the peak of the amplitude. It can be seen that the amplitude of the sudden sound is longer than the voice from the amplitude peak. Also, depending on the sound component, the duration may be longer than the duration of sudden sound. Even in such a case, as a process of step S004, the duration of the sudden sound of the detection target is compared, and the duration is compared to distinguish between the sudden sound of the detection target and the sudden signal as the ambient noise. be able to.
ステップS004における継続時間の算出例としては、図3(A)に例示するように、
ピーク位置から所定の区間Int内における閾値Th以上の値の数を求める。区間Int
内における閾値Th以上の値が多いということは、振幅の継続時間が長いということを示
す。
As an example of calculating the duration in step S004, as illustrated in FIG.
The number of values greater than or equal to the threshold Th within a predetermined section Int from the peak position is obtained. Section Int
If there are many values equal to or greater than the threshold value Th in the graph, it means that the duration time of the amplitude is long.
また、ステップS004においては、ピーク位置を基準としたエネルギー変化量として
、ピーク位置から区間Int内の最後のサンプル位置までの振幅の絶対値を加算し、エネ
ルギーを算出する。図3(B)に示すように、検出対象の突発音の振幅はピーク位置から
緩やかに減衰するが、周辺雑音としての突発性信号は急峻に減衰しているため、エネルギ
ー変化量に差が生じる。従って、突発音確定部153は、ステップS004において算出
した継続時間とエネルギー変化量各々が所定の閾値以上である場合(ステップS005:
Yes)、そのピーク位置における波形を突発音として確定する。所定の閾値以下である
場合(ステップS005:No)、突発音は検出されないため、次のフレームを解析対象
としてステップS001の処理に戻る。
In step S004, the absolute value of the amplitude from the peak position to the last sample position in the section Int is added as the amount of energy change based on the peak position to calculate energy. As shown in FIG. 3B, the amplitude of the sudden sound of the detection target is gradually attenuated from the peak position. However, since the sudden signal as the ambient noise is abruptly attenuated, there is a difference in the amount of energy change. . Accordingly, the sudden
Yes), the waveform at the peak position is determined as a sudden sound. If it is equal to or less than the predetermined threshold (step S005: No), since sudden sound is not detected, the process returns to step S001 with the next frame as an analysis target.
ここで、突発音がフレームの境界付近に存在している場合の処理について説明する。解
析対象のフレームの境界に突発音がある場合、突発音の継続時間が隣接するフレームとで
分断されるなど、正確な検出ができない場合が生じるためである。具体的には、ステップ
S002からステップS005までの処理を、解析対象のフレームとその直前のフレーム
の一部のサンプル区間を含めて分析することにより可能とする。また、ステップS001
におけるフレーム化処理時に、隣接するフレーム同士オーバーラップする区間を設けたフ
レーム化処理としてもよい。この場合のオーバーラップ区間の時間幅は、検出対象の突発
音の継続時間以上の時間幅であることが好ましい。
Here, processing when sudden sound is present near the boundary of the frame will be described. This is because when there is a sudden sound at the boundary of the frame to be analyzed, there are cases where accurate detection cannot be performed, for example, the duration of the sudden sound is divided between adjacent frames. Specifically, the processing from step S002 to step S005 is made possible by analyzing the analysis target frame and a part of the sample interval of the immediately preceding frame. Step S001
At the time of framing processing, the framing processing may be provided with a section where adjacent frames overlap. In this case, the time width of the overlap section is preferably a time width equal to or longer than the duration of the sudden sound to be detected.
以上、ステップS001からステップS005までの処理は、突発音を検出するための
短期時間分析である。
As described above, the processing from step S001 to step S005 is a short-time analysis for detecting sudden sound.
次に、概形モデル化部154は、ステップS005において突発音として検出された波
形に対して概形モデル化処理を行う(ステップS006)。具体的には、図4(A)に示
すように、入力波形を絶対値に変換する。さらに、図4(B)に示すように絶対値に変換
された波形に対してその振幅値にメディアンフィルターによる処理を行う。なお、振幅値
の概形モデル化処理は上記に限らず、移動平均を用いるなど、他の手法によっても可能で
ある。ステップS006において概形モデル化された波形のデータやピーク位置等は、逐
次記憶部130に記憶される。
Next, the
酸素マスクが振動して発生する周期性突発音の周期は、一般的に0.05〜0.1se
cである。上述した短期時間分析により突発音が検出され、その後上述した周期となるフ
レーム数の時間幅内に突発音が検出されなかった場合は、検出された突発音は周期性突発
音ではないため、概形モデル化されたデータは記憶部130から消去してもよい。また、
上述した周期となるフレーム数内に突発音が検出された場合は、周期性突発音である可能
性が高いため、概形モデル化されたデータを所定のフレーム数分記憶部130に記憶する
。記憶するフレーム数は周期性突発音の周期等によって変更されてもよい。
The period of periodic sudden sound generated when the oxygen mask vibrates is generally 0.05 to 0.1 se.
c. If a sudden sound is detected by the short-term time analysis described above and no sudden sound is detected within the time span of the number of frames in the period described above, the detected sudden sound is not a periodic sudden sound. The data modeled may be deleted from the
When a sudden sound is detected within the number of frames having the above-described period, since there is a high possibility of a periodic sudden sound, the roughly modeled data is stored in the
次に、ステップS006において概形モデル化された波形に対して、相関値算出部15
5は、記憶部130に記憶されている過去のフレームにおける概形モデルとの相関値を算
出する(ステップS007)。具体的な処理としては、相関値算出部155は、式1に示
すような一般的な自己相関関数を用いて相関値を算出する。式1において、Nはサンプル
データ数、nは時系列サンプルを表す整数であり、mは時系列のサンプルシフト量を示し
、自己相関関数の結果Aを求める。
Next, the correlation value calculation unit 15 is applied to the waveform modeled in the rough shape in step S006.
5 calculates a correlation value with the outline model in the past frame stored in the storage unit 130 (step S007). As a specific process, the correlation
ステップS007の処理として、具体的な概形モデルによる相関値算出について図5を
用いて説明する。相関値を算出する範囲は、図5(A)の枠で囲った範囲で示すように、
突発音の継続時間とし、これを相関範囲とする。この相関範囲を1サンプルずつずらしな
がらサンプル毎に相関値を算出する。この処理においては、全てのサンプルに対して相関
値を算出すると、演算量が多くなってしまうため、検出対象である周期性突発音の持続時
間分ずらしたサンプルから相関値を算出することにより、算出処理量の効率化を行うこと
ができる。具体例としては、一般的な酸素マスクが振動することにより発生する周期性突
発音の継続時間は約0.05secであるため、約0.05secに相当するサンプル数
分ずらした位置から相関値を算出する。
As a process of step S007, correlation value calculation using a specific outline model will be described with reference to FIG. The range for calculating the correlation value is as shown by the range surrounded by the frame in FIG.
The duration of sudden sound is taken as the correlation range. The correlation value is calculated for each sample while shifting the correlation range by one sample. In this process, if the correlation value is calculated for all the samples, the amount of calculation increases, so by calculating the correlation value from the sample shifted by the duration of the periodic sudden sound that is the detection target, The calculation processing amount can be made more efficient. As a specific example, since the duration of periodic sudden sound generated when a general oxygen mask vibrates is about 0.05 sec, the correlation value is calculated from a position shifted by the number of samples corresponding to about 0.05 sec. calculate.
ステップS007の処理において算出した相関値による相関性の高い突発音の例を図5
(B)に示す。図5(B)においては、各々の突発音の波形の後半部分において相関性の
高い形態があることが分かる。この相関値により各々の突発音は相関性があり、連続的に
相関性の高い突発音が存在することが分かる。
An example of sudden sound with high correlation based on the correlation value calculated in step S007 is shown in FIG.
Shown in (B). In FIG. 5B, it can be seen that there is a highly correlated form in the latter half of each sudden sound waveform. It can be seen from this correlation value that each sudden sound has a correlation, and there is a continuous highly sound sudden sound.
また、相関値算出部155はステップS007において算出した相関値が所定の閾値以
上であるか否かを判断する(ステップS008)。ここでいう所定の閾値とは、突発音の
波形同士に十分な相関性があり、同一の発生源による突発音であることが判断できる値と
する。ステップS008において、相関値が所定の閾値以上であると判断された場合(ス
テップS008:Yes)、過去のフレームにおいて同様の突発音が発生しているものと
みなし、次のステップへ移行する。ステップS008において、相関値が所定の閾値以上
ではないと判断された場合(ステップS008:No)、周期的な突発音ではないため、
ステップS001の処理に戻る。
Further, the correlation
The process returns to step S001.
ステップS008において、相関値が所定の閾値以上であると判断された場合(ステッ
プS008:Yes)、図5(B)に示すように解析対象の突発音と過去の突発音との距
離である時間幅を算出し(ステップS009)、算出した時間幅で周期性を有する周期性
突発音であると判断する。
When it is determined in step S008 that the correlation value is equal to or greater than a predetermined threshold (step S008: Yes), as shown in FIG. 5B, the time that is the distance between the sudden sound to be analyzed and the past sudden sound The width is calculated (step S009), and it is determined that the periodic sudden sound having periodicity with the calculated time width.
以上、ステップS006からステップS009までの処理は、短期時間分析において検
出した突発音が周期性突発音であることを検出するための長期時間分析である。
As described above, the processing from step S006 to step S009 is a long-term time analysis for detecting that the sudden sound detected in the short-term time analysis is a periodic sudden sound.
ステップ001からステップS009までの周期性突発音の検出処理においては、背景
雑音に検出対象の突発音以外の音で類似した波形概形を有する突発音が発生した場合、そ
のような偶発的な突発音を検出対象の周期性突発音であると判断してしまう場合もある。
以下の処理は周期性突発音をより正確に検出するための処理である。
In the periodic sudden sound detection process from step 001 to step S009, when a sudden sound having a similar waveform outline occurs in a sound other than the sudden sound to be detected in the background noise, such an accidental sudden sound is generated. In some cases, it may be determined that the sound is a periodic sudden sound to be detected.
The following processing is processing for more accurately detecting periodic sudden sound.
先ず、周期性突発音判定部156は、現時点において周期性突発音モードであるか否か
を判断する(ステップS010)。周期性突発音モードとは、突発音が検出され且つその
突発音が周期性を有している場合のモードである。突発音が発生していてもその突発音が
周期性を有していない場合は、周期性突発音モードではない。また、突発音検出前の初期
値は、周期性突発音モードではない。
First, the periodic sudden
ステップS010において、周期性突発音モードであると判断された場合(ステップS
10:Yes)、周期性突発音判定部156は、解析中の突発音区間であるステップS0
09において算出した時間幅と、過去の突発音区間である時間幅とを比較する(ステップ
S011)。ステップS011における具体的な比較例としては、検出対象の周期性突発
音としてとりうる時間幅の下限値から上限値までの間の値であるか否かを判断する。他に
は、解析中の周期性突発音における記憶部130に記憶されている過去分の時間幅の最小
値から最大値まで、またはこれらの最小値および最大値に所定の係数を掛けた値の間など
である。
If it is determined in step S010 that the periodic sudden sound mode is selected (step S010)
10: Yes), the periodic sudden
The time width calculated in 09 is compared with the time width that is a past sudden sound section (step S011). As a specific comparative example in step S011, it is determined whether or not the value is between a lower limit value and an upper limit value of a time width that can be taken as a periodic sudden sound to be detected. Other than the minimum value to the maximum value of the past time width stored in the
ステップS011において、所定の範囲内であると判断された場合(ステップS011
:Yes)、周期性突発音が継続しているため、周期性突発音モードを維持させる(ステ
ップS012)。ステップS011において、所定の範囲内ではないと判断された場合(
ステップS011:No)、周期性突発音が継続していないため、周期性突発音モードを
解除する(ステップS013)。ステップS011がNoである場合とは、周期性突発音
の周期性が消滅した場合であるが、ステップS013の処理前に、周期性が保たれていな
いと判定された結果の頻度や連続性をステップS013に移行する判断要素として加えて
もよい。
If it is determined in step S011 that it is within the predetermined range (step S011)
: Yes), since the periodic sudden sound continues, the periodic sudden sound mode is maintained (step S012). If it is determined in step S011 that it is not within the predetermined range (
Step S011: No), since periodic sudden sound does not continue, the periodic sudden sound mode is canceled (step S013). The case where Step S011 is No is a case where the periodicity of periodic sudden sound disappears, but the frequency and continuity of the result determined that periodicity is not maintained before the processing of Step S013. You may add as a determination element which transfers to step S013.
ステップS010において、周期性突発音モードではないと判断された場合(ステップ
S10:No)、周期性突発音判定部156は突発音の周期性について判定する(ステッ
プS014)。突発音は、例えば過去に一回のみ周期性のある突発音が存在した場合であ
っても、その周期性は偶然発生している可能性もある。従って、ステップS014の判断
として、所定のフレーム以内に周期性のある突発音が所定回数存在するか否かを確認する
ことにより、突発音が周期性突発音であることを確認する。
In step S010, when it is determined that the mode is not the periodic sudden sound mode (step S10: No), the periodic sudden
ステップS014においては、例えば所定の数フレームの期間中に3回にわたり相関性
の高い突発音が確認できた場合、周期性突発音モードとする。これは、突発音が存在し、
さらに所定の解析期間中に突発音が4回検出され、且つそれらの突発音の間隔が等間隔で
ある場合に相当する。等間隔であるか否かの判断は、ステップS011の判断と同一であ
ってもよい。このような突発音は偶発的に発生した確率が低いため、周期性を備えている
と判断することができる。等間隔である相関性の高い突発音の確認回数は、上記に限らず
4回以上であってもよい。
In step S014, for example, when a sudden sound with high correlation is confirmed three times during a predetermined number of frames, the periodic sudden sound mode is set. This is a sudden sound,
Further, this corresponds to a case where sudden sound is detected four times during a predetermined analysis period and the intervals between the sudden sounds are equal. The determination as to whether the intervals are equal may be the same as the determination in step S011. Since such a sudden sound has a low probability of accidental occurrence, it can be determined that it has periodicity. The number of times of confirmation of sudden sound with high correlation at equal intervals is not limited to the above, and may be four or more.
ステップS014における判断結果に基づき、周期性突発音判定部156は検出対象の
突発音が周期性を備える突発音である場合は周期性突発音モードとし(ステップS016
)、周期性を備える突発音ではない場合は周期性突発音モードではない状態が維持される
。
Based on the determination result in step S014, the periodic sudden
), When it is not a sudden sound with periodicity, a state that is not a periodic sudden sound mode is maintained.
以上のように、本発明に係る雑音検出装置100は、短期時間分析、長期時間分析およ
び周期性突発音モードを備え、突発音の振幅値、継続時間、自己相関値、周期性の時間幅
という特徴量に基づき、正確に周期性突発音を検出することができる。
As described above, the
このように検出された周期性突発音に対して、雑音検出装置100を内蔵または接続す
る各種装置は、ノイズキャンセル処理や音声強調処理など必要な処理を行うことが可能で
ある。
Various devices that incorporate or connect the
次に、雑音検出装置100を用いた通信装置200について、図6から図13を用いて
説明する。本実施形態に係る通信装置200は、酸素マスクを装着した状態で使用される
通信装置を例として説明するが、他の実施可能な形態としてはこれに限らない。
Next, the
本実施形態において、酸素ボンベからの酸素残量が少なくなった場合に生じる酸素マス
クの振動による周期性突発音は、その酸素マスクを装着している人物が緊急を要する状態
であることを表す。また、酸素マスクを装着している複数の人物が存在する場合において
、いずれかの酸素マスクが周期性突発音を発生した場合、現場の状況や酸素マスクあるい
はヘルメット等の装着によって、周辺音を聞き取ることは困難である。このため、雑音検
出装置100が検出した周期性突発音に基づき、迅速な報知や対象人物の特定を行う必要
がある。
In the present embodiment, the periodic sudden sound generated by the vibration of the oxygen mask that occurs when the amount of oxygen remaining from the oxygen cylinder is low indicates that the person wearing the oxygen mask is in an urgent state. In addition, when there are multiple persons wearing oxygen masks, if any of the oxygen masks generates periodic sudden sound, the surrounding sounds can be heard depending on the situation in the field or wearing an oxygen mask or helmet. It is difficult. For this reason, based on the periodic sudden sound detected by the
図6は、本発明に係る通信装置200の構成ブロック図である。通信装置200は、各
種無線通信装置や携帯電話等である。
FIG. 6 is a configuration block diagram of the
通信装置200は、主な構成要素として雑音検出装置100、マイクロフォン210、
音声出力部220、通信部230、表示部240、制御部250を備える。これら以外に
も例えば電源や操作部など通信装置200として機能するために必要な構成要素を適宜備
える。
The
An
マイクロフォン210は、通信装置200を用いて音声通話を行う場合に音声信号など
の音信号を取得するためのマイクロフォンおよび雑音検出装置100による雑音を検出す
るためのマイクロフォンである。各々の目的のマイクロフォンは、共用されてもよく各々
備えられていてもよい。マイクロフォン210から入力された音声信号は、制御部250
によって通信部230により送信される搬送波に変調される。また、マイクロフォン21
0から入力された信号は、雑音検出装置100が備える入力部110に入力される。マイ
クロフォン210から入力された音声信号をデジタル信号の音声データに変換するA/Dコ
ンバータを備えてもよい。
The microphone 210 is a microphone for acquiring a sound signal such as an audio signal when performing a voice call using the
Is modulated into a carrier wave transmitted by the
The signal input from 0 is input to the
音声出力部220は、通信装置200を用いて音声通話を行う場合に通話先からの音声
を出力するためのスピーカまたはイヤホン等である。音声出力部220への音声出力は、
制御部250によって制御される。
The
It is controlled by the
通信部230は、各種無線通信の送受信を行う通信モジュール等であり、通信は通信制
御部253によって制御される。
The
表示部240は、液晶表示装置等の表示素子であり、表示内容や表示形態は制御部25
0により制御される。
The
Controlled by zero.
制御部250は、通信装置200の構成要素および各種処理のためのプログラムを実行
するCPUやDSP等であり、雑音検出装置100の制御部150と共用であってもよい
。
The
制御部250は、実行されるプログラムによって各種機能を実現する。本実施形態にお
いて制御部250は、突発音区間音圧算出部251、通知制御部252、通信制御部25
3を備える。
The
3 is provided.
突発音区間音圧算出部251は、雑音検出装置100が周期性突発音を検出した場合、
検出した周期性突発音の音圧レベルや音圧レベルの変化量に基づき、周期性突発音の音源
情報を算出する。
When the
Sound source information of periodic sudden sound is calculated based on the detected sound pressure level of periodic sudden sound and the amount of change in the sound pressure level.
通知制御部252は、突発音区間音圧算出部251が算出した周期性突発音の音源情報
に基づいた通知処理に関する制御を行う。
The
通信制御部253は、通信部230による無線通信に関する制御を行う。
The
また、通知制御部252が通知を行うために用いる通信部230、通信制御部253、
表示部240などを包括して通知部290とする。通知部290は、通知制御部252の
制御により上記構成要素の一部または全部を用いて通知を行い、通知の手法によっては他
の構成要素を含む。
In addition, a
The notifying
次に、通信装置200に備えられている雑音検出装置100が周期性突発音を検出した
場合における通信装置200の処理例について、図7から図10を用いて説明する。
Next, processing examples of the
具体例としては、酸素ボンベからの酸素残量が少なくなった場合に生じる酸素マスクの
振動による周期性突発音を、振動している酸素マスクの装着者またはその周囲で同様に酸
素マスクを装着している他の装着者などが使用している通信装置200が検出した場合の
処理例であるが、これに限定はされない。
As a specific example, the periodic sudden sound caused by the vibration of the oxygen mask that occurs when the amount of oxygen remaining from the oxygen cylinder is low, and the wearer of the vibrating oxygen mask or the surrounding area similarly wears the oxygen mask. However, the present invention is not limited to this example.
先ず、雑音検出装置100が周期性突発音を検出した場合、図7のフローチャートにお
いて突発音区間音圧算出部251は、検出した周期性突発音の音圧レベルを予め定められ
ている閾値と比較する(ステップS101)。比較する音圧レベルは、所定区間の平均値
や中央値などである。
First, when the
ステップS101の比較結果において、検出された周期性突発音の音圧レベルが閾値以
上である場合(ステップS102:Yes)、周期性突発音の発生源が自身の酸素マスク
であるため、通知制御部252は、自身の異常発生を通知する(ステップS103)。
If the detected sound pressure level of periodic sudden sound is equal to or higher than the threshold value in the comparison result of step S101 (step S102: Yes), the source of the periodic sudden sound is its own oxygen mask, so the
ステップS103における自身の異常発生の通知は、様々な手法が適用可能である。具
体的な例としては、通知制御部252の制御により通信制御部253および通信部230
を用いて、異常発生を知らせる無線送信を行う。異常発生を知らせる無線送信によって、
音声信号として異常の発生を通知したり、受信した周囲の通信装置が備えるLED等の光
源を点滅させ、視覚的に異常の発生を通知してもよい。さらには、自身の通信装置200
が備える表示部240や光源を用いて異常を視覚的に通知してもよい。異常発生を知らせ
る無線送信や表示においては、酸素量低下など具体的な異常内容が判別できることとして
もよい。
Various methods can be applied to the notification of the occurrence of abnormality in step S103. As a specific example, the
Is used to perform wireless transmission to notify the occurrence of an abnormality. By wireless transmission to inform the occurrence of anomalies,
The occurrence of an abnormality may be notified as an audio signal, or a light source such as an LED provided in the received surrounding communication device may be blinked to visually notify the occurrence of the abnormality. Furthermore, its
You may visually notify abnormality using the
ステップS101の比較結果において、検出された周期性突発音の音圧レベルが閾値以
上ではない場合(ステップS102:No)、周期性突発音の発生源が自身の酸素マスク
ではなく周囲に存在する他者の酸素マスクであるため、通知制御部252は、周囲の他者
において異常が発生していることを通知する(ステップS104)。ステップS104に
おける他者の異常発生の通知においても、様々な手法が適用可能である。具体的な例とし
ては、ステップS103における例と同様であるが、異常発生を知らせる無線送信や表示
においては、具体的な異常内容に加えて他者に異常が発生していることを判別できること
としてもよい。
If the detected sound pressure level of periodic sudden sound is not equal to or higher than the threshold value in the comparison result of step S101 (step S102: No), the source of periodic sudden sound is not in its own oxygen mask but in the surroundings. Since it is the person's oxygen mask, the
次に、突発音区間音圧算出部251は、異常が発生した他者の位置情報を取得する(ス
テップS105)。ステップS105の処理は、他者が周囲に複数存在する場合、どの他
者に異常が生じているかを明確にするためである。ステップS105の処理については後
述する。
Next, the sudden sound section sound
ステップS105において、異常が発生した他者の位置情報を取得した後、通知制御部
252は、異常対象である他者の位置情報を通知する(ステップS106)。異常対象で
ある他者の位置情報の通知においても様々な手法が適用可能であり、位置情報の種類によ
っても異なる場合もあるが、無線送信による視覚的または聴覚的な通知、または表示部2
40や光源を用いる視覚的な通知が適切である。
In step S105, after acquiring the position information of the other person in which the abnormality has occurred, the
Visual notification using 40 or a light source is appropriate.
次にステップS105の第一の処理例について説明する。図8は異常が発生している他
者と自己との位置関係を取得する処理を説明するフローチャートである。図7におけるス
テップS101およびステップS102の処理により他者に異常が発生したと判断された
後、突発音区間音圧算出部251は周期性突発音の所定区間毎の音圧レベルの変化を判定
する(ステップS201)。
Next, a first processing example of step S105 will be described. FIG. 8 is a flowchart for explaining the process of acquiring the positional relationship between another person who has an abnormality and herself. After it is determined that an abnormality has occurred in the other person by the processing of step S101 and step S102 in FIG. 7, the sudden sound interval sound
ステップS201の判定において、現時点における区間の音圧レベルが過去の区間の音
圧レベルより大きいと判断された場合(ステップS202:Yes)、通知制御部252
は異常が発生している他者が自己に近づいていると判断する(ステップS203)。この
ため、図7におけるステップS106においては、各種手法により異常が発生している他
者が自己に近づいていることを通知する。
When it is determined in step S201 that the sound pressure level in the current section is higher than the sound pressure level in the past section (step S202: Yes), the
It is determined that the other person who has an abnormality is approaching herself (step S203). For this reason, in step S106 in FIG. 7, it is notified that another person who has developed an abnormality is approaching himself / herself by various methods.
ステップS201の判定において、現時点における区間の音圧レベルが過去の区間の音
圧レベルより小さいと判断された場合(ステップS202:No)、通知制御部252は
異常が発生している他者が自己から遠ざかっていると判断する(ステップS204)。こ
のため、図7におけるステップS106においては、各種手法により異常が発生している
他者が自己から遠ざかっていることを通知する。
If it is determined in step S201 that the sound pressure level in the current section is lower than the sound pressure level in the past section (step S202: No), the
ステップS201の判定においては、音圧レベルの変化を判定する音声区間の長さによ
っては、複数の音声区間において連続して音圧レベルの上昇または下降が確認されること
により判断してもよい。
In the determination in step S201, depending on the length of the sound section for determining the change in the sound pressure level, the sound pressure level may be determined to be increased or decreased continuously in a plurality of sound sections.
このような通知を行うことで、異常が発生した他者の発見時間の短縮に繋げることがで
きる。
By performing such notification, it is possible to shorten the discovery time of the other person who has an abnormality.
次に、図9および図10を用いてステップS105の第二の処理例について説明する。
図7におけるステップS101およびステップS102の処理により他者に異常が発生し
たと判断された後、通知制御部252は、音声出力部220による音声出力または表示部
240による表示を用いて、異常対象方向検出のための動作を行う指示を行う(ステップ
S211)。具体的には、通信装置200または通信装置200を保持した人物がその場
で360度回転するように指示する。
Next, a second processing example of step S105 will be described with reference to FIGS.
After it is determined that an abnormality has occurred in the other person through the processing of step S101 and step S102 in FIG. 7, the
ステップS211における指示後、突発音区間音圧算出部251は、周期性突発音の所
定区間毎の音圧レベル取得し(ステップS212)、周期性突発音の方向を判定する(ス
テップS213)。図10は、ステップS212の処理において取得した音圧レベルの例
である。図10においては、回転開始から終了までの角度を横軸とし、音圧レベルを縦軸
としており、180度の位置つまり回転開始時の向きにおいて後方向で最大の音圧レベル
を得ており、その方向に異常が発生した他者が存在していることが分かる。音圧レベルと
回転角度は、ステップS211における指示開始時間から概算してもよいが、通信装置2
00に加速度センサ等が備えられ、加速度センサの出力によって回転角度を取得してもよ
い。
After the instruction in step S211, the sudden sound section sound
00 may be provided with an acceleration sensor or the like, and the rotation angle may be acquired by the output of the acceleration sensor.
このため、図7におけるステップS106においては、各種手法により、ステップS2
13において判定した異常が発生している他者の方向を通知する。
For this reason, in step S106 in FIG.
The direction of the other person in which the abnormality determined in 13 has occurred is notified.
このような通知を行うことで、異常が発生した他者の発見時間のさらなる短縮に繋げる
ことができる。また、図8および図9において説明した他者の位置情報取得処理は他の位
置情報取得処理と組み合わせて実行されてもよい。
By performing such notification, it is possible to further shorten the discovery time of the other person who has an abnormality. Further, the position information acquisition process of the other person described in FIGS. 8 and 9 may be executed in combination with another position information acquisition process.
次に、図11から図13を用いてステップS105の第三の処理例について説明する。
第三の処理例については、通信装置200の構成が一部異なってくる。このため、通信装
置200の構成ブロック図を図11を用いて説明する。図11の説明においては図6と共
通する部分の説明は省略する。
Next, a third processing example of step S105 will be described with reference to FIGS.
Regarding the third processing example, the configuration of the
図11に示す通信装置200は、マイクロフォン210に代えて第1マイクロフォン2
11および第2マイクロフォン212を備える。第1マイクロフォン211および第2マ
イクロフォン212は、機能としてはマイクロフォン210と同一であり、複数備えられ
ていることが異なる。
The
11 and a
図12に第1マイクロフォン211および第2マイクロフォン212は、通信装置20
0において同一面またはほぼ対象となるように配置されている。このため、突発音1の発
生位置においては、第2マイクロフォン212には第1マイクロフォン211よりも時間
的に遅延した信号が入力される。同様に、突発音2の発生位置においては、第1マイクロ
フォン211には第2マイクロフォン212よりも時間的に遅延した信号が入力される。
In FIG. 12, the
At 0, they are arranged so as to be the same surface or almost the target. For this reason, at the position where the sudden sound 1 is generated, a signal delayed in time from the
制御部250は、実行されるプログラムによって相関値算出部254を実現する。相関
値算出部254は、第1マイクロフォン211および第2マイクロフォン212から入力
された周期性突発音の相関値を求める。
The
図13を用いて、図11に示す通信装置200によるステップS105の第三の処理例
について説明する。図11に示す通信装置200においても、図7に示す周期性突発音を
検出した場合における処理は同一である。
A third processing example of step S105 performed by the
図7におけるステップS101およびステップS102の処理により他者に異常が発生
したと判断された後、相関値算出部254は、第1マイクロフォン211および第2マイ
クロフォン212のいずれかに入力された信号を基準として相関値を求める(ステップS
211)。
After it is determined that an abnormality has occurred in the other person through the processing in steps S101 and S102 in FIG. 7, the correlation
211).
ステップS211の処理は、例えば第1マイクロフォン211に入力された信号を基準
とする場合、式2を用いて相関値を算出する。式2においては、第1マイクロフォン21
1をマイク1、第2マイクロフォン212をマイク2として記載している。式2において
、Nはサンプルデータ数、nは時系列サンプルを表す整数であり、mは時系列のサンプル
シフト量を示し、自己相関関数の結果Aを求める。
In the process of step S211, for example, when the signal input to the
1 is described as a microphone 1, and the
式2を用いて相関値を算出した場合、図12に示す突発音1の方向で周期性突発音が発
生した場合は、第1マイクロフォン211に対して第2マイクロフォン212より先行し
て周期性突発音の信号が到着する。同様に突発音2の方向で周期性突発音が発生した場合
は、第2マイクロフォン212に対して第1マイクロフォン211より先行して周期性突
発音の信号が到着する。
When the correlation value is calculated using Equation 2, if a periodic sudden sound occurs in the direction of the sudden sound 1 shown in FIG. 12, the periodic sudden attack precedes the
このように、ステップS221において相関値算出部254は、第1マイクロフォン2
11または第2マイクロフォン212を基準として相関値を求める。また、相関値算出部
254は、ステップS221で算出した相関値に基づき、相関が最も高い波形の時間幅か
ら周期性突発音の複数のマイクロフォン間の位相差を取得し、位相差より周期性突発音の
発生方向を判定する(ステップS222)。
In this way, in step S221, the correlation
11 or the
このような処理によって判定した周期性突発音の発生方向を、図7におけるステップS
106にて、指定された各種手法を用いて通知する。このような通知を行うことで、異常
が発生した他者の発見時間のさらなる短縮に繋げることができる。また、図13において
説明した他者の位置情報取得処理は他の位置情報取得処理と組み合わせて実行されてもよ
い。
The generation direction of the periodic sudden sound determined by such processing is shown in step S in FIG.
At 106, notification is made using various designated methods. By performing such notification, it is possible to further shorten the discovery time of the other person who has an abnormality. The other person's position information acquisition process described in FIG. 13 may be executed in combination with another position information acquisition process.
このような構成を備える通信装置200は、迅速且つ適切に周期性突発音を検出し、周
期性突発音が発生していることや周期性突発音の発生源に関する情報を自身または周囲の
通信装置200へ通知することができる。
The
次に、本発明に係る雑音低減装置500および雑音低減方法について、図14から図2
2を用いて説明する。
Next, a
This will be described using 2.
本発明の実施形態である雑音低減装置500は、例えば後述する通信装置600に内蔵
された状態で、一例として工事現場や災害現場などの環境で用いられる。一例としては上
述したように、消防士が火災現場における活動時に用いる酸素マスクが周期的な突発音を
発生し、受話側の音声の聞き取りが困難となる場合がある。
The
図14は、本発明に係る雑音低減装置500のブロック図である。雑音低減装置500
は、後述する通信装置600等に搭載される。雑音低減装置500は、通信装置等にモジ
ュールとして搭載されてもよく、通信装置600に備えられているCPU等の処理および
通信装置600の構成要素を用いて実現されてもよい。また、PCや携帯端末等により実
現されてもよい。
FIG. 14 is a block diagram of a
Is mounted on a communication device 600 or the like to be described later. The
また、雑音低減装置500は、図1に示す雑音検出装置100と共通の構成要素を備え
ており、同一の装置であってもよい。また、雑音低減装置500および雑音検出装置10
0は、通信装置600等の構成要素を用いて同時に実現されてもよい。
Moreover, the
0 may be realized simultaneously using components such as the communication device 600.
雑音低減装置500は、主な構成要素として入力部510、出力部520、記憶部53
0、制御部550を備える。これら以外にも雑音低減装置500として機能するために必
要な構成要素を適宜備える。
The
0 and a
入力部510は、雑音低減装置500が雑音を低減する対象の音データが入力されるイ
ンターフェースであり、具体的な構成は入力部110と同様である。
The
出力部520は、雑音低減装置500が雑音を低減した音データを出力するインターフ
ェースである。出力部520による出力形態や出力タイミング等は、制御部550により
制御される。出力部520は、雑音低減装置500が単体で用いられる場合は、雑音が低
減された音データの出力を行う各種インターフェースを備え、雑音低減装置500が通信
装置600に内蔵される場合は、通信装置600が備える通信部に雑音が低減された音デ
ータを出力する。
The
記憶部530は、雑音低減装置500の雑音低減処理に用いる一時的なデータの記憶や
、概形モデル等を記憶する。記憶部530の具体的な構成は記憶部130と同様であり、
制御部550において実行される各種プログラムも記憶部530に記憶される。
The
Various programs executed in the
制御部550は、雑音低減装置500の構成要素および各種処理のためのプログラムを
実行するCPUやDSP等である。雑音低減装置500が通信装置600に内蔵されてい
る場合は、通信装置600の制御部650と共用であってもよい。
The
制御部550は、実行されるプログラムによって各種機能を実現する。本実施形態にお
いて制御部550は、フレーム処理部551、突発音検出部552、音声区間判定部55
3、突発音周期性判定部554、音圧量調整値決定部555、出力レベル調整部556を
実現する。
The
3. A sudden sound periodicity determination unit 554, a sound pressure amount adjustment
フレーム処理部551は、フレーム処理部151と同様に、入力部510から入力され
た雑音を低減する対象の音データに対して、所定のサンプル数に従った時間幅で音データ
をフレームに区切る処理を行う。
Similar to the
突発音検出部552は、フレーム処理部551でフレーム化された時間幅の音データか
ら、検出対象である突発音を検出する処理を行う。また、突発音検出部552は、検出さ
れた突発音に対して概形モデル化処理を行う。
The sudden
音声区間判定部553は、フレーム処理部551でフレーム化された時間幅の音データ
が音声を含む音声区間であるか否かを判断する処理を行う。また、音声区間判定部553
は、音声区間に対して音声を包含する割合である音声包含量を算出する処理を行う。
The voice
Performs a process of calculating a speech inclusion amount, which is a ratio of speech inclusion to the speech section.
突発音周期性判定部554は、突発音検出部552で検出された突発音が周期性を備え
る周期性突発音であるか否かを判断する処理を行う。
The sudden sound periodicity determination unit 554 performs processing to determine whether or not the sudden sound detected by the sudden
音圧量調整値決定部555は、突発音周期性判定部554突発音が周期性を備えると判
断された場合、音声区間判定部553による判定結果に基づき突発音の音圧量調整値を決
定する処理を行う。
The sound pressure amount adjustment
出力レベル調整値556は、音圧量調整値決定部555により決定された音圧量調整値
によって突発音の音圧量を調整することにより、突発音を低減する処理を行う。
The output
図15は、図14に示す突発音検出部552の構成ブロック図である。突発音検出部5
52が突発音を検出するための構成は問わないが、一例として図1に示す振幅検出部15
2、突発音確定部153および概形モデル化部154が突発音を検出するための機能であ
るため、各々と同様の機能である振幅検出部561、突発音確定部562および概形モデ
ル化部563を備える。
FIG. 15 is a block diagram showing the configuration of the sudden
The configuration for detecting the sudden sound by 52 is not limited, but as an example, the amplitude detector 15 shown in FIG.
2. Since the sudden
振幅検出部561は、フレーム処理部551でフレーム化された時間軸の音データを構
成する複数のサンプル点より、振幅値が他のサンプル点と比較して高い値を示すサンプル
点の位置をピーク位置として検出する処理を行う。具体的には、振幅値が所定の閾値以上
である場合のピーク位置を検出する。
The
突発音確定部562は、振幅検出部561において検出されたピーク位置に基づき、振
幅の高い信号が継続する期間と、ピーク位置を基準としたエネルギー変化量を算出し、検
出対象となる突発音を確定する処理を行う。
Based on the peak position detected by the
概形モデル化部563は、突発音確定部562において確定された突発音の時間軸音声
振幅波形から概形モデル波形を生成する処理を行う。
The
次に、図16のフローチャートを用いて雑音低減装置500による雑音低減方法につい
て説明する。
Next, the noise reduction method by the
先ず、入力部510に入力された音データに対してフレーム処理部551は所定のサン
プル数の時間幅でフレーム化する処理を行う(ステップS501)。ステップS501の
処理は、図2に示すステップS001の処理と同様である。例えば酸素残量が少なくなっ
た際の酸素マスクが振動することによる周期的突発音は、最も音圧レベルが高いピーク位
置の立ち上がりから立ち下がりまで約0.1secの時間幅を有する。従って、このよう
な周期性突発音の存在を検出するためには、各突発音の前後の突発音を含まない区間を確
保し、ピーク位置における振幅の変化量やエネルギー変化量の推移に基づき突発音を検出
する必要がある。このため、検出対象の突発音の存在を把握するための時間幅としては、
ピーク位置の立ち上がりから立ち下がりまでの約0.1secに対して、0.3secか
ら0.5secであることが望ましい。
First, the
It is desirable that it is 0.3 sec to 0.5 sec with respect to about 0.1 sec from the rise to the fall of the peak position.
次に、突発音検出部552は、ステップS501においてフレーム化された音データか
ら突発音を検出し、検出された突発音の振幅値および波形の変化量から概形モデル化処理
を行う(ステップS502)。突発音検出部552による突発音の検出手法は様々な手法
が適用可能であるが、一例としては、図2に示すステップS002からステップS005
の処理を適用してもよい。また、突発音検出部552による突発音の概形モデル化処理に
ついても図2に示すステップS006の処理を適用してもよい。この場合、突発音検出部
552は、図15に示すように、振幅検出部152、突発音確定部562および概形モデ
ル化部154に対応する振幅検出部561、突発音確定部562および概形モデル化部5
63としての機能を備える。
Next, the sudden
You may apply the process of. Also, the process of step S006 shown in FIG. 2 may be applied to the sudden sound outline modeling process by the sudden
The function as 63 is provided.
ステップS502の突発音検出処理を図17を用いて説明する。先ず、振幅検出部56
1はステップS501においてフレーム化した音データの振幅値を所定の閾値と比較し(
ステップS602)、振幅値が閾値以上であるか否かを判断する(ステップS602)。
ステップS602において、振幅値が閾値以上であると判断された場合、振幅検出部56
1は時間軸上のピーク位置を検出する。
The sudden sound detection process in step S502 will be described with reference to FIG. First, the amplitude detector 56
1 compares the amplitude value of the sound data framed in step S501 with a predetermined threshold (
In step S602), it is determined whether or not the amplitude value is greater than or equal to a threshold value (step S602).
If it is determined in step S602 that the amplitude value is greater than or equal to the threshold value, the amplitude detection unit 56
1 detects the peak position on the time axis.
ステップS602において振幅値が閾値以下であると判断された場合(ステップS60
2:No)、解析対象となるフレームにおいて突発音は無いため、次のフレームを解析対
象としてステップS501の処理に戻る。
When it is determined in step S602 that the amplitude value is equal to or smaller than the threshold value (step S60)
2: No), since there is no sudden sound in the analysis target frame, the process returns to step S501 with the next frame as the analysis target.
ステップS602において、振幅値が閾値以上であると判断された場合(ステップS6
02:Yes)、突発音確定部562は、検出したピーク位置に基づき振幅の高い信号の
継続時間とピーク位置を基準としたエネルギー変化量を算出し、突発音を確定する(ステ
ップS603)。
If it is determined in step S602 that the amplitude value is greater than or equal to the threshold value (step S6)
02: Yes), the sudden
また、ステップS603においては、ピーク位置を基準としたエネルギー変化量として
、ピーク位置から区間Int内の最後のサンプル位置までの振幅の絶対値を加算し、エネ
ルギーを算出する。突発音確定部562は、ステップS603において算出した継続時間
とエネルギー変化量各々が所定の閾値以上である場合(ステップS604:Yes)、そ
のピーク位置における波形を突発音として確定する。所定の閾値以下である場合(ステッ
プS604:No)、突発音は検出されないため、次のフレームを解析対象としてステッ
プS501の処理に戻る。
In step S603, the absolute value of the amplitude from the peak position to the last sample position in the section Int is added as the amount of energy change with the peak position as a reference to calculate energy. The sudden
次に、概形モデル化部563は、ステップS604において突発音として検出された波
形に対して概形モデル化処理を行う(ステップS605)。
Next, the
ここで、概形モデル化処理の例について図18から図22を用いて説明する。ここで説
明する概形モデル化処理は、ステップS605の処理を実行する概形モデル化部563に
おいて実施されるとともに、図2のステップS006の処理を実行する概形モデル化部1
54における概形モデル化処理に適用してもよい。なお、本実施形態においては、突発音
を低減する際にAGC(Automatic Gain Control)処理を用いるため、概形モデル化処理
においてAGC係数を用いる。AGC処理は周知の手法であるが、本実施形態においては
AGC係数を突発音の低減に応用し、入力された音データに含まれる突発音の感度を下げ
て出力することで、突発音を低減することを可能とする。
Here, an example of the outline modeling process will be described with reference to FIGS. The rough shape modeling process described here is performed in the rough
It may be applied to the rough shape modeling process in 54. In this embodiment, since AGC (Automatic Gain Control) processing is used when reducing sudden sound, AGC coefficients are used in the rough modeling processing. AGC processing is a well-known technique, but in this embodiment, the AGC coefficient is applied to reduce sudden sound, and the sudden sound sensitivity included in the input sound data is reduced and output, thereby reducing sudden sound. It is possible to do.
先ず、概形モデル化処理の第1の例を、図18および図19を用いて説明する。 First, a first example of the outline modeling process will be described with reference to FIGS.
概形モデル化部563は、突発音確定部562により確定された突発音の突発音区間か
ら最大振幅値を検出する(ステップS701)。ステップS701の処理は、図19(A
)に示すように、突発音としての波形の開始位置から終了位置までの区間である突発音区
間における振幅の最大値を検出する。ここで検出する振幅の最大値は振幅の絶対値の最大
値であってもよい。
The
), The maximum value of the amplitude in the sudden sound section that is the section from the start position to the end position of the waveform as the sudden sound is detected. The maximum value of the amplitude detected here may be the maximum value of the absolute value of the amplitude.
次に、概形モデル化部563は、ステップS701において検出した最大振幅値からA
GC係数αpkを算出する(ステップS702)。ステップS702におけるAGC係数α
pkの算出は、式3を用いて求める。式3において、Igainは入力信号の振幅値でありステ
ップS701において検出した最大振幅値である。HgainはIgainに対してAGC処理を
行った後の目標とする振幅値であり、Mgainは所定の閾値である。
Next, the
The GC coefficient α pk is calculated (step S702). AGC coefficient α in step S702
pk is calculated using Equation 3. In Equation 3, Igain is the amplitude value of the input signal, which is the maximum amplitude value detected in step S701. Hgain is a target amplitude value after performing AGC processing on Igain, and Mgain is a predetermined threshold value.
式3において、所定の閾値であるMgainは、突発音区間の振幅値から算出することが望
ましいが、予め設定された値であってもよい。AGC処理後の目標値であるHgainは、突
発音が存在しない区間の振幅値と同等となるように設定することが望ましいが、予め設定
された値であってもよい。
In Equation 3, it is desirable to calculate Mgain, which is a predetermined threshold, from the amplitude value of the sudden sound interval, but it may be a preset value. Hgain, which is the target value after the AGC process, is desirably set to be equal to the amplitude value in a section where there is no sudden sound, but may be a preset value.
式3は、具体的には、入力信号の振幅値であるIgainが所定の閾値Mgainより大きい場
合にHgainとなるように調整するAGC係数αpkを算出する。
Specifically, the expression 3 calculates the AGC coefficient α pk that is adjusted so as to be Hgain when Igain, which is the amplitude value of the input signal, is larger than a predetermined threshold value Mgain.
次に、概形モデル化部563はステップS702において算出されたAGC係数αpkを
、突発音区間の各サンプル値に入力するとともに、突発音区間以外のAGC係数を1とし
て、図19(B)に示すような矩形波を作成する(ステップS703)。ステップS70
3で作成された矩形波を突発音の概形モデルとする。
Next, the rough
The rectangular wave created in step 3 is used as a rough model of sudden sound.
次に、概形モデル化処理の第2の例を、図20を用いて説明する。概形モデル化処理の
第2の例は、第1の例として説明した図18のフローチャートにおけるステップS703
の処理が異なる。
Next, a second example of the outline modeling process will be described with reference to FIG. The second example of the outline modeling process is step S703 in the flowchart of FIG. 18 described as the first example.
The processing of is different.
概形モデル化部563は、ステップS702において算出されたAGC係数αpkに基づ
いて、図20に示すように、突発音波形のピーク位置と突発音区間の前後のサンプル数か
ら三角波を作成する(ステップS703)。ここでいうピーク位置とは、ステップS70
1で検出された突発音区間の最大値の振幅値とサンプル位置を示す。
Based on the AGC coefficient α pk calculated in step S702, the rough
1 shows the amplitude value and the sample position of the maximum value of the sudden sound section detected in 1.
例えば、サンプル位置StにおけるAGC係数αStは式4により求められる。 For example, the AGC coefficient α St at the sample position St is obtained by Expression 4.
第2の例におけるステップS703は、ピーク位置から突発音区間の範囲内におけるサ
ンプル位置毎にAGC係数を求めて作成された三角波を突発音の概形モデルとする。
In step S703 in the second example, a triangular wave created by obtaining an AGC coefficient for each sample position within the range of the sudden sound section from the peak position is used as a general model of sudden sound.
次に、概形モデル化処理の第3の例を、図21および図22を用いて説明する。概形モ
デル化処理の第3の例は、第1の例および第2の例として説明した図18のフローチャー
トにおけるステップS701の後にステップS710の処理が加えられることが異なる。
Next, a third example of the outline modeling process will be described with reference to FIGS. The third example of the outline modeling process is different in that the process of step S710 is added after step S701 in the flowchart of FIG. 18 described as the first example and the second example.
概形モデル化部563は、ステップS701において検出した突発音の最大振幅値にお
けるサンプル位置から突発音を区間分割し、分割した各々の区間における振幅の最大値を
検出する(ステップS710)。具体的には、図22(A)に示すように、ステップS7
01において検出した突発音を最大振幅値におけるサンプル位置を基準として、任意の複
数区間として突発音区間を分割する。図22(A)においては、最大値を基準として区間
幅tの分割区間a、分割区間bおよび分割区間cに突発音区間を分割している。
The
The sudden sound section detected in 01 is divided into arbitrary multiple sections with reference to the sample position at the maximum amplitude value. In FIG. 22A, the sudden sound segment is divided into a divided section a, a divided section b, and a divided section c having a section width t on the basis of the maximum value.
分割数および分割方法は任意である。具体例として最大振幅値のサンプル位置から突発
音区間終了位置までを任意の分割数で等分した区間幅tによる分割を行う。突発音の特性
としては、突発音区間の初期に最大振幅値が存在するため、突発音区間発生位置から最大
振幅値のサンプル位置までは区間分割する必要は無いが、突発音の特性によっては区間分
割する。
The number of divisions and the division method are arbitrary. As a specific example, division is performed by a section width t obtained by equally dividing the maximum amplitude value sample position to the sudden sound section end position by an arbitrary number of divisions. As the characteristics of sudden sound, there is a maximum amplitude value at the beginning of the sudden sound section, so it is not necessary to divide the section from the position where the sudden sound section is generated to the sample position of the maximum amplitude value. To divide.
概形モデル化部563は、分割した各々の区間における最大振幅値を検出し、式4によ
り各々の区間の最大振幅値におけるAGC係数を算出し、図22(B)に示すような波形
を突発音の概形波形とする。図22(B)に示す突発音の概形波形は波形を平滑化しても
よい。
The rough
図16に戻り、ステップS501においてフレーム化された音データに対し、音声区間
判定部553はそのフレームが音声区間であるか否かを判断する(ステップS503)。
音声区間の判定処理とは、フレーム化された区間の音データに人の声の成分が含まれてい
る場合を音声区間とする処理である。
Returning to FIG. 16, for the sound data framed in step S501, the speech
The voice segment determination process is a process in which a voice segment is included when the sound data of a framed segment includes a human voice component.
ステップS503において音声区間ではないと判断された場合(ステップS504:N
o)、つまり人の声の成分が含まれていないと判断された場合は、判断対象のフレームが
音声区間でないことを記憶し、ステップS506へ推移する。音声区間でないことの記録
としては、音声区間であるフレームに対して例えば「1」または「正」のフラグを付し、
音声区間ではないフレームに対してはフラグを付さないなどである。
When it is determined in step S503 that it is not a voice section (step S504: N
o) In other words, when it is determined that no human voice component is included, the fact that the frame to be determined is not a speech segment is stored, and the process proceeds to step S506. As a record of not being a speech section, for example, a “1” or “positive” flag is attached to a frame that is a speech section,
For example, a flag is not attached to a frame that is not a speech segment.
ステップS503において音声区間であると判断された場合(ステップS504:Ye
s)、つまり人の声の成分が含まれていると判断された場合は、判断対象のフレームに対
して音声区間であることを示すフラグを付し、判断対象のフレームにおける音声成分の包
含量を算出し(ステップS505)、ステップS506へ推移する。
If it is determined in step S503 that it is a voice section (step S504: Ye)
s), that is, when it is determined that a human voice component is included, a flag indicating that it is a speech section is attached to the frame to be determined, and the inclusion amount of the sound component in the frame to be determined Is calculated (step S505), and the process proceeds to step S506.
ステップS501の音声区間判定の処理手法およびステップS505の音声成分包含量
算出手法は任意であるが、具体例として本出願人による特開2012−128411号公
報に開示された技術等を適用することができる。
The processing method of speech segment determination in step S501 and the speech component inclusion amount calculation method in step S505 are arbitrary, but the technique disclosed in Japanese Patent Application Laid-Open No. 2012-128411 by the present applicant can be applied as a specific example. it can.
ステップS502の処理、およびステップS503からステップS505の処理は、並
行して実行されてもよく、いずれかを先に処理してもよい。
The processing in step S502 and the processing in steps S503 to S505 may be executed in parallel, or any one may be processed first.
次に、突発音周期性判定部554は、ステップS502における突発音の検出結果およ
びステップS503における音声区間判定結果に基づき、検出された突発音の周期性を検
出する(ステップS506)。ステップS506における突発音の周期性検出処理は、ス
テップS502における概形モデル化処理(ステップS605)による突発音の概形モデ
ル間の最大振幅値を示すピークの間隔を測定することにより求める。測定されたピークの
間隔が、許容された誤差範囲であり且つ所定回数に渡って連続している場合、検出された
突発音は周期性を備える周期性突発音であると判断できる。 また、ステップS506に
おける突発音の周期性検出は、突発音の概形モデルの自己相関を用いた、図2に示すステ
ップS008およびステップS009の処理を用いてもよい。
Next, the sudden sound periodicity determination unit 554 detects the periodicity of the detected sudden sound based on the detection result of the sudden sound in step S502 and the speech section determination result in step S503 (step S506). The sudden sound periodicity detection process in step S506 is obtained by measuring the peak interval indicating the maximum amplitude value between the sudden sound outline models in the outline modeling process (step S605) in step S502. When the measured peak interval is within an allowable error range and continues for a predetermined number of times, it can be determined that the detected sudden sound is a periodic sudden sound having periodicity. Further, the detection of the periodicity of sudden sound in step S506 may use the processing in steps S008 and S009 shown in FIG. 2 using the autocorrelation of the sudden sound outline model.
ステップS506の検出結果により、突発音が周期性を備える周期性突発音であると判
断された場合(ステップS507:Yes)、周期性突発音の持続性を示すフラグを付す
。具体的には突発音が周期性突発音であると判断された初回の突発音から、例えば「1」
または「正」のフラグを付し、突発音が検出されなくなるまで、または突発音が周期性突
発音ではないと判断されるまでフラグを維持する。
If it is determined from the detection result in step S506 that the sudden sound is a periodic sound with periodicity (step S507: Yes), a flag indicating the continuity of the periodic sound is added. Specifically, from the first sudden sound in which the sudden sound was determined to be a periodic sudden sound, for example, “1”
Alternatively, a “positive” flag is attached, and the flag is maintained until no sudden sound is detected or until it is determined that the sudden sound is not a periodic sudden sound.
また、突発音が周期性であることを示すフラグが維持されている状態であり、ステップ
S502において突発音が検出されなかった場合であっても、検出対象のフレームに対し
てステップS503において音声区間であると判断されている場合は、ステップS506
の処理において突発音が周期性を備えるとする。これは、検出対象のフレームに含まれて
いる音声成分の影響により突発音が検出できない可能性があるためである。
Further, even when the flag indicating that the sudden sound is periodic is maintained and no sudden sound is detected in step S502, the speech section is detected in step S503 for the detection target frame. If it is determined that it is, step S506.
It is assumed that the sudden sound has periodicity in the above process. This is because sudden sound may not be detected due to the influence of the audio component included in the detection target frame.
ステップS506において突発音が周期性を有さないと判断された場合(ステップS5
07:No)、検出された突発音に周期性が無い、または周期性突発音が終了したために
、次のフレームを解析対象としてステップS501の処理に戻る。突発音が周期性を有さ
ない判断は、例えば突発音の概形モデルの相関値や時間幅による周期性検出に加えて、ス
テップS503における音声区間ではない場合が該当する。また、音声区間であっても音
声包含量が所定以下の場合に周期性を有さないと判断する対象としてもよい。ステップS
507がNoの場合に周期性突発音の持続性を示すフラグが付されている場合は、検出対
象のフレームよりフラグを消去する。
If it is determined in step S506 that the sudden sound has no periodicity (step S5)
07: No), since the detected sudden sound has no periodicity or the periodic sudden sound has ended, the process returns to step S501 with the next frame as an analysis target. The judgment that the sudden sound has no periodicity corresponds to, for example, the case where the sudden sound is not a speech section in step S503 in addition to the periodicity detection based on the correlation value or time width of the sudden sound outline model. Moreover, even if it is an audio | voice area, it is good also as a target judged as having no periodicity when the audio | voice inclusion amount is below predetermined. Step S
When a flag indicating the continuity of periodic sudden sound is attached when 507 is No, the flag is deleted from the detection target frame.
ステップS507において突発音が周期性を有すると判断された場合(ステップS50
7:Yes)、ステップS508以降の周期性突発音の音圧量調整値を決定する処理に進
む。
If it is determined in step S507 that the sudden sound has periodicity (step S50)
7: Yes), the process proceeds to the process of determining the sound pressure amount adjustment value of the periodic sudden sound after step S508.
ステップS508において音圧量調整値決定部555は、周期性突発音であると判断さ
れたフレームが音声区間であるか否かを判断する(ステップS508)。ステップS50
8の判断は、ステップS504において付されたフラグの有無により判断する。
In step S508, the sound pressure amount adjustment
The determination of 8 is made based on the presence / absence of the flag added in step S504.
ステップS508において音声区間ではないと判断された場合(ステップS508:N
o)、すなわち周期性突発音である突発音が含まれるフレームに音声成分が含まれていな
い場合は、検出された突発音の音圧を低減しても音声には影響が無い。このため、このよ
うなフレームにおいては、ステップS605において概形モデル化された波形に基づき音
圧量調整値を算出する(ステップS509)。
When it is determined in step S508 that it is not a voice section (step S508: N
o) In other words, when a speech component is not included in a frame including a sudden sound that is a periodic sudden sound, the sound is not affected even if the sound pressure of the detected sudden sound is reduced. For this reason, in such a frame, the sound pressure amount adjustment value is calculated based on the waveform modeled in step S605 (step S509).
ステップS509において算出される音圧量調整値は、具体的にはそのフレームにおけ
る概形モデル化波形をそのまま用いる。具体的には、図18および図21におけるステッ
プS703で作成されたAGCカーブをそのフレームにおける音圧量調整値とする。
As the sound pressure amount adjustment value calculated in step S509, specifically, the rough model waveform in the frame is used as it is. Specifically, the AGC curve created in step S703 in FIGS. 18 and 21 is used as the sound pressure amount adjustment value in the frame.
ステップS508において音声区間であると判断された場合(ステップS508:Ye
s)、すなわち周期性突発音である突発音が含まれるフレームに音声成分が含まれている
場合は、含まれる音声成分の影響を加味して音圧量調整値を設定する。音圧量調整値決定
部555は、周期性突発音である突発音が含まれるフレームの音声成分の含有量が閾値以
上であるか否かを判断する(ステップS510)。
If it is determined in step S508 that it is a voice section (step S508: Ye)
s), that is, when a sound component is included in a frame including a sudden sound that is a periodic sudden sound, the sound pressure amount adjustment value is set in consideration of the influence of the included sound component. The sound pressure amount adjustment
ステップS510において、音声成分の含有量が所定の閾値以上であると判断された場
合(ステップS510:Yes)、突発音よりも音声成分が強くなることが考えられる。
ここで、ステップS605において概形モデル化された波形に基づき音圧量調整値を算出
すると、音声成分を大幅に減少させてしまう。ステップS511においては、概形モデル
化された波形に基づく音圧量調整ではなく、記憶部530に記憶されている過去に求めた
音圧量調整値を調整して用いる(ステップS511)。
In step S510, when it is determined that the content of the audio component is equal to or greater than the predetermined threshold (step S510: Yes), the audio component may be stronger than the sudden sound.
Here, if the sound pressure amount adjustment value is calculated based on the waveform that has been roughly modeled in step S605, the sound component is greatly reduced. In step S511, the sound pressure amount adjustment value obtained in the past stored in the
ステップS511の処理を具体的に説明すると、音声成分の含有量が所定の閾値以上で
ある場合は、周期性突発音であることを示すフラグが付されていても、上述したように音
声成分の影響により突発音が検出できない場合である。仮に検出できたとしても突発音よ
りも音声が強い可能性がある。このため、対象フレームの直近で更新された音圧量調整値
を記憶部530より読み出す。記憶部530から読み出す直近の音圧量調整値は、音声信
号が含まれていないフレームにおける音圧量調整値とする。この場合、音圧量調整値の最
大振幅値を、例えば2分の1、3分の1など音声信号が必要以上に低減されないように調
整する。音圧量調整値の調整は、予め定められた値であってもよく、音声成分の含有量に
基づき変更可能であってもよい。
The processing in step S511 will be described in detail. If the content of the audio component is equal to or greater than a predetermined threshold value, as described above, even if a flag indicating periodic sudden sound is attached, This is a case where sudden sound cannot be detected due to the influence. Even if it can be detected, the voice may be stronger than the sudden sound. For this reason, the sound pressure amount adjustment value updated immediately before the target frame is read from the
ステップS510において、音声成分の含有量が所定の閾値未満であると判断された場
合(ステップS510:No)、突発音が検出されているが音声信号も含まれている。こ
のため、音圧量調整値決定部555はステップS509と同様に対象となるフレームの概
形モデル化波形に基づいたAGCカーブを、音声信号が必要以上に低減されないように調
整した上で用いる(ステップS512)。ステップS512における音圧量調整値の調整
も、予め定められた値であってもよく、音声成分の含有量に基づき変更可能であってもよ
いが、ステップS511における調整に比して音圧調整t値の最大振幅値が小さくならな
いような調整である。
In step S510, when it is determined that the content of the audio component is less than the predetermined threshold (step S510: No), a sudden sound is detected, but an audio signal is also included. For this reason, the sound pressure amount adjustment
ステップS509、ステップS511およびステップS512の処理において音圧量調
整値が決定した後、音圧量調整値決定部555は対象のフレームに対して音圧調整値に基
づき突発音を低減する処理を行う(ステップS513)。また、ステップS509、ステ
ップS511およびステップS512の処理において決定された音圧調整値は、対象のフ
レームに対応付けられて逐次記憶部530に記憶される。ここで記憶された音圧調整値は
次以降のフレームにおけるステップS511およびステップS512の処理時に用いられ
る。
After the sound pressure amount adjustment value is determined in the processing of step S509, step S511, and step S512, the sound pressure amount adjustment
このような処理を行うことで、雑音低減装置500は、音声信号が含まれている場合で
あっても音声信号への影響を最小限としながら、周期性突発音を低減することができる。
By performing such processing, the
次に、雑音低減装置500を用いた通信装置600について、図23を用いて説明する
。通信装置600は通信装置200と同様に各種無線通信装置や携帯電話等であり、通信
装置200と同一の装置であってもよい。この場合、通信装置600には雑音検出装置1
00による雑音検出機能およひ雑音低減装置500による雑音低減機能が搭載されること
となる。
Next, communication apparatus 600 using
The noise detection function by 00 and the noise reduction function by the
通信装置600は、主な構成要素として雑音低減検出装置500、マイクロフォン61
0、音声出力部620、通信部630、表示部640、制御部650を備える。これら以
外にも例えば電源や操作部など通信装置600として機能するために必要な構成要素を適
宜備える。
The communication device 600 includes a noise
0, an
マイクロフォン610は、通信装置600を用いて音声通話を行う場合に音声信号など
の音信号を取得するためのマイクロフォンおよび雑音低減装置500による雑音を検出す
るためのマイクロフォンであり、マイクロフォン210と同様の構成である。各々の目的
のマイクロフォンは、共用されてもよく各々備えられていてもよい。マイクロフォン61
0から入力された信号は、制御部650によって通信部630により送信される搬送波に
変調される。通信部630によって送信されるデータは雑音低減装置500によって雑音
が低減されたデータである。
The
The signal input from 0 is modulated by the
音声出力部620は、通信装置600を用いて音声通話を行う場合に通話先からの音声
を出力するためのスピーカまたはイヤホン等であり、音声出力部220と同様の構成であ
る。
The
通信部630は、各種無線通信の送受信を行う通信モジュール等であり、通信部230
と同様の構成である。
The
It is the same composition as.
表示部640は、液晶表示装置等の表示素子であり、表示部240と同様の構成である
。
The
制御部650は、通信装置600の構成要素および各種処理のためのプログラムを実行
するCPUやDSP等であり、制御部250の構成と同様である。また、雑音低減装置5
00の制御部550と共用であってもよい。
The
00
制御部650は、実行されるプログラムによって各種機能を実現する。本実施形態にお
いて制御部650は、通信制御部653を備え、通信部630による無線通信に関する制
御を行う。
The
このような構成を備える通信装置600は、周期性突発音が発生する環境下においても
雑音低減処理による音声信号への影響を抑え、適切に雑音が低減された音声通信を行うこ
とができる。
The communication apparatus 600 having such a configuration can suppress the influence on the audio signal due to the noise reduction process even in an environment where periodic sudden sound occurs, and can perform audio communication with appropriately reduced noise.
100 雑音検出装置、110 入力部、120 出力部、130 記憶部、150 制
御部、151 フレーム処理部、152 振幅検出部、153 突発音確定部、154
概形モデル化部、155 相関値算出部、156 周期性突発音判定部、200 通信装
置、210 マイクロフォン、211 第1マイクロフォン、212 第2マイクロフォ
ン、220 音声出力部、230 通信部、240 表示部、250 制御部、251
突発音区間音圧算出部、252 通知制御部、253 通信制御部、254 相関値算出
部、290 通知部、500 雑音低減装置、510 入力部、520 出力部、530
記憶部、550 制御部、551 フレーム処理部、552 突発音検出部、553
音声区間判定部、554 突発音周期性判定部、555 音圧量調整値決定部、556
出力レベル調整部、561 振幅検出部、562 突発音確定部、563 概形モデル化
部、600 通信装置、610 マイクロフォン、620 音声出力部、630 通信部
、640 表示部、650 制御部、653 通信制御部
100 Noise Detection Device, 110 Input Unit, 120 Output Unit, 130 Storage Unit, 150 Control Unit, 151 Frame Processing Unit, 152 Amplitude Detection Unit, 153 Sudden Sound Determination Unit, 154
Outline modeling unit, 155 correlation value calculation unit, 156 periodic sudden sound determination unit, 200 communication device, 210 microphone, 211 first microphone, 212 second microphone, 220 audio output unit, 230 communication unit, 240 display unit, 250 control unit, 251
Sudden sound section sound pressure calculation unit, 252 notification control unit, 253 communication control unit, 254 correlation value calculation unit, 290 notification unit, 500 noise reduction device, 510 input unit, 520 output unit, 530
Storage unit, 550 control unit, 551 frame processing unit, 552 sudden sound detection unit, 553
Voice section determination unit 554, sudden sound
Output level adjustment unit, 561 amplitude detection unit, 562 sudden sound determination unit, 563 rough shape modeling unit, 600 communication device, 610 microphone, 620 audio output unit, 630 communication unit, 640 display unit, 650 control unit, 653 communication control Part
Claims (4)
前記フレーム処理部により区切られたフレームにおける突発音を検出する突発音検出部、
前記突発音の時間軸振幅波形を概形モデル化する概形モデル化部、
前記フレーム処理部により区切られたフレームが音声区間であるか否かを判断する音声区間判定部、
前記突発音検出部により検出された突発音が周期性を備えるか否かを判断する突発音周期性判定部、
前記突発音周期性判定部により突発音が周期性を備えると判断された場合、かつ前記音声区間判定部により、音声区間ではないと判断された場合には前記突発音の概形モデルに基づき突発音の音圧量調整値を決定し、音声区間であると判断された場合には音声区間ではないと判断された場合よりも音圧量調整値を小さく設定する音圧量調整値決定部、
を備えることを特徴とする雑音低減装置。 A frame processing unit that performs processing for dividing the input audio signal into frames having a predetermined time width;
A sudden sound detection unit for detecting sudden sound in the frames delimited by the frame processing unit,
A rough modeling unit for modeling the time-axis amplitude waveform of the sudden sound;
A speech segment determination unit that determines whether or not the frame delimited by the frame processing unit is a speech segment;
A sudden sound periodicity determination unit that determines whether or not the sudden sound detected by the sudden sound detection unit has periodicity,
When the sudden sound periodicity determining unit determines that the sudden sound has periodicity, and when the speech interval determining unit determines that the sudden sound is not a voice interval, the sudden sound is suddenly generated based on the outline model of the sudden sound. A sound pressure amount adjustment value determining unit that determines a sound pressure amount adjustment value of the sound and sets the sound pressure amount adjustment value to be smaller when it is determined that the sound interval is not determined than when the sound interval is determined;
A noise reduction device comprising:
請求項1に記載の雑音低減装置。 The rough shape modeling unit is characterized in that a sudden sound time-axis amplitude waveform is roughly shaped based on the duration and maximum amplitude value of the sudden sound.
The noise reduction device according to claim 1.
前記フレーム処理ステップにおいて区切られたフレームにおける突発音を検出する突発音検出ステップ、
前記突発音の時間軸振幅波形を概形モデル化する概形モデル化ステップ、
前記フレーム処理ステップにおいて区切られたフレームが音声区間であるか否かを判断する音声区間判定ステップ、
前記突発音検出ステップにおいて検出された突発音が周期性を備えるか否かを判断する突発音周期性判定ステップ、
前記突発音周期性判定ステップにおいて突発音が周期性を備えると判断された場合、かつ前記音声区間判定ステップにおいて、音声区間ではないと判断された場合には前記突発音の概形モデルに基づき突発音の音圧量調整値を決定し、音声区間であると判断された場合には音声区間ではないと判断された場合よりも音圧量調整値を小さく設定する音圧量調整値決定ステップ、
を含むことを特徴とする雑音低減方法。 A frame processing step for performing processing for dividing the input audio signal into frames of a predetermined time width;
A sudden sound detection step for detecting a sudden sound in the frame delimited in the frame processing step;
A rough modeling step for rough modeling of the time axis amplitude waveform of the sudden sound;
A speech segment determination step for determining whether or not the frame delimited in the frame processing step is a speech segment;
A sudden sound periodicity determining step for determining whether or not the sudden sound detected in the sudden sound detecting step has periodicity;
If it is determined in the sudden sound periodicity determining step that the sudden sound has periodicity, and if it is determined in the speech interval determining step that it is not a voice interval, the sudden sound is suddenly generated based on the outline model of the sudden sound. A sound pressure amount adjustment value determining step for determining a sound pressure amount adjustment value of the sound, and setting the sound pressure amount adjustment value to be smaller when it is determined that the sound section is not the sound section when it is determined to be a sound section;
A noise reduction method comprising:
入力された音声信号に対して所定の時間幅のフレームに区切る処理を行うフレーム処理ステップ、
前記フレーム処理ステップにおいて区切られたフレームにおける突発音を検出する突発音検出ステップ、
前記突発音の時間軸振幅波形を概形モデル化する概形モデル化ステップ、
前記フレーム処理ステップにおいて区切られたフレームが音声区間であるか否かを判断する音声区間判定ステップ、
前記突発音検出ステップにおいて検出された突発音が周期性を備えるか否かを判断する突発音周期性判定ステップ、
前記突発音周期性判定ステップにおいて突発音が周期性を備えると判断された場合、かつ前記音声区間判定ステップにおいて、音声区間ではないと判断された場合には前記突発音の概形モデルに基づき突発音の音圧量調整値を決定し、音声区間であると判断された場合には音声区間ではないと判断された場合よりも音圧量調整値を小さく設定する音圧量調整値決定ステップ、
を実行させることを特徴とするプログラム。 On the computer,
A frame processing step for performing processing for dividing the input audio signal into frames of a predetermined time width;
A sudden sound detection step for detecting a sudden sound in the frame delimited in the frame processing step;
A rough modeling step for rough modeling of the time axis amplitude waveform of the sudden sound;
A speech segment determination step for determining whether or not the frame delimited in the frame processing step is a speech segment;
A sudden sound periodicity determining step for determining whether or not the sudden sound detected in the sudden sound detecting step has periodicity;
If it is determined in the sudden sound periodicity determining step that the sudden sound has periodicity, and if it is determined in the speech interval determining step that it is not a voice interval, the sudden sound is suddenly generated based on the outline model of the sudden sound. A sound pressure amount adjustment value determining step for determining a sound pressure amount adjustment value of the sound, and setting the sound pressure amount adjustment value to be smaller when it is determined that the sound section is not the sound section when it is determined to be a sound section;
A program characterized by having executed.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017122032A JP6489163B2 (en) | 2017-06-22 | 2017-06-22 | Noise reduction apparatus, noise reduction method, and program. |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017122032A JP6489163B2 (en) | 2017-06-22 | 2017-06-22 | Noise reduction apparatus, noise reduction method, and program. |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013145548A Division JP6163924B2 (en) | 2013-07-11 | 2013-07-11 | Noise detection apparatus, noise detection method, noise reduction apparatus, noise reduction method, communication apparatus, and program. |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017191332A JP2017191332A (en) | 2017-10-19 |
JP6489163B2 true JP6489163B2 (en) | 2019-03-27 |
Family
ID=60086220
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017122032A Active JP6489163B2 (en) | 2017-06-22 | 2017-06-22 | Noise reduction apparatus, noise reduction method, and program. |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6489163B2 (en) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108806707B (en) * | 2018-06-11 | 2020-05-12 | 百度在线网络技术(北京)有限公司 | Voice processing method, device, equipment and storage medium |
CN113469834B (en) * | 2021-07-27 | 2023-11-03 | 江苏宝联气体有限公司 | Outdoor design skid-mounted on-site oxygen generation method and system |
CN115206323B (en) * | 2022-09-16 | 2022-11-29 | 江门市鸿裕达电机电器制造有限公司 | Voice recognition method of fan voice control system |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH113094A (en) * | 1997-06-12 | 1999-01-06 | Kobe Steel Ltd | Noise eliminating device |
JP4058987B2 (en) * | 2002-04-15 | 2008-03-12 | 三菱電機株式会社 | Noise removing apparatus and noise removing method |
JP2003317368A (en) * | 2002-04-25 | 2003-11-07 | Digion Inc | Method for detecting and eliminating pulsed noise by digital signal processing |
JP4162604B2 (en) * | 2004-01-08 | 2008-10-08 | 株式会社東芝 | Noise suppression device and noise suppression method |
JP4413043B2 (en) * | 2004-03-09 | 2010-02-10 | 日本電信電話株式会社 | Periodic noise suppression method, periodic noise suppression device, periodic noise suppression program |
JP4868999B2 (en) * | 2006-09-22 | 2012-02-01 | 富士通株式会社 | Speech recognition method, speech recognition apparatus, and computer program |
JP5504445B2 (en) * | 2010-03-26 | 2014-05-28 | 国立大学法人九州工業大学 | Microphone device |
-
2017
- 2017-06-22 JP JP2017122032A patent/JP6489163B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2017191332A (en) | 2017-10-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9084062B2 (en) | Conversation detection apparatus, hearing aid, and conversation detection method | |
JP6489163B2 (en) | Noise reduction apparatus, noise reduction method, and program. | |
EP2640095B1 (en) | Method for fitting a hearing aid device with active occlusion control to a user | |
CN108235181B (en) | Method for noise reduction in an audio processing apparatus | |
JP2018156044A (en) | Voice recognition device, voice recognition method, and voice recognition program | |
US20130202130A1 (en) | Motion Based Compensation of Uplinked Audio | |
US10943596B2 (en) | Audio processing device, image processing device, microphone array system, and audio processing method | |
KR20140128316A (en) | Motion based compensation of downlinked audio | |
JP2010011447A (en) | Hearing aid, hearing-aid processing method and integrated circuit for hearing-aid | |
US10320967B2 (en) | Signal processing device, non-transitory computer-readable storage medium, signal processing method, and telephone apparatus | |
JPWO2011152056A1 (en) | Hearing measurement apparatus and method | |
JP6163924B2 (en) | Noise detection apparatus, noise detection method, noise reduction apparatus, noise reduction method, communication apparatus, and program. | |
JP5251808B2 (en) | Noise removal device | |
US10757514B2 (en) | Method of suppressing an acoustic reverberation in an audio signal and hearing device | |
WO2022206049A1 (en) | Audio signal processing method and apparatus, and device and storage medium | |
JP2532007B2 (en) | Hearing aid fitting device | |
US8635064B2 (en) | Information processing apparatus and operation method thereof | |
JP5863928B1 (en) | Audio adjustment device | |
US11388514B2 (en) | Method for operating a hearing device, and hearing device | |
JP6296291B2 (en) | Conversation voice level notification system and conversation voice level notification method | |
JP2010026323A (en) | Speech speed detection device | |
JP7430083B2 (en) | speech control device | |
DK3232906T3 (en) | HEARING TEST SYSTEM | |
JP6569853B2 (en) | Directivity control system and audio output control method | |
US10873816B2 (en) | Providing feedback of an own voice loudness of a user of a hearing device |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20180724 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20180925 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20181030 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20181227 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190129 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190211 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6489163 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |