JP4866958B2 - Noise removal in an electronic device having a far-field microphone on the console - Google Patents

Noise removal in an electronic device having a far-field microphone on the console Download PDF

Info

Publication number
JP4866958B2
JP4866958B2 JP2009509909A JP2009509909A JP4866958B2 JP 4866958 B2 JP4866958 B2 JP 4866958B2 JP 2009509909 A JP2009509909 A JP 2009509909A JP 2009509909 A JP2009509909 A JP 2009509909A JP 4866958 B2 JP4866958 B2 JP 4866958B2
Authority
JP
Grant status
Grant
Patent type
Prior art keywords
signal
console
noise
processor
microphone
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2009509909A
Other languages
Japanese (ja)
Other versions
JP2009535997A (en )
Inventor
マオ シャドン
Original Assignee
株式会社ソニー・コンピュータエンタテインメント
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Grant date

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M9/00Interconnection arrangements not involving centralised switching
    • H04M9/08Two-way loud-speaking telephone systems with means for suppressing echoes or otherwise conditioning for one or other direction of traffic
    • H04M9/082Two-way loud-speaking telephone systems with means for suppressing echoes or otherwise conditioning for one or other direction of traffic using echo cancellers
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L2021/02161Number of inputs available containing the signal or the noise to be suppressed
    • G10L2021/02163Only one microphone
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00-G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00-G10L21/00 characterised by the type of extracted parameters
    • G10L25/18Speech or voice analysis techniques not restricted to a single one of groups G10L15/00-G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band

Description

[優先権の主張] [Priority claim]
本出願は、本出願と譲受人が共通であって本出願と同時に係属する特許文献1の恩恵を主張し、その開示内容全体をここに援用する。 This application claims the benefit of Patent Document 1 by the present applicant and assignee are pending at the same time as the present application a common, entirely incorporated by reference disclosures herein. 本出願は、本出願と譲受人が共通であって本出願と同時に係属する特許文献2の恩恵を主張し、その開示内容全体をここに援用する。 This application claims the benefit of Patent Document 2 by the present applicant and assignee are pending at the same time as the present application a common, entirely incorporated by reference disclosures herein. 本出願はまた、本出願と譲受人が共通であって本出願と同時に係属する特許文献3の恩恵を主張し、その開示内容全体をここに援用する。 This application also claims the benefit of Patent Document 3 by the present applicant and assignee are pending at the same time as the present application a common, entirely incorporated by reference disclosures herein. 本出願はまた、本出願と譲受人が共通であって本出願と同時に係属する特許文献4の恩恵を主張し、その開示内容全体をここに援用する。 This application also claims the benefit of Patent Document 4 that the present application and assignee are pending at the same time as the present application a common, entirely incorporated by reference disclosures herein. 本出願はまた、本出願と譲受人が共通であって本出願と同時に係属する特許文献5の恩恵を主張し、その開示内容全体をここに援用する。 This application also claims the benefit of Patent Document 5 that the present application and assignee are pending at the same time as the present application a common, entirely incorporated by reference disclosures herein. 本出願はまた、本出願と譲受人が共通であって本出願と同時に係属する特許文献6の恩恵を主張し、その開示内容全体をここに援用する。 This application also claims the benefit of Patent Document 6 by the applicant and assignee are pending at the same time as the present application a common, entirely incorporated by reference disclosures herein. 本出願はまた、本出願と譲受人が共通であって本出願と同時に係属する特許文献7の恩恵を主張し、その開示内容全体をここに援用する。 This application also claims the benefit of Patent Document 7 in which the present application and assignee are pending at the same time as the present application a common, entirely incorporated by reference disclosures herein. 本出願はまた、本出願と譲受人が共通であって本出願と同時に係属する特許文献8の恩恵を主張し、その開示内容全体をここに援用する。 This application also claims the benefit of Patent Document 8 this application and assignee are pending at the same time as the present application a common, entirely incorporated by reference disclosures herein. 本出願はまた、本出願と譲受人が共通であって本出願と同時に係属する特許文献9の恩恵を主張し、その開示内容全体をここに援用する。 This application also claims the benefit of Patent Document 9 by the present applicant and assignee are pending at the same time as the present application a common, entirely incorporated by reference disclosures herein. 本出願はまた、本出願と譲受人が共通であって本出願と同時に係属する特許文献10の恩恵を主張し、その開示内容全体をここに援用する。 This application also claims the benefit of Patent Document 10 that the present application and assignee are pending at the same time as the present application a common, entirely incorporated by reference disclosures herein.
米国特許出願 第11/381,727号,シャドン マオ, "NOISE REMOVAL FOR ELECTRONIC DEVICE WITH FAR FIELD MICROPHONE ON CONSOLE", 2006年5月4日出願, (代理人整理番号SCEA05073US00) US patent application Ser. No. 11 / 381,727, Shadon Mao, "NOISE REMOVAL FOR ELECTRONIC DEVICE WITH FAR FIELD MICROPHONE ON CONSOLE", filed on May 4, 2006, (Attorney Docket No. SCEA05073US00) 米国特許出願 第11/381,729号,シャドン マオ, "ULTRA SMALL MICROPHONE ARRAY", 2006年5月4日出願, (代理人整理番号SCEA05062US00) US patent application Ser. No. 11 / 381,729, Shadon Mao, "ULTRA SMALL MICROPHONE ARRAY", 5 May 4, 2006 application, (Attorney Docket No. SCEA05062US00) 米国特許出願 第11/381,728号,シャドン マオ, "ECHO AND NOISE CANCELATION", 2006年5月4日出願, (代理人整理番号SCEA05064US00) US patent application Ser. No. 11 / 381,728, Shadon Mao, "ECHO AND NOISE CANCELATION", filed on May 4, 2006, (Attorney Docket No. SCEA05064US00) 米国特許出願 第11/381,725号,シャドン マオ, "METHODS AND APPARATUS FOR TARGETED SOUND DETECTION", 2006年5月4日出願, (代理人整理番号SCEA05072US00), US patent application Ser. No. 11 / 381,725, Shadon Mao, "METHODS AND APPARATUS FOR TARGETED SOUND DETECTION", filed on May 4, 2006, (Attorney Docket No. SCEA05072US00), 米国特許出願 第11/381,724号,シャドン マオ, "METHODS AND APPARATUS FOR TARGETED SOUND DETECTION AND CHARACTERIZATION", 2006年5月4日出願, (代理人整理番号SCEA05079US00) US patent application Ser. No. 11 / 381,724, Shadon Mao, "METHODS AND APPARATUS FOR TARGETED SOUND DETECTION AND CHARACTERIZATION", filed on May 4, 2006, (Attorney Docket No. SCEA05079US00) 米国特許出願 第11/381,721号,シャドン マオ, "SELECTIVE SOUND SOURCE LISTENING IN CONJUNCTION WITH COMPUTER INTERACTIVE PROCESSING", 2006年5月4日出願, (代理人整理番号SCEA04005 JUMBOUS) US patent application Ser. No. 11 / 381,721, Shadon Mao, "SELECTIVE SOUND SOURCE LISTENING IN CONJUNCTION WITH COMPUTER INTERACTIVE PROCESSING", filed on May 4, 2006, (Attorney Docket No. SCEA04005 JUMBOUS) PCT出願 PCT/US06/17483号,シャドン マオ, "SELECTIVE SOUND SOURCE LISTENING IN CONJUNCTION WITH COMPUTER INTERACTIVE PROCESSING", 2006年5月4日出願, (代理人整理番号SCEA04005 JUMBOPCT) PCT application PCT / US06 / 17483 issue, Shadon Mao, "SELECTIVE SOUND SOURCE LISTENING IN CONJUNCTION WITH COMPUTER INTERACTIVE PROCESSING", filed on May 4, 2006, (Attorney Docket No. SCEA04005 JUMBOPCT) 米国特許出願 第11/418,988号,シャドン マオ, "METHODS AND APPARATUSES FOR ADJUSTING A LISTENING AREA FOR CAPTURING SOUNDS", 2006年5月4日出願, (代理人整理番号SCEA-00300) US patent application Ser. No. 11 / 418,988, Shadon Mao, "METHODS AND APPARATUSES FOR ADJUSTING A LISTENING AREA FOR CAPTURING SOUNDS", filed on May 4, 2006, (Attorney Docket No. SCEA-00300) 米国特許出願 第11/418,989号,シャドン マオ, "METHODS AND APPARATUSES FOR CAPTURING AN AUDIO SIGNAL BASED ON VISUAL IMAGE", 2006年5月4日出願, (代理人整理番号SCEA-00400) US patent application Ser. No. 11 / 418,989, Shadon Mao, "METHODS AND APPARATUSES FOR CAPTURING AN AUDIO SIGNAL BASED ON VISUAL IMAGE", filed on May 4, 2006, (Attorney Docket No. SCEA-00400) 米国特許出願 第11/429,047号,シャドン マオ, "METHODS AND APPARATUSES FOR CAPTURING AN AUDIO SIGNAL BASED ON A LOCATION OF THE SIGNAL", 2006年5月4日出願, (代理人整理番号SCEA-00500) US patent application Ser. No. 11 / 429,047, Shadon Mao, "METHODS AND APPARATUSES FOR CAPTURING AN AUDIO SIGNAL BASED ON A LOCATION OF THE SIGNAL", filed on May 4, 2006, (Attorney Docket No. SCEA-00500)

多くの民生用電子装置において、様々なユーザコントロール装置や入力装置を含むコンソールが用いられている。 In many consumer electronic devices, have been used consoles include various user controls or input devices can. テレビゲームコンソールや、ケーブルテレビセット・トップボックスや、デジタルビデオレコーダのような多くの用途において、コンソールにはマイクロフォンが組み込まれていることが望ましい。 TV or game console, and cable TV set-top box, in many applications, such as digital video recorders, it is desirable to have a built-in microphone on the console. コストを削減するために、マイクロフォンは典型的には、優先的な受信方向を有さない従来型の全方向性マイクロフォンである。 To reduce costs, the microphone is typically a conventional omnidirectional microphone with no preferential reception direction. 残念ながら、このような電子装置コンソールは、冷却ファン、ハードディスクドライブ、CD−ROMドライブ、デジタルビデオディスク(DVD)ドライブのようなノイズ源をも含む。 Unfortunately, such an electronic device console, cooling fan, also including hard disk drives, CD-ROM drives, the noise source, such as a digital video disk (DVD) drive. コンソール上に位置するマイクロフォンは、例えばユーザの音声コマンドなどの所望の音声入力を多いに妨害しうる。 Microphones located on the console may interfere, for example, often a desired speech input such as the user's voice commands. この問題に対処するために、これらのノイズ源からのノイズをフィルタリング処理により除去する技術がこれらの装置に実装されている。 To address this problem, a technique for removing noise from these noise sources by filtering is implemented in these devices.

従来の手法は、広帯域(ブロードバンド)に分布するノイズをフィルタリング処理により除去する場合において、効果的であった。 Conventional approaches, in the case of removing the noise distributed in the wide band (broadband) by filtering, was effective. 例えば、ファンからのノイズはガウス分布に従うため、周波数の広帯域にわたって分布している。 For example, noise from fans to follow a Gaussian distribution, are distributed over a wide band of frequencies. このようなノイズは、ガウス分布によってシミュレーションすることができ、コンソールのマイクロフォンの入力信号から打ち消す(cancel)ことができる。 Such noise can be simulated by a Gaussian distribution, it can be canceled out from the input signal of the console microphone (cancel). 例えばハードディスクやDVDドライブなどのディスクドライブからのノイズは、ガンマ分布や狭帯域ラプラス分布のような狭帯域(ナローバンド)周波数分布によって特徴づけられる。 For example the noise from the disk drive such as a hard disk or a DVD drive is characterized by a narrow band (narrow band) frequency distribution as a gamma distribution and a narrow band Laplacian distribution. 残念ながら、ガウス分布ノイズ用の方法であって、ガンマ分布に従うノイズの除去に適した決定的な方法はない。 Unfortunately, a method for Gaussian noise, no decisive method suitable for removal of noise according to the gamma distribution.

[発明の概要] [Summary of the Invention]
本発明の実施例は、1以上のマイクロフォンのあるコンソールを有し、狭帯域(ナローバンド)分布ノイズ源もまたそのコンソール上に位置する装置におけるノイズの低減を目的とする。 Examples of the present invention has a console with one or more microphones, also for the purpose of noise reduction of the device located on the console narrowband (narrowband) distribution noise source. 広帯域に分布する所望の音と狭帯域に分布するノイズを含むマイクロフォン信号が、複数の周波数ビンに分割される。 Microphone signal including a noise distribution to a desired sound and narrowband distributed in wide band is divided into a plurality of frequency bins. 各周波数ビンにおいて、信号のその周波数ビン内の一部が、そのコンソールに位置する狭帯域ノイズ源の狭帯域分布特性に属するかどうか、決定される。 In each frequency bin, a part in that frequency bin of the signal, whether belonging to the narrow band distribution characteristic of the narrow band noise source located on the console, is determined. 狭帯域ノイズを低減するために、狭帯域分布に属する信号の一部を含む周波数ビンが、フィルタリング処理される。 To reduce the narrow band noise, frequency bins comprising a portion of the signals belonging to the narrow band distribution is filtering.

本発明の教示は、添付の図面とともに、以下の詳細な図面を考慮することによって、容易に理解することができる。 The teachings of the present invention, in conjunction with the accompanying drawings, by considering the following detailed drawings, it can be easily understood.
本発明の1実施形態にかかる電子装置の概略図である。 It is a schematic view of an electronic device according to an embodiment of the present invention. 図1に示されるタイプの装置におけるノイズ低減方法のフローチャートである。 It is a flowchart of a noise reduction method in the type of apparatus shown in Figure 1. 図3A−3Bは、本発明の実施形態にかかる狭帯域ノイズ低減を説明するグラフであり、マイクロフォン信号を周波数の関数として示すグラフである。 Figure 3A-3B are graphs illustrating the narrow band noise reduction according to the embodiment of the present invention, is a graph showing the microphone signal as a function of frequency. 図4A−4Bは、本発明の別の実施形態にかかる狭帯域ノイズ低減を説明するグラフであり、異なるマイクロフォンのマイクロフォン信号を周波数の関数として示すグラフである。 Figure 4A-4B is a graph illustrating the narrow band noise reduction according to another embodiment of the present invention, is a graph showing the microphone signals of different microphones as a function of frequency.

[具体的な実施形態の説明] Description of Specific Embodiments
以下の詳細な説明は、説明の目的のための具体的な細部を含むが、以下の細部について、多くの変形や変更が、本発明の範囲内において可能であることは、当該技術分野において通常の知識を有する者に理解されるだろう。 The following detailed description, including specific details for purposes of illustration, the following details, is that many variations and modifications are possible within the scope of the present invention, typically in the art it will be understood to those of knowledge. したがって、以下に記述される本発明の実施例の説明により、特許請求の範囲に記載されている発明が一般性を失うことはなく、また、制限されることはない。 Therefore, the description of the embodiments of the present invention described below, the invention described in the appended claims are not to lose generality, also, is not limited.

図1に示されるように、本発明の実施形態にかかる電子装置100は、1以上のマイクロフォン104A、104Bを有するコンソール102を含む。 As shown in FIG. 1, the electronic apparatus 100 according to an embodiment of the present invention includes a console 102 having one or more microphones 104A, the 104B. ここで用いられるように、コンソールという語は、一般的に、計算かつ/または信号処理機能を実行する電子コンポーネントを含むスタンドアローンユニットを指す。 As used herein, the term console, generally refers to a stand-alone unit which includes an electronic component to perform calculations and / or signal processing function. コンソールは、例えばジョイスティック106のような、1以上の外部入力装置からの入力を受けてもよい。 Console, such as a joystick 106 may receive input from one or more external input devices. そして、コンソールは、例えばモニタ108のような1以上の外部出力装置に出力を供給してもよい。 Then, the console, for example one or more the external output device may provide an output such as a monitor 108. コンソール102は、CPU110とメモリ112を含んでもよい。 Console 102 may include a CPU110 and memory 112. コンソールは、オプションとして、コンソールのコンポーネントを冷却するためのファン114を含んでもよい。 The console may optionally include a fan 114 for cooling the console component. コンソール102は、例えば、ソニープレイステーション(登録商標)のようなテレビゲームシステムのコンソールであってもよく、ケーブルテレビセット・トップボックスであってもよく、カルフォルニア州アルビソのTiVoIncが提供するTiVoデジタルビデオレコーダであってもよい。 Console 102, for example, may be a console of video game systems such as the Sony PlayStation (registered trademark), TiVo digital video recorder may be a cable TV set-top box, that of California Arubiso TiVoInc provided it may be.

プロセッサユニット110とメモリ112は、システムバス116を介して互いに接続されていてもよい。 The processor unit 110 and memory 112 may be connected to each other via a system bus 116. マイクロフォン104Aと104Bは、入出力(I/O)エレメント118を通して、プロセッサかつ/またはメモリと接続されていてもよい。 Microphone 104A and 104B, through input-output (I / O) elements 118, may be connected to the processor and / or memory. ここで用いられるように、入出力(I/O)という言葉は、一般的に、コンソール100への/からの、および周辺装置への/からのデータを転送する任意のプログラム、オペレーション、または装置を指す。 As used herein, input and output (I / O) word is generally any program to be transferred to the console 100 / from, and to the peripheral device / data from the, operation or device, the point. すべてのデータ転送が、一の装置からの出力であり、他の一の装置への入力であると見なすことができるであろう。 All data transfers, an output from one device could be regarded as an input to another one device.

装置100は、コンソール102に対して内部の、または外部の追加的な1以上の周辺ユニットを含んでもよい。 Device 100 may include internal to the console 102, or the external additional one or more peripheral units. 周辺装置は、キーボードやマウスなどの入力のみの装置や、プリンタなどの出力のみの装置、そして上書き可能CD−ROMなどの入力装置かつ出力装置として動作する装置を含む。 Peripheral devices include devices or only the input such as a keyboard or a mouse, only device output, such as a printer, and a device that operates as an input device and an output device such as a rewritable CD-ROM. 周辺装置という言葉は、マウス、キーボード、プリンタ、モニタ、マイクロフォン、ゲームコントローラ、カメラ、外部Zipドライブ、スキャナなどの外部装置と、CD−ROMドライブ、CD−Rドライブ、ハードディスクドライブ、DVDドライブ、内部モデムなどの内部装置(例えば、ディスクドライブ120)、および、フラッシュメモリ用リーダ/ライタ、ハードドライブなどのそのほかの周辺装置を含む。 The term peripheral device, a mouse, keyboard, printer, monitor, microphone, game controller, camera, external Zip drive, and an external device such as a scanner, CD-ROM drives, CD-R drive, hard disk drive, DVD drive, internal modem the apparatus (such as for example, a disk drive 120), and includes a flash memory reader / writer, the other peripheral devices such as hard drives.

コンソールは少なくとも一つの、ディスクドライブ120のような狭帯域分布ノイズ源を含む。 The console comprises at least one narrowband distribution noise sources such as a disk drive 120. ディスクドライブ120からの狭帯域ノイズは、マイクロフォン入力x (t)、x (t)から生成されたデジタル信号からフィルタリング処理される。 Narrow band noise from the disk drive 120, microphone input x A (t), it is filtering processing from a digital signal generated from x B (t). これにより、例えばリモートソース101からの音声などの所望の音が、ディスクドライブ120の音によりかき消されないようにできる。 Thus, for example, desired sound such as voice from the remote source 101, it can be prevented drowned out by the sound of the disc drive 120. 狭帯域ノイズはガンマ分布により特徴づけられるかもしれない。 Narrow band noise might be characterized by the gamma distribution. ソース101からの所望の音は、望ましくは、ガウス分布確率密度関数のような広帯域確率密度関数によって特徴づけられる。 Desired sound from the source 101 is preferably characterized by a broadband probability density function such as a Gaussian distribution probability density function.

メモリ112は、プロセッサ110によって実行可能なコード化された命令、かつ/または、狭帯域ディスクドライブノイズの除去を促進するデータ115を含んでもよい。 The memory 112, the instruction encoded executable by the processor 110, and / or may include data 115 to facilitate removal of the narrowband disk drive noise. 特に、データ115は、ディスクドライブからの音の録音の長時間トレーニングデータから作成された分布関数を含んでもよい。 In particular, the data 115 may include a distribution function that was created a long time from the training data of the recording of sound from the disk drive. 分布関数は、ルックアップテーブルの形で格納されていてもよい。 Distribution function, may be stored in the form of a look-up table.

コード化された命令113は、図1に示されるタイプの装置における狭帯域分布ノイズを低減するための方法200を実行してもよい。 Coded instructions 113 may perform the method 200 for reducing narrow band distribution noise in the apparatus of the type shown in Figure 1. 方法200によると、1以上のコンソールマイクロフォン入力信号104A、104Bは、ステップ202に示されるように、周波数ビンに分割される。 According to the method 200, one or more console microphone input signals 104A, 104B, as shown in step 202, is divided into frequency bins. 信号を複数の周波数ビンに分割するステップは、時間窓で切り取られた信号の一部(例えば、マイクロフォン信号x (t))を取得するステップ、その時間窓で切り取られた信号の一部を周波数領域信号x(f)に変換するステップ(例えば高速フーリエ変換を用いて)、周波数領域信号を周波数ビンに分割するステップを含んでもよい。 Dividing the signal into a plurality of frequency bins, some of the signal is cut off by the time window (e.g., microphone signal x A (t)) acquiring a part of the signal cut out by the time window the step of converting into the frequency domain signals x (f) (for example, using a fast Fourier transform) may include the step of dividing the frequency domain signal into frequency bins. ステップ204において、例えば、約32ミリ秒のマイクロフォンデータが、周波数ビンに分類するためのバッファに格納されているかもしれない。 In step 204, for example, a microphone data about 32 milliseconds, may have been stored in the buffer for classifying the frequency bins. それぞれの周波数ビンについて、信号の一部であるその周波数ビン内の信号が、狭帯域ディスクドライブノイズの狭帯域分布特性に属するかどうか、決定される。 For each frequency bin, the signal in that frequency bin is a part of the signal, whether belonging to the narrow band distribution characteristic of the narrow band disk drive noise is determined. ステップ206に示されるように、狭帯域分布に属する信号の一部を含む周波数ビンは、入力信号から、フィルタリング処理によって除去される。 As shown in step 206, the frequency bins comprising a portion of the signals belonging to the narrow band distribution from the input signal, is removed by the filtering process.

入力信号のフィルタリング処理については、図3A−Bを参照することにより理解されるであろう。 The filtering of the input signal may be understood by referring to FIG. 3A-B. 具体的には、図3Aに示されるように、周波数領域信号x(f)は、広帯域信号302と狭帯域信号304の組み合わせであると見なすことができるであろう。 Specifically, as shown in FIG. 3A, the frequency domain signal x (f) it will can be regarded as a combination of broadband signal 302 and narrowband signals 304. 図3Bに示されるように、これらの信号が周波数ビン306に分割されるとき、各ビンは、広帯域信号302の一部と、狭帯域信号304の一部に対応する値を含む。 As shown in Figure 3B, when these signals are divided into frequency bins 306, each bin includes a portion of the wideband signal 302, a value corresponding to a portion of the narrowband signal 304. 信号x(f)の、所与の周波数ビンにおける狭帯域信号304に起因する一部(図3Bにおいて、破線の棒グラフで示されている)は、トレーニングデータから予測することができるであろう。 Signal x (f), (3B, the which is shown by the dashed bars) part due to the narrow-band signal 304 at a given frequency bin will be able to predict from the training data. この部分は、そのビンにおいて狭帯域ノイズをフィルタリング処理により除去するために、周波数ビン306内の値から差し引かれてもよい。 This part, in order to remove by filtering the narrow band noise in the bin may be subtracted from the value of the frequency bins 306.

狭帯域信号304は、以下のように予測されてもよい。 Narrowband signal 304 may be predicted as follows. 初めに、分布モデルのトレーニングのために、大きなボリュームにおいて、狭帯域信号サンプルが採集される。 First, because of the distribution model training, in a large volume, narrowband signal samples are collected. 分布モデルは、スピーチモデリングのようなパターン認識技術分野において、当業者に広く知られている。 Distribution model, the pattern recognition art such as speech modeling are well known to those skilled in the art. 狭帯域信号304のための分布モデルは、スピーチモデリングにおいて用いられるモデルと、いくつかの例外を除いて近似する。 Distribution model for narrowband signal 304, a model used in a speech modeling, approximate few exceptions. 具体的には、ガウス分布による広帯域分布と考えられているスピーチと異なり、狭帯域信号304内の狭帯域ノイズは、「ガンマ」分布密度関数を有する。 Specifically, unlike the speech believed broadband distribution by a Gaussian distribution, narrow band noise in the narrowband signal 304 has a "gamma" distribution density function. この分布モデルは、「ガンマミックスモデル」として知られている。 This distribution model is known as "gamma mix model". これに対して、話者/言語認識のようなスピーチ応用例においては、通常、「ガウス分布ミックスモデル」が用いられる。 On the other hand, in the speech applications such as speaker / language recognition, usually, "Gaussian distribution mix model" is used. これら二つのモデルは非常に近似しており、基礎となる分布関数のみが、大きく異なる。 These two models are very similar, only the distribution function of the underlying differs greatly. モデルトレーニング手法は、スピーチモデリングにおいて広く利用可能である「予測最大」(EM:Estimate−Maximize)アルゴリズムに従う。 Model training techniques are widely available in speech modeling "predicted maximum": according to the (EM Estimate-Maximize) algorithm. EMアルゴリズムは、トレーニングデータセットから、モデルパラメータの組を予測するインタラクティブな尤度最大化(liklihood maximization)方法である。 EM algorithm from the training data set, which is interactive likelihood maximization to predict a set of model parameters (liklihood maximization) method. 特徴ベクトル(feature vector)が、パワースペクトラムの対数から直接的に生成される。 Feature vector (Description feature vector) is generated directly from the logarithm of the power spectrum. これに対して、スピーチモデルにおいては、通常、DCTやセプトラム係数(ceptrum−coefficient)のような、さらなる圧縮が適用される。 In contrast, in the speech model, usually, such as DCT and Seputoramu coefficients (ceptrum-coefficient), additional compression is applied. これは、興味の対象となる信号は狭帯域に分布し、広帯域バックグラウンドにおける減衰につながる帯域平均は望しくないからである。 This is subject to signal interest are distributed in a narrow band, band average lead to attenuation in a broadband background there is no Nozomu properly. 実時間において、モデルは、狭帯域ノイズパワースペクトラム密度(PSD)を予測するために用いられる。 In real-time, the model is used to predict the narrow band noise power spectrum density (PSD).

このようなモデルに対するアルゴリズムは以下のように進められる。 Algorithm for such a model proceeds as follows.

初めに、信号x(t)が、時間領域から周波数領域に変換される。 First, the signal x (t) is transformed from the time domain to the frequency domain.
X(k)=fft(x(t)) X (k) = fft (x (t))
ここで、kは、周波数インデックスである。 Here, k is the frequency index.

次に周波数領域信号X(k)から、パワースペクトラムが取得される。 Then the frequency domain signal X (k), the power spectrum is obtained.
yy (k)=X(k). S yy (k) = X ( k). conj(X(k)) * Conj (X (k))
ここで、「conj」は、複素共役を指す。 Here, "conj" refers to the complex conjugate.

次に、パワースペクトラムの対数から、特徴ベクトルV(k)が、取得される。 Next, the logarithm of the power spectrum, the feature vector V (k) is obtained.
V(k)=log(S yy (k)) V (k) = log (S yy (k))

「特徴ベクトル」という語は、パターン認識において広く用いられる語である。 The term "feature vector" is a widely word for use in the pattern recognition. 基本的に、任意のパターンマッチングは、1)先験的な(priori)特徴空間における分布を定義するあらかじめトレーニングされたモデルと、2)ランタイムが観測される特徴ベクトルと含む。 Basically, any pattern matching includes 1) a pre-trained model defines a distribution of a priori (priori) feature space, 2) a feature vector runtime is observed. タスクは、特徴ベクトルをモデルに対してマッチングすることである。 Task is to match the feature vectors for the model. 事前にトレーニングされたガンマ<モデル>を所与として、狭帯域ノイズが存在する確率<P (k)>は、この観測された特徴V(k)から取得できる。 Pre trained gamma <model> Given the probability that narrow band noise is present <P n (k)> can be obtained from the observed feature V (k).
(k)=Gamma(Model,V(k)) P n (k) = Gamma ( Model, V (k))

狭帯域ノイズPSDは、適応的に更新される。 Narrow band noise PSD is updated adaptively.
nn (k)=α nn (k)+(1−α) yy (k) (k)+S nn (k) (1−P (k)) S nn (k) = α * S nn (k) + (1-α) * S yy (k) * P n (k) + S nn (k) * (1-P n (k))
Pn(k)が、0であるならば、すなわち、狭帯域ノイズは存在せず、S nn (k)は、変化しない。 Pn (k) is, if it is 0, that is, narrow band noise is absent, S nn (k) does not change. (k)=1であるならば、すなわち、周波数<k>は、完全に狭帯域ノイズである。 If a P n (k) = 1, i.e., the frequency <k> are completely narrow band noise. そうすると、 Then,
nn (k)=α nn (k)+(1−α) yy (k) S nn (k) = α * S nn (k) + (1-α) * S yy (k)
が成り立つ。 It holds. これは基本的に、統計的ピリオドグラム平均である。 This is basically a statistical periodogram average. ここでαは、スムージングファクタである。 Here α is a smoothing factor.

予測ノイズPSDを所与として、クリーンな音声信号を予測することは、複雑ではない。 Given the predicted noise PSD, to predict the clean speech signal are not complicated. このような予測を実行するためのアルゴリズムの例は、よく知られており、非特許文献1および非特許文献に記載されるMMSEに基づく。 Examples of such algorithms to perform prediction are well known and based on the MMSE described in Non-Patent Documents 1 and. 両文献の開示内容を、ここに援用する。 The disclosures of both references are incorporated herein.

また別の実施形態においては、フィルタリング処理に当たって、コンソール102上の2以上のマイクロフォンの存在を有利に活用してもよい。 In yet another embodiment, when the filtering processing may be advantageously utilized for the presence of two or more microphones on the console 102. コンソール102上に二つのマイクロフォン104A、104Bがある時には、そのうちの一方(104B)が他方(104)よりも、ディスクドライブの近くにあるかもしれない。 Two microphones 104A to the console 102, when there is 104B, one of which (104B) than the other (104), there may be close to the disk drive. その結果、マイクロフォン入力信号x (t)とx (t)とで、ディスクドライブ120からのノイズの到着時間が異なる。 As a result, de microphone input signal x A (t) and x B (t), the arrival time of the noise from the disk drive 120 is different. 到着時間の差は、図4A−Bに示されるように、入力信号x (t)とx (t)が、それぞれx (f)とx (f)へと周波数変換されたときの、周波数分布の差に帰着する。 Difference in arrival time, as shown in Figure 4A-B, when the input signal x A (t) and x B (t) is frequency-converted into x A (f) and x B (f), respectively of, resulting in a difference of frequency distribution. これに対して、リモートソースからの周波数が広帯域に分布することに関しては、x (t)とx (t)とについて、それほど違いはないであろう。 In contrast, with respect to the frequency from a remote source is distributed to a wide band, for x A and (t) x B (t), the will no difference so. しかしながら、マイクロフォン104Aからの狭帯域信号304Aの周波数分布は、マイクロフォン104Bからの周波数分布304Bに対して、周波数がシフトしているだろう。 However, the frequency distribution of the narrow-band signal 304A from the microphone 104A is, with respect to the frequency distribution 304B from the microphone 104B, would frequency is shifted. 周波数ビン306に対する狭帯域ノイズの寄与は、二つのマイクロフォン104A、104Bからの周波数領域信号x (f)、x (f)から特徴ベクトルV(k)を生成することにより決定することができる。 Contribution of the narrow band noise against frequency bin 306 may be determined by generating two microphones 104A, from 104B frequency-domain signal x A (f), x B (f) from the feature vector V (k) .

例えば、第一特徴ベクトルV(k,A)は、マイクロフォン104AについてのパワースペクトラムS yy (k,A)から生成される。 For example, the first feature vector V (k, A) is generated from the power spectrum S yy for microphone 104A (k, A).
V(k,A)=log(S yy (k,A)) V (k, A) = log (S yy (k, A))

第二特徴ベクトルV(k,B)は、マイクロフォン104BについてのパワースペクトラムS yy (k,B)から生成される。 Second feature vector V (k, B) is generated from the power spectrum S yy for microphone 104B (k, B).
V(k,B)=log(S yy (k,B)) V (k, B) = log (S yy (k, B))

特徴ベクトルV(k)は、V(k,A)とV(k,B)とを、単純に連結することにより得られる。 Feature vector V (k) is, V (k, A) and V (k, B) and is obtained by simply coupling.
V(k)=[V(k,1),V(k,2)] V (k) = [V (k, 1), V (k, 2)]

残りのモデルトレーニング、実時間検出は、モデルサイズと特徴ベクトルの次元が倍であることを除いて、同じである。 The remaining model training, real-time detection, except that the dimension of the model size and the feature vector is doubled, the same. 上述の手法においては、アレイビームフォーミング(array beam forming)も、到着時間差に依存する手法も用いていないが、実際には、空間情報は、トレーニングされたモデルとランタイム特徴ベクトルに、暗に含まれており、検出における正確性を大いに向上させる。 In the above method, the array beamforming (array beam forming) also, is not also used techniques that rely on the arrival time difference, in fact, the spatial information, the model and runtime feature vectors trained, it is implied and which greatly improves the accuracy in detection.

本発明の実施形態は、ここで提示されたように用いられてもよく、また他のユーザ入力メカニズムと共に用いられてもよい。 Embodiments of the present invention may be used as presented herein, also may be used with other user input mechanisms. 方位角方向や音声のボリュームを追跡したり測定したりするメカニズム、かつ/または、能動的または受動的にオブジェクトの位置を追跡するメカニズム、マシン・ビジョンを用いるメカニズム、これらの組み合わせなどである。 Mechanism or to measure or track the volume of azimuth and audio, and / or a mechanism to track the position of actively or passively object, the mechanism of using machine vision, and the like combinations thereof. 追跡されるオブジェクトは、システムへのフィードバックを操作する補助的なコントロール装置やボタンを含んでもよい。 Object to be tracked may include ancillary control device and buttons for operating the feedback to the system. そのようなフィードバックには、光源からの光の放射、音質の歪曲手段、その他の適切な送信機、変調器、コントロール装置、ボタン、圧力パッドなどが含まれてもよいが、これらに制限されるものではない。 Such feedback, emission of light from the light source, the sound quality distortion unit, other suitable transmitters, modulators, control device, button, may be included, such as a pressure pad, it is limited to not. それは、同じ符号化状態の転送や変調に影響を及ぼしてもよく、かつ/または、システムによって追跡されている装置への命令や、その装置からの命令を転送してもよい。 It may affect the transfer and modulation of the same coding state, and / or instructions to and from devices being tracked by the system may transfer the command from the device. そのような装置は、本発明の実施形態に関連して用いられるシステムの一部であったり、またはシステムと相互作用したり、またはシステムに影響を与えたりする。 Such devices, or a embodiment part of a system used in connection with the present invention, or the system or interact with, or or impact system.

以上は、本発明の好ましい実施形態の完全な記述であるが、他の様々な変形、変更、等価物への置換が可能である。 Above is a complete description of the preferred embodiments of the present invention, various other modifications and changes can be made, substitution of equivalents. それゆえ、本発明の範囲は、上記の記述によって決定されるのではなく、以下の請求項によって決定されるべきであり、その完全な等価物もその範囲に含まれる。 Therefore, the scope of the present invention is not to be determined by the above description, the following should be determined by the claims, their full equivalents are also included in the range. ここで記述された特徴は、好ましいものであるか否かに関わらず、ここで述べたいずれの特徴と組み合わされてもよい。 Feature described herein, regardless of whether or not preferred, may be combined with any of the features described herein. 以下の請求項においては、特に明示的に断らない限りは、各要素の数量は一以上である。 In the following claims, unless otherwise stated explicitly, the quantity of each element is one or more. ここに、添付される請求項は、所与の請求項において、「〜ための手段」との語句を用いて明示的に示される場合の他は、ミーンズ・プラス・ファンクションの制限を含むと解されてはならない。 Here, the appended claims, in a given claim, other when explicitly indicated using the phrase "means for ..." is to include restriction means-plus-function solutions It should not be.

Claims (21)

  1. コンソールを有する電子装置においてノイズ低減方法を実装するためのプロセッサ可読命令セットを格納したプロセッサ可読媒体であって、前記コンソールには1以上のマイクロフォンが位置しており、前記コンソールには狭帯域分布ノイズのノイズ源が位置しており、プロセッサはマイクロフォンと接続されており、メモリはプロセッサと接続されており、 A processor-readable medium having stored thereon processor-readable instruction set for implementing the noise reduction method in an electronic apparatus having a console, the said console is positioned one or more microphones, narrowband distribution noise in the console noise sources are located, the processor is connected to the microphone, the memory is connected to the processor,
    前記プロセッサ可読命令は、 Wherein the processor readable instructions,
    実行された際に、広帯域に分布する所望の音と、前記コンソール上に位置するノイズ源からの狭帯域分布ノイズとを含む信号を、前記1以上のマイクロフォンから取得するステップを前記装置に実行せしめる命令と、 When executed, allowed to perform a desired sound distributed broadband, a signal including a narrowband distribution noise from the noise source located on the console, the step of acquiring from the one or more microphones to said device instruction and,
    実行された際に、前記信号を複数の周波数ビンに分割するステップを実行せしめる命令と、 When executed, the instructions allowed to perform the step of dividing the signal into a plurality of frequency bins,
    実行された際に、前記信号のパワースペクトラムの対数から特徴ベクトルを生成し、その特徴ベクトルについて事前にトレーニングされたモデルに対するマッチングをとることにより、各周波数ビンについて、その周波数ビン内の前記信号の一部が、前記コンソール上に位置するノイズ源からの狭帯域分布特性に属するか決定するステップを実行せしめる命令と、 When executed, it generates a feature vector from the logarithm of the power spectrum of the signal, prior by taking matching for trained model for the feature vector, for each frequency bin, of the signal in that frequency bin part, the instructions allowed to perform the step of determining whether belonging to the narrow band distribution characteristic from the noise source located on the console,
    実行された際に、 前記1以上のマイクロフォンからの信号から生成された信号データから、狭帯域分布特性に属する前記信号の一部を含む周波数ビンをフィルタリング処理するステップを実行せしめる命令と、 When executed, from the signal data generated from a signal from the one or more microphones, and instructions allowed to perform the step of filtering the frequency bins comprising a portion of the signals belonging to the narrow band distribution characteristic,
    を含むプロセッサ可読媒体。 The processor readable medium containing.
  2. 前記その周波数ビン内の前記信号の一部が狭帯域分布特性に属するか決定するステップは、その周波数ビン内の前記信号の一部に対応する値と、前記コンソール上に位置するノイズ源からの既知の信号から導出された、その周波数ビンの値として格納されている値とを比較するステップを含む請求項1に記載のプロセッサ可読媒体。 Wherein the step of partially determined belongs to the narrow band distribution characteristic of the signal in that frequency bin, and values ​​corresponding to the portion of the signal in that frequency bin, from the noise source located on the console It derived from a known signal, the processor-readable medium of claim 1 including the step of comparing the value stored as the value of the frequency bin.
  3. 前記1以上のマイクロフォンは、第1マイクロフォンと、第2マイクロフォンとを含み、 The one or more microphones comprises a first microphone, a second microphone,
    前記1以上のマイクロフォンから信号を取得するステップは、前記第1マイクロフォンから第1信号を取得するステップと、前記第2マイクロフォンから第2信号を取得するステップとを含み、 Obtaining a signal from the one or more microphones comprises the steps of: obtaining a first signal from the first microphone, and obtaining a second signal from the second microphone,
    前記その周波数ビン内の前記信号の一部が狭帯域分布特性に属するか決定するステップは、前記第1信号から第1ベクトル特性を決定し、前記第2信号から第2ベクトル特性を取得するステップと、前記第1信号と前記第2信号とから結合特徴ベクトルを形成し、その結合特徴ベクトルをモデルに対してマッチングするステップとを含む請求項1に記載のプロセッサ可読媒体。 The step that step partially determined belongs to the narrow band distribution characteristic of the signal in the frequency bins, which determines a first vector characteristic from said first signal to obtain a second vector characteristic from said second signal When the first signal and to form a bond feature vector from said second signal, the processor-readable medium of claim 1 including the step of matching the binding feature vector to the model.
  4. 前記信号を、複数の周波数ビンに分割するステップは、 Dividing the signal into a plurality of frequency bins,
    時間窓で切り取られた前記信号の一部を取り込むステップと、 A step of capturing a portion of the signal, taken in a time window,
    前記時間窓で切り取られた前記信号の一部を周波数領域信号に変換するステップと、 And converting a portion of the signal, taken at the time window in the frequency domain signal,
    前記周波数領域信号を、複数の周波数ビンに分割するステップと、 Dividing the frequency domain signal, into a plurality of frequency bins,
    を含む請求項1に記載のプロセッサ可読媒体。 The processor readable medium of claim 1 comprising a.
  5. 前記広帯域に分布する所望の音は、音声である請求項1に記載のプロセッサ可読媒体。 Desired sound, the processor-readable medium of claim 1 is a sound to be distributed to the wideband.
  6. 前記狭帯域分布ノイズのノイズ源は、ディスクドライブである請求項1に記載のプロセッサ可読媒体。 The noise sources of the narrow band distribution noise, the processor-readable medium of claim 1 is a disk drive.
  7. 前記広帯域に分布する所望の音は、ガウス分布確率密度関数で特徴づけられる請求項1に記載のプロセッサ可読媒体。 Desired sound, the processor-readable medium of claim 1, characterized by a Gaussian distribution probability density function distributed to the wideband.
  8. 前記狭帯域ノイズは、ガンマ分布確率密度関数で特徴づけられる請求項1に記載のプロセッサ可読媒体。 The narrow band noise, the processor-readable medium of claim 1, characterized by a gamma distribution probability density function.
  9. 電子装置であって、 An electronic apparatus,
    コンソールと、 And the console,
    前記コンソール上に位置する1以上のマイクロフォンと、 And one or more microphones positioned on the console,
    前記コンソール上に位置する狭帯域ノイズのノイズ源と、 A noise source of narrow band noise located on the console,
    前記マイクロフォンに接続されているプロセッサと、 A processor connected to said microphone,
    前記プロセッサに接続されており、ノイズ低減方法を実装するためのプロセッサ可読命令セットを格納するメモリとを備え、 It is connected to said processor, and a memory for storing processor readable instruction set for implementing the noise reduction method,
    前記プロセッサ可読命令は、 Wherein the processor readable instructions,
    実行された際に、広帯域に分布する所望の音と、前記コンソール上に位置するノイズ源からの狭帯域分布ノイズとを含む信号を、前記1以上のマイクロフォンから取得するステップを前記装置に実行せしめる命令と、 When executed, allowed to perform a desired sound distributed broadband, a signal including a narrowband distribution noise from the noise source located on the console, the step of acquiring from the one or more microphones to said device instruction and,
    実行された際に、前記信号を複数の周波数ビンに分割するステップを実行せしめる命令と、 When executed, the instructions allowed to perform the step of dividing the signal into a plurality of frequency bins,
    実行された際に、前記信号のパワースペクトラムの対数から特徴ベクトルを生成し、その特徴ベクトルについて事前にトレーニングされたモデルに対するマッチングをとることにより、各周波数ビンについて、その周波数ビン内の前記信号の一部が、前記コンソール上に位置するノイズ源からの狭帯域分布特性に属するか決定するステップを実行せしめる命令と、 When executed, it generates a feature vector from the logarithm of the power spectrum of the signal, prior by taking matching for trained model for the feature vector, for each frequency bin, of the signal in that frequency bin part, the instructions allowed to perform the step of determining whether belonging to the narrow band distribution characteristic from the noise source located on the console,
    実行された際に、前記1以上のマイクロフォンからの信号から生成された信号データから、狭帯域分布特性に属する前記信号の一部を含む周波数ビンをフィルタリング処理するステップを実行せしめる命令と、 When executed, from the signal data generated from a signal from the one or more microphones, and instructions allowed to perform the step of filtering the frequency bins comprising a portion of the signals belonging to the narrow band distribution characteristic,
    を含む電子装置。 Electronic device comprising a.
  10. 前記実行された際に各周波数ビンについてその周波数ビン内の前記信号の一部が前記コンソール上に位置するノイズ源からの狭帯域分布特性に属するか決定するステップを実行せしめる命令は、 Instructions allowed to perform the step of determining whether belonging to the narrow band distribution characteristic of the noise source a portion of the signal in that frequency bin for each frequency bin in the are executed is located on the console,
    実行された際に、その周波数ビン内の前記信号の一部に対応する値と、前記コンソール上に位置するノイズ源からの既知の信号から導出されたその周波数ビンの値として格納されている値とを比較する1以上の命令を含む請求項9に記載の装置。 When executed, values ​​and the known stored values ​​as the value of the frequency bin derived from the signal from the noise source located on the console to a portion of the signal in that frequency bin the apparatus of claim 9 including one or more instructions for comparing and.
  11. 前記メモリに格納されたルックアップテーブルをさらに備え、 Further comprising a look-up table stored in said memory,
    前記ルックアップテーブルは、前記格納されている値を含む請求項10に記載の装置。 The look-up table, according to claim 10 comprising a value that is the storage.
  12. 前記1以上のマイクロフォンは、第1マイクロフォンと、第2マイクロフォンとを含む請求項9に記載の装置。 The one or more microphone apparatus of claim 9 comprising a first microphone, a second microphone.
  13. 前記実行された際に信号を前記1以上のマイクロフォンから取得するステップを実行せしめる命令は、 Instructions allowed to perform the step of obtaining a signal when the run from the one or more microphones,
    実行された際に、前記第1マイクロフォンから第1信号を取得するステップと、前記第2マイクロフォンとから第2信号を取得するステップとを前記装置に実行せしめる1以上の命令を含み、 When executed, comprising the steps of: obtaining a first signal from the first microphone, an instruction allowed to one or more execution to the device and obtaining a second signal from said second microphone,
    前記その周波数ビン内の前記信号の一部が狭帯域分布特性に属するか決定するステップは、前記第1信号から第1ベクトル特性を決定し、前記第2信号から第2ベクトル特性を取得するステップと、前記第1信号と前記第2信号とから結合特徴ベクトルを形成し、その結合特徴ベクトルをモデルに対してマッチングするステップとを含む請求項9に記載の装置。 The step that step partially determined belongs to the narrow band distribution characteristic of the signal in the frequency bins, which determines a first vector characteristic from said first signal to obtain a second vector characteristic from said second signal When apparatus of claim 9 wherein said first signal and to form a bond feature vector from said second signal, and a step of matching the binding feature vector to the model.
  14. 前記実行された際に前記信号を複数の周波数ビンに分割するステップを実行せしめる命令は、 Wherein the step of dividing the signal into a plurality of frequency bins when executed allowed to execute instructions,
    時間窓で切り取られた前記信号の一部を取り込むステップと、 A step of capturing a portion of the signal, taken in a time window,
    前記時間窓で切り取られた前記信号の一部を周波数領域信号に変換するステップと、 And converting a portion of the signal, taken at the time window in the frequency domain signal,
    前記周波数領域信号を、複数の周波数ビンに分割するステップと、 Dividing the frequency domain signal, into a plurality of frequency bins,
    を前記装置に実行せしめる命令を含む請求項9に記載の装置。 The apparatus of claim 9 including instructions allowed to run on the device.
  15. 前記広帯域に分布する所望の音は、音声である請求項9に記載の装置。 Desired sound distributed in the broadband A device according to claim 9 is a voice.
  16. 前記狭帯域分布ノイズのノイズ源は、ディスクドライブである請求項9に記載の装置。 The noise sources of the narrow band distribution noise The apparatus of claim 9 which is a disk drive.
  17. 前記広帯域に分布する所望の音は、ガウス分布確率密度関数で特徴づけられる請求項9に記載の装置。 Desired sound distributed in the broadband A device according to claim 9, characterized by a Gaussian distribution probability density function.
  18. 前記狭帯域ノイズは、ガンマ分布確率密度関数で特徴づけられる請求項9に記載の装置。 The narrow band noise, according to claim 9, characterized by a gamma distribution probability density function.
  19. 前記コンソールは、テレビゲームコンソールである請求項9に記載の装置。 The console device of claim 9 is a television game console.
  20. 前記コンソールは、デジタルビデオレコーダ、またはケーブルテレビセットトップボックスである請求項9に記載の装置。 The console device according to the digital video recorder or claim 9, which is a cable television set-top boxes.
  21. コンソールを有する装置においてノイズを低減する方法であって、そのコンソールは、1以上のマイクロフォンとそのコンソール上に位置する狭帯域分布ノイズ源とを有し、 A method of reducing noise in a device having a console, the console, and a narrow-band distribution noise source located on one or more microphones and its console,
    広帯域に分布する所望の音と、前記コンソール上に位置するノイズ源からの狭帯域分布ノイズとを含む信号を、前記1以上のマイクロフォンから取得するステップと、 Obtaining the desired sound distributed broadband, a signal including a narrowband distribution noise from the noise source located on the console, from the one or more microphones,
    前記信号を、複数の周波数ビンに分割するステップと、 Dividing the signal into a plurality of frequency bins,
    前記信号のパワースペクトラムの対数から特徴ベクトルを生成し、その特徴ベクトルについて事前にトレーニングされたモデルに対するマッチングをとることにより、各周波数ビンについて、その周波数ビン内の前記信号の一部が、前記コンソール上に位置するノイズ源からの狭帯域分布特性に属するか、決定するステップと、 Generating a feature vector from the logarithm of the power spectrum of the signal, prior by taking matching for trained model for the feature vector, for each frequency bin, a portion of the signal in that frequency bin, the console it belongs to a narrow band distribution characteristic of the noise source located above and determining,
    前記1以上のマイクロフォンからの信号から生成された信号データから、狭帯域分布特性に属する前記信号の一部を含む周波数ビンをフィルタリング処理するステップと、 From the signal data generated from a signal from the one or more microphones, the method comprising: filtering the frequency bins comprising a portion of the signals belonging to the narrow band distribution characteristic,
    を備える方法。 The method comprises a.
JP2009509909A 2003-08-27 2007-03-30 Noise removal in an electronic device having a far-field microphone on the console Expired - Fee Related JP4866958B2 (en)

Priority Applications (21)

Application Number Priority Date Filing Date Title
US11381728 US7545926B2 (en) 2006-05-04 2006-05-04 Echo and noise cancellation
US11429047 US8233642B2 (en) 2003-08-27 2006-05-04 Methods and apparatuses for capturing an audio signal based on a location of the signal
US11381725 US7783061B2 (en) 2003-08-27 2006-05-04 Methods and apparatus for the targeted sound detection
PCT/US2006/017483 WO2006121896A3 (en) 2005-05-05 2006-05-04 Microphone array based selective sound source listening and video game control
US11418988 US8160269B2 (en) 2003-08-27 2006-05-04 Methods and apparatuses for adjusting a listening area for capturing sounds
US11/381,721 2006-05-04
US11/381,725 2006-05-04
US11/381,724 2006-05-04
US11/381,727 2006-05-04
USPCT/US2006/017483 2006-05-04
US11/381,728 2006-05-04
US11/418,988 2006-05-04
US11418989 US8139793B2 (en) 2003-08-27 2006-05-04 Methods and apparatus for capturing audio signals based on a visual image
US11381721 US8947347B2 (en) 2003-08-27 2006-05-04 Controlling actions in a video game unit
US11381727 US7697700B2 (en) 2006-05-04 2006-05-04 Noise removal for electronic device with far field microphone on console
US11381729 US7809145B2 (en) 2006-05-04 2006-05-04 Ultra small microphone array
US11/381,729 2006-05-04
US11/429,047 2006-05-04
US11381724 US8073157B2 (en) 2003-08-27 2006-05-04 Methods and apparatus for targeted sound detection and characterization
US11/418,989 2006-05-04
PCT/US2007/065701 WO2007130766A3 (en) 2006-05-04 2007-03-30 Narrow band noise reduction for speech enhancement

Publications (2)

Publication Number Publication Date
JP2009535997A true JP2009535997A (en) 2009-10-01
JP4866958B2 true JP4866958B2 (en) 2012-02-01

Family

ID=56290936

Family Applications (3)

Application Number Title Priority Date Filing Date
JP2009509908A Expired - Fee Related JP4476355B2 (en) 2003-08-27 2007-03-30 Echo and noise cancellation
JP2009509909A Expired - Fee Related JP4866958B2 (en) 2003-08-27 2007-03-30 Noise removal in an electronic device having a far-field microphone on the console
JP2010019147A Expired - Fee Related JP4833343B2 (en) 2003-08-27 2010-01-29 Echo and noise cancellation

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2009509908A Expired - Fee Related JP4476355B2 (en) 2003-08-27 2007-03-30 Echo and noise cancellation

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2010019147A Expired - Fee Related JP4833343B2 (en) 2003-08-27 2010-01-29 Echo and noise cancellation

Country Status (3)

Country Link
EP (2) EP2014132A4 (en)
JP (3) JP4476355B2 (en)
WO (2) WO2007130766A3 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2858068A4 (en) * 2012-05-31 2016-02-24 Toyota Motor Co Ltd Audio source detection device, noise model generation device, noise reduction device, audio source direction estimation device, approaching vehicle detection device and noise reduction method

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010106734A1 (en) * 2009-03-18 2010-09-23 日本電気株式会社 Audio signal processing device
JP4964267B2 (en) * 2009-04-03 2012-06-27 有限会社ケプストラム Adaptive filters and echo canceller with this
JP2010249939A (en) * 2009-04-13 2010-11-04 Sony Corp Noise reducing device and noise determination method

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04340599A (en) * 1991-05-16 1992-11-26 Ricoh Co Ltd Noise canceller device
JPH06303689A (en) * 1993-04-16 1994-10-28 Oki Electric Ind Co Ltd Moise eliminating device
JP2001513916A (en) * 1997-03-03 2001-09-04 テレフォンアクチーボラゲット エル エム エリクソン(パブル) High resolution post-processing method of speech decoding dexterity
JP2001299835A (en) * 2000-04-24 2001-10-30 Tomi Kensetsu:Kk Nursing device and nursing room using the same
JP2002537586A (en) * 1999-02-18 2002-11-05 アンドレア エレクトロニクス コーポレイション System for eliminating noise, a method and apparatus
JP2003284181A (en) * 2002-03-20 2003-10-03 Matsushita Electric Ind Co Ltd Sound collection apparatus
JP2004254329A (en) * 2003-02-21 2004-09-09 Herman Becker Automotive Systems-Wavemakers Inc System for suppressing wind noise
JP2005197956A (en) * 2004-01-06 2005-07-21 Matsushita Electric Ind Co Ltd Periodic noise suppressor
WO2006007290A2 (en) * 2004-06-30 2006-01-19 Motorola, Inc., A Corporation Of The State Of Delaware Method and apparatus for equalizing a speech signal generated within a self-contained breathing apparatus system

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4802227A (en) * 1987-04-03 1989-01-31 American Telephone And Telegraph Company Noise reduction processing arrangement for microphone arrays
DE69428119T2 (en) * 1993-07-07 2002-03-21 Picturetel Corp Reduction of the background noise for speech enhancement
US5806025A (en) * 1996-08-07 1998-09-08 U S West, Inc. Method and system for adaptive filtering of speech signals using signal-to-noise ratio to choose subband filter bank
FR2771542B1 (en) * 1997-11-21 2000-02-11 Sextant Avionique filtering method frequentiel apply to sound signals denoising using a Wiener filter
DE19806015C2 (en) * 1998-02-13 1999-12-23 Siemens Ag A method of improving the acoustic sidetone attenuation in handsfree
US6263078B1 (en) * 1999-01-07 2001-07-17 Signalworks, Inc. Acoustic echo canceller with fast volume control compensation
US6426979B1 (en) * 1999-04-29 2002-07-30 Legerity, Inc. Adaptation control algorithm for echo cancellation using signal-value based analysis
US6526139B1 (en) * 1999-11-03 2003-02-25 Tellabs Operations, Inc. Consolidated noise injection in a voice processing system
US7139401B2 (en) * 2002-01-03 2006-11-21 Hitachi Global Storage Technologies B.V. Hard disk drive with self-contained active acoustic noise reduction
DE10305369B4 (en) * 2003-02-10 2005-05-19 Siemens Ag User adaptive method for noise modeling
US6947549B2 (en) * 2003-02-19 2005-09-20 The Hong Kong Polytechnic University Echo canceller
DE602005020662D1 (en) * 2004-10-13 2010-05-27 Koninkl Philips Electronics Nv echo cancellation

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04340599A (en) * 1991-05-16 1992-11-26 Ricoh Co Ltd Noise canceller device
JPH06303689A (en) * 1993-04-16 1994-10-28 Oki Electric Ind Co Ltd Moise eliminating device
JP2001513916A (en) * 1997-03-03 2001-09-04 テレフォンアクチーボラゲット エル エム エリクソン(パブル) High resolution post-processing method of speech decoding dexterity
JP2002537586A (en) * 1999-02-18 2002-11-05 アンドレア エレクトロニクス コーポレイション System for eliminating noise, a method and apparatus
JP2001299835A (en) * 2000-04-24 2001-10-30 Tomi Kensetsu:Kk Nursing device and nursing room using the same
JP2003284181A (en) * 2002-03-20 2003-10-03 Matsushita Electric Ind Co Ltd Sound collection apparatus
JP2004254329A (en) * 2003-02-21 2004-09-09 Herman Becker Automotive Systems-Wavemakers Inc System for suppressing wind noise
JP2005197956A (en) * 2004-01-06 2005-07-21 Matsushita Electric Ind Co Ltd Periodic noise suppressor
WO2006007290A2 (en) * 2004-06-30 2006-01-19 Motorola, Inc., A Corporation Of The State Of Delaware Method and apparatus for equalizing a speech signal generated within a self-contained breathing apparatus system

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2858068A4 (en) * 2012-05-31 2016-02-24 Toyota Motor Co Ltd Audio source detection device, noise model generation device, noise reduction device, audio source direction estimation device, approaching vehicle detection device and noise reduction method

Also Published As

Publication number Publication date Type
EP2012725A2 (en) 2009-01-14 application
JP2009535996A (en) 2009-10-01 application
EP2014132A4 (en) 2013-01-02 application
EP2014132A2 (en) 2009-01-14 application
EP2012725A4 (en) 2011-10-12 application
WO2007130766A2 (en) 2007-11-15 application
JP2010171985A (en) 2010-08-05 application
WO2007130765A2 (en) 2007-11-15 application
JP2009535997A (en) 2009-10-01 application
WO2007130765A3 (en) 2008-12-18 application
JP4476355B2 (en) 2010-06-09 grant
JP4833343B2 (en) 2011-12-07 grant
WO2007130766A3 (en) 2008-09-04 application

Similar Documents

Publication Publication Date Title
Naylor et al. Speech dereverberation
US20090080666A1 (en) Apparatus and method for extracting an ambient signal in an apparatus and method for obtaining weighting coefficients for extracting an ambient signal and computer program
Wang Time-frequency masking for speech separation and its potential for hearing aid design
US20080071540A1 (en) Speech recognition method for robot under motor noise thereof
US20110026724A1 (en) Active noise reduction method using perceptual masking
US20110293103A1 (en) Systems, methods, devices, apparatus, and computer program products for audio equalization
US20120051548A1 (en) Microphone array subset selection for robust noise reduction
US20040064307A1 (en) Noise reduction method and device
US20130259254A1 (en) Systems, methods, and apparatus for producing a directional sound field
US20080140396A1 (en) Model-based signal enhancement system
Luts et al. Multicenter evaluation of signal enhancement algorithms for hearing aids
US20120215519A1 (en) Systems, methods, apparatus, and computer-readable media for spatially selective audio augmentation
US20090060222A1 (en) Sound zoom method, medium, and apparatus
Martin Speech enhancement based on minimum mean-square error estimation and supergaussian priors
US20110038489A1 (en) Systems, methods, apparatus, and computer-readable media for coherence detection
US20080189104A1 (en) Adaptive noise suppression for digital speech signals
US7613310B2 (en) Audio input system
US7113605B2 (en) System and process for time delay estimation in the presence of correlated noise and reverberation
US20060280312A1 (en) Methods and apparatus for capturing audio signals based on a visual image
US20110178798A1 (en) Adaptive ambient sound suppression and speech tracking
Davis Noise reduction in speech applications
US20120120218A1 (en) Semi-private communication in open environments
US20040230428A1 (en) Method and apparatus for blind source separation using two sensors
US20100246844A1 (en) Method for Determining a Signal Component for Reducing Noise in an Input Signal
US20060269072A1 (en) Methods and apparatuses for adjusting a listening area for capturing sounds

Legal Events

Date Code Title Description
A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20101126

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20110126

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110802

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111003

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20111108

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20111114

R150 Certificate of patent (=grant) or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20141118

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees