JP2008197577A - 音声処理装置、音声処理方法およびプログラム - Google Patents
音声処理装置、音声処理方法およびプログラム Download PDFInfo
- Publication number
- JP2008197577A JP2008197577A JP2007035410A JP2007035410A JP2008197577A JP 2008197577 A JP2008197577 A JP 2008197577A JP 2007035410 A JP2007035410 A JP 2007035410A JP 2007035410 A JP2007035410 A JP 2007035410A JP 2008197577 A JP2008197577 A JP 2008197577A
- Authority
- JP
- Japan
- Prior art keywords
- sound
- voice
- input
- unit
- volume
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 10
- 238000000926 separation method Methods 0.000 claims description 49
- 238000003384 imaging method Methods 0.000 claims description 22
- 238000004364 calculation method Methods 0.000 claims description 14
- 230000002441 reversible effect Effects 0.000 claims description 5
- 238000000034 method Methods 0.000 description 17
- 238000010586 diagram Methods 0.000 description 16
- 230000006870 function Effects 0.000 description 16
- 238000001228 spectrum Methods 0.000 description 7
- 230000003111 delayed effect Effects 0.000 description 4
- 238000012880 independent component analysis Methods 0.000 description 4
- 230000008859 change Effects 0.000 description 3
- 230000007423 decrease Effects 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000004590 computer program Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 230000007613 environmental effect Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000003595 spectral effect Effects 0.000 description 2
- TUBQDCKAWGHZPF-UHFFFAOYSA-N 1,3-benzothiazol-2-ylsulfanylmethyl thiocyanate Chemical compound C1=CC=C2SC(SCSC#N)=NC2=C1 TUBQDCKAWGHZPF-UHFFFAOYSA-N 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 238000004378 air conditioning Methods 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000005336 cracking Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/02—Editing, e.g. varying the order of information signals recorded on, or reproduced from, record carriers
- G11B27/031—Electronic editing of digitised analogue information signals, e.g. audio or video signals
- G11B27/034—Electronic editing of digitised analogue information signals, e.g. audio or video signals on discs
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G1/00—Details of arrangements for controlling amplification
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N5/00—Details of television systems
- H04N5/76—Television signal recording
- H04N5/765—Interface circuits between an apparatus for recording and another apparatus
- H04N5/77—Interface circuits between an apparatus for recording and another apparatus between a recording apparatus and a television camera
- H04N5/772—Interface circuits between an apparatus for recording and another apparatus between a recording apparatus and a television camera the recording apparatus and the television camera being placed in the same enclosure
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
- H04R3/005—Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L2021/02087—Noise filtering the noise being separate speech, e.g. cocktail party
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N5/00—Details of television systems
- H04N5/76—Television signal recording
- H04N5/91—Television signal processing therefor
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N9/00—Details of colour television systems
- H04N9/79—Processing of colour television signals in connection with recording
- H04N9/80—Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
- H04N9/804—Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components
- H04N9/806—Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components with processing of the sound signal
- H04N9/8063—Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components with processing of the sound signal using time division multiplex of the PCM audio and PCM video signals
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2201/00—Details of transducers, loudspeakers or microphones covered by H04R1/00 but not provided for in any of its subgroups
- H04R2201/40—Details of arrangements for obtaining desired directional characteristic by combining a number of identical transducers covered by H04R1/40 but not provided for in any of its subgroups
- H04R2201/401—2D or 3D arrays of transducers
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2430/00—Signal processing covered by H04R, not provided for in its groups
- H04R2430/20—Processing of the output signals of the acoustic transducers of an array for obtaining a desired directivity characteristic
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/15—Aspects of sound capture and related signal processing for recording or reproduction
Abstract
【解決手段】入力音声に特定音源から発せられた第一の音声が含まれているか否かを音源の位置情報に基づいて判定する音声判定部と、音声判定部により入力音声に第一の音声が含まれていると判定された場合、入力音声を第一の音声と特定音源以外の音源から発せられた第二の音声とに分離する音声分離部と、音声分離部により分離された第一の音声と第二の音声を任意の音量比率で混合する音声混合部150と、を備えることを特徴とする。
【選択図】図3
Description
まず、本発明の第1の実施形態にかかる音声記録装置10について説明する。本実施形態の説明においては、図1および図2を参照して音声記録装置10が用いられる場面の一例を説明した後に、図3〜図10を参照して音声記録装置10の構成および動作を説明する。
次に、本発明の第2の実施形態にかかる音声再生装置11について説明する。本実施形態にかかる音声再生装置11は、既に記憶されている音声に含まれる近傍音声の占める音量比率が調整された混合音声を再生することができる。以下、図11を参照して当該音声再生装置11の構成を説明する。
なお、本実施形態の説明においては、第1の実施形態で説明した内容と実質的に同一である構成については説明を省略し、第1の実施形態と異なる構成に重きをおいて説明する。
次に、本発明の第3の実施形態にかかる音声再生装置12について説明する。本実施形態にかかる音声再生装置12は、入力音声にAGC(Auto Gain Control)が施されている場合、入力音声に含まれる収音対象音声の音量を逆補正し、収音対象音声を強調(ブースト)することができる。以下、図12および図13を参照し、本実施形態にかかる音声再生装置12の構成および動作を説明する。
なお、本実施形態の説明においては、第2の実施形態で説明した内容と実質的に同一である構成については説明を省略し、第2の実施形態と異なる構成に重きをおいて説明する。
11、12 音声再生装置
110 音声収音部
120 音声判定部
124 音量検出器
134 音質検出器
136 距離方向推定器
138 操作者音声推定器
140 音源分離部
150 音声混合部
160 記録部
170、172 記憶部
174 再生部
180 音声出力部
190 音量補正部
Claims (15)
- 入力音声に特定音源から発せられた第一の音声が含まれているか否かを判定する音声判定部と;
前記音声判定部により前記入力音声に前記第一の音声が含まれていると判定された場合、前記入力音声を前記第一の音声と前記特定音源以外の音源から発せられた第二の音声とに分離する音声分離部と;
前記音声分離部により分離された前記第一の音声と前記第二の音声を、任意の音量比率で混合する音声混合部と;
を備えることを特徴とする、音声処理装置。 - 前記特定音源は前記入力音声の収録位置から設定距離の範囲内に位置することを特徴とする、請求項1に記載の音声処理装置。
- 前記第一の音声は、前記入力音声を収音する際に用いられた装置の操作者に起因する音声を含み、
前記第二の音声は、収音対象から発せられた音声を含むことを特徴とする、請求項2に記載の音声処理装置。 - 前記音声判定部は、前記入力音声の音量または音質の少なくともいずれかに基づいて前記入力音声に前記第一の音声が含まれているか否かを判定することを特徴とする、請求項3に記載の音声処理装置。
- 映像を撮像する撮像部をさらに備え、
前記音声判定部は、入力音声に含まれる1または2以上の音源から発せられた音声の音量または位相の少なくともいずれかに基づいて前記音源の位置情報を算出する位置情報算出部を備え、前記入力音声の音源の位置が前記撮像部の撮像方向の後方であると前記位置情報算出部により算出され、前記入力音声が人間の音声と一致または近似する音質である場合、前記入力音声に特定音源から発せられた前記第一の音声が含まれていると判定することを特徴とする、請求項4に記載の音声処理装置。 - 前記入力音声の音源の位置が収音位置から設定距離の範囲内であり、前記入力音声にインパルス音が含まれ、前記入力音声が過去の平均音量と比較して大きい場合、前記音声判定部は、前記入力音声に特定音源から発せられた前記第一の音声が含まれていると判定することを特徴とする、請求項4に記載の音声処理装置。
- 前記入力音声を収音する複数の収音部と;
前記音声混合部により混合された混合音声を記憶媒体に記録する記録部と;
を備えることを特徴とする、請求項1に記載の音声処理装置。 - 前記入力音声を記憶している記憶媒体と;
前記記憶媒体に記憶されている前記入力音声を再生し、前記位置情報算出部、前記音声判定部および前記音声分離部の少なくともいずれかに出力する再生部と;
を備えることを特徴とする、請求項1に記載の音声処理装置。 - 前記入力音声の音量が補正されている場合、前記音声分離部により分離された前記第二の音声の音量に、前記補正の程度に応じた逆補正を行なう音量補正部と;
を備えることを特徴とする、請求項1に記載の音声処理装置。 - 入力音声の分離を行う音声分離部と;
前記音声分離部により分離された音声に特定音源から発せられた第一の音声が含まれているか否かを判定する音声判定部と;
前記音声分離部により分離された前記第一の音声と前記特定音源以外の音源から発せられた第二の音声を、任意の音量比率で混合する音声混合部と;
を備えることを特徴とする、音声処理装置。 - コンピュータを、
入力音声に特定音源から発せられた第一の音声が含まれているか否かを前記音源の位置情報に基づいて判定する音声判定部と;
前記音声判定部により前記入力音声に前記第一の音声が含まれていると判定された場合、前記入力音声を前記第一の音声と前記特定音源以外の音源から発せられた第二の音声とに分離する音声分離部と;
前記音声分離部により分離された前記第一の音声と前記第二の音声とを、任意の音量比率で混合する音声混合部と;
を備えることを特徴とする音声処理装置として機能させるための、プログラム。 - 前記音声判定部は、前記入力音声の音量または音質の少なくともいずれかに基づいて前記入力音声に前記第一の音声が含まれているか否かを判定することを特徴とする、請求項11に記載のプログラム。
- 映像を撮像する撮像部をさらに備え、
前記音声判定部は、入力音声に含まれる1または2以上の音源から発せられた音声の音量または位相の少なくともいずれかに基づいて前記音源の位置情報を算出する位置情報算出部を備え、前記入力音声の音源の位置が前記撮像部の撮像方向の後方であると前記位置情報算出部により算出され、前記入力音声が人間の音声と一致または近似する音質である場合、前記入力音声に特定音源から発せられた前記第一の音声が含まれていると判定することを特徴とする、請求項12に記載のプログラム。 - 前記入力音声の音源の位置が収音位置から設定距離の範囲内であり、前記入力音声にインパルス音が含まれ、前記入力音声が過去の平均音量と比較して大きい場合、前記音声判定部は、前記入力音声に特定音源から発せられた前記第一の音声が含まれていると判定することを特徴とする、請求項12に記載のプログラム。
- 入力音声に特定音源から発せられた第一の音声が含まれているか否かを前記音源の位置情報に基づいて判定するステップと;
前記入力音声に前記第一の音声が含まれていると判定された場合、前記入力音声を前記第一の音声と前記特定音源以外の音源から発せられた第二の音声とに分離するステップと;
前記分離された前記第一の音声と前記第二の音声を、任意の音量比率で混合するステップと;
を含むことを特徴とする、音声処理方法。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007035410A JP4449987B2 (ja) | 2007-02-15 | 2007-02-15 | 音声処理装置、音声処理方法およびプログラム |
US12/069,844 US8422695B2 (en) | 2007-02-15 | 2008-02-13 | Sound processing apparatus, sound processing method and program |
CN2008100082947A CN101246690B (zh) | 2007-02-15 | 2008-02-15 | 声音处理设备及声音处理方法 |
US13/788,488 US9762193B2 (en) | 2007-02-15 | 2013-03-07 | Sound processing apparatus, sound processing method and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007035410A JP4449987B2 (ja) | 2007-02-15 | 2007-02-15 | 音声処理装置、音声処理方法およびプログラム |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2008197577A true JP2008197577A (ja) | 2008-08-28 |
JP2008197577A5 JP2008197577A5 (ja) | 2008-11-06 |
JP4449987B2 JP4449987B2 (ja) | 2010-04-14 |
Family
ID=39706737
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007035410A Expired - Fee Related JP4449987B2 (ja) | 2007-02-15 | 2007-02-15 | 音声処理装置、音声処理方法およびプログラム |
Country Status (3)
Country | Link |
---|---|
US (2) | US8422695B2 (ja) |
JP (1) | JP4449987B2 (ja) |
CN (1) | CN101246690B (ja) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010112996A (ja) * | 2008-11-04 | 2010-05-20 | Sony Corp | 音声処理装置、音声処理方法およびプログラム |
JP2010112995A (ja) * | 2008-11-04 | 2010-05-20 | Sony Corp | 通話音声処理装置、通話音声処理方法およびプログラム |
JP2010112994A (ja) * | 2008-11-04 | 2010-05-20 | Sony Corp | 音声処理装置、音声処理方法およびプログラム |
JP2010187363A (ja) * | 2009-01-16 | 2010-08-26 | Sanyo Electric Co Ltd | 音響信号処理装置及び再生装置 |
WO2011027862A1 (ja) * | 2009-09-04 | 2011-03-10 | 株式会社ニコン | 音声データ合成装置 |
JP2011199855A (ja) * | 2010-02-25 | 2011-10-06 | Nec Corp | 携帯機器 |
JP2011203048A (ja) * | 2010-03-25 | 2011-10-13 | Tokyo Electric Power Co Inc:The | 音源位置特定装置および音源位置特定方法 |
JP2014502109A (ja) * | 2010-12-03 | 2014-01-23 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | 到来方向推定から幾何学的な情報の抽出による音取得 |
CN112203188A (zh) * | 2020-07-24 | 2021-01-08 | 北京工业大学 | 一种自动音量调节方法 |
Families Citing this family (30)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2454732A2 (en) * | 2009-07-15 | 2012-05-23 | Vijay Sathya | System and method of determining the appropriate mixing volume for an event sound corresponding to an impact related event and determining the enhanced event audio |
US9838784B2 (en) | 2009-12-02 | 2017-12-05 | Knowles Electronics, Llc | Directional audio capture |
US8265341B2 (en) * | 2010-01-25 | 2012-09-11 | Microsoft Corporation | Voice-body identity correlation |
US8798290B1 (en) | 2010-04-21 | 2014-08-05 | Audience, Inc. | Systems and methods for adaptive signal equalization |
US9558755B1 (en) | 2010-05-20 | 2017-01-31 | Knowles Electronics, Llc | Noise suppression assisted automatic speech recognition |
JP5741281B2 (ja) * | 2011-07-26 | 2015-07-01 | ソニー株式会社 | 音声信号処理装置、撮像装置、音声信号処理方法、プログラム及び記録媒体 |
KR101219709B1 (ko) * | 2011-12-07 | 2013-01-09 | 현대자동차주식회사 | 음원 믹싱을 위한 자동 볼륨 제어 방법 |
US9197974B1 (en) * | 2012-01-06 | 2015-11-24 | Audience, Inc. | Directional audio capture adaptation based on alternative sensory input |
JP6225118B2 (ja) * | 2012-01-17 | 2017-11-01 | コーニンクレッカ フィリップス エヌ ヴェKoninklijke Philips N.V. | 音源位置推定 |
JP5834948B2 (ja) * | 2012-01-24 | 2015-12-24 | 富士通株式会社 | 残響抑制装置、残響抑制方法及び残響抑制用コンピュータプログラム |
US9640194B1 (en) | 2012-10-04 | 2017-05-02 | Knowles Electronics, Llc | Noise suppression for speech processing based on machine-learning mask estimation |
CN104123950B (zh) * | 2014-07-17 | 2015-11-25 | 努比亚技术有限公司 | 一种录音方法及装置 |
US9799330B2 (en) | 2014-08-28 | 2017-10-24 | Knowles Electronics, Llc | Multi-sourced noise suppression |
US9978388B2 (en) | 2014-09-12 | 2018-05-22 | Knowles Electronics, Llc | Systems and methods for restoration of speech components |
US9668048B2 (en) | 2015-01-30 | 2017-05-30 | Knowles Electronics, Llc | Contextual switching of microphones |
CN106067996B (zh) * | 2015-04-24 | 2019-09-17 | 松下知识产权经营株式会社 | 语音再现方法、语音对话装置 |
CN105578097A (zh) * | 2015-07-10 | 2016-05-11 | 宇龙计算机通信科技(深圳)有限公司 | 一种录像方法及终端 |
JP6727825B2 (ja) * | 2016-02-02 | 2020-07-22 | キヤノン株式会社 | 音声処理装置および音声処理方法 |
CN106483502B (zh) * | 2016-09-23 | 2019-10-18 | 科大讯飞股份有限公司 | 一种声源定位方法及装置 |
JP6591477B2 (ja) * | 2017-03-21 | 2019-10-16 | 株式会社東芝 | 信号処理システム、信号処理方法及び信号処理プログラム |
CN106954126B (zh) * | 2017-03-31 | 2020-01-10 | 深圳壹秘科技有限公司 | 一种音频信息处理方法及其会议终端 |
CN110575051B (zh) * | 2018-06-11 | 2022-03-18 | 佛山市顺德区美的电热电器制造有限公司 | 一种烹饪设备及烹饪设备的控制方法、装置和存储介质 |
CN108810699B (zh) * | 2018-06-19 | 2020-01-24 | 李金雄 | 一种运动蓝牙耳机 |
CN111192573B (zh) * | 2018-10-29 | 2023-08-18 | 宁波方太厨具有限公司 | 基于语音识别的设备智能化控制方法 |
CN109639904B (zh) * | 2019-01-25 | 2021-02-02 | 努比亚技术有限公司 | 一种手机模式调整方法、系统及计算机存储介质 |
US11308949B2 (en) * | 2019-03-12 | 2022-04-19 | International Business Machines Corporation | Voice assistant response system based on a tone, keyword, language or etiquette behavioral rule |
CN111370019B (zh) * | 2020-03-02 | 2023-08-29 | 字节跳动有限公司 | 声源分离方法及装置、神经网络的模型训练方法及装置 |
CN111698631B (zh) * | 2020-05-22 | 2021-10-15 | 深圳市东微智能科技股份有限公司 | 音频设备自动调试方法、音频设备以及音频系统 |
CN116095564B (zh) * | 2023-04-10 | 2023-06-23 | 深圳市嘉润原新显科技有限公司 | 显示器混音电路及显示器 |
CN116990755A (zh) * | 2023-09-22 | 2023-11-03 | 海宁市微纳感知计算技术有限公司 | 一种鸣笛声源定位方法、系统、电子设备及可读存储介质 |
Family Cites Families (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS63152277A (ja) | 1986-12-17 | 1988-06-24 | Matsushita Electric Ind Co Ltd | 携帯用ビデオカメラ |
JP3131249B2 (ja) | 1991-08-23 | 2001-01-31 | 日本放送協会 | 混合音声信号受信装置 |
JP2742344B2 (ja) * | 1991-10-09 | 1998-04-22 | 富士通株式会社 | 音声編集装置 |
JPH0543200U (ja) | 1991-10-30 | 1993-06-11 | クラリオン株式会社 | 音声記録系装置 |
DE19854373B4 (de) * | 1998-11-25 | 2005-02-24 | Robert Bosch Gmbh | Verfahren zur Steuerung der Empfindlichkeit eines Mikrofons |
JP2001084713A (ja) | 1999-09-10 | 2001-03-30 | Nippon Hoso Kyokai <Nhk> | ビデオカメラと一体型の音源分離収音マイクロホンシステム |
DE10043090A1 (de) * | 2000-09-01 | 2002-03-28 | Bosch Gmbh Robert | Verfahren zur Wiedergabe von Audiosignalen mindestens zweier verschiedener Quellen |
JP2002218583A (ja) | 2001-01-17 | 2002-08-02 | Sony Corp | 音場合成演算方法及び装置 |
US7123727B2 (en) * | 2001-07-18 | 2006-10-17 | Agere Systems Inc. | Adaptive close-talking differential microphone array |
US20030059061A1 (en) * | 2001-09-14 | 2003-03-27 | Sony Corporation | Audio input unit, audio input method and audio input and output unit |
JP3852383B2 (ja) | 2002-08-05 | 2006-11-29 | 日本ビクター株式会社 | ビデオ再生装置 |
US7383178B2 (en) * | 2002-12-11 | 2008-06-03 | Softmax, Inc. | System and method for speech processing using independent component analysis under stability constraints |
JP4143487B2 (ja) | 2003-06-30 | 2008-09-03 | 株式会社東芝 | 時系列情報制御システム及びその方法並びに時系列情報制御プログラム |
JP2005341073A (ja) | 2004-05-26 | 2005-12-08 | Sony Corp | マイクロホン |
US8687820B2 (en) * | 2004-06-30 | 2014-04-01 | Polycom, Inc. | Stereo microphone processing for teleconferencing |
JP4462617B2 (ja) | 2004-11-29 | 2010-05-12 | 株式会社神戸製鋼所 | 音源分離装置,音源分離プログラム及び音源分離方法 |
JP3906230B2 (ja) * | 2005-03-11 | 2007-04-18 | 株式会社東芝 | 音響信号処理装置、音響信号処理方法、音響信号処理プログラム、及び音響信号処理プログラムを記録したコンピュータ読み取り可能な記録媒体 |
DE102005032274B4 (de) * | 2005-07-11 | 2007-05-10 | Siemens Audiologische Technik Gmbh | Hörvorrichtung und entsprechendes Verfahren zur Eigenstimmendetektion |
US7567898B2 (en) * | 2005-07-26 | 2009-07-28 | Broadcom Corporation | Regulation of volume of voice in conjunction with background sound |
US20070147635A1 (en) * | 2005-12-23 | 2007-06-28 | Phonak Ag | System and method for separation of a user's voice from ambient sound |
-
2007
- 2007-02-15 JP JP2007035410A patent/JP4449987B2/ja not_active Expired - Fee Related
-
2008
- 2008-02-13 US US12/069,844 patent/US8422695B2/en active Active
- 2008-02-15 CN CN2008100082947A patent/CN101246690B/zh not_active Expired - Fee Related
-
2013
- 2013-03-07 US US13/788,488 patent/US9762193B2/en active Active
Cited By (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8818805B2 (en) | 2008-11-04 | 2014-08-26 | Sony Corporation | Sound processing apparatus, sound processing method and program |
JP2010112995A (ja) * | 2008-11-04 | 2010-05-20 | Sony Corp | 通話音声処理装置、通話音声処理方法およびプログラム |
JP2010112994A (ja) * | 2008-11-04 | 2010-05-20 | Sony Corp | 音声処理装置、音声処理方法およびプログラム |
JP2010112996A (ja) * | 2008-11-04 | 2010-05-20 | Sony Corp | 音声処理装置、音声処理方法およびプログラム |
US8996367B2 (en) | 2008-11-04 | 2015-03-31 | Sony Corporation | Sound processing apparatus, sound processing method and program |
JP2010187363A (ja) * | 2009-01-16 | 2010-08-26 | Sanyo Electric Co Ltd | 音響信号処理装置及び再生装置 |
WO2011027862A1 (ja) * | 2009-09-04 | 2011-03-10 | 株式会社ニコン | 音声データ合成装置 |
CN102483928A (zh) * | 2009-09-04 | 2012-05-30 | 株式会社尼康 | 声音数据合成装置 |
CN102483928B (zh) * | 2009-09-04 | 2013-09-11 | 株式会社尼康 | 声音数据合成装置 |
JP2011055409A (ja) * | 2009-09-04 | 2011-03-17 | Nikon Corp | 音声データ合成装置 |
JP2011199855A (ja) * | 2010-02-25 | 2011-10-06 | Nec Corp | 携帯機器 |
JP2011203048A (ja) * | 2010-03-25 | 2011-10-13 | Tokyo Electric Power Co Inc:The | 音源位置特定装置および音源位置特定方法 |
JP2014502109A (ja) * | 2010-12-03 | 2014-01-23 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | 到来方向推定から幾何学的な情報の抽出による音取得 |
US9396731B2 (en) | 2010-12-03 | 2016-07-19 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Sound acquisition via the extraction of geometrical information from direction of arrival estimates |
US10109282B2 (en) | 2010-12-03 | 2018-10-23 | Friedrich-Alexander-Universitaet Erlangen-Nuernberg | Apparatus and method for geometry-based spatial audio coding |
CN112203188A (zh) * | 2020-07-24 | 2021-01-08 | 北京工业大学 | 一种自动音量调节方法 |
Also Published As
Publication number | Publication date |
---|---|
US20080199152A1 (en) | 2008-08-21 |
US8422695B2 (en) | 2013-04-16 |
CN101246690A (zh) | 2008-08-20 |
US20130182857A1 (en) | 2013-07-18 |
CN101246690B (zh) | 2011-07-13 |
US9762193B2 (en) | 2017-09-12 |
JP4449987B2 (ja) | 2010-04-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4449987B2 (ja) | 音声処理装置、音声処理方法およびプログラム | |
US8165416B2 (en) | Automatic gain and exposure control using region of interest detection | |
JP4952698B2 (ja) | 音声処理装置、音声処理方法およびプログラム | |
JP4441879B2 (ja) | 信号処理装置および方法、プログラム、並びに記録媒体 | |
JP2010187363A (ja) | 音響信号処理装置及び再生装置 | |
US8687090B2 (en) | Method of removing audio noise and image capturing apparatus including the same | |
JP2012027186A (ja) | 音声信号処理装置、音声信号処理方法及びプログラム | |
US9967660B2 (en) | Signal processing apparatus and method | |
JP2003270034A (ja) | 音情報解析方法、装置、プログラム、および記録媒体 | |
CN104937955B (zh) | 自动的扬声器极性检测 | |
JP2011101110A (ja) | 撮像装置 | |
US10535363B2 (en) | Audio processing apparatus and control method thereof | |
CN108781310A (zh) | 使用视频的图像来选择要增强的视频的音频流 | |
US20220260664A1 (en) | Audio processing | |
US20060012831A1 (en) | Electronic watermarking method and storage medium for storing electronic watermarking program | |
JP7247338B2 (ja) | パノラマ画像 | |
US11889260B2 (en) | Determination of sound source direction | |
JP3739673B2 (ja) | ズーム推定方法、装置、ズーム推定プログラム、および同プログラムを記録した記録媒体 | |
CN104079822B (zh) | 摄像装置、信号处理装置及方法 | |
JP4495704B2 (ja) | 音像定位強調再生方法、及びその装置とそのプログラムと、その記憶媒体 | |
US11363374B2 (en) | Signal processing apparatus, method of controlling signal processing apparatus, and non-transitory computer-readable storage medium | |
EP3706432A1 (en) | Processing multiple spatial audio signals which have a spatial overlap | |
JP2008022069A (ja) | 音声収録装置および音声収録方法 | |
JP6167483B2 (ja) | 再生処理装置、撮像装置および再生処理プログラム | |
JP2010091974A (ja) | 再生装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080922 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080922 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20090120 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090203 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090406 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090512 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090709 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090908 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20091028 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100105 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100118 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 4449987 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130205 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130205 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140205 Year of fee payment: 4 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |