JP6395558B2 - 第1の録音装置、第2の録音装置、録音システム、第1の録音方法、第2の録音方法、第1の録音プログラム、および第2の録音プログラム - Google Patents
第1の録音装置、第2の録音装置、録音システム、第1の録音方法、第2の録音方法、第1の録音プログラム、および第2の録音プログラム Download PDFInfo
- Publication number
- JP6395558B2 JP6395558B2 JP2014214421A JP2014214421A JP6395558B2 JP 6395558 B2 JP6395558 B2 JP 6395558B2 JP 2014214421 A JP2014214421 A JP 2014214421A JP 2014214421 A JP2014214421 A JP 2014214421A JP 6395558 B2 JP6395558 B2 JP 6395558B2
- Authority
- JP
- Japan
- Prior art keywords
- analysis
- data
- recording
- sound
- ranges
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims description 211
- 238000004458 analytical method Methods 0.000 claims description 499
- 230000008569 process Effects 0.000 claims description 162
- 238000004891 communication Methods 0.000 claims description 123
- 238000012545 processing Methods 0.000 claims description 92
- 238000001914 filtration Methods 0.000 claims description 43
- 230000005540 biological transmission Effects 0.000 claims description 21
- 238000004364 calculation method Methods 0.000 description 69
- 238000005070 sampling Methods 0.000 description 46
- 238000006243 chemical reaction Methods 0.000 description 20
- 238000001514 detection method Methods 0.000 description 16
- 238000013139 quantization Methods 0.000 description 14
- 230000006870 function Effects 0.000 description 13
- 238000001228 spectrum Methods 0.000 description 8
- 230000004044 response Effects 0.000 description 6
- 238000010606 normalization Methods 0.000 description 5
- 238000013461 design Methods 0.000 description 4
- 230000005236 sound signal Effects 0.000 description 4
- 230000007423 decrease Effects 0.000 description 3
- 230000003247 decreasing effect Effects 0.000 description 3
- 230000009467 reduction Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 206010011224 Cough Diseases 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
- H04R3/005—Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L21/0232—Processing in the frequency domain
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
- G10L25/60—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for measuring the quality of voice signals
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R1/00—Details of transducers, loudspeakers or microphones
- H04R1/20—Arrangements for obtaining desired frequency or directional characteristics
- H04R1/32—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
- H04R1/40—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers
- H04R1/406—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers microphones
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
- H04R3/04—Circuits for transducers, loudspeakers or microphones for correcting frequency response
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L2021/02161—Number of inputs available containing the signal or the noise to be suppressed
- G10L2021/02166—Microphone arrays; Beamforming
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2420/00—Details of connection covered by H04R, not provided for in its groups
- H04R2420/07—Applications of wireless loudspeakers or wireless microphones
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2430/00—Signal processing covered by H04R, not provided for in its groups
- H04R2430/03—Synergistic effects of band splitting and sub-band processing
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Health & Medical Sciences (AREA)
- Otolaryngology (AREA)
- Quality & Reliability (AREA)
- Computational Linguistics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- General Health & Medical Sciences (AREA)
- Circuit For Audible Band Transducer (AREA)
- Signal Processing For Digital Recording And Reproducing (AREA)
Description
以下、図面を参照し、本発明の実施形態を説明する。図1は、本発明の実施形態の録音システム10の構成を示している。図1に示すように、録音システム10は、第1の録音装置101と第2の録音装置102とを有する。第1の録音装置101と第2の録音装置102とは、会議および講演会などにおける話者の声、音楽イベントおよび楽器演奏などで演者が演奏する音楽などの様々な音声を記録する。また、第1の録音装置101と第2の録音装置102とは、他の通信端末との間でデータ通信を行う。
図2は第1の録音装置101の構成を示している。図2に示すように、第1の録音装置101は、第1のマイク部201と、第1のA/D変換部202と、第1のフィルタ処理部203と、第1の周波数解析部204と、第1の表示部205と、第1の制御部206と、第1の音声品質決定部207と、第1のメモリ208と、第1のクロック発生部209と、第1の記録部210と、第1の通信部211と、第1の入力部212と、雑音帯域検出部213と、時刻差分算出部214と、条件決定部215とを有する。
図3は第2の録音装置102の構成を示している。図3に示すように、第2の録音装置102は、第2のマイク部301と、第2のA/D変換部302と、第2のフィルタ処理部303と、第2の周波数解析部304と、第2の表示部305と、第2の制御部306と、第2の音声品質決定部307と、第2のメモリ308と、第2のクロック発生部309と、第2の記録部310と、第2の通信部311と、第2の入力部312とを有する。
図4と図5とは、第1の録音装置101が行う全体処理の手順を示している。図6と図7とは、第2の録音装置102が行う全体処理の手順を示している。以下では第1の例と第2の例とを説明する。図4と図6とが第1の例に対応する。図5と図7とが第2の例に対応する。
図4は、第1の例における第1の録音装置101が行う全体処理の手順を示している。第1の通信部211は第2の録音装置102との間でネットワーク接続を行う(ステップS401)。これによって、第1の録音装置101と第2の録音装置102とは、互いにデータ通信可能な状態になる。例えば、無線LANを介して無線ネットワーク接続が行われる場合、第1の録音装置101には第2の録音装置102と共通のネットワーク情報が設定されている。第1の通信部211は、そのネットワーク情報に基づいて無線ネットワーク接続を行う。
図5は、第2の例における第1の録音装置101が行う全体処理の手順を示している。図4に示す処理では、録音処理の直前に録音時の第1の音声品質が決定される。しかし、第1の録音装置101に対して録音時の第1の音声品質が予め設定されている場合がある。つまり、第1の録音装置101は単独でも録音装置として使用することができるため、録音時の第1の音声品質が既に設定されている場合がある。この場合の処理について図5を用いて説明する。
図12は、第1の録音装置101が行う第1の録音処理の手順を示している。第1の録音装置101は、第1の録音処理において、複数の独立した処理を並行的に実行する。一部の処理は、第1の音声の入力と第1の音声データの生成とを含む第1の音声入力処理である。残りの処理は、第1の音声データに対する処理である。これらの処理はマルチタスクで、かつ非同期に実行される。
R = (データ列Xとデータ列Yとの共分散変数) / (データ列Xの標準偏差 × データ列Yの標準偏差) ・・・(1)
図13は、第2の録音装置102が行う第2の録音処理の手順を示している。第2の録音装置102は、第2の録音処理において、複数の独立した処理を並行的に実行する。一部の処理は、第2の音声の入力と第2の音声データの生成とを含む第2の音声入力処理である。残りの処理は、第2の音声データに対する処理である。これらの処理はマルチタスクで、かつ非同期に実行される。
図16を参照し、解析データ量調整処理について説明する。第1の周波数解析部204または第2の周波数解析部304は、デジタルデータに対して周波数解析を行うときのフーリエ変換に伴う計算時間を算出する(ステップS1601)。周波数解析に高速フーリエ変換(FFT)が使用される場合、データ量がNであるデータに対する計算回数は2Nlog2Nにより求まる。例えば、CPUが演算を行い、CPUクロックが1GHzである場合、1命令の実行時間は1nsである。例えば、高速フーリエ変換の計算に20命令が必要である場合、1回の計算時間は20nsである。デジタルデータが、48kHzのサンプリング周波数で1秒間に取得されたデータである場合、高速フーリエ変換の計算回数は、上記の式により1492872回となる。この計算時間は約300msである。
101 第1の録音装置
102 第2の録音装置
201 第1のマイク部
202 第1のA/D変換部
203 第1のフィルタ処理部
204 第1の周波数解析部
205 第1の表示部
206 第1の制御部
207 第1の音声品質決定部
208 第1のメモリ
209 第1のクロック発生部
210 第1の記録部
211 第1の通信部
212 第1の入力部
213 雑音帯域検出部
214 時刻差分算出部
215 条件決定部
216 第1の音声入力部
301 第2のマイク部
302 第2のA/D変換部
303 第2のフィルタ処理部
304 第2の周波数解析部
305 第2の表示部
306 第2の制御部
307 第2の音声品質決定部
308 第2のメモリ
309 第2のクロック発生部
310 第2の記録部
311 第2の通信部
312 第2の入力部
313 第2の音声入力部
Claims (10)
- 第1の録音装置であって、
第1の音声が入力され、入力された前記第1の音声から第1の音声データを生成する第1の音声入力部と、
第1の通信部と、
前記第1の音声データに対する第1の周波数解析を複数の解析範囲毎に行い、前記第1の周波数解析の結果を示す第1の結果情報を前記複数の解析範囲毎に生成する第1の周波数解析部と、
第1の開始位置と第2の開始位置とを決定し、前記第1の音声データにおける第1の音声品質を考慮して前記解析範囲を決定し、前記第1の開始位置は、前記第1の周波数解析が開始される前記第1の音声データの位置であり、前記第2の開始位置は、第2の周波数解析が開始される第2の音声データの位置である条件決定部と、
前記第1の結果情報と第2の結果情報とに基づいて、雑音帯域を前記複数の解析範囲毎に検出する雑音帯域検出部と、
前記雑音帯域のデータをフィルタリングする第1のフィルタを前記複数の解析範囲毎に生成し、前記第1のフィルタによる第1のフィルタ処理を前記第1の音声データに前記複数の解析範囲毎に施し、第3の音声データを生成する第1のフィルタ処理部と、
前記第3の音声データを記録する第1の記録部と、
を有し、
前記第1の通信部は、前記第2の開始位置と前記解析範囲とに関する情報を第2の録音装置に送信し、
前記第1の通信部はさらに、前記第2の結果情報を前記複数の解析範囲毎に前記第2の録音装置から受信し、
前記第1の通信部はさらに、前記雑音帯域に関する情報を前記複数の解析範囲毎に前記第2の録音装置に送信し、
前記第2の録音装置は、第2の音声から前記第2の音声データを生成し、前記第2の音声データに対する前記第2の周波数解析を前記複数の解析範囲毎に行い、前記第2の周波数解析の結果を示す前記第2の結果情報を前記複数の解析範囲毎に生成し、前記雑音帯域のデータをフィルタリングする第2のフィルタを前記複数の解析範囲毎に生成し、前記第2のフィルタによる第2のフィルタ処理を前記第2の音声データに前記複数の解析範囲毎に施し、第4の音声データを前記複数の解析範囲毎に生成する
第1の録音装置。 - 前記第1の音声品質に基づいて、前記第2の音声データにおける第2の音声品質を決定し、前記第2の音声品質は前記第1の音声品質と異なる第1の音声品質決定部をさらに有し、
前記第1の通信部はさらに、前記第2の音声品質に関する音声品質情報を前記第2の録音装置に送信する
請求項1に記載の第1の録音装置。 - 前記第1の音声データと前記第2の音声データとを比較する比較処理により前記第1の音声と前記第2の音声との位相差を検出し、検出された前記位相差に基づいて前記第1の録音装置と前記第2の録音装置とのシステム時刻の差分を算出する時刻差分算出部をさらに有し、
前記条件決定部は、前記システム時刻の差分に基づいて前記第1の開始位置と前記第2の開始位置とを決定し、
前記第1の通信部はさらに、前記第2の音声データを第2の録音装置から受信する
請求項1に記載の第1の録音装置。 - 第2の録音装置であって、
第2の音声が入力され、入力された前記第2の音声から第2の音声データを生成する第2の音声入力部と、
第2の通信部と、
前記第2の音声データに対する第2の周波数解析を複数の解析範囲毎に行い、前記第2の周波数解析の結果を示す第2の結果情報を前記複数の解析範囲毎に生成する第2の周波数解析部と、
雑音帯域のデータをフィルタリングする第2のフィルタを前記複数の解析範囲毎に生成し、前記第2のフィルタによる第2のフィルタ処理を前記第2の音声データに前記複数の解析範囲毎に施し、第4の音声データを前記複数の解析範囲毎に生成する第2のフィルタ処理部と、
前記第4の音声データを記録する第2の記録部と、
を有し、
前記第2の通信部はさらに、第2の開始位置と前記解析範囲とに関する情報を第1の録音装置から受信し、
前記第2の通信部はさらに、前記第2の結果情報を前記複数の解析範囲毎に前記第1の録音装置に送信し、
前記第2の通信部はさらに、前記雑音帯域に関する情報を前記複数の解析範囲毎に前記第1の録音装置から受信し、
前記第1の録音装置は、第1の音声から第1の音声データを生成し、第1の音声データに対する第1の周波数解析を前記複数の解析範囲毎に行い、前記第1の周波数解析の結果を示す第1の結果情報を前記複数の解析範囲毎に生成し、第1の開始位置と前記第2の開始位置とを決定し、前記第1の音声データにおける第1の音声品質を考慮して前記解析範囲を決定し、前記第1の結果情報と前記第2の結果情報とに基づいて、前記雑音帯域を前記複数の解析範囲毎に検出し、前記雑音帯域のデータをフィルタリングする第1のフィルタを前記複数の解析範囲毎に生成し、前記第1のフィルタによる第1のフィルタ処理を前記第1の音声データに前記複数の解析範囲毎に施し、第3の音声データを前記複数の解析範囲毎に生成し、
前記第1の開始位置は、前記第1の周波数解析が開始される前記第1の音声データの位置であり、前記第2の開始位置は、前記第2の周波数解析が開始される前記第2の音声データの位置である
第2の録音装置。 - 音声品質情報に基づいて前記第2の音声データにおける第2の音声品質を決定する第2の音声品質決定部をさらに有し、
前記第2の通信部はさらに、前記音声品質情報を前記第1の録音装置から受信する
請求項4に記載の第2の録音装置。 - 第1の録音装置と第2の録音装置とを有する録音システムであって、
前記第1の録音装置は、
第1の音声が入力され、入力された前記第1の音声から第1の音声データを生成する第1の音声入力部と、
第1の通信部と、
前記第1の音声データに対する第1の周波数解析を複数の解析範囲毎に行い、前記第1の周波数解析の結果を示す第1の結果情報を前記複数の解析範囲毎に生成する第1の周波数解析部と、
第1の開始位置と第2の開始位置とを決定し、前記第1の音声データにおける第1の音声品質を考慮して前記解析範囲を決定し、前記第1の開始位置は、前記第1の周波数解析が開始される前記第1の音声データの位置であり、前記第2の開始位置は、第2の周波数解析が開始される第2の音声データの位置である条件決定部と、
前記第1の結果情報と第2の結果情報とに基づいて、雑音帯域を前記複数の解析範囲毎に検出する雑音帯域検出部と、
前記雑音帯域のデータをフィルタリングする第1のフィルタを前記複数の解析範囲毎に生成し、前記第1のフィルタによる第1のフィルタ処理を前記第1の音声データに前記複数の解析範囲毎に施し、第3の音声データを生成する第1のフィルタ処理部と、
前記第3の音声データを記録する第1の記録部と、
を有し、
前記第1の通信部は、前記第2の開始位置と前記解析範囲とに関する情報を前記第2の録音装置に送信し、
前記第1の通信部はさらに、前記第2の結果情報を前記複数の解析範囲毎に前記第2の録音装置から受信し、
前記第1の通信部はさらに、前記雑音帯域に関する情報を前記複数の解析範囲毎に前記第2の録音装置に送信し、
前記第2の録音装置は、
第2の音声が入力され、入力された前記第2の音声から前記第2の音声データを生成する第2の音声入力部と、
第2の通信部と、
前記第2の音声データに対する前記第2の周波数解析を複数の解析範囲毎に行い、前記第2の周波数解析の結果を示す第2の結果情報を前記複数の解析範囲毎に生成する第2の周波数解析部と、
前記雑音帯域のデータをフィルタリングする第2のフィルタを前記複数の解析範囲毎に生成し、前記第2のフィルタによる第2のフィルタ処理を前記第2の音声データに前記複数の解析範囲毎に施し、第4の音声データを前記複数の解析範囲毎に生成する第2のフィルタ処理部と、
前記第4の音声データを記録する第2の記録部と、
を有し、
前記第2の通信部は、前記第2の開始位置と前記解析範囲とに関する情報を前記第1の録音装置から受信し、
前記第2の通信部はさらに、前記第2の結果情報を前記複数の解析範囲毎に前記第1の録音装置に送信し、
前記第2の通信部はさらに、前記雑音帯域に関する情報を前記複数の解析範囲毎に前記第1の録音装置から受信する
録音システム。 - 第1の録音装置が行う第1の録音方法であって、
第1の音声が入力され、入力された前記第1の音声から第1の音声データを生成する第1の音声入力ステップと、
前記第1の音声データに対する第1の周波数解析を複数の解析範囲毎に行い、前記第1の周波数解析の結果を示す第1の結果情報を前記複数の解析範囲毎に生成する第1の周波数解析ステップと、
第1の開始位置と第2の開始位置とを決定し、前記第1の音声データにおける第1の音声品質を考慮して前記解析範囲を決定し、前記第1の開始位置は、前記第1の周波数解析が開始される前記第1の音声データの位置であり、前記第2の開始位置は、第2の周波数解析が開始される第2の音声データの位置である条件決定ステップと、
前記第1の結果情報と第2の結果情報とに基づいて、雑音帯域を前記複数の解析範囲毎に検出する雑音帯域検出ステップと、
前記雑音帯域のデータをフィルタリングする第1のフィルタを前記複数の解析範囲毎に生成し、前記第1のフィルタによる第1のフィルタ処理を前記第1の音声データに前記複数の解析範囲毎に施し、第3の音声データを生成する第1のフィルタ処理ステップと、
前記第3の音声データを記録する第1の記録ステップと、
前記第2の開始位置と前記解析範囲とに関する情報を第2の録音装置に送信する第1の送信ステップと、
前記第2の結果情報を前記複数の解析範囲毎に前記第2の録音装置から受信する受信ステップと、
前記雑音帯域に関する情報を前記複数の解析範囲毎に前記第2の録音装置に送信する第2の送信ステップと、
を有し、
前記第2の録音装置は、第2の音声から前記第2の音声データを生成し、前記第2の音声データに対する前記第2の周波数解析を前記複数の解析範囲毎に行い、前記第2の周波数解析の結果を示す前記第2の結果情報を前記複数の解析範囲毎に生成し、前記雑音帯域のデータをフィルタリングする第2のフィルタを前記複数の解析範囲毎に生成し、前記第2のフィルタによる第2のフィルタ処理を前記第2の音声データに前記複数の解析範囲毎に施し、第4の音声データを前記複数の解析範囲毎に生成する
第1の録音方法。 - 第2の録音装置が行う第2の録音方法であって、
第2の音声が入力され、入力された前記第2の音声から第2の音声データを生成する第2の音声入力ステップと、
前記第2の音声データに対する第2の周波数解析を複数の解析範囲毎に行い、前記第2の周波数解析の結果を示す第2の結果情報を前記複数の解析範囲毎に生成する第2の周波数解析ステップと、
雑音帯域のデータをフィルタリングする第2のフィルタを前記複数の解析範囲毎に生成し、前記第2のフィルタによる第2のフィルタ処理を前記第2の音声データに前記複数の解析範囲毎に施し、第4の音声データを前記複数の解析範囲毎に生成する第2のフィルタ処理ステップと、
前記第4の音声データを記録する第2の記録ステップと、
第2の開始位置と前記解析範囲とに関する情報を第1の録音装置から受信する第1の受信ステップと、
前記第2の結果情報を前記複数の解析範囲毎に前記第1の録音装置に送信する送信ステップと、
前記雑音帯域に関する情報を前記複数の解析範囲毎に前記第1の録音装置から受信する第2の受信ステップと、
を有し、
前記第1の録音装置は、第1の音声から第1の音声データを生成し、第1の音声データに対する第1の周波数解析を前記複数の解析範囲毎に行い、前記第1の周波数解析の結果を示す第1の結果情報を前記複数の解析範囲毎に生成し、第1の開始位置と前記第2の開始位置とを決定し、前記第1の音声データにおける第1の音声品質を考慮して前記解析範囲を決定し、前記第1の結果情報と前記第2の結果情報とに基づいて、前記雑音帯域を前記複数の解析範囲毎に検出し、前記雑音帯域のデータをフィルタリングする第1のフィルタを前記複数の解析範囲毎に生成し、前記第1のフィルタによる第1のフィルタ処理を前記第1の音声データに前記複数の解析範囲毎に施し、第3の音声データを前記複数の解析範囲毎に生成し、
前記第1の開始位置は、前記第1の周波数解析が開始される前記第1の音声データの位置であり、前記第2の開始位置は、前記第2の周波数解析が開始される前記第2の音声データの位置である
第2の録音方法。 - 第1の録音装置のコンピュータに、
第1の音声が入力され、入力された前記第1の音声から第1の音声データを生成する第1の音声入力ステップと、
前記第1の音声データに対する第1の周波数解析を複数の解析範囲毎に行い、前記第1の周波数解析の結果を示す第1の結果情報を前記複数の解析範囲毎に生成する第1の周波数解析ステップと、
第1の開始位置と第2の開始位置とを決定し、前記第1の音声データにおける第1の音声品質を考慮して前記解析範囲を決定し、前記第1の開始位置は、前記第1の周波数解析が開始される前記第1の音声データの位置であり、前記第2の開始位置は、第2の周波数解析が開始される第2の音声データの位置である条件決定ステップと、
前記第1の結果情報と第2の結果情報とに基づいて、雑音帯域を前記複数の解析範囲毎に検出する雑音帯域検出ステップと、
前記雑音帯域のデータをフィルタリングする第1のフィルタを前記複数の解析範囲毎に生成し、前記第1のフィルタによる第1のフィルタ処理を前記第1の音声データに前記複数の解析範囲毎に施し、第3の音声データを生成する第1のフィルタ処理ステップと、
前記第3の音声データを記録する第1の記録ステップと、
前記第2の開始位置と前記解析範囲とに関する情報を第2の録音装置に送信する第1の送信ステップと、
前記第2の結果情報を前記複数の解析範囲毎に前記第2の録音装置から受信する受信ステップと、
前記雑音帯域に関する情報を前記複数の解析範囲毎に前記第2の録音装置に送信する第2の送信ステップと、
を実行させるための第1の録音プログラムであって、
前記第2の録音装置は、第2の音声から前記第2の音声データを生成し、前記第2の音声データに対する前記第2の周波数解析を前記複数の解析範囲毎に行い、前記第2の周波数解析の結果を示す前記第2の結果情報を前記複数の解析範囲毎に生成し、前記雑音帯域のデータをフィルタリングする第2のフィルタを前記複数の解析範囲毎に生成し、前記第2のフィルタによる第2のフィルタ処理を前記第2の音声データに前記複数の解析範囲毎に施し、第4の音声データを前記複数の解析範囲毎に生成する
第1の録音プログラム。 - 第2の録音装置のコンピュータに、
第2の音声が入力され、入力された前記第2の音声から第2の音声データを生成する第2の音声入力ステップと、
前記第2の音声データに対する第2の周波数解析を複数の解析範囲毎に行い、前記第2の周波数解析の結果を示す第2の結果情報を前記複数の解析範囲毎に生成する第2の周波数解析ステップと、
雑音帯域のデータをフィルタリングする第2のフィルタを前記複数の解析範囲毎に生成し、前記第2のフィルタによる第2のフィルタ処理を前記第2の音声データに前記複数の解析範囲毎に施し、第4の音声データを前記複数の解析範囲毎に生成する第2のフィルタ処理ステップと、
前記第4の音声データを記録する第2の記録ステップと、
第2の開始位置と前記解析範囲とに関する情報を第1の録音装置から受信する第1の受信ステップと、
前記第2の結果情報を前記複数の解析範囲毎に前記第1の録音装置に送信する送信ステップと、
前記雑音帯域に関する情報を前記複数の解析範囲毎に前記第1の録音装置から受信する第2の受信ステップと、
を実行させるための第2の録音プログラムであって、
前記第1の録音装置は、第1の音声から第1の音声データを生成し、第1の音声データに対する第1の周波数解析を前記複数の解析範囲毎に行い、前記第1の周波数解析の結果を示す第1の結果情報を前記複数の解析範囲毎に生成し、第1の開始位置と前記第2の開始位置とを決定し、前記第1の音声データにおける第1の音声品質を考慮して前記解析範囲を決定し、前記第1の結果情報と前記第2の結果情報とに基づいて、前記雑音帯域を前記複数の解析範囲毎に検出し、前記雑音帯域のデータをフィルタリングする第1のフィルタを前記複数の解析範囲毎に生成し、前記第1のフィルタによる第1のフィルタ処理を前記第1の音声データに前記複数の解析範囲毎に施し、第3の音声データを前記複数の解析範囲毎に生成し、
前記第1の開始位置は、前記第1の周波数解析が開始される前記第1の音声データの位置であり、前記第2の開始位置は、前記第2の周波数解析が開始される前記第2の音声データの位置である
第2の録音プログラム。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014214421A JP6395558B2 (ja) | 2014-10-21 | 2014-10-21 | 第1の録音装置、第2の録音装置、録音システム、第1の録音方法、第2の録音方法、第1の録音プログラム、および第2の録音プログラム |
PCT/JP2015/075855 WO2016063651A1 (ja) | 2014-10-21 | 2015-09-11 | 第1の録音装置、第2の録音装置、録音システム、第1の録音方法、第2の録音方法、第1の録音プログラム、および第2の録音プログラム |
US15/489,012 US10356518B2 (en) | 2014-10-21 | 2017-04-17 | First recording device, second recording device, recording system, first recording method, second recording method, first computer program product, and second computer program product |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014214421A JP6395558B2 (ja) | 2014-10-21 | 2014-10-21 | 第1の録音装置、第2の録音装置、録音システム、第1の録音方法、第2の録音方法、第1の録音プログラム、および第2の録音プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2016080968A JP2016080968A (ja) | 2016-05-16 |
JP6395558B2 true JP6395558B2 (ja) | 2018-09-26 |
Family
ID=55760696
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014214421A Expired - Fee Related JP6395558B2 (ja) | 2014-10-21 | 2014-10-21 | 第1の録音装置、第2の録音装置、録音システム、第1の録音方法、第2の録音方法、第1の録音プログラム、および第2の録音プログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US10356518B2 (ja) |
JP (1) | JP6395558B2 (ja) |
WO (1) | WO2016063651A1 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111145770B (zh) * | 2018-11-02 | 2022-11-22 | 北京微播视界科技有限公司 | 音频处理方法和装置 |
CN109545242A (zh) * | 2018-12-07 | 2019-03-29 | 广州势必可赢网络科技有限公司 | 一种音频数据处理方法、系统、装置及可读存储介质 |
CN110189771A (zh) * | 2019-05-31 | 2019-08-30 | 腾讯音乐娱乐科技(深圳)有限公司 | 同源音频的音质检测方法、装置及存储介质 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06110455A (ja) * | 1992-09-25 | 1994-04-22 | Mitsubishi Electric Corp | オーディオ信号の符号化/復号化方法およびこの方法を用いたオーディオ再生装置 |
JP2002258895A (ja) * | 2001-03-05 | 2002-09-11 | Korg Inc | 多チャンネル録音再生装置 |
US20040078199A1 (en) * | 2002-08-20 | 2004-04-22 | Hanoh Kremer | Method for auditory based noise reduction and an apparatus for auditory based noise reduction |
US7454331B2 (en) * | 2002-08-30 | 2008-11-18 | Dolby Laboratories Licensing Corporation | Controlling loudness of speech in signals that contain speech and other types of audio material |
US7464029B2 (en) * | 2005-07-22 | 2008-12-09 | Qualcomm Incorporated | Robust separation of speech signals in a noisy environment |
JP6179081B2 (ja) | 2011-09-15 | 2017-08-16 | 株式会社Jvcケンウッド | ノイズ低減装置、音声入力装置、無線通信装置、およびノイズ低減方法 |
JP5705190B2 (ja) * | 2012-11-05 | 2015-04-22 | 日本電信電話株式会社 | 音響信号強調装置、音響信号強調方法、およびプログラム |
JP6278294B2 (ja) * | 2013-03-11 | 2018-02-14 | 大学共同利用機関法人情報・システム研究機構 | 音声信号処理装置及び方法 |
-
2014
- 2014-10-21 JP JP2014214421A patent/JP6395558B2/ja not_active Expired - Fee Related
-
2015
- 2015-09-11 WO PCT/JP2015/075855 patent/WO2016063651A1/ja active Application Filing
-
2017
- 2017-04-17 US US15/489,012 patent/US10356518B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
US10356518B2 (en) | 2019-07-16 |
US20170223453A1 (en) | 2017-08-03 |
JP2016080968A (ja) | 2016-05-16 |
WO2016063651A1 (ja) | 2016-04-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8160270B2 (en) | Method and apparatus for acquiring multi-channel sound by using microphone array | |
EP3320692B1 (en) | Spatial audio processing apparatus | |
JP6074263B2 (ja) | 雑音抑圧装置及びその制御方法 | |
US9538308B2 (en) | Adaptive room equalization using a speaker and a handheld listening device | |
CN110537221A (zh) | 用于空间音频处理的两阶段音频聚焦 | |
EP1954096B1 (en) | Apparatus and method for measuring loudspeaker transfer function with enhanced frequency resolution | |
JP2010233173A (ja) | 信号処理装置、および信号処理方法、並びにプログラム | |
CN106470379B (zh) | 用于基于扬声器位置信息处理音频信号的方法和设备 | |
JP2020500480A (ja) | デバイス内の非対称配列の複数のマイクからの空間メタデータの分析 | |
JP6395558B2 (ja) | 第1の録音装置、第2の録音装置、録音システム、第1の録音方法、第2の録音方法、第1の録音プログラム、および第2の録音プログラム | |
JP2017530396A (ja) | 音源を強調するための方法及び機器 | |
US20220246161A1 (en) | Sound modification based on frequency composition | |
US20160100259A1 (en) | Feedback estimation based on deterministic sequences | |
KR101008250B1 (ko) | 기지 음향신호 제거방법 및 장치 | |
JP2009075160A (ja) | コミュニケーション音声処理方法とその装置、及びそのプログラム | |
US10366703B2 (en) | Method and apparatus for processing audio signal including shock noise | |
KR101850693B1 (ko) | 인-이어 마이크로폰을 갖는 이어셋의 대역폭 확장 장치 및 방법 | |
CN109076283B (zh) | 耳机的音色补偿装置及方法 | |
JP4960838B2 (ja) | 距離測定装置、距離測定方法、距離測定プログラム、および記録媒体 | |
WO2023051622A1 (zh) | 提升远场语音交互性能的方法和远场语音交互系统 | |
CN110301142B (zh) | 滤波器生成装置、滤波器生成方法以及存储介质 | |
CN109688531B (zh) | 获取高音质音频变换信息的方法、电子装置及记录介质 | |
JP4746498B2 (ja) | 単一指向性マイクロホン | |
JP6018141B2 (ja) | オーディオ信号処理装置、オーディオ信号処理方法およびオーディオ信号処理プログラム | |
Zhidkov | Statistical characterization and modeling of noise effects in near-ultrasound aerial acoustic communications |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20170822 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20180807 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20180828 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 6395558 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |