JP6395558B2 - 第1の録音装置、第2の録音装置、録音システム、第1の録音方法、第2の録音方法、第1の録音プログラム、および第2の録音プログラム - Google Patents

第1の録音装置、第2の録音装置、録音システム、第1の録音方法、第2の録音方法、第1の録音プログラム、および第2の録音プログラム Download PDF

Info

Publication number
JP6395558B2
JP6395558B2 JP2014214421A JP2014214421A JP6395558B2 JP 6395558 B2 JP6395558 B2 JP 6395558B2 JP 2014214421 A JP2014214421 A JP 2014214421A JP 2014214421 A JP2014214421 A JP 2014214421A JP 6395558 B2 JP6395558 B2 JP 6395558B2
Authority
JP
Japan
Prior art keywords
analysis
data
recording
sound
ranges
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2014214421A
Other languages
English (en)
Other versions
JP2016080968A (ja
Inventor
龍一 清重
龍一 清重
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Olympus Corp
Original Assignee
Olympus Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Olympus Corp filed Critical Olympus Corp
Priority to JP2014214421A priority Critical patent/JP6395558B2/ja
Priority to PCT/JP2015/075855 priority patent/WO2016063651A1/ja
Publication of JP2016080968A publication Critical patent/JP2016080968A/ja
Priority to US15/489,012 priority patent/US10356518B2/en
Application granted granted Critical
Publication of JP6395558B2 publication Critical patent/JP6395558B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/005Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0232Processing in the frequency domain
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • G10L25/60Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for measuring the quality of voice signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/20Arrangements for obtaining desired frequency or directional characteristics
    • H04R1/32Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
    • H04R1/40Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers
    • H04R1/406Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/04Circuits for transducers, loudspeakers or microphones for correcting frequency response
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L2021/02161Number of inputs available containing the signal or the noise to be suppressed
    • G10L2021/02166Microphone arrays; Beamforming
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2420/00Details of connection covered by H04R, not provided for in its groups
    • H04R2420/07Applications of wireless loudspeakers or wireless microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2430/00Signal processing covered by H04R, not provided for in its groups
    • H04R2430/03Synergistic effects of band splitting and sub-band processing

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Health & Medical Sciences (AREA)
  • Otolaryngology (AREA)
  • Quality & Reliability (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • General Health & Medical Sciences (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)

Description

本発明は、複数の録音装置を用いて録音を行う技術に関する。
楽器教室の発表会のような小規模な演奏会などでICレコーダーを使用した録音が行われることがある。観客席においてICレコーダーのマイクがステージ上の演者に向けられ、録音が行われる。このとき、演者の演奏のみがクリアに録音されるように、指向性を有するズーム機能が使用される。
しかし、ICレコーダーに内蔵されているマイクの性能では、完全な指向性を得ることが難しい。例えば、観客がパンフレットを開く音または咳の音などの雑音が所望の音声に混入することがある。このため、良好な録音結果を得ることが難しい。
一般的な指向性マイクの原理について説明する。指向性マイクは複数のマイクで構成されている。複数のマイクは、録音の対象である音声を発生する音源の方向と、その反対の方向とへそれぞれ向けられて配置されている。音源の方向からの音声に対して、音源方向の反対の方向からの音声の位相を反転してその音声を重ね合わせることにより、音源からの音声以外の音声が打ち消される。
マイクの指向性をより高めるためには音波の伝播特性などを考慮した高度な設計が必要である。各マイクが適切な位置に配置されなければ高い性能を得ることが難しい。このため、装置の大きさ、形状、各マイクの配置などの設計の自由度が制限される。これらの条件により、高い指向性を得るための設計と製作とのコストが大きい。このため、一般的に、高い性能を持つ指向性マイク機能は、特定の用途に使用されるプロ用のICレコーダーに実装されている。一方、プロ以外のユーザが使用する汎用的なICレコーダーには、ズームマイクと呼ばれる指向性マイク機能が実装されている。しかし、コスト、汎用性、持ち運びの利便性などのバランスを保つために、高い指向性を得るマイクは実装されていない。
特許文献1では、音声信号に含まれるノイズ成分を低減する方法が開示されている。特許文献1に開示された方法では、装置が備える複数のマイクによって得られる音声信号の位相差を利用することにより、主となる音声用マイクと、雑音を集音する参照用マイクとが決定される。
特開2013−78118号公報
しかしながら、特許文献1に開示された方法では、音声用マイクと参照用マイクとを決定するためには、位相差が発生する間隔で複数のマイクが配置される必要がある。したがって装置設計の自由度が低い。また、音声用マイクと参照用マイクとはノイズ低減装置の一部であり、各マイクが独立しているシステムにおいてノイズ低減を行う方法は開示されていない。
本発明は、複数の独立した録音装置が存在するシステムにおいて、雑音が低減された2つの音声データを得ることができる技術を提供する。
本発明は、第1の録音装置であって、第1の音声が入力され、入力された前記第1の音声から第1の音声データを生成する第1の音声入力部と、第1の通信部と、前記第1の音声データに対する第1の周波数解析を複数の解析範囲毎に行い、前記第1の周波数解析の結果を示す第1の結果情報を前記複数の解析範囲毎に生成する第1の周波数解析部と、第1の開始位置と第2の開始位置とを決定し、前記第1の音声データにおける第1の音声品質を考慮して前記解析範囲を決定し、前記第1の開始位置は、前記第1の周波数解析が開始される前記第1の音声データの位置であり、前記第2の開始位置は、第2の周波数解析が開始される第2の音声データの位置である条件決定部と、前記第1の結果情報と第2の結果情報とに基づいて、雑音帯域を前記複数の解析範囲毎に検出する雑音帯域検出部と、前記雑音帯域のデータをフィルタリングする第1のフィルタを前記複数の解析範囲毎に生成し、前記第1のフィルタによる第1のフィルタ処理を前記第1の音声データに前記複数の解析範囲毎に施し、第3の音声データを生成する第1のフィルタ処理部と、前記第3の音声データを記録する第1の記録部と、を有し、前記第1の通信部は、前記第2の開始位置と前記解析範囲とに関する情報を第2の録音装置に送信し、前記第1の通信部はさらに、前記第2の結果情報を前記複数の解析範囲毎に前記第2の録音装置から受信し、前記第1の通信部はさらに、前記雑音帯域に関する情報を前記複数の解析範囲毎に前記第2の録音装置に送信し、前記第2の録音装置は、第2の音声から前記第2の音声データを生成し、前記第2の音声データに対する前記第2の周波数解析を前記複数の解析範囲毎に行い、前記第2の周波数解析の結果を示す前記第2の結果情報を前記複数の解析範囲毎に生成し、前記雑音帯域のデータをフィルタリングする第2のフィルタを前記複数の解析範囲毎に生成し、前記第2のフィルタによる第2のフィルタ処理を前記第2の音声データに前記複数の解析範囲毎に施し、第4の音声データを前記複数の解析範囲毎に生成する第1の録音装置である。
また、本発明は、第2の録音装置であって、第2の音声が入力され、入力された前記第2の音声から第2の音声データを生成する第2の音声入力部と、第2の通信部と、前記第2の音声データに対する第2の周波数解析を複数の解析範囲毎に行い、前記第2の周波数解析の結果を示す第2の結果情報を前記複数の解析範囲毎に生成する第2の周波数解析部と、雑音帯域のデータをフィルタリングする第2のフィルタを前記複数の解析範囲毎に生成し、前記第2のフィルタによる第2のフィルタ処理を前記第2の音声データに前記複数の解析範囲毎に施し、第4の音声データを前記複数の解析範囲毎に生成する第2のフィルタ処理部と、前記第4の音声データを記録する第2の記録部と、を有し、前記第2の通信部はさらに、第2の開始位置と前記解析範囲とに関する情報を第1の録音装置から受信し、前記第2の通信部はさらに、前記第2の結果情報を前記複数の解析範囲毎に前記第1の録音装置に送信し、前記第2の通信部はさらに、前記雑音帯域に関する情報を前記複数の解析範囲毎に前記第1の録音装置から受信し、前記第1の録音装置は、第1の音声から第1の音声データを生成し、第1の音声データに対する第1の周波数解析を前記複数の解析範囲毎に行い、前記第1の周波数解析の結果を示す第1の結果情報を前記複数の解析範囲毎に生成し、第1の開始位置と前記第2の開始位置とを決定し、前記第1の音声データにおける第1の音声品質を考慮して前記解析範囲を決定し、前記第1の結果情報と前記第2の結果情報とに基づいて、前記雑音帯域を前記複数の解析範囲毎に検出し、前記雑音帯域のデータをフィルタリングする第1のフィルタを前記複数の解析範囲毎に生成し、前記第1のフィルタによる第1のフィルタ処理を前記第1の音声データに前記複数の解析範囲毎に施し、第3の音声データを前記複数の解析範囲毎に生成し、前記第1の開始位置は、前記第1の周波数解析が開始される前記第1の音声データの位置であり、前記第2の開始位置は、前記第2の周波数解析が開始される前記第2の音声データの位置である第2の録音装置である。
また、本発明は、第1の録音装置と第2の録音装置とを有する録音システムであって、前記第1の録音装置は、第1の音声が入力され、入力された前記第1の音声から第1の音声データを生成する第1の音声入力部と、第1の通信部と、前記第1の音声データに対する第1の周波数解析を複数の解析範囲毎に行い、前記第1の周波数解析の結果を示す第1の結果情報を前記複数の解析範囲毎に生成する第1の周波数解析部と、第1の開始位置と第2の開始位置とを決定し、前記第1の音声データにおける第1の音声品質を考慮して前記解析範囲を決定し、前記第1の開始位置は、前記第1の周波数解析が開始される前記第1の音声データの位置であり、前記第2の開始位置は、第2の周波数解析が開始される第2の音声データの位置である条件決定部と、前記第1の結果情報と第2の結果情報とに基づいて、雑音帯域を前記複数の解析範囲毎に検出する雑音帯域検出部と、前記雑音帯域のデータをフィルタリングする第1のフィルタを前記複数の解析範囲毎に生成し、前記第1のフィルタによる第1のフィルタ処理を前記第1の音声データに前記複数の解析範囲毎に施し、第3の音声データを生成する第1のフィルタ処理部と、前記第3の音声データを記録する第1の記録部と、を有し、前記第1の通信部は、前記第2の開始位置と前記解析範囲とに関する情報を前記第2の録音装置に送信し、前記第1の通信部はさらに、前記第2の結果情報を前記複数の解析範囲毎に前記第2の録音装置から受信し、前記第1の通信部はさらに、前記雑音帯域に関する情報を前記複数の解析範囲毎に前記第2の録音装置に送信し、前記第2の録音装置は、第2の音声が入力され、入力された前記第2の音声から前記第2の音声データを生成する第2の音声入力部と、第2の通信部と、前記第2の音声データに対する前記第2の周波数解析を複数の解析範囲毎に行い、前記第2の周波数解析の結果を示す第2の結果情報を前記複数の解析範囲毎に生成する第2の周波数解析部と、前記雑音帯域のデータをフィルタリングする第2のフィルタを前記複数の解析範囲毎に生成し、前記第2のフィルタによる第2のフィルタ処理を前記第2の音声データに前記複数の解析範囲毎に施し、第4の音声データを前記複数の解析範囲毎に生成する第2のフィルタ処理部と、前記第4の音声データを記録する第2の記録部と、を有し、前記第2の通信部は、前記第2の開始位置と前記解析範囲とに関する情報を前記第1の録音装置から受信し、前記第2の通信部はさらに、前記第2の結果情報を前記複数の解析範囲毎に前記第1の録音装置に送信し、前記第2の通信部はさらに、前記雑音帯域に関する情報を前記複数の解析範囲毎に前記第1の録音装置から受信する録音システムである。
また、本発明は、第1の録音装置が行う第1の録音方法であって、第1の音声が入力され、入力された前記第1の音声から第1の音声データを生成する第1の音声入力ステップと、前記第1の音声データに対する第1の周波数解析を複数の解析範囲毎に行い、前記第1の周波数解析の結果を示す第1の結果情報を前記複数の解析範囲毎に生成する第1の周波数解析ステップと、第1の開始位置と第2の開始位置とを決定し、前記第1の音声データにおける第1の音声品質を考慮して前記解析範囲を決定し、前記第1の開始位置は、前記第1の周波数解析が開始される前記第1の音声データの位置であり、前記第2の開始位置は、第2の周波数解析が開始される第2の音声データの位置である条件決定ステップと、前記第1の結果情報と第2の結果情報とに基づいて、雑音帯域を前記複数の解析範囲毎に検出する雑音帯域検出ステップと、前記雑音帯域のデータをフィルタリングする第1のフィルタを前記複数の解析範囲毎に生成し、前記第1のフィルタによる第1のフィルタ処理を前記第1の音声データに前記複数の解析範囲毎に施し、第3の音声データを生成する第1のフィルタ処理ステップと、前記第3の音声データを記録する第1の記録ステップと、前記第2の開始位置と前記解析範囲とに関する情報を第2の録音装置に送信する第1の送信ステップと、前記第2の結果情報を前記複数の解析範囲毎に前記第2の録音装置から受信する受信ステップと、前記雑音帯域に関する情報を前記複数の解析範囲毎に前記第2の録音装置に送信する第2の送信ステップと、を有し、前記第2の録音装置は、第2の音声から前記第2の音声データを生成し、前記第2の音声データに対する前記第2の周波数解析を前記複数の解析範囲毎に行い、前記第2の周波数解析の結果を示す前記第2の結果情報を前記複数の解析範囲毎に生成し、前記雑音帯域のデータをフィルタリングする第2のフィルタを前記複数の解析範囲毎に生成し、前記第2のフィルタによる第2のフィルタ処理を前記第2の音声データに前記複数の解析範囲毎に施し、第4の音声データを前記複数の解析範囲毎に生成する第1の録音方法である。
また、本発明は、第2の録音装置が行う第2の録音方法であって、第2の音声が入力され、入力された前記第2の音声から第2の音声データを生成する第2の音声入力ステップと、前記第2の音声データに対する第2の周波数解析を複数の解析範囲毎に行い、前記第2の周波数解析の結果を示す第2の結果情報を前記複数の解析範囲毎に生成する第2の周波数解析ステップと、雑音帯域のデータをフィルタリングする第2のフィルタを前記複数の解析範囲毎に生成し、前記第2のフィルタによる第2のフィルタ処理を前記第2の音声データに前記複数の解析範囲毎に施し、第4の音声データを前記複数の解析範囲毎に生成する第2のフィルタ処理ステップと、前記第4の音声データを記録する第2の記録ステップと、第2の開始位置と前記解析範囲とに関する情報を第1の録音装置から受信する第1の受信ステップと、前記第2の結果情報を前記複数の解析範囲毎に前記第1の録音装置に送信する送信ステップと、前記雑音帯域に関する情報を前記複数の解析範囲毎に前記第1の録音装置から受信する第2の受信ステップと、を有し、前記第1の録音装置は、第1の音声から第1の音声データを生成し、第1の音声データに対する第1の周波数解析を前記複数の解析範囲毎に行い、前記第1の周波数解析の結果を示す第1の結果情報を前記複数の解析範囲毎に生成し、第1の開始位置と前記第2の開始位置とを決定し、前記第1の音声データにおける第1の音声品質を考慮して前記解析範囲を決定し、前記第1の結果情報と前記第2の結果情報とに基づいて、前記雑音帯域を前記複数の解析範囲毎に検出し、前記雑音帯域のデータをフィルタリングする第1のフィルタを前記複数の解析範囲毎に生成し、前記第1のフィルタによる第1のフィルタ処理を前記第1の音声データに前記複数の解析範囲毎に施し、第3の音声データを前記複数の解析範囲毎に生成し、前記第1の開始位置は、前記第1の周波数解析が開始される前記第1の音声データの位置であり、前記第2の開始位置は、前記第2の周波数解析が開始される前記第2の音声データの位置である第2の録音方法である。
また、本発明は、第1の録音装置のコンピュータに、第1の音声が入力され、入力された前記第1の音声から第1の音声データを生成する第1の音声入力ステップと、前記第1の音声データに対する第1の周波数解析を複数の解析範囲毎に行い、前記第1の周波数解析の結果を示す第1の結果情報を前記複数の解析範囲毎に生成する第1の周波数解析ステップと、第1の開始位置と第2の開始位置とを決定し、前記第1の音声データにおける第1の音声品質を考慮して前記解析範囲を決定し、前記第1の開始位置は、前記第1の周波数解析が開始される前記第1の音声データの位置であり、前記第2の開始位置は、第2の周波数解析が開始される第2の音声データの位置である条件決定ステップと、前記第1の結果情報と第2の結果情報とに基づいて、雑音帯域を前記複数の解析範囲毎に検出する雑音帯域検出ステップと、前記雑音帯域のデータをフィルタリングする第1のフィルタを前記複数の解析範囲毎に生成し、前記第1のフィルタによる第1のフィルタ処理を前記第1の音声データに前記複数の解析範囲毎に施し、第3の音声データを生成する第1のフィルタ処理ステップと、前記第3の音声データを記録する第1の記録ステップと、前記第2の開始位置と前記解析範囲とに関する情報を第2の録音装置に送信する第1の送信ステップと、前記第2の結果情報を前記複数の解析範囲毎に前記第2の録音装置から受信する受信ステップと、前記雑音帯域に関する情報を前記複数の解析範囲毎に前記第2の録音装置に送信する第2の送信ステップと、を実行させるための第1の録音プログラムであって、前記第2の録音装置は、第2の音声から前記第2の音声データを生成し、前記第2の音声データに対する前記第2の周波数解析を前記複数の解析範囲毎に行い、前記第2の周波数解析の結果を示す前記第2の結果情報を前記複数の解析範囲毎に生成し、前記雑音帯域のデータをフィルタリングする第2のフィルタを前記複数の解析範囲毎に生成し、前記第2のフィルタによる第2のフィルタ処理を前記第2の音声データに前記複数の解析範囲毎に施し、第4の音声データを前記複数の解析範囲毎に生成する第1の録音プログラムである。
また、本発明は、第2の録音装置のコンピュータに、第2の音声が入力され、入力された前記第2の音声から第2の音声データを生成する第2の音声入力ステップと、前記第2の音声データに対する第2の周波数解析を複数の解析範囲毎に行い、前記第2の周波数解析の結果を示す第2の結果情報を前記複数の解析範囲毎に生成する第2の周波数解析ステップと、雑音帯域のデータをフィルタリングする第2のフィルタを前記複数の解析範囲毎に生成し、前記第2のフィルタによる第2のフィルタ処理を前記第2の音声データに前記複数の解析範囲毎に施し、第4の音声データを前記複数の解析範囲毎に生成する第2のフィルタ処理ステップと、前記第4の音声データを記録する第2の記録ステップと、第2の開始位置と前記解析範囲とに関する情報を第1の録音装置から受信する第1の受信ステップと、前記第2の結果情報を前記複数の解析範囲毎に前記第1の録音装置に送信する送信ステップと、前記雑音帯域に関する情報を前記複数の解析範囲毎に前記第1の録音装置から受信する第2の受信ステップと、を実行させるための第2の録音プログラムであって、前記第1の録音装置は、第1の音声から第1の音声データを生成し、第1の音声データに対する第1の周波数解析を前記複数の解析範囲毎に行い、前記第1の周波数解析の結果を示す第1の結果情報を前記複数の解析範囲毎に生成し、第1の開始位置と前記第2の開始位置とを決定し、前記第1の音声データにおける第1の音声品質を考慮して前記解析範囲を決定し、前記第1の結果情報と前記第2の結果情報とに基づいて、前記雑音帯域を前記複数の解析範囲毎に検出し、前記雑音帯域のデータをフィルタリングする第1のフィルタを前記複数の解析範囲毎に生成し、前記第1のフィルタによる第1のフィルタ処理を前記第1の音声データに前記複数の解析範囲毎に施し、第3の音声データを前記複数の解析範囲毎に生成し、前記第1の開始位置は、前記第1の周波数解析が開始される前記第1の音声データの位置であり、前記第2の開始位置は、前記第2の周波数解析が開始される前記第2の音声データの位置である第2の録音プログラムである。
本発明によれば、複数の独立した録音装置が存在するシステムにおいて、雑音が低減された2つの音声データを得ることができる。
本発明の実施形態の録音システムの構成を示す概略図である。 本発明の実施形態の第1の録音装置の構成を示すブロック図である。 本発明の実施形態の第2の録音装置の構成を示すブロック図である。 本発明の実施形態の第1の録音装置が行う全体処理の手順を示すフローチャートである。 本発明の実施形態の第1の録音装置が行う全体処理の手順を示すフローチャートである。 本発明の実施形態の第2の録音装置が行う全体処理の手順を示すフローチャートである。 本発明の実施形態の第2の録音装置が行う全体処理の手順を示すフローチャートである。 本発明の実施形態の第1の録音装置が行う第1の音声品質決定処理の手順を示すフローチャートである。 本発明の実施形態の第1の録音装置が行う第1の音声品質決定処理の手順を示すフローチャートである。 本発明の実施形態の第2の録音装置が行う第2の音声品質決定処理の手順を示すフローチャートである。 本発明の実施形態の第2の録音装置が行う第2の音声品質決定処理の手順を示すフローチャートである。 本発明の実施形態の第1の録音装置が行う第1の録音処理の手順を示すフローチャートである。 本発明の実施形態の第2の録音装置が行う第2の録音処理の手順を示すフローチャートである。 本発明の実施形態の第1の録音装置が行う解析条件決定処理の手順を示すフローチャートである。 本発明の実施形態の第1の録音装置が行う位相合わせ処理の手順を示すフローチャートである。 本発明の実施形態の第1の録音装置と第2の録音装置とが行う解析データ量調整処理の手順を示すフローチャートである。 本発明の実施形態におけるパワースペクトルを示すグラフである。
(システム構成)
以下、図面を参照し、本発明の実施形態を説明する。図1は、本発明の実施形態の録音システム10の構成を示している。図1に示すように、録音システム10は、第1の録音装置101と第2の録音装置102とを有する。第1の録音装置101と第2の録音装置102とは、会議および講演会などにおける話者の声、音楽イベントおよび楽器演奏などで演者が演奏する音楽などの様々な音声を記録する。また、第1の録音装置101と第2の録音装置102とは、他の通信端末との間でデータ通信を行う。
第1の録音装置101と第2の録音装置102との周辺には、第1の音源SS1と第2の音源SS2,SS3,SS4とが存在している。第1の音源SS1は、録音の対象である音声を発生する。第2の音源SS2,SS3,SS4は、録音の対象である音声以外の雑音を発生する。
第1の録音装置101は、第1の音源SS1の方向にマイクを向けている。また、第1の録音装置101は、録音の対象である音声を発生する音源(目的音源)の方向からの音声を主に集音可能な指向性機能を有する。第1の録音装置101はマイクの指向性/無指向性を切り替えることができる。第1の録音装置101の性能は、高い指向性を得ることができるマイク性能に特化していない。つまり、第1の録音装置101が有する指向性機能が有効である場合でも、第1の録音装置101は目的音源以外の音源からの音声を完全には遮断できない。第1の録音装置101の指向性機能は、主に範囲R1に存在する目的音源である第1の音源SS1からの音声を集音することができる。また、第1の録音装置101の指向性機能は、目的音源ではない第2の音源SS2,SS3,SS4からの音声を集音する。第2の音源SS2,SS3,SS4からの音声の音量は、目的音源からの音声の音量と比較して小さい。
第2の録音装置102は第1の録音装置101の近傍に配置されている。第1の録音装置101と第2の録音装置102との距離は1m以内であることが望ましい。第2の録音装置102は無指向性マイクを有する。このため、第2の録音装置102は、範囲R2に存在する第1の音源SS1と第2の音源SS2,SS3,SS4とからの音声を区別なく集音する。
第1の録音装置101と第2の録音装置102とは、互いに通信可能な状態にある。第1の録音装置101と第2の録音装置102とは、各々が集音した音声に音声信号解析を行った結果を通信相手に通知する。これによって、第1の録音装置101と第2の録音装置102とは、互いに協調しながら目的音源からの音声とそれ以外の音源からの音声とを判別し、雑音を抑制した良好な音声データを得る。良好な音声データを得る詳細な方法については以下で説明する。
本発明の実施形態では、第1の録音装置101と第2の録音装置102とによって、異なる音声品質の2つの音声データが得られる。例えば、第1の録音装置101では、高品質の音声が記録された音声データが得られ、第2の録音装置102では、低品質の音声が記録された音声データが得られる。例えば、第2の録音装置102で得られた音声データは、インターネット上のWebサイトへの掲示等に使用できる。
(第1の録音装置101の構成)
図2は第1の録音装置101の構成を示している。図2に示すように、第1の録音装置101は、第1のマイク部201と、第1のA/D変換部202と、第1のフィルタ処理部203と、第1の周波数解析部204と、第1の表示部205と、第1の制御部206と、第1の音声品質決定部207と、第1のメモリ208と、第1のクロック発生部209と、第1の記録部210と、第1の通信部211と、第1の入力部212と、雑音帯域検出部213と、時刻差分算出部214と、条件決定部215とを有する。
第1のマイク部201は、指向性/無指向性機能を実現するために複数のコンデンサマイクによって構成されたマイクアレイを有する。マイクアレイの各コンデンサマイクに対して主マイクまたは副マイクの役割が決められている。各コンデンサマイクは互いに異なる方向の音声を集音するように配置されている。各コンデンサマイクは、集音された各音声をアナログ信号に変換する。第1のマイク部201は、副マイクで得られたアナログ信号の位相を反転し、そのアナログ信号を、主マイクで得られたアナログ信号に重ね合わせることによって、特定方向からの音声以外の影響を減少させた第1のアナログ信号を得る。以下の説明では、第1のマイク部201の指向性機能が有効である。前述したように、第1のマイク部201は、第1の音源SS1以外の音源からの音声を完全には遮断できない。
第1のA/D変換部202は、第1のマイク部201で得られる第1のアナログ信号をサンプリング周波数と量子化ビット数とに基づいてデジタルデータすなわち第1の音声データに変換する。サンプリング条件の1つであるサンプリング周波数は、48kHz/96kHz/192kHzなど、予め準備されているパラメータ値である。サンプリング条件の1つである量子化ビット数は、16bit/32bitなど、予め準備されているパラメータ値である。
第1のマイク部201と第1のA/D変換部202とは、第1の音声入力部216を構成する。第1の音声が第1の音声入力部216に入力される。第1の音声入力部216は、入力された第1の音声から第1の音声データを生成する。
時刻差分算出部214は、第1の音声データと第2の音声データとを比較する比較処理により第1の音声と第2の音声との位相差を検出する。第2の音声データは、第2の録音装置102によって第2の音声から生成される。時刻差分算出部214は、検出された位相差に基づいて第1の録音装置101と第2の録音装置102とのシステム時刻の差分(時刻差分)を算出する。
第1の周波数解析部204は、第1の音声データに対する第1の周波数解析を複数の解析範囲毎に行い、第1の周波数解析の結果を示す第1の結果情報を複数の解析範囲毎に生成する。具体的には、第1の周波数解析部204は、第1の音声データにフーリエ変換を行うことにより、第1の音声データに含まれる音声の周波数特性を解析する。第1の周波数解析部204は、第1の音声データに含まれる音声の周波数情報と、周波数毎の振幅情報および位相情報とを含む第1の結果情報を得る。解析範囲は、所定の期間に得られる第1の音声データの範囲である。第1の周波数解析部204は、複数の解析範囲のそれぞれの第1の音声データに対して第1の周波数解析を行う。
条件決定部215は、第1の開始位置と第2の開始位置とを決定する。例えば、条件決定部215は、第1の録音装置101と第2の録音装置102とのシステム時刻の差に基づいて第1の開始位置と第2の開始位置とを決定する。また、条件決定部215は、第1の音声データにおける第1の音声品質を考慮して解析範囲を決定する。第1の開始位置は、第1の周波数解析が開始される第1の音声データの位置である。第2の開始位置は、第2の周波数解析が開始される第2の音声データの位置である。第2の周波数解析は、第2の録音装置102によって第2の音声データに対して行われる。第2の周波数解析は、第1の周波数解析と同様の処理である。解析範囲が決定されるときに考慮される第1の音声品質は、第1の音声入力部216が第1の音声データを生成するときの条件、すなわち第1のA/D変換部202がアナログ信号をデジタルデータに変換するときのサンプリング周波数である。
雑音帯域検出部213は、第1の結果情報と第2の結果情報とに基づいて雑音帯域を複数の解析範囲毎に検出する。第1の結果情報は、第1の周波数解析の結果を示す。第2の結果情報は、第2の周波数解析の結果を示す。具体的には、雑音帯域検出部213は、第1の結果情報と第2の結果情報とに基づいて、第1の音声データと第2の音声データとに含まれる、目的音源以外の音源からの音声に対応する部分を推定する。雑音帯域検出部213は、推定した部分を表す周波数情報と、周波数毎の振幅情報および位相情報とを含む雑音帯域情報を生成する。
第1のフィルタ処理部203は、雑音帯域のデータをフィルタリングする第1のフィルタを複数の解析範囲毎に生成する。第1のフィルタ処理部203は、第1のフィルタによる第1のフィルタ処理を第1の音声データに複数の解析範囲毎に施す。これによって、第1のフィルタ処理部203は、第3の音声データを複数の解析範囲毎に生成する。つまり、第1のフィルタ処理部203は、複数の解析範囲のそれぞれの第1の音声データから第3の音声データを生成する。
第1の音声品質決定部207は、第1の音声データにおける第1の音声品質に基づいて、第2の音声データにおける第2の音声品質を決定する。第2の音声品質は第1の音声品質と異なる。アナログ信号がデジタルデータに変換されるとき、サンプリング周波数と量子化ビット数との値に応じてデジタルデータの品質が変わる。つまり、第1の音声品質と第2の音声品質とは、サンプリング周波数と量子化ビット数とを含むサンプリング条件である。第2の音声品質は、第1の音声品質よりも低音質であってもよい。
第1のメモリ208は、録音実行時にシステム内部の動作状態を管理するための時刻差分情報などの情報と、第1のA/D変換部202によって生成された第1の音声データとを一時記憶する。第1のクロック発生部209は、第1の録音装置101の内部で使用される基準時刻すなわちシステム時刻をカウントするシステムクロックを発生する。第1の記録部210は、第1のフィルタ処理部203によって生成された第3の音声データを記録する。第1の記録部210は、第3の音声データが記録される記録媒体を有する。あるいは、第3の音声データが記録される記録媒体が第1の記録部210に接続される。
第1の通信部211は、他の録音装置である第2の録音装置102と有線ネットワークまたは無線ネットワークを構成する。例えば、有線ネットワークはUSB(Universal Serial Bus)またはイーサネット(登録商標)である。例えば、無線ネットワークは無線LAN(Local Area Network)である。第1の通信部211は、第2の音声データ、様々な情報、要求メッセージおよびその応答メッセージなどの通信を行う。具体的には、第1の通信部211は、第2の音声から生成された第2の音声データを第2の録音装置102から受信する。第1の通信部211はさらに、第2の音声品質に関する音声品質情報を第2の録音装置102に送信する。第1の通信部211はさらに、第2の開始位置と解析範囲とに関する情報を第2の録音装置102に送信する。第1の通信部211はさらに、第2の結果情報を複数の解析範囲毎に第2の録音装置102から受信する。第1の通信部211はさらに、雑音帯域に関する情報を複数の解析範囲毎に第2の録音装置102に送信する。
第1の表示部205は、第1の録音装置101に設定可能な第1の音声品質の情報の一覧を表示する。第1の入力部212は、ユーザからの入力を受け付けるユーザインターフェイスである。第1の入力部212は、第1の音声品質の情報の一覧が表示された後、ユーザからの第1の音声品質の情報の選択を受け付ける。
第1の制御部206は、第1の録音装置101の各部を制御する。例えば、第1の制御部206は、第1の制御部206の動作を規定する命令を含むプログラムを読み込み、読み込まれたプログラムを実行する。このプログラムは、フラッシュメモリのような「コンピュータ読み取り可能な記録媒体」により提供されてもよい。また、上述したプログラムは、このプログラムが保存された記憶装置等を有するコンピュータから、伝送媒体を介して、あるいは伝送媒体中の伝送波により第1の録音装置101に伝送されてもよい。プログラムを伝送する「伝送媒体」は、インターネット等のネットワーク(通信網)や電話回線等の通信回線(通信線)のように、情報を伝送する機能を有する媒体である。また、上述したプログラムは、前述した機能の一部を実現してもよい。さらに、上述したプログラムは、前述した機能をコンピュータに既に記録されているプログラムとの組合せで実現できる、いわゆる差分ファイル(差分プログラム)であってもよい。
(第2の録音装置102の構成)
図3は第2の録音装置102の構成を示している。図3に示すように、第2の録音装置102は、第2のマイク部301と、第2のA/D変換部302と、第2のフィルタ処理部303と、第2の周波数解析部304と、第2の表示部305と、第2の制御部306と、第2の音声品質決定部307と、第2のメモリ308と、第2のクロック発生部309と、第2の記録部310と、第2の通信部311と、第2の入力部312とを有する。
第2のマイク部301は、周辺に存在する音源からの音声を無指向に集音し、第2のアナログ信号を得る。
第2のA/D変換部302は、第2のマイク部301で得られる第2のアナログ信号をサンプリング周波数と量子化ビット数とに基づいてデジタルデータすなわち第2の音声データに変換する。サンプリング条件の1つであるサンプリング周波数は、48kHz/96kHz/192kHzなど、予め準備されているパラメータ値である。サンプリング条件の1つである量子化ビット数は、16bit/32bitなど、予め準備されているパラメータ値である。
第2のマイク部301と第2のA/D変換部302とは、第2の音声入力部313を構成する。第2の音声が第2の音声入力部313に入力される。第2の音声入力部313は、入力された第2の音声から第2の音声データを生成する。第2の音声入力部313の音声入力の第2の指向性は第1の音声入力部216の第1の指向性よりも広い。この例では、第2の音声入力部313の音声入力の第2の指向性は無指向性である。
第2の周波数解析部304は、第2の音声データに対する第2の周波数解析を複数の解析範囲毎に行い、第2の周波数解析の結果を示す第2の結果情報を複数の解析範囲毎に生成する。具体的には、第2の周波数解析部304は、第2の音声データにフーリエ変換を行うことにより、第2の音声データに含まれる音声の周波数特性を解析する。第2の周波数解析部304は、第2の音声データに含まれる音声の周波数情報と、周波数毎の振幅情報および位相情報とを含む第2の結果情報を得る。解析範囲は、所定の期間に得られる第2の音声データの範囲である。第2の周波数解析部304は、複数の解析範囲のそれぞれの第2の音声データに対して第2の周波数解析を行う。
第2のフィルタ処理部303は、雑音帯域のデータをフィルタリングする第2のフィルタを複数の解析範囲毎に生成する。第2のフィルタ処理部303は、第2のフィルタによる第2のフィルタ処理を第2の音声データに複数の解析範囲毎に施す。これによって、第2のフィルタ処理部303は、第4の音声データを複数の解析範囲毎に生成する。つまり、第2のフィルタ処理部303は、複数の解析範囲のそれぞれの第2の音声データから第4の音声データを生成する。
第2の音声品質決定部307は、第1の録音装置101から受信される音声品質情報に基づいて第2の音声データにおける第2の音声品質を決定する。アナログ信号がデジタルデータに変換されるとき、サンプリング周波数と量子化ビット数との値に応じてデジタルデータの品質が変わる。第2の音声品質決定部307は、このときのサンプリング条件を決定する。音声品質情報は、第1の録音装置101から受信される。
第2のメモリ308は、録音実行時にシステム内部の動作状態を管理するための情報と、第2のA/D変換部302によって生成された第2の音声データとを一時記憶する。第2のクロック発生部309は、第2の録音装置102の内部で使用される基準時刻すなわちシステム時刻をカウントするシステムクロックを発生する。第2の記録部310は、第2のフィルタ処理部303によって生成された第4の音声データを記録する。第2の記録部310は、第4の音声データが記録される記録媒体を有する。あるいは、第4の音声データが記録される記録媒体が第2の記録部310に接続される。
第2の通信部311は、他の録音装置である第1の録音装置101と有線ネットワークまたは無線ネットワークを構成する。具体的には、第2の通信部311は、第2の音声データを第1の録音装置101に送信する。第2の通信部311はさらに、音声品質情報を第1の録音装置101から受信する。第2の通信部311はさらに、第2の開始位置と解析範囲とに関する情報を複数の解析範囲毎に第1の録音装置101から受信する。第2の通信部311はさらに、第2の結果情報を複数の解析範囲毎に第1の録音装置101に送信する。第2の通信部311はさらに、雑音帯域に関する情報を複数の解析範囲毎に第1の録音装置101から受信する。
第2の表示部305は、第2の録音装置102に設定可能な第2の音声品質の情報の一覧を表示する。第2の入力部312は、ユーザからの入力を受け付けるユーザインターフェイスである。第2の入力部312は、第2の音声品質の情報の一覧が表示された後、ユーザからの第2の音声品質の情報の選択を受け付ける。
第2の制御部306は、第2の録音装置102の各部を制御する。例えば、第2の制御部306は、第2の制御部306の動作を規定する命令を含むプログラムを読み込み、読み込まれたプログラムを実行する。このプログラムの実現形態は、図1に示す第1の制御部206の機能を実現するプログラムの実現形態と同様である。
(全体処理)
図4と図5とは、第1の録音装置101が行う全体処理の手順を示している。図6と図7とは、第2の録音装置102が行う全体処理の手順を示している。以下では第1の例と第2の例とを説明する。図4と図6とが第1の例に対応する。図5と図7とが第2の例に対応する。
(第1の例)
図4は、第1の例における第1の録音装置101が行う全体処理の手順を示している。第1の通信部211は第2の録音装置102との間でネットワーク接続を行う(ステップS401)。これによって、第1の録音装置101と第2の録音装置102とは、互いにデータ通信可能な状態になる。例えば、無線LANを介して無線ネットワーク接続が行われる場合、第1の録音装置101には第2の録音装置102と共通のネットワーク情報が設定されている。第1の通信部211は、そのネットワーク情報に基づいて無線ネットワーク接続を行う。
第1の録音装置101がネットワークに接続され、第2の録音装置102とデータ通信可能な状態になった後、第1の制御部206は、音声品質情報要求を生成し、生成された音声品質情報要求を第1の通信部211に出力する。第1の通信部211は音声品質情報要求を第2の録音装置102に送信する(ステップS402)。音声品質情報要求は、音声品質情報の要求を示すメッセージである。音声品質情報は、各録音装置がサポートしているサンプリング条件を示す。例えば、音声品質情報は、サンプリング周波数と量子化ビット数との組み合わせである。音声品質情報は、48kHz/16bitと、96kHz/16bitと、192kHz/32bitとのいずれか1つを示す情報である。例えば、48kHz/16bitは、サンプリング周波数が48kHzに設定され、量子化ビット数が16bitに設定されてサンプリングが行われることを示している。96kHz/16bitと、192kHz/32bitとの意味は上記と同様である。
第1の録音装置101は、音声品質情報要求が送信された後、第2の録音装置102からの応答を待つ。第1の通信部211は、第2の録音装置102がサポートしている全ての音声品質に関する複数の音声品質情報を受信する(ステップS403)。受信された複数の音声品質情報は、第1の制御部206を介して第1の音声品質決定部207に出力される。
第1の録音装置101は、第1の録音装置101がサポートしている複数のサンプリング条件を示す複数の音声品質情報と、第2の録音装置102から受信された複数の音声品質情報とに基づいて、第1の音声品質決定処理を行う(ステップS404)。第1の音声品質決定処理では、第1の録音装置101と第2の録音装置102とが録音を行うときの第1の音声品質と第2の音声品質とが決定される。ステップS404では、第1の録音装置101は、第2の録音装置102が録音を行うときの第2の音声品質が、第1の録音装置101が録音を行うときの第1の音声品質と異なるように、第1の音声品質と第2の音声品質とを決定する。
図8と図9とを用いて第1の音声品質決定処理について説明する。図8は、録音処理が開始される前にユーザが第1の録音装置101を用いて第1の音声品質と第2の音声品質とを選択する場合の第1の音声品質決定処理の手順を示している。
第1の制御部206は、第1の録音装置101がサポートしている複数の第1の音声品質の一覧を第1の表示部205に表示させる(ステップS801)。例えば、第1の録音装置101がサポートしている複数の第1の音声品質に対応する複数の音声品質情報は、第1の録音装置101の不揮発性メモリに保存されている。ステップS801では、第1の制御部206は、複数の音声品質情報を不揮発性メモリから読み出し、読み出された複数の音声品質情報を第1の表示部205に出力する。第1の表示部205は、複数の音声品質情報に基づいて複数の第1の音声品質を表示する。48kHz/16bit、96kHz/16bit、192kHz/32bitなどの複数の第1の音声品質をユーザが理解できるように、リスト上に並べられた文字列が表示される。
第1の表示部205に表示された複数の第1の音声品質の一覧からユーザが所望の第1の音声品質を選択する。選択された第1の音声品質を示す情報が第1の入力部212に入力される。第1の音声品質決定部207は、第1の制御部206を介して、第1の入力部212に入力された情報を取得する。第1の音声品質決定部207は、取得された情報が示す音声品質を第1の音声品質に決定する(ステップS802)。
第1の音声品質が決定された後、第1の制御部206は、第2の録音装置102がサポートしている複数の第2の音声品質の一覧を第1の表示部205に表示させる(ステップS803)。ステップS803では、第1の制御部206は、ステップS403で受信された複数の音声品質情報を第1の表示部205に出力する。第1の表示部205は、複数の音声品質情報に基づいて複数の第2の音声品質を表示する。48kHz/16bit、96kHz/16bit、192kHz/32bitなどの複数の第2の音声品質をユーザが理解できるように、リスト上に並べられた文字列が表示される。
第1の表示部205に表示された複数の第2の音声品質の一覧からユーザが所望の第2の音声品質を選択する。選択された第2の音声品質を示す情報が第1の入力部212に入力される。第1の音声品質決定部207は、第1の制御部206を介して、第1の入力部212に入力された情報を取得する。第1の音声品質決定部207は、取得された情報が示す音声品質を第2の音声品質に決定する(ステップS804)。
第2の録音装置102が録音を行うときの第2の音声品質は、第1の録音装置101に設定された第1の音声品質と異なる。第1の音声品質と異なる第2の音声品質が選択されるために、第1の録音装置101は以下のように構成されてもよい。
ステップS803では、第1の表示部205は、第2の録音装置102がサポートしている第2の音声品質のうち第1の録音装置101に対して選択された第1の音声品質と同じ第2の音声品質を表示しなくてもよい。あるいは、ステップS803では、第1の表示部205は、第2の録音装置102がサポートしている第2の音声品質のうち、第1の録音装置101に対して選択された第1の音声品質よりも低音質の第2の音声品質のみを表示してもよい。例えば、第1の録音装置101に対する第1の音声品質として192kHz/32bitが選択された場合、第2の音声品質として96kHz/16bitと48kHz/16bitとのみが表示されてもよい。
第1の音声品質決定部207は第2の音声品質を選択し、選択された第2の音声品質はステップS801で第1の表示部205に表示されてもよい。第1の音声品質よりも低音質の第2の音声品質のみが表示される場合、ステップS804では、第1の音声品質決定部207は、第1の音声品質よりも低音質の第2の音声品質を決定することが可能である。また、特に条件は設けられず、ステップS803では、第1の表示部205は、第2の録音装置102がサポートしている全ての第2の音声品質を表示してもよい。
以上の処理により、第1の録音装置101は、ユーザが希望する第1の音声品質と第2の音声品質とを決定することができる。
図8に示す処理ではユーザによって第1の音声品質と第2の音声品質とが選択される。別の方法として、図9に示すように、第1の録音装置101に設定される第1の音声品質と、第2の録音装置102に設定される第2の音声品質とを決定する方法が予め決められており、ユーザがそれらを選択することなく第1の録音装置101がそれらを決定してもよい。
図9に示す第1の音声品質決定処理について説明する。第1の音声品質決定部207は、第1の録音装置101がサポートしている複数の第1の音声品質から条件に合う第1の音声品質を選択する(ステップS901)。例えば、第1の録音装置101がサポートしている複数の第1の音声品質に対応する複数の音声品質情報は、第1の録音装置101の不揮発性メモリに保存されている。ステップS901では、第1の音声品質決定部207は、第1の制御部206を介して、複数の音声品質情報を不揮発性メモリから読み出し、読み出された複数の音声品質情報が示す複数の第1の音声品質から条件に合う第1の音声品質を選択する。これによって、第1の音声品質決定部207は、第1の音声品質を決定する。
第1の音声品質が決定された後、第1の音声品質決定部207は、第2の録音装置102がサポートしている複数の第2の音声品質から条件に合う第2の音声品質を選択する(ステップS902)。例えば、第2の録音装置102がサポートしている複数の第2の音声品質に対応する複数の音声品質情報は、第1の録音装置101の不揮発性メモリに保存されている。ステップS902では、第1の音声品質決定部207は、第1の制御部206を介して、複数の音声品質情報を不揮発性メモリから読み出し、読み出された複数の音声品質情報が示す複数の第2の音声品質から条件に合う第2の音声品質を選択する。これによって、第1の音声品質決定部207は、第2の音声品質を決定する。
上記の処理では、第1の音声品質に応じて第2の音声品質が選択される。例えば、ステップS901では、第1の音声品質決定部207は、選択可能な第1の音声品質のうち最高品質を選択する。また、ステップS902では、第1の音声品質決定部207は、選択可能な第2の音声品質のうちステップS901で選択された第1の音声品質よりも低音質の第2の音声品質を選択する。例えば、サンプリング周波数が第1の音声品質におけるサンプリング周波数の半分であり、量子化ビット数が最小である第2の音声品質が選択される。あるいは、ステップS902では、第1の音声品質決定部207は、選択可能な第2の音声品質のうちステップS901で選択された第1の音声品質と同一の第2の音声品質を選択してもよい。選択の条件は、工場出荷時に第1の録音装置101に予め記録されていてもよい。あるいは、第1の録音装置101に初期設定メニューが用意され、ユーザが任意のタイミングで初期設定メニューから第1の音声品質と第2の音声品質との設定を変更してもよい。いずれにせよ、録音処理が開始される一連の処理において、上記のように既に設定されている条件に従って第1の音声品質と第2の音声品質とが決定される。
再び、図4について説明する。第1の音声品質決定処理が行われ後、第1の音声品質決定部207は、第1の音声品質決定処理によって決定された第1の音声品質すなわちサンプリング条件を第1のA/D変換部202に設定する(ステップS405)。さらに、第1の音声品質決定部207は、第1の音声品質決定処理によって決定された第2の音声品質を示す音声品質情報を生成する。第1の音声品質決定部207は、第1の制御部206を介して、音声品質情報を第1の通信部211に出力する。第1の通信部211は、音声品質情報を第2の録音装置102に送信する(ステップS406)。
音声品質情報が送信された後、第1の制御部206は、ユーザの指示あるいは第2の録音装置102からの通知により録音開始を判断する(ステップS407)。録音開始に関するユーザの指示は、第1の入力部212に入力される。ステップS407では、第1の制御部206は、第1の入力部212に入力された指示または第1の通信部211によって受信された情報に基づいて録音開始を判断する。
録音開始の指示が第1の入力部212に入力された場合、または録音開始を指示する録音開始通知が第1の通信部211によって受信された場合、第1の制御部206は録音開始が指示されたと判断する。録音開始の指示が第1の入力部212に入力されず、かつ録音開始を指示する録音開始通知が第1の通信部211によって受信されていない場合、第1の制御部206は録音開始が指示されていないと判断する。録音開始が指示されていない場合、第1の制御部206は録音開始の判断を繰り返す。
録音開始が指示された場合、第1の制御部206は録音開始通知を生成し、生成された録音開始通知を第1の通信部211に出力する。第1の通信部211は、録音開始通知を第2の録音装置102に送信する(ステップS408)。第1の録音装置101が録音開始通知を送信した後に第2の録音装置102から録音開始通知が受信された場合、第1の録音装置101は、受信された録音開始通知を無視してもよい。
録音開始通知が送信された後、第1の録音装置101は第1の録音処理を行う(ステップS409)。第1の録音処理の詳細については後述する。第1の録音処理が行われた後、第1の制御部206は、ユーザの指示あるいは第2の録音装置102からの通知により録音終了を判断する(ステップS410)。録音終了に関するユーザの指示は、第1の入力部212に入力される。ステップS410では、第1の制御部206は、第1の入力部212に入力された指示または第1の通信部211によって受信された情報に基づいて録音終了を判断する。
録音終了の指示が第1の入力部212に入力された場合、または録音終了を指示する録音終了通知が第1の通信部211によって受信された場合、第1の制御部206は録音終了が指示されたと判断する。録音終了の指示が第1の入力部212に入力されず、かつ録音終了を指示する録音終了通知が第1の通信部211によって受信されていない場合、第1の制御部206は録音終了が指示されていないと判断する。録音終了が指示されていない場合、第1の制御部206は第1の録音処理を繰り返す。
録音終了が指示されている場合、第1の制御部206は、録音終了通知を生成し、生成された録音終了通知を第1の通信部211に出力する。第1の通信部211は、録音終了通知を第2の録音装置102に送信する(ステップS411)。第1の録音装置101が録音終了通知を送信した後に第2の録音装置102から録音終了通知が受信された場合、第1の録音装置101は、受信された録音終了通知を無視してもよい。録音終了通知が送信された後、第1の録音装置101が行う全体処理が終了する。
図6は、第1の例における第2の録音装置102が行う全体処理の手順を示している。図6に示す処理は、図4に示す処理に対応する。
第2の通信部311は第1の録音装置101との間でネットワーク接続を行う(ステップS601)。これによって、第1の録音装置101と第2の録音装置102とは、互いにデータ通信可能な状態になる。例えば、無線LANを介して無線ネットワーク接続が行われる場合、第2の録音装置102には第1の録音装置101と共通のネットワーク情報が設定されている。第2の通信部311は、そのネットワーク情報に基づいて無線ネットワーク接続を行う。
第2の録音装置102がネットワークに接続され、第1の録音装置101とデータ通信可能な状態になった後、第2の通信部311は音声品質情報要求を第1の録音装置101から受信する(ステップS602)。受信された音声品質情報要求は第2の制御部306に出力される。
第2の制御部306は、音声品質情報要求に基づいて、第2の録音装置102がサポートしている全ての音声品質に対応する複数の音声品質情報を第2の通信部311に出力する。例えば、第2の録音装置102がサポートしている複数の第2の音声品質に対応する複数の音声品質情報は、第2の録音装置102の不揮発性メモリに保存されている。第2の制御部306は、複数の音声品質情報を不揮発性メモリから読み出し、読み出された複数の音声品質情報を第2の通信部311に出力する。第2の通信部311は、複数の音声品質情報を第1の録音装置101に送信する(ステップS603)。
前述したように、第1の録音装置101は、第2の録音装置102からの複数の音声品質情報に基づいて、第2の録音装置102に設定される第2の音声品質を決定する。また、第1の録音装置101は、決定された第2の音声品質を示す音声品質情報を送信する。第2の録音装置102の第2の通信部311は、音声品質情報を第1の録音装置101から受信する(ステップS604)。受信された音声品質情報は、第2の制御部306を介して第2の音声品質決定部307に出力される。
第2の音声品質決定部307は、音声品質情報に基づいて、第2の録音装置102が録音を行うときの第2の音声品質を決定する(ステップS605)。第1の録音装置101から受信された音声品質情報が示す第2の音声品質と、ステップS605で決定される第2の音声品質とは同一である。第2の音声品質が決定された後、第2の音声品質決定部307は、決定された第2の音声品質すなわちサンプリング条件を第2のA/D変換部302に設定する(ステップS606)。
第2の音声品質が設定された後、第2の制御部306は、ユーザの指示あるいは第1の録音装置101からの通知により録音開始を判断する(ステップS607)。録音開始に関するユーザの指示は、第2の入力部312に入力される。ステップS607では、第2の制御部306は、第2の入力部312に入力された指示または第2の通信部311によって受信された情報に基づいて録音開始を判断する。
録音開始の指示が第2の入力部312に入力された場合、または録音開始を指示する録音開始通知が第2の通信部311によって受信された場合、第2の制御部306は録音開始が指示されたと判断する。録音開始の指示が第2の入力部312に入力されず、かつ録音開始を指示する録音開始通知が第2の通信部311によって受信されていない場合、第2の制御部306は録音開始が指示されていないと判断する。録音開始が指示されていない場合、第2の制御部306は録音開始の判断を繰り返す。
録音開始が指示された場合、第2の制御部306は録音開始通知を生成し、生成された録音開始通知を第2の通信部311に出力する。第2の通信部311は、録音開始通知を第1の録音装置101に送信する(ステップS608)。第2の録音装置102が録音開始通知を送信した後に第1の録音装置101から録音開始通知が受信された場合、第2の録音装置102は、受信された録音開始通知を無視してもよい。
録音開始通知が送信された後、第2の録音装置102は第2の録音処理を行う(ステップS609)。第2の録音処理の詳細については後述する。第2の録音処理が行われた後、第2の制御部306は、ユーザの指示あるいは第1の録音装置101からの通知により録音終了を判断する(ステップS610)。録音終了に関するユーザの指示は、第2の入力部312に入力される。ステップS610では、第2の制御部306は、第2の入力部312に入力された指示または第2の通信部311によって受信された情報に基づいて録音終了を判断する。
録音終了の指示が第2の入力部312に入力された場合、または録音終了を指示する録音終了通知が第2の通信部311によって受信された場合、第2の制御部306は録音終了が指示されたと判断する。録音終了の指示が第2の入力部312に入力されず、かつ録音終了を指示する録音終了通知が第2の通信部311によって受信されていない場合、第2の制御部306は録音終了が指示されていないと判断する。録音終了が指示されていない場合、第2の制御部306は第2の録音処理を繰り返す。
録音終了が指示されている場合、第2の制御部306は、録音終了通知を生成し、生成された録音終了通知を第2の通信部311に出力する。第2の通信部311は、録音終了通知を第1の録音装置101に送信する(ステップS611)。第2の録音装置102が録音終了通知を送信した後に第1の録音装置101から録音終了通知が受信された場合、第2の録音装置102は、受信された録音終了通知を無視してもよい。録音終了通知が送信された後、第2の録音装置102が行う全体処理が終了する。
(第2の例)
図5は、第2の例における第1の録音装置101が行う全体処理の手順を示している。図4に示す処理では、録音処理の直前に録音時の第1の音声品質が決定される。しかし、第1の録音装置101に対して録音時の第1の音声品質が予め設定されている場合がある。つまり、第1の録音装置101は単独でも録音装置として使用することができるため、録音時の第1の音声品質が既に設定されている場合がある。この場合の処理について図5を用いて説明する。
第1の通信部211は第2の録音装置102との間でネットワーク接続を行う(ステップS501)。これによって、第1の録音装置101と第2の録音装置102とは、互いにデータ通信可能な状態になる。例えば、無線LANを介して無線ネットワーク接続が行われる場合、第1の録音装置101には第2の録音装置102と共通のネットワーク情報が設定されている。第1の通信部211は、そのネットワーク情報に基づいて無線ネットワーク接続を行う。
第1の録音装置101がネットワークに接続され、第2の録音装置102とデータ通信可能な状態になった後、第1の音声品質決定部207は、第1のA/D変換部202に設定されている第1の音声品質を確認する(ステップS502)。第1の音声品質決定部207は、ステップS502で確認された第1の音声品質を示す音声品質情報を生成する。第1の音声品質決定部207は、第1の制御部206を介して、音声品質情報を第1の通信部211に出力する。第1の通信部211は、音声品質情報を第2の録音装置102に送信する(ステップS503)。
音声品質情報が送信された後、ステップS504〜S508の処理が行われる。ステップS504〜S508の処理は、図4のステップS407〜S411の処理と同様である。ステップS508の処理が行われた後、第1の録音装置101が行う全体処理が終了する。
図7は、第2の例における第2の録音装置102が行う全体処理の手順を示している。図7に示す処理は、図5に示す処理に対応する。
第2の通信部311は第1の録音装置101との間でネットワーク接続を行う(ステップS701)。これによって、第1の録音装置101と第2の録音装置102とは、互いにデータ通信可能な状態になる。例えば、無線LANを介して無線ネットワーク接続が行われる場合、第2の録音装置102には第1の録音装置101と共通のネットワーク情報が設定されている。第2の通信部311は、そのネットワーク情報に基づいて無線ネットワーク接続を行う。
第2の録音装置102がネットワークに接続され、第1の録音装置101とデータ通信可能な状態になった後、第2の通信部311は音声品質情報を第1の録音装置101から受信する(ステップS702)。受信された音声品質情報は、第2の制御部306を介して第2の音声品質決定部307に出力される。
第2の録音装置102は、第2の録音装置102がサポートしている複数のサンプリング条件を示す複数の音声品質情報と、第1の録音装置101から受信された音声品質情報とに基づいて、第2の音声品質決定処理を行う(ステップS703)。第2の音声品質決定処理では、第2の録音装置102が録音を行うときの第2の音声品質が決定される。ステップS703では、第2の録音装置102は、第2の録音装置102が録音を行うときの第2の音声品質が、第1の録音装置101が録音を行うときの第1の音声品質と異なるように、第2の音声品質を決定する。
図10と図11とを用いて第2の音声品質決定処理について説明する。図10は、録音処理が開始される前にユーザが第2の録音装置102を用いて第2の音声品質を選択する場合の第2の音声品質決定処理の手順を示している。
第2の音声品質決定部307は、第2の録音装置102がサポートしている複数の第2の音声品質から、条件を満たす第2の音声品質を抽出する(ステップS1001)。例えば、第2の録音装置102がサポートしている複数の第2の音声品質に対応する複数の音声品質情報は、第2の録音装置102の不揮発性メモリに保存されている。ステップS1001では、第2の音声品質決定部307は、第2の制御部306を介して、複数の音声品質情報を不揮発性メモリから読み出し、読み出された複数の音声品質情報が示す複数の第2の音声品質から条件に合う第2の音声品質を選択する。これによって、第2の音声品質決定部307は、第2の音声品質を抽出する。抽出された第2の音声品質を示す音声品質情報は第2の制御部306に出力される。
第2の制御部306は、ステップS1001で抽出された第2の音声品質の一覧を第2の表示部305に表示させる(ステップS1002)。ステップS1002では、第2の制御部306は、ステップS1001で抽出された第2の音声品質を示す音声品質情報を第2の表示部305に出力する。第2の表示部305は、音声品質情報に基づいて第2の音声品質を表示する。
第2の表示部305に表示された第2の音声品質の一覧からユーザが所望の第2の音声品質を選択する。選択された第2の音声品質を示す情報が第1の入力部212に入力される。第2の音声品質決定部307は、第2の制御部306を介して、第2の入力部312に入力された情報を取得する。第2の音声品質決定部307は、取得された情報が示す音声品質を第2の音声品質に決定する(ステップS1003)。
第2の録音装置102が録音を行うときの第2の音声品質は、第1の録音装置101に設定された第1の音声品質と異なる。第1の音声品質と異なる第2の音声品質が選択されるために、第2の録音装置102は以下のように構成されてもよい。
ステップS1001では、第2の音声品質決定部307は、第2の録音装置102がサポートしている第2の音声品質のうち第1の録音装置101に対して選択された第1の音声品質と同じ第2の音声品質を抽出しなくてもよい。あるいは、ステップS1001では、第2の音声品質決定部307は、第2の録音装置102がサポートしている第2の音声品質のうち、第1の録音装置101に対して選択された第1の音声品質よりも低音質の第2の音声品質のみを抽出してもよい。例えば、第1の録音装置101に対する第1の音声品質として192kHz/32bitが選択された場合、第2の音声品質として96kHz/16bitと48kHz/16bitとのみが抽出されてもよい。
第1の音声品質よりも低音質の第2の音声品質のみが抽出される場合、ステップS1003では、第2の音声品質決定部307は、第1の音声品質よりも低音質の第2の音声品質を決定することが可能である。また、特に条件は設けられず、ステップS1001では、第2の録音装置102がサポートしている全ての第2の音声品質が選択されてもよい。
以上の処理により、第2の録音装置102は、ユーザが希望する第2の音声品質を決定することができる。
図10に示す処理ではユーザによって第2の音声品質が選択される。別の方法として、図11に示すように、第2の録音装置102に設定される第2の音声品質を決定する方法が予め決められており、ユーザがそれを選択することなく第2の録音装置102がそれを決定してもよい。
図11に示す第2の音声品質決定処理について説明する。第2の音声品質決定部307は、第2の録音装置102がサポートしている複数の第2の音声品質から条件に合う第2の音声品質を選択する(ステップS1101)。例えば、第2の録音装置102がサポートしている複数の第2の音声品質に対応する複数の音声品質情報は、第2の録音装置102の不揮発性メモリに保存されている。ステップS1101では、第2の音声品質決定部307は、第2の制御部306を介して、複数の音声品質情報を不揮発性メモリから読み出し、読み出された複数の音声品質情報が示す複数の第2の音声品質から条件に合う第2の音声品質を選択する。これによって、第2の音声品質決定部307は、第2の音声品質を決定する。
上記の処理では、第1の音声品質に応じて第2の音声品質が選択される。例えば、ステップS1101では、第2の音声品質決定部307は、選択可能な第2の音声品質のうち第1の録音装置101から受信された音声品質情報が示す第1の音声品質よりも低音質の第2の音声品質を選択する。例えば、サンプリング周波数が第1の音声品質におけるサンプリング周波数の半分であり、量子化ビット数が最小である第2の音声品質が選択される。あるいは、ステップS1101では、第2の音声品質決定部307は、選択可能な第2の音声品質のうち第1の録音装置101から受信された音声品質情報が示す第1の音声品質と同一の第2の音声品質を選択してもよい。選択の条件は、工場出荷時に第2の録音装置102に予め記録されていてもよい。あるいは、第2の録音装置102に初期設定メニューが用意され、ユーザが任意のタイミングで初期設定メニューから第2の音声品質の設定を変更してもよい。いずれにせよ、録音処理が開始される一連の処理において、上記のように既に設定されている条件に従って第2の音声品質が決定される。
再び、図7について説明する。第2の音声品質決定処理が行われ後、第2の音声品質決定部307は、第2の音声品質決定処理によって決定された第2の音声品質すなわちサンプリング条件を第2のA/D変換部302に設定する(ステップS704)。
第2の音声品質が設定された後、ステップS708〜S712の処理が行われる。ステップS708〜S712の処理は、図6のステップS607〜S611の処理と同様である。ステップS712の処理が行われた後、第2の録音装置102が行う全体処理が終了する。
(第1の録音処理)
図12は、第1の録音装置101が行う第1の録音処理の手順を示している。第1の録音装置101は、第1の録音処理において、複数の独立した処理を並行的に実行する。一部の処理は、第1の音声の入力と第1の音声データの生成とを含む第1の音声入力処理である。残りの処理は、第1の音声データに対する処理である。これらの処理はマルチタスクで、かつ非同期に実行される。
第1の音声入力処理について説明する。第1の録音処理が開始された後、第1の音声入力処理が行われる(ステップS1200)。第1の音声入力処理では以下の処理が行われる。
第1のマイク部201に第1の音声が入力され、第1のマイク部201は第1の音声に基づく第1のアナログ信号を出力する(ステップS1201)。第1のA/D変換部202は、第1のアナログ信号をA/D変換することにより第1の音声データを生成する(ステップS1202)。ステップS1202でA/D変換が行われるときのサンプリング条件は、第1の音声品質の設定値に従う。また、第1の音声データが生成されるとき、第1の音声の集音時刻を示す時刻情報が第1の音声データに付加される。
第1のA/D変換部202によって生成された第1の音声データは第1のメモリ208に一次記憶される(ステップS1203)。第1のメモリ208に一時記憶された第1の音声データは、必要な処理が実行されるときに第1のメモリ208から読み出される。処理が実行された第1の音声データは第1のメモリ208から削除される。
ステップS1219の処理が終了するまで、ステップS1201の処理と、ステップS1202の処理と、ステップS1203の処理とは並行的に繰り返し実行される。
第1の音声データに対する処理について説明する。第1の録音処理が開始された後、第1の制御部206は、時刻差分の算出が終了しているか否かを判断する(ステップS1204)。時刻差分は、第1の録音装置101と第2の録音装置102とのシステム時刻の差分を示す。第1のメモリ208に時刻差分が一時記憶されている場合、時刻差分の算出は終了している。第1のメモリ208に時刻差分が一時記憶されていない場合、時刻差分の算出は終了していない。時刻差分の算出が終了している場合、ステップS1209の処理が行われる。
時刻差分の算出が終了していない場合、第1の制御部206は、第2の音声データの送信を要求する音声データ要求を生成し、生成された音声データ要求を第1の通信部211に出力する。第1の通信部211は、音声データ要求を第2の録音装置102に送信する(ステップS1205)。音声データ要求が送信された後、第1の通信部211は、第2の音声データを第2の録音装置102から受信する(ステップS1206)。第2の音声データが受信された後、第1の録音装置101は、第2の録音装置102から受信された第2の音声データと、第1の録音装置101で生成された第1の音声データとに基づいて、位相合わせ処理を行う(ステップS1207)。
図15を参照し、位相合わせ処理について説明する。位相合わせ処理では、第1のメモリ208に一時記憶されている第1の音声データのうち先頭のデータを含み、かつ所定時間に生成されたデータが使用される。また、第2の録音装置102から受信された第2の音声データのうち先頭のデータを含み、かつ所定時間に生成されたデータが使用される。
2つのデジタルデータの位相を合わせる方法として、デジタルデータの正規化が行われる。時刻差分算出部214は、サンプリング周波数に基づく正規化を行う(ステップS1501)。第1の録音装置101と第2の録音装置102とがそれぞれ録音を実行するときのサンプリング周波数が異なる場合、第1の録音装置101と第2の録音装置102とが同じ1秒間の音声に対して生成した音声データのデータ数が異なる。位相合わせ処理が容易になるように、このデータ数を合わせる処理が行われる。
例えば、第1の録音装置101のサンプリング周波数が96kHzであり、第2の録音装置102のサンプリング周波数が48kHzである場合、第1の音声データのデータ数が第2の音声データのデータ数と一致するように、第1の音声データのデータ数が変更される。サンプリング周波数が96kHzである場合、1秒間の音声データに含まれるデータ数は96000である。同様にサンプリング周波数が48kHzである場合、1秒間の音声データに含まれるデータ数は48000である。96000/48000=2であるため、時刻差分算出部214は、第1の音声データのデータ数を半分にする。具体的には、時刻差分算出部214は、第1の音声データにおいて時間的に隣接する2つのデータを平均化し、1つのデータとする。
サンプリング周波数に基づく正規化が行われた後、時刻差分算出部214は、量子化ビット数に基づく正規化を行う(ステップS1502)。例えば、第1の録音装置101の量子化ビット数が32bitであり、第2の録音装置102の量子化ビット数が16bitである場合、時刻差分算出部214は音声信号の振幅を単純に比較することはできない。このため、時刻差分算出部214は、32bitと16bitとの比である係数すなわち2を求め、求めた係数を第2の音声データに乗算する。
量子化ビット数に基づく正規化が行われた後、時刻差分算出部214は、第1の音声データと第2の音声データとに基づいて相関係数を算出する(ステップS1503)。ステップS1503における相関係数の算出は、第1の音声データと第2の音声データとを比較する比較処理に対応する。ステップS1503では、一般的に知られている相関係数の算出方法が使用される。第1の音声データを構成するデータ列をX、第2の音声データを構成するデータ列をYとし、XとYとがn個のデータを含む場合、相関係数Rは以下の(1)式により求めることができる。つまり、相関係数Rは、データ列Xとデータ列Yとの共分散変数を、データ列Xの標準偏差とデータ列Yの標準偏差との積で割ることにより得られる。
R = (データ列Xとデータ列Yとの共分散変数) / (データ列Xの標準偏差 × データ列Yの標準偏差) ・・・(1)
相関係数が算出された後、時刻差分算出部214は、相関係数の算出が所定の回数行われたか否かを判断することにより、相関係数の算出が完了したか否かを判断する(ステップS1504)。相関係数の算出が完了していない場合、時刻差分算出部214は、相関係数の算出に使用される第1の音声データまたは第2の音声データの範囲を変更する(ステップS1505)。第1の音声データまたは第2の音声データの範囲が変更された後、ステップS1503で相関係数が算出される。
例えば、第1の音声データと第2の音声データとが1秒間の音声に対応するデータである場合の相関係数の算出方法を説明する。第1の録音装置101のサンプリング周波数が96kHzであり、第2の録音装置102のサンプリング周波数が48kHzである場合の例では、第1の音声データと第2の音声データとはそれぞれ48000個のデータを有する。便宜のため、48000個のデータは、各データが生成された時刻の順に1〜48000の番号を有する。
時刻差分算出部214は、第1の音声データの番号1〜24000のデータと、第2の音声データの番号24001〜48000のデータとについて相関係数を算出する。続いて、時刻差分算出部214は、使用される第1の音声データと第2の音声データとのデータ数を1データずつ増やしながら、または減らしながら相関係数を算出する。使用される第1の音声データと第2の音声データとのデータ数が1データ増加する、または減少する処理がステップS1505の処理に対応する。
具体的には、時刻差分算出部214は、第1の音声データの番号1〜24001のデータと、第2の音声データの番号24000〜48000のデータとについて相関係数を算出する。続いて、時刻差分算出部214は、第1の音声データの番号1〜240002のデータと、第2の音声データの番号23999〜48000のデータとについて相関係数を算出する。
第1の音声データと第2の音声データとのデータ数が1ずつ増加しながら同様の処理が繰り返される。同様の処理が繰り返された後、時刻差分算出部214は、第1の音声データの番号1〜480000のデータと、第2の音声データの番号1〜48000のデータとについて相関係数を算出する。続いて、時刻差分算出部214は、第1の音声データの番号2〜480000のデータと、第2の音声データの番号1〜47999のデータとについて相関係数を算出する。
第1の音声データと第2の音声データとのデータ数が1ずつ減少しながら同様の処理が繰り返される。同様の処理が繰り返された後、時刻差分算出部214は、第1の音声データの番号24001〜480000のデータと、第2の音声データの番号1〜24000のデータとについて相関係数を算出する。これによって、相関係数の算出が完了する。
相関係数の算出が完了した場合、時刻差分算出部214は、複数の相関係数のうち最大の相関係数の算出に使用された第1の音声データと第2の音声データとの時間方向のずれ量を位相差として検出する(ステップS1506)。例えば、最大の相関係数の算出に使用された第1の音声データと第2の音声データとの先頭位置の時間方向のずれ量が位相差として検出される。例えば、第1の音声データの番号1〜24001のデータと、第2の音声データの番号24000〜48000のデータとの先頭位置の時間方向のずれ量は、23999個のデータに相当する時間である。サンプリング周波数が48kHzである場合を基準に音声データの正規化が行われた場合、23999個のデータに相当する時間は約500msである。
ステップS1506で検出される位相差は、第1の録音装置101に入力される第1の音声と第2の録音装置102に入力される第2の音声との位相差を含む。第1の音声データにおける第1の音声の位相の基準は第1の音声データの先頭位置である。第2の音声データにおける第2の音声の位相の基準は第2の音声データの先頭位置である。第1の録音装置101と第2の録音装置102との位置がほぼ同一であるため、同一の音源からの音声が第1の録音装置101と第2の録音装置102とに入力されるタイミングの差分は無視できる。このため、ステップS1506で検出される位相差は、第1の音声データの先頭位置に対する第1の音声の相対的な位置と、第2の音声データの先頭位置に対する第2の音声の相対的な位置との差分である。この差分は、第1の録音装置101と第2の録音装置102との録音開始タイミングの差分に相当する。サンプリング周波数が48kHzである場合を基準に音声データの正規化が行われた場合、約20μsの精度で位相差が求まる。
以上の処理により、第1の録音装置101で得られる第1の音声データと、第2の録音装置102で得られる第2の音声データとの位相差を求めることができる。
再び、図12について説明する。位相合わせ処理が行われた後、時刻差分算出部214は、第1の音声データに付加されている時刻情報と、第2の音声データに付加されている時刻情報と、ステップS1506で検出された位相差とに基づいて、第1の録音装置101と第2の録音装置102とのシステム時刻の差分すなわち時刻差分を算出する(ステップS1208)。第1の音声データに付加されている時刻情報(例えば、第1の音声データの先頭データの時刻情報)と、第2の音声データに付加されている時刻情報(例えば、第2の音声データの先頭データの時刻情報)との差分が第1の録音装置101と第2の録音装置102との録音開始タイミングの差分である。ステップS1506で検出された位相差から第1の録音装置101と第2の録音装置102との録音開始タイミングの差分を引くことにより、第1の録音装置101と第2の録音装置102とのシステム時刻の差分が得られる。
時刻差分が算出された後、時刻差分算出部214は、第1の制御部206を介して、第1のメモリ208から第1の音声データを読み込む(ステップS1209)。続いて、時刻差分算出部214は解析条件決定処理を行う(ステップS1210)。
図14を参照し、解析条件決定処理について説明する。時刻差分算出部214は、現在、第1の録音装置101に設定されている第1の音声品質を確認する(ステップS1401)。第1の音声品質が高音質(例えば、サンプリング周波数が192kHz)である場合、時刻差分算出部214は相対的に広い解析範囲を設定する(ステップS1402)。また、第1の音声品質が低音質(例えば、サンプリング周波数が48kHz)である場合、時刻差分算出部214は相対的に狭い解析範囲を設定する(ステップS1403)。
解析範囲は、第1の録音装置101の第1の周波数解析部204によって第1の周波数解析が行われる第1の音声データの範囲と、第2の録音装置102の第2の周波数解析部304によって第2の周波数解析が行われる第2の音声データの範囲とを示している。第1の録音装置101に設定されている第1の音声品質が所定の音声品質よりも高い場合、相対的に広い解析範囲が設定される。また、第1の録音装置101に設定されている第1の音声品質が所定の音声品質よりも低い場合、相対的に狭い解析範囲が設定される。
本発明の実施形態では、デジタルデータに対する周波数解析の方法として、一般的に知られているフーリエ変換が使用される。フーリエ変換の特性により、データ量が増えると分解能が上がり、データ量が減ると分解能が下がる。したがって、高音質の音声データに対する周波数解析が行われる場合、できるだけ良い精度で周波数解析を行うために広い解析範囲が設定され、データ量が増える。一方、データ量が増加すると計算量が増える。さらに、システムの負荷が高くなり、システムのレスポンスが低下する。このため、低音質の音声データに対する周波数解析が行われる場合、解析計算のための処理時間が優先される。つまり、狭い解析範囲が設定され、データ量が減る。例えば、第1の音声品質が高音質(例えば、サンプリング周波数が192kHz)である場合、10秒の解析範囲が設定される。例えば、第1の音声品質が低音質(例えば、サンプリング周波数が48kHz)である場合、1秒の解析範囲が設定される。0.1秒のデータに対するフーリエ変換の分解能は10Hzである。1秒のデータに対するフーリエ変換の分解能は1Hzである。10秒のデータに対するフーリエ変換の分解能は0.1Hzである。
解析範囲が設定された後、時刻差分算出部214は、解析開始位置を算出する(ステップS1404)。解析開始位置は、第1の開始位置と第2の開始位置とを含む。第1の開始位置は、第1の周波数解析が開始される第1の音声データの位置である。第2の開始位置は、第2の周波数解析が開始される第2の音声データの位置である。
例えば、1回目の第1の周波数解析における第1の開始位置は、第1のメモリ208に一時記憶されている第1の音声データの先頭位置である。第1の録音装置101が第1の録音処理を開始するタイミングと、第2の録音装置102が第2の録音処理を開始するタイミングとが一致しなくてもよい。このため、1回目の第1の周波数解析における第1の開始位置は、第1のメモリ208に一時記憶されている第1の音声データの先頭位置から所定時間に相当する範囲だけずれた位置であってもよい。この所定時間は、第1の録音処理の開始タイミングと第2の録音処理の開始タイミングとのずれとして想定される時間よりも長ければよい。
2回目の第1の周波数解析における第1の開始位置は、1回目の第1の周波数解析における第1の開始位置から解析範囲だけずれた位置である。例えば、1回目の第1の周波数解析における第1の開始位置における第1の音声データに付加されている時刻情報が時刻T1を示し、解析範囲がR秒に相当する範囲である場合、2回目の第1の周波数解析における第1の開始位置は、時刻(T1+R)に対応するデータ位置である。3回目以後の第1の周波数解析における第1の開始位置は同様に算出される。
例えば、1回目の第2の周波数解析における第2の開始位置は、上記の時刻T1から時刻差分だけずれた時刻に対応するデータ位置である。2回目の第2の周波数解析における第2の開始位置は、1回目の第2の周波数解析における第2の開始位置から解析範囲だけずれた位置である。3回目以後の第2の周波数解析における第2の開始位置は同様に算出される。
以上の処理により、第1の周波数解析と第2の周波数解析との解析条件が決定される。第1の録音装置101は、第1の音声品質に適した解析範囲を設定することができる。
再び、図12について説明する。解析条件が決定された後、第1の周波数解析部204は、解析データ量調整処理を行う(ステップS1211)。システムに応じて解析計算の処理時間が異なる。このため、解析データ量調整処理では、システムへの負荷とレスポンス性能とが考慮され、処理時間が適当な時間となるようにデータ量が調整される。解析データ量調整処理については後述する。
解析データ量調整処理が行われた後、第1の周波数解析部204は、第1の開始位置を基準とする解析範囲の第1の音声データに対して第1の周波数解析を行い、第1の周波数解析の結果を示す第1の結果情報を生成する(ステップS1212)。第1の録音処理が繰り返し行われるため、異なる複数の解析範囲毎に第1の周波数解析が行われる。また、異なる複数の解析範囲毎に第1の結果情報が生成される。
第1の周波数解析では、一般的に知られているフーリエ変換が使用され、デジタルデータに対して解析の計算が行われる。解析条件としてデータ量の低減が指定されている場合、第1の周波数解析部204は、第1の音声データに対して1秒当たりのデータ量を減らして第1の周波数解析を行う。
第1の周波数解析が行われた後、第1の制御部206は、結果情報要求を生成し、生成された結果情報要求を第1の通信部211に出力する。結果情報要求は、第2の録音装置102が行う第2の周波数解析の結果を示す第2の結果情報の要求を示す。結果情報要求は、解析条件決定処理によって決定された解析条件、すなわち解析範囲と第2の開始位置とに関する情報を含む。第1の通信部211は、結果情報要求を第2の録音装置102に送信する(ステップS1213)。結果情報要求が送信された後、第1の通信部211は、第2の結果情報を第2の録音装置102から受信する(ステップS1214)。
第2の結果情報が受信された後、雑音帯域検出部213は、第1の結果情報と第2の結果情報とを比較する(ステップS1215)。続いて、雑音帯域検出部213は、ステップS1215の処理の結果に基づいて、雑音帯域を検出する(ステップS1216)。第1の録音処理が繰り返し行われるため、異なる複数の解析範囲毎に雑音帯域が検出される。
図17を参照し、ステップS1215とステップS1216との処理の内容を説明する。第1の結果情報と第2の結果情報とは、音声の周波数情報と、周波数毎の振幅情報および位相情報とを含む。図17は、音声の周波数情報と周波数毎の振幅情報とを含むパワースペクトルをグラフで示している。図17(a)は、第1の結果情報に対応するパワースペクトルを示している。図17(b)は、第2の結果情報に対応するパワースペクトルを示している。
第1の結果情報と第2の結果情報とは、同一の時刻に集音された音声のデータに対する周波数解析の結果を含む。このため、図17(a)と図17(b)とでは同一の周波数帯域にピークが現れている。また、同一の周波数帯域における振幅1701は振幅1700よりも大きい。
第1の録音装置101は主に目的音源からの音声を集音する。一方、第2の録音装置102は、目的音源以外の音源からの音声を目的音源からの音声と同等のレベルで集音する。したがって、目的音源からの音声に関して、第1の周波数解析により得られるパワースペクトルに現れるピークが、第2の周波数解析により得られるパワースペクトルに現れるピークよりも大きくなる。また、目的音源以外の音源からの音声に関して、第2の周波数解析により得られるパワースペクトルに現れるピークが、第1の周波数解析により得られるパワースペクトルに現れるピークよりも大きくなる。つまり、振幅1700と振幅1701との比較により、雑音帯域検出部213は、この振幅1700と振幅1701とに対応する周波数帯域が目的音源以外の音源からの音声に基づくと推定できる。つまり、雑音帯域検出部213は、この周波数帯域が雑音帯域であると推定できる。
ステップS1215では、雑音帯域検出部213は、第1の結果情報に対応する周波数毎の振幅と、第2の結果情報に対応する周波数毎の振幅とを比較する。ステップS1216では、雑音帯域検出部213は、比較の結果に基づいて、各周波数帯域が雑音帯域であるか否かを判断する。
再び、図12の説明を行う。雑音帯域が検出された後、雑音帯域検出部213は、検出された雑音帯域を示す雑音帯域情報を生成する。雑音帯域検出部213は、第1の制御部206を介して、雑音帯域情報を第1の通信部211と第1のフィルタ処理部203とに出力する。第1の通信部211は、雑音帯域情報を第2の録音装置102に送信する(ステップS1217)。雑音帯域情報には、推定された周波数と、振幅と、位相との情報が含まれる。
雑音帯域情報が送信された後、第1のフィルタ処理部203は、雑音帯域のデータをフィルタリングする第1のフィルタを生成する。第1のフィルタ処理部203はさらに、第1のフィルタによる第1のフィルタ処理を第1の音声データに施し、第3の音声データを生成する(ステップS1218)。第3の音声データは、雑音が除去された第1の音声のデジタルデータである。第1のフィルタ処理は、雑音帯域の周波数と、振幅と、位相とに基づいて、一般的に知られている方法によって行われる。周波数と、振幅と、位相とが分かっているため、第1の音声データのうち雑音帯域に相当する部分のデジタルデータの位相を反転し、位相が反転されたデジタルデータを第1の音声データに重ね合わせることにより、第1の音声データから雑音帯域のデータを取り除くことができる。第1の録音処理が繰り返し行われるため、異なる複数の解析範囲毎に第1のフィルタが生成される。また、異なる複数の解析範囲毎に第1のフィルタ処理が行われる。
生成された第3の音声データは、第1の制御部206を介して第1の記録部210に出力される。第1の記録部210は、第3の音声データを記録する(ステップS1219)。
以上の処理により、第1の録音装置101は、目的音源以外の音源からの雑音が取り除かれた良好な音声のデジタルデータを得ることができる。
(第2の録音処理)
図13は、第2の録音装置102が行う第2の録音処理の手順を示している。第2の録音装置102は、第2の録音処理において、複数の独立した処理を並行的に実行する。一部の処理は、第2の音声の入力と第2の音声データの生成とを含む第2の音声入力処理である。残りの処理は、第2の音声データに対する処理である。これらの処理はマルチタスクで、かつ非同期に実行される。
第2の音声入力処理について説明する。第2の録音処理が開始された後、第2の音声入力処理が行われる(ステップS1300)。第2の音声入力処理では以下の処理が行われる。
第2のマイク部301に第2の音声が入力され、第2のマイク部301は第2の音声に基づく第2のアナログ信号を出力する(ステップS1301)。第2のA/D変換部302は、第2のアナログ信号をA/D変換することにより第2の音声データを生成する(ステップS1302)。ステップS1302でA/D変換が行われるときのサンプリング条件は、第2の音声品質の設定値に従う。また、第2の音声データが生成されるとき、第2の音声の集音時刻を示す時刻情報が第2の音声データに付加される。
第2のA/D変換部302によって生成された第2の音声データは第2のメモリ308に一次記憶される(ステップS1303)。第2のメモリ308に一時記憶された第2の音声データは、必要な処理が実行されるときに第2のメモリ308から読み出される。処理が実行された第2の音声データは第2のメモリ308から削除される。
ステップS1314の処理が終了するまで、ステップS1301の処理と、ステップS1302の処理と、ステップS1303の処理とは並行的に繰り返し実行される。
第2の音声データに対する処理について説明する。第2の録音処理が開始された後、第2の制御部306は、音声データ要求が受信されたか否かを判断する(ステップS1304)。音声データ要求が受信されていない場合、ステップS1307の処理が行われる。
音声データ要求が受信された場合、第2の制御部306は、第2のメモリ308から第2の音声データを読み込む(ステップS1305)。ステップS1305では、第2のメモリ308に一時記憶されている全ての第2の音声データが読み込まれる。続いて、第2の制御部306は、第2の音声データを第2の通信部311に出力する。第2の通信部311は、第2の音声データを第1の録音装置101に送信する(ステップS1306)。
第2の音声データが送信された後、第2の制御部306は、結果情報要求が受信されたか否かを判断する(ステップS1307)。結果情報要求が受信されていない場合、ステップS1312の処理が行われる。結果情報要求が受信された場合、第2の周波数解析部304は、第2の制御部306を介して、第2のメモリ308から第2の音声データを読み込む(ステップS1308)。
続いて、第2の周波数解析部304は、解析データ量調整処理を行う(ステップS1309)。システムに応じて解析計算の処理時間が異なる。このため、解析データ量調整処理では、システムへの負荷とレスポンス性能とが考慮され、処理時間が適当な時間となるようにデータ量が調整される。解析データ量調整処理については後述する。
解析データ量調整処理が行われた後、第2の周波数解析部304は、第2の開始位置を基準とする解析範囲の第2の音声データに対して第2の周波数解析を行い、第2の周波数解析の結果を示す第2の結果情報を生成する(ステップS1310)。第1の録音装置101から受信される結果情報要求は、解析範囲と第2の開始位置とに関する情報を含む。ステップS1310では、この情報が使用される。第2の録音処理が繰り返し行われるため、異なる複数の解析範囲毎に第2の周波数解析が行われる。また、異なる複数の解析範囲毎に第2の結果情報が生成される。
第2の周波数解析では、第1の周波数解析と同様にフーリエ変換が使用され、デジタルデータに対して解析の計算が行われる。解析条件としてデータ量の低減が指定されている場合、第2の周波数解析部304は、第2の音声データに対して1秒当たりのデータ量を減らして第2の周波数解析を行う。
第2の周波数解析が行われた後、第2の周波数解析部304は、第2の制御部306を介して第2の結果情報を第2の通信部311に出力する。第2の通信部311は、第2の結果情報を第1の録音装置101に送信する(ステップS1311)。第2の結果情報が送信された後、第2の通信部311は、雑音帯域情報を第1の録音装置101から受信する(ステップS1312)。受信された雑音帯域情報は、第2の制御部306を介して第2のフィルタ処理部303に出力される。
第2のフィルタ処理部303は、雑音帯域のデータをフィルタリングする第2のフィルタを生成する。第2のフィルタ処理部303はさらに、第2のフィルタによる第2のフィルタ処理を第2の音声データに施し、第4の音声データを生成する(ステップS1313)。第4の音声データは、雑音が除去された第2の音声のデジタルデータである。周波数と、振幅と、位相とが分かっているため、第2の音声データのうち雑音帯域に相当する部分のデジタルデータの位相を反転し、位相が反転されたデジタルデータを第2の音声データに重ね合わせることにより、第2の音声データから雑音帯域のデータを取り除くことができる。第2の録音処理が繰り返し行われるため、異なる複数の解析範囲毎に第2のフィルタが生成される。また、異なる複数の解析範囲毎に第2のフィルタ処理が行われる。
生成された第4の音声データは、第2の制御部306を介して第2の記録部310に出力される。第2の記録部310は、第4の音声データを記録する(ステップS1314)。
以上の処理により、第2の録音装置102は、目的音源以外の音源からの雑音が取り除かれた良好な音声のデジタルデータを得ることができる。また、第2の録音装置102は、第1の録音装置101で得られる第1の音声データにおける第1の音声品質と異なる第2の音声品質のデジタルデータを得ることができる。
(解析データ量調整処理)
図16を参照し、解析データ量調整処理について説明する。第1の周波数解析部204または第2の周波数解析部304は、デジタルデータに対して周波数解析を行うときのフーリエ変換に伴う計算時間を算出する(ステップS1601)。周波数解析に高速フーリエ変換(FFT)が使用される場合、データ量がNであるデータに対する計算回数は2Nlog2Nにより求まる。例えば、CPUが演算を行い、CPUクロックが1GHzである場合、1命令の実行時間は1nsである。例えば、高速フーリエ変換の計算に20命令が必要である場合、1回の計算時間は20nsである。デジタルデータが、48kHzのサンプリング周波数で1秒間に取得されたデータである場合、高速フーリエ変換の計算回数は、上記の式により1492872回となる。この計算時間は約300msである。
システムによって計算時間が異なる。録音処理のレスポンス性能を確保するために、第1の周波数解析部204または第2の周波数解析部304は、計算時間がデジタルデータの実時間を超えるか否かを確認する(ステップS1602)。計算時間がデジタルデータの実時間を超えない場合、解析データ量調整処理は終了する。計算時間がデジタルデータの実時間を超える場合、第1の周波数解析部204または第2の周波数解析部304は、データ量を調整するための条件を決定する(ステップS1603)。
例えば、高音質のデータに要求される分解能が0.1Hzである場合、10秒程度のデータ量が必要である。CPUクロックが1GHzである場合、192kHzのサンプリング周波数でサンプリングされた10秒間のデータの計算時間は約1.6秒である。計算時間が実時間を超えないため、問題はない。
一方、上記の条件でCPUクロックが100MHzである場合、計算時間は約16秒である。この場合、計算時間が実時間を超えるため、データ量を調整する必要がある。この場合、高速フーリエ変換による周波数解析が行われるとき、第1の周波数解析部204または第2の周波数解析部304は、デジタルデータの1秒あたりのデータ数を減らす。具体的には、第1の周波数解析部204または第2の周波数解析部304は、1秒当たりのデータ量を1/2倍または1/4倍等する。このようにデータ量が減らされた後、第1の周波数解析部204または第2の周波数解析部304は、計算時間を再計算し、計算時間が実時間を超えるか否かを再度確認する。データ量は、隣り合うデータを平均化することにより減らされる。上記の条件の場合、1秒当たりのデータ量が1/2になれば計算時間が約7.6秒となる。この計算時間は実時間を超えない。
第1の周波数解析部204または第2の周波数解析部304は、周波数解析を行うとき、必要に応じてこの処理を行う。これによって、データ量が減り、計算時間が短縮される。
以上の処理により、第1の録音装置101または第2の録音装置102は、計算時間がデジタルデータの実時間を超えないように第1の音声データまたは第2の音声データのデータ量を調整することができる。
本発明の実施形態では、第1の録音装置101が時刻差分算出部214を有する。しかし、第2の録音装置102が、時刻差分算出部214と同様の構成を有していてもよい。第2の録音装置102が、時刻差分算出部214と同様の構成を有する場合、図12に示す第1の録音処理と、図13に示す第2の録音処理とは、以下のように変更される。
例えば、第1の録音処理では、ステップS1204〜S1208の処理は行われない。また、ステップS1209の処理が行われる前に、ステップS1304〜S1306の処理と同様の処理が行われる。また、時刻差分に関する情報が第2の録音装置102から受信される。
例えば、第2の録音処理では、ステップS1304〜S1306の処理は行われない。また、ステップS1307の処理が行われる前に、ステップS1204〜S1208の処理と同様の処理が行われる。また、時刻差分に関する情報が第1の録音装置101に送信される。
本発明の実施形態によれば、第1の音声入力部216と、第1の通信部211と、第1の周波数解析部204と、条件決定部215と、雑音帯域検出部213と、第1のフィルタ処理部203と、第1の記録部210と、を有する第1の録音装置101が構成される。
また、本発明の実施形態によれば、第2の音声入力部313と、第2の通信部311と、第2の周波数解析部304と、第2のフィルタ処理部303と、第2の記録部310と、を有する第2の録音装置102が構成される。
また、本発明の実施形態によれば、第1の録音装置101と第2の録音装置102とを有する録音システム10が構成される。
また、本発明の実施形態によれば、第1の音声入力ステップ(ステップS1200)と、第1の周波数解析ステップ(ステップS1212)と、条件決定ステップ(ステップS1210)と、雑音帯域検出ステップ(ステップS1216)と、第1のフィルタ処理ステップ(ステップS1218)と、第1の記録ステップ(ステップS1219)と、第1の送信ステップ(ステップS1213)と、受信ステップ(ステップS1214)と、第2の送信ステップ(ステップS1217)と、を有する第1の録音方法が構成される。
また、本発明の実施形態によれば、第2の音声入力ステップ(ステップS1300)と、第2の周波数解析ステップ(ステップS1310)と、第2のフィルタ処理ステップ(ステップS1313)と、第2の記録ステップ(ステップS1314)と、第1の受信ステップ(ステップS1307)と、送信ステップ(ステップS1311)と、第2の受信ステップ(ステップS1312)と、を有する第2の録音方法が構成される。
また、本発明の実施形態によれば、第1の録音装置101のコンピュータに、第1の音声入力ステップ(ステップS1200)と、第1の周波数解析ステップ(ステップS1212)と、条件決定ステップ(ステップS1210)と、雑音帯域検出ステップ(ステップS1216)と、第1のフィルタ処理ステップ(ステップS1218)と、第1の記録ステップ(ステップS1219)と、第1の送信ステップ(ステップS1213)と、受信ステップ(ステップS1214)と、第2の送信ステップ(ステップS1217)と、を実行させるための第1の録音プログラムが構成される。
また、本発明の実施形態によれば、第2の録音装置102のコンピュータに、第2の音声入力ステップ(ステップS1300)と、第2の周波数解析ステップ(ステップS1310)と、第2のフィルタ処理ステップ(ステップS1313)と、第2の記録ステップ(ステップS1314)と、第1の受信ステップ(ステップS1307)と、送信ステップ(ステップS1311)と、第2の受信ステップ(ステップS1312)と、を実行させるための第2の録音プログラムが構成される。
本発明の実施形態では、複数の独立した録音装置が存在するシステムにおいて、雑音が低減された2つの音声データを得ることができる。また、第1の録音装置101と第2の録音装置102とにおいて、異なる音声品質のデジタルデータを得ることができる。
また、システム時刻の差分に基づいて、第1の周波数解析の第1の開始位置と第2の周波数解析の第2の開始位置とが決定される。このため、第1の録音装置101と第2の録音装置102とのシステム時刻が一致していない場合であっても、同一の期間に対応する第1の音声データと第2の音声データとに第1の周波数解析と第2の周波数解析とが行われる。この結果、第1の録音装置101は、雑音を精度良く低減するための雑音帯域を検出することができる。
以上、図面を参照して本発明の実施形態について詳述してきたが、具体的な構成は上記の実施形態に限られるものではなく、本発明の要旨を逸脱しない範囲の設計変更等も含まれる。
10 録音システム
101 第1の録音装置
102 第2の録音装置
201 第1のマイク部
202 第1のA/D変換部
203 第1のフィルタ処理部
204 第1の周波数解析部
205 第1の表示部
206 第1の制御部
207 第1の音声品質決定部
208 第1のメモリ
209 第1のクロック発生部
210 第1の記録部
211 第1の通信部
212 第1の入力部
213 雑音帯域検出部
214 時刻差分算出部
215 条件決定部
216 第1の音声入力部
301 第2のマイク部
302 第2のA/D変換部
303 第2のフィルタ処理部
304 第2の周波数解析部
305 第2の表示部
306 第2の制御部
307 第2の音声品質決定部
308 第2のメモリ
309 第2のクロック発生部
310 第2の記録部
311 第2の通信部
312 第2の入力部
313 第2の音声入力部

Claims (10)

  1. 第1の録音装置であって、
    第1の音声が入力され、入力された前記第1の音声から第1の音声データを生成する第1の音声入力部と、
    第1の通信部と、
    前記第1の音声データに対する第1の周波数解析を複数の解析範囲毎に行い、前記第1の周波数解析の結果を示す第1の結果情報を前記複数の解析範囲毎に生成する第1の周波数解析部と、
    第1の開始位置と第2の開始位置とを決定し、前記第1の音声データにおける第1の音声品質を考慮して前記解析範囲を決定し、前記第1の開始位置は、前記第1の周波数解析が開始される前記第1の音声データの位置であり、前記第2の開始位置は、第2の周波数解析が開始される第2の音声データの位置である条件決定部と、
    前記第1の結果情報と第2の結果情報とに基づいて、雑音帯域を前記複数の解析範囲毎に検出する雑音帯域検出部と、
    前記雑音帯域のデータをフィルタリングする第1のフィルタを前記複数の解析範囲毎に生成し、前記第1のフィルタによる第1のフィルタ処理を前記第1の音声データに前記複数の解析範囲毎に施し、第3の音声データを生成する第1のフィルタ処理部と、
    前記第3の音声データを記録する第1の記録部と、
    を有し、
    前記第1の通信部は、前記第2の開始位置と前記解析範囲とに関する情報を第2の録音装置に送信し、
    前記第1の通信部はさらに、前記第2の結果情報を前記複数の解析範囲毎に前記第2の録音装置から受信し、
    前記第1の通信部はさらに、前記雑音帯域に関する情報を前記複数の解析範囲毎に前記第2の録音装置に送信し、
    前記第2の録音装置は、第2の音声から前記第2の音声データを生成し、前記第2の音声データに対する前記第2の周波数解析を前記複数の解析範囲毎に行い、前記第2の周波数解析の結果を示す前記第2の結果情報を前記複数の解析範囲毎に生成し、前記雑音帯域のデータをフィルタリングする第2のフィルタを前記複数の解析範囲毎に生成し、前記第2のフィルタによる第2のフィルタ処理を前記第2の音声データに前記複数の解析範囲毎に施し、第4の音声データを前記複数の解析範囲毎に生成する
    第1の録音装置。
  2. 前記第1の音声品質に基づいて、前記第2の音声データにおける第2の音声品質を決定し、前記第2の音声品質は前記第1の音声品質と異なる第1の音声品質決定部をさらに有し、
    前記第1の通信部はさらに、前記第2の音声品質に関する音声品質情報を前記第2の録音装置に送信する
    請求項1に記載の第1の録音装置。
  3. 前記第1の音声データと前記第2の音声データとを比較する比較処理により前記第1の音声と前記第2の音声との位相差を検出し、検出された前記位相差に基づいて前記第1の録音装置と前記第2の録音装置とのシステム時刻の差分を算出する時刻差分算出部をさらに有し、
    前記条件決定部は、前記システム時刻の差分に基づいて前記第1の開始位置と前記第2の開始位置とを決定し、
    前記第1の通信部はさらに、前記第2の音声データを第2の録音装置から受信する
    請求項1に記載の第1の録音装置。
  4. 第2の録音装置であって、
    第2の音声が入力され、入力された前記第2の音声から第2の音声データを生成する第2の音声入力部と、
    第2の通信部と、
    前記第2の音声データに対する第2の周波数解析を複数の解析範囲毎に行い、前記第2の周波数解析の結果を示す第2の結果情報を前記複数の解析範囲毎に生成する第2の周波数解析部と、
    雑音帯域のデータをフィルタリングする第2のフィルタを前記複数の解析範囲毎に生成し、前記第2のフィルタによる第2のフィルタ処理を前記第2の音声データに前記複数の解析範囲毎に施し、第4の音声データを前記複数の解析範囲毎に生成する第2のフィルタ処理部と、
    前記第4の音声データを記録する第2の記録部と、
    を有し、
    前記第2の通信部はさらに、第2の開始位置と前記解析範囲とに関する情報を第1の録音装置から受信し、
    前記第2の通信部はさらに、前記第2の結果情報を前記複数の解析範囲毎に前記第1の録音装置に送信し、
    前記第2の通信部はさらに、前記雑音帯域に関する情報を前記複数の解析範囲毎に前記第1の録音装置から受信し、
    前記第1の録音装置は、第1の音声から第1の音声データを生成し、第1の音声データに対する第1の周波数解析を前記複数の解析範囲毎に行い、前記第1の周波数解析の結果を示す第1の結果情報を前記複数の解析範囲毎に生成し、第1の開始位置と前記第2の開始位置とを決定し、前記第1の音声データにおける第1の音声品質を考慮して前記解析範囲を決定し、前記第1の結果情報と前記第2の結果情報とに基づいて、前記雑音帯域を前記複数の解析範囲毎に検出し、前記雑音帯域のデータをフィルタリングする第1のフィルタを前記複数の解析範囲毎に生成し、前記第1のフィルタによる第1のフィルタ処理を前記第1の音声データに前記複数の解析範囲毎に施し、第3の音声データを前記複数の解析範囲毎に生成し、
    前記第1の開始位置は、前記第1の周波数解析が開始される前記第1の音声データの位置であり、前記第2の開始位置は、前記第2の周波数解析が開始される前記第2の音声データの位置である
    第2の録音装置。
  5. 音声品質情報に基づいて前記第2の音声データにおける第2の音声品質を決定する第2の音声品質決定部をさらに有し、
    前記第2の通信部はさらに、前記音声品質情報を前記第1の録音装置から受信する
    請求項4に記載の第2の録音装置。
  6. 第1の録音装置と第2の録音装置とを有する録音システムであって、
    前記第1の録音装置は、
    第1の音声が入力され、入力された前記第1の音声から第1の音声データを生成する第1の音声入力部と、
    第1の通信部と、
    前記第1の音声データに対する第1の周波数解析を複数の解析範囲毎に行い、前記第1の周波数解析の結果を示す第1の結果情報を前記複数の解析範囲毎に生成する第1の周波数解析部と、
    第1の開始位置と第2の開始位置とを決定し、前記第1の音声データにおける第1の音声品質を考慮して前記解析範囲を決定し、前記第1の開始位置は、前記第1の周波数解析が開始される前記第1の音声データの位置であり、前記第2の開始位置は、第2の周波数解析が開始される第2の音声データの位置である条件決定部と、
    前記第1の結果情報と第2の結果情報とに基づいて、雑音帯域を前記複数の解析範囲毎に検出する雑音帯域検出部と、
    前記雑音帯域のデータをフィルタリングする第1のフィルタを前記複数の解析範囲毎に生成し、前記第1のフィルタによる第1のフィルタ処理を前記第1の音声データに前記複数の解析範囲毎に施し、第3の音声データを生成する第1のフィルタ処理部と、
    前記第3の音声データを記録する第1の記録部と、
    を有し、
    前記第1の通信部は、前記第2の開始位置と前記解析範囲とに関する情報を前記第2の録音装置に送信し、
    前記第1の通信部はさらに、前記第2の結果情報を前記複数の解析範囲毎に前記第2の録音装置から受信し、
    前記第1の通信部はさらに、前記雑音帯域に関する情報を前記複数の解析範囲毎に前記第2の録音装置に送信し、
    前記第2の録音装置は、
    第2の音声が入力され、入力された前記第2の音声から前記第2の音声データを生成する第2の音声入力部と、
    第2の通信部と、
    前記第2の音声データに対する前記第2の周波数解析を複数の解析範囲毎に行い、前記第2の周波数解析の結果を示す第2の結果情報を前記複数の解析範囲毎に生成する第2の周波数解析部と、
    前記雑音帯域のデータをフィルタリングする第2のフィルタを前記複数の解析範囲毎に生成し、前記第2のフィルタによる第2のフィルタ処理を前記第2の音声データに前記複数の解析範囲毎に施し、第4の音声データを前記複数の解析範囲毎に生成する第2のフィルタ処理部と、
    前記第4の音声データを記録する第2の記録部と、
    を有し、
    前記第2の通信部は、前記第2の開始位置と前記解析範囲とに関する情報を前記第1の録音装置から受信し、
    前記第2の通信部はさらに、前記第2の結果情報を前記複数の解析範囲毎に前記第1の録音装置に送信し、
    前記第2の通信部はさらに、前記雑音帯域に関する情報を前記複数の解析範囲毎に前記第1の録音装置から受信する
    録音システム。
  7. 第1の録音装置が行う第1の録音方法であって、
    第1の音声が入力され、入力された前記第1の音声から第1の音声データを生成する第1の音声入力ステップと、
    前記第1の音声データに対する第1の周波数解析を複数の解析範囲毎に行い、前記第1の周波数解析の結果を示す第1の結果情報を前記複数の解析範囲毎に生成する第1の周波数解析ステップと、
    第1の開始位置と第2の開始位置とを決定し、前記第1の音声データにおける第1の音声品質を考慮して前記解析範囲を決定し、前記第1の開始位置は、前記第1の周波数解析が開始される前記第1の音声データの位置であり、前記第2の開始位置は、第2の周波数解析が開始される第2の音声データの位置である条件決定ステップと、
    前記第1の結果情報と第2の結果情報とに基づいて、雑音帯域を前記複数の解析範囲毎に検出する雑音帯域検出ステップと、
    前記雑音帯域のデータをフィルタリングする第1のフィルタを前記複数の解析範囲毎に生成し、前記第1のフィルタによる第1のフィルタ処理を前記第1の音声データに前記複数の解析範囲毎に施し、第3の音声データを生成する第1のフィルタ処理ステップと、
    前記第3の音声データを記録する第1の記録ステップと、
    前記第2の開始位置と前記解析範囲とに関する情報を第2の録音装置に送信する第1の送信ステップと、
    前記第2の結果情報を前記複数の解析範囲毎に前記第2の録音装置から受信する受信ステップと、
    前記雑音帯域に関する情報を前記複数の解析範囲毎に前記第2の録音装置に送信する第2の送信ステップと、
    を有し、
    前記第2の録音装置は、第2の音声から前記第2の音声データを生成し、前記第2の音声データに対する前記第2の周波数解析を前記複数の解析範囲毎に行い、前記第2の周波数解析の結果を示す前記第2の結果情報を前記複数の解析範囲毎に生成し、前記雑音帯域のデータをフィルタリングする第2のフィルタを前記複数の解析範囲毎に生成し、前記第2のフィルタによる第2のフィルタ処理を前記第2の音声データに前記複数の解析範囲毎に施し、第4の音声データを前記複数の解析範囲毎に生成する
    第1の録音方法。
  8. 第2の録音装置が行う第2の録音方法であって、
    第2の音声が入力され、入力された前記第2の音声から第2の音声データを生成する第2の音声入力ステップと、
    前記第2の音声データに対する第2の周波数解析を複数の解析範囲毎に行い、前記第2の周波数解析の結果を示す第2の結果情報を前記複数の解析範囲毎に生成する第2の周波数解析ステップと、
    雑音帯域のデータをフィルタリングする第2のフィルタを前記複数の解析範囲毎に生成し、前記第2のフィルタによる第2のフィルタ処理を前記第2の音声データに前記複数の解析範囲毎に施し、第4の音声データを前記複数の解析範囲毎に生成する第2のフィルタ処理ステップと、
    前記第4の音声データを記録する第2の記録ステップと、
    第2の開始位置と前記解析範囲とに関する情報を第1の録音装置から受信する第1の受信ステップと、
    前記第2の結果情報を前記複数の解析範囲毎に前記第1の録音装置に送信する送信ステップと、
    前記雑音帯域に関する情報を前記複数の解析範囲毎に前記第1の録音装置から受信する第2の受信ステップと、
    を有し、
    前記第1の録音装置は、第1の音声から第1の音声データを生成し、第1の音声データに対する第1の周波数解析を前記複数の解析範囲毎に行い、前記第1の周波数解析の結果を示す第1の結果情報を前記複数の解析範囲毎に生成し、第1の開始位置と前記第2の開始位置とを決定し、前記第1の音声データにおける第1の音声品質を考慮して前記解析範囲を決定し、前記第1の結果情報と前記第2の結果情報とに基づいて、前記雑音帯域を前記複数の解析範囲毎に検出し、前記雑音帯域のデータをフィルタリングする第1のフィルタを前記複数の解析範囲毎に生成し、前記第1のフィルタによる第1のフィルタ処理を前記第1の音声データに前記複数の解析範囲毎に施し、第3の音声データを前記複数の解析範囲毎に生成し、
    前記第1の開始位置は、前記第1の周波数解析が開始される前記第1の音声データの位置であり、前記第2の開始位置は、前記第2の周波数解析が開始される前記第2の音声データの位置である
    第2の録音方法。
  9. 第1の録音装置のコンピュータに、
    第1の音声が入力され、入力された前記第1の音声から第1の音声データを生成する第1の音声入力ステップと、
    前記第1の音声データに対する第1の周波数解析を複数の解析範囲毎に行い、前記第1の周波数解析の結果を示す第1の結果情報を前記複数の解析範囲毎に生成する第1の周波数解析ステップと、
    第1の開始位置と第2の開始位置とを決定し、前記第1の音声データにおける第1の音声品質を考慮して前記解析範囲を決定し、前記第1の開始位置は、前記第1の周波数解析が開始される前記第1の音声データの位置であり、前記第2の開始位置は、第2の周波数解析が開始される第2の音声データの位置である条件決定ステップと、
    前記第1の結果情報と第2の結果情報とに基づいて、雑音帯域を前記複数の解析範囲毎に検出する雑音帯域検出ステップと、
    前記雑音帯域のデータをフィルタリングする第1のフィルタを前記複数の解析範囲毎に生成し、前記第1のフィルタによる第1のフィルタ処理を前記第1の音声データに前記複数の解析範囲毎に施し、第3の音声データを生成する第1のフィルタ処理ステップと、
    前記第3の音声データを記録する第1の記録ステップと、
    前記第2の開始位置と前記解析範囲とに関する情報を第2の録音装置に送信する第1の送信ステップと、
    前記第2の結果情報を前記複数の解析範囲毎に前記第2の録音装置から受信する受信ステップと、
    前記雑音帯域に関する情報を前記複数の解析範囲毎に前記第2の録音装置に送信する第2の送信ステップと、
    を実行させるための第1の録音プログラムであって、
    前記第2の録音装置は、第2の音声から前記第2の音声データを生成し、前記第2の音声データに対する前記第2の周波数解析を前記複数の解析範囲毎に行い、前記第2の周波数解析の結果を示す前記第2の結果情報を前記複数の解析範囲毎に生成し、前記雑音帯域のデータをフィルタリングする第2のフィルタを前記複数の解析範囲毎に生成し、前記第2のフィルタによる第2のフィルタ処理を前記第2の音声データに前記複数の解析範囲毎に施し、第4の音声データを前記複数の解析範囲毎に生成する
    第1の録音プログラム。
  10. 第2の録音装置のコンピュータに、
    第2の音声が入力され、入力された前記第2の音声から第2の音声データを生成する第2の音声入力ステップと、
    前記第2の音声データに対する第2の周波数解析を複数の解析範囲毎に行い、前記第2の周波数解析の結果を示す第2の結果情報を前記複数の解析範囲毎に生成する第2の周波数解析ステップと、
    雑音帯域のデータをフィルタリングする第2のフィルタを前記複数の解析範囲毎に生成し、前記第2のフィルタによる第2のフィルタ処理を前記第2の音声データに前記複数の解析範囲毎に施し、第4の音声データを前記複数の解析範囲毎に生成する第2のフィルタ処理ステップと、
    前記第4の音声データを記録する第2の記録ステップと、
    第2の開始位置と前記解析範囲とに関する情報を第1の録音装置から受信する第1の受信ステップと、
    前記第2の結果情報を前記複数の解析範囲毎に前記第1の録音装置に送信する送信ステップと、
    前記雑音帯域に関する情報を前記複数の解析範囲毎に前記第1の録音装置から受信する第2の受信ステップと、
    を実行させるための第2の録音プログラムであって、
    前記第1の録音装置は、第1の音声から第1の音声データを生成し、第1の音声データに対する第1の周波数解析を前記複数の解析範囲毎に行い、前記第1の周波数解析の結果を示す第1の結果情報を前記複数の解析範囲毎に生成し、第1の開始位置と前記第2の開始位置とを決定し、前記第1の音声データにおける第1の音声品質を考慮して前記解析範囲を決定し、前記第1の結果情報と前記第2の結果情報とに基づいて、前記雑音帯域を前記複数の解析範囲毎に検出し、前記雑音帯域のデータをフィルタリングする第1のフィルタを前記複数の解析範囲毎に生成し、前記第1のフィルタによる第1のフィルタ処理を前記第1の音声データに前記複数の解析範囲毎に施し、第3の音声データを前記複数の解析範囲毎に生成し、
    前記第1の開始位置は、前記第1の周波数解析が開始される前記第1の音声データの位置であり、前記第2の開始位置は、前記第2の周波数解析が開始される前記第2の音声データの位置である
    第2の録音プログラム。
JP2014214421A 2014-10-21 2014-10-21 第1の録音装置、第2の録音装置、録音システム、第1の録音方法、第2の録音方法、第1の録音プログラム、および第2の録音プログラム Expired - Fee Related JP6395558B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2014214421A JP6395558B2 (ja) 2014-10-21 2014-10-21 第1の録音装置、第2の録音装置、録音システム、第1の録音方法、第2の録音方法、第1の録音プログラム、および第2の録音プログラム
PCT/JP2015/075855 WO2016063651A1 (ja) 2014-10-21 2015-09-11 第1の録音装置、第2の録音装置、録音システム、第1の録音方法、第2の録音方法、第1の録音プログラム、および第2の録音プログラム
US15/489,012 US10356518B2 (en) 2014-10-21 2017-04-17 First recording device, second recording device, recording system, first recording method, second recording method, first computer program product, and second computer program product

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014214421A JP6395558B2 (ja) 2014-10-21 2014-10-21 第1の録音装置、第2の録音装置、録音システム、第1の録音方法、第2の録音方法、第1の録音プログラム、および第2の録音プログラム

Publications (2)

Publication Number Publication Date
JP2016080968A JP2016080968A (ja) 2016-05-16
JP6395558B2 true JP6395558B2 (ja) 2018-09-26

Family

ID=55760696

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014214421A Expired - Fee Related JP6395558B2 (ja) 2014-10-21 2014-10-21 第1の録音装置、第2の録音装置、録音システム、第1の録音方法、第2の録音方法、第1の録音プログラム、および第2の録音プログラム

Country Status (3)

Country Link
US (1) US10356518B2 (ja)
JP (1) JP6395558B2 (ja)
WO (1) WO2016063651A1 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111145770B (zh) * 2018-11-02 2022-11-22 北京微播视界科技有限公司 音频处理方法和装置
CN109545242A (zh) * 2018-12-07 2019-03-29 广州势必可赢网络科技有限公司 一种音频数据处理方法、系统、装置及可读存储介质
CN110189771A (zh) * 2019-05-31 2019-08-30 腾讯音乐娱乐科技(深圳)有限公司 同源音频的音质检测方法、装置及存储介质

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06110455A (ja) * 1992-09-25 1994-04-22 Mitsubishi Electric Corp オーディオ信号の符号化/復号化方法およびこの方法を用いたオーディオ再生装置
JP2002258895A (ja) * 2001-03-05 2002-09-11 Korg Inc 多チャンネル録音再生装置
US20040078199A1 (en) * 2002-08-20 2004-04-22 Hanoh Kremer Method for auditory based noise reduction and an apparatus for auditory based noise reduction
US7454331B2 (en) * 2002-08-30 2008-11-18 Dolby Laboratories Licensing Corporation Controlling loudness of speech in signals that contain speech and other types of audio material
US7464029B2 (en) * 2005-07-22 2008-12-09 Qualcomm Incorporated Robust separation of speech signals in a noisy environment
JP6179081B2 (ja) 2011-09-15 2017-08-16 株式会社Jvcケンウッド ノイズ低減装置、音声入力装置、無線通信装置、およびノイズ低減方法
JP5705190B2 (ja) * 2012-11-05 2015-04-22 日本電信電話株式会社 音響信号強調装置、音響信号強調方法、およびプログラム
JP6278294B2 (ja) * 2013-03-11 2018-02-14 大学共同利用機関法人情報・システム研究機構 音声信号処理装置及び方法

Also Published As

Publication number Publication date
US10356518B2 (en) 2019-07-16
US20170223453A1 (en) 2017-08-03
JP2016080968A (ja) 2016-05-16
WO2016063651A1 (ja) 2016-04-28

Similar Documents

Publication Publication Date Title
US8160270B2 (en) Method and apparatus for acquiring multi-channel sound by using microphone array
EP3320692B1 (en) Spatial audio processing apparatus
JP6074263B2 (ja) 雑音抑圧装置及びその制御方法
US9538308B2 (en) Adaptive room equalization using a speaker and a handheld listening device
CN110537221A (zh) 用于空间音频处理的两阶段音频聚焦
EP1954096B1 (en) Apparatus and method for measuring loudspeaker transfer function with enhanced frequency resolution
JP2010233173A (ja) 信号処理装置、および信号処理方法、並びにプログラム
CN106470379B (zh) 用于基于扬声器位置信息处理音频信号的方法和设备
JP2020500480A (ja) デバイス内の非対称配列の複数のマイクからの空間メタデータの分析
JP6395558B2 (ja) 第1の録音装置、第2の録音装置、録音システム、第1の録音方法、第2の録音方法、第1の録音プログラム、および第2の録音プログラム
JP2017530396A (ja) 音源を強調するための方法及び機器
US20220246161A1 (en) Sound modification based on frequency composition
US20160100259A1 (en) Feedback estimation based on deterministic sequences
KR101008250B1 (ko) 기지 음향신호 제거방법 및 장치
JP2009075160A (ja) コミュニケーション音声処理方法とその装置、及びそのプログラム
US10366703B2 (en) Method and apparatus for processing audio signal including shock noise
KR101850693B1 (ko) 인-이어 마이크로폰을 갖는 이어셋의 대역폭 확장 장치 및 방법
CN109076283B (zh) 耳机的音色补偿装置及方法
JP4960838B2 (ja) 距離測定装置、距離測定方法、距離測定プログラム、および記録媒体
WO2023051622A1 (zh) 提升远场语音交互性能的方法和远场语音交互系统
CN110301142B (zh) 滤波器生成装置、滤波器生成方法以及存储介质
CN109688531B (zh) 获取高音质音频变换信息的方法、电子装置及记录介质
JP4746498B2 (ja) 単一指向性マイクロホン
JP6018141B2 (ja) オーディオ信号処理装置、オーディオ信号処理方法およびオーディオ信号処理プログラム
Zhidkov Statistical characterization and modeling of noise effects in near-ultrasound aerial acoustic communications

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170822

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180807

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180828

R151 Written notification of patent or utility model registration

Ref document number: 6395558

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees