WO2019012587A1 - ゲイン調整装置、遠隔会話装置、ゲイン調整方法、およびゲイン調整プログラム - Google Patents

ゲイン調整装置、遠隔会話装置、ゲイン調整方法、およびゲイン調整プログラム Download PDF

Info

Publication number
WO2019012587A1
WO2019012587A1 PCT/JP2017/025163 JP2017025163W WO2019012587A1 WO 2019012587 A1 WO2019012587 A1 WO 2019012587A1 JP 2017025163 W JP2017025163 W JP 2017025163W WO 2019012587 A1 WO2019012587 A1 WO 2019012587A1
Authority
WO
WIPO (PCT)
Prior art keywords
gain adjustment
microphone
sensor
level
distance
Prior art date
Application number
PCT/JP2017/025163
Other languages
English (en)
French (fr)
Inventor
訓史 鵜飼
未輝雄 村松
Original Assignee
ヤマハ株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ヤマハ株式会社 filed Critical ヤマハ株式会社
Priority to PCT/JP2017/025163 priority Critical patent/WO2019012587A1/ja
Priority to JP2019529340A priority patent/JPWO2019012587A1/ja
Publication of WO2019012587A1 publication Critical patent/WO2019012587A1/ja
Priority to US16/710,355 priority patent/US10893358B2/en

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/005Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G3/00Gain control in amplifiers or frequency changers
    • H03G3/20Automatic control
    • H03G3/30Automatic control in amplifiers having semiconductor devices
    • H03G3/3005Automatic control in amplifiers having semiconductor devices in amplifiers suitable for low-frequencies, e.g. audio amplifiers
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G3/00Gain control in amplifiers or frequency changers
    • H03G3/20Automatic control
    • H03G3/30Automatic control in amplifiers having semiconductor devices
    • H03G3/32Automatic control in amplifiers having semiconductor devices the control being dependent upon ambient noise level or sound level
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/56Arrangements for connecting several subscribers to a common circuit, i.e. affording conference facilities
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/14Systems for two-way working
    • H04N7/15Conference systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/20Arrangements for obtaining desired frequency or directional characteristics
    • H04R1/32Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
    • H04R1/326Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only for microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R5/00Stereophonic arrangements
    • H04R5/027Spatial or constructional arrangements of microphones, e.g. in dummy heads
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2430/00Signal processing covered by H04R, not provided for in its groups
    • H04R2430/01Aspects of volume control, not necessarily automatic, in sound systems

Definitions

  • One embodiment of the present invention relates to a gain adjustment device for adjusting the gain of an audio signal, a remote conversation device, a gain adjustment method, and a gain adjustment program.
  • the audio signal automatic level adjustment device of Patent Document 1 discloses a configuration that monitors the level of an input signal and attenuates the signal when a high level signal is input.
  • a gain adjustment device capable of maintaining the level constant regardless of the distance to the speaker and reflecting the change in the speaker volume Intended to provide.
  • a gain adjustment device includes a level adjuster, a sensor, and a setting unit.
  • the level adjuster adjusts the level of the audio signal acquired by the microphone.
  • the sensor measures a physical quantity that changes according to the distance.
  • the setting unit sets the gain of the level adjuster according to the measurement result of the sensor.
  • the level can be made constant regardless of the distance to the speaker, and changes in the volume of the speaker can be reflected.
  • FIG. It is the schematic which shows the structure of a sound collection apparatus. It is a block diagram which shows the structure of a sound collection apparatus. It is a block diagram which shows the functional structure of CPU. It is a flowchart which shows operation
  • FIG. It is a block diagram showing composition of sound collection device 1A. It is a block diagram which shows the functional structure of CPU. It is a block diagram showing functional composition of CPU further provided with a band pass filter. It is a figure which shows the audio processing apparatus 1B further provided with the speaker 16.
  • FIG. It is a figure showing composition of a speech processing system. It is a figure showing a headset type case. 12A and 12B are schematic views showing the features of the speech processing system according to the second embodiment.
  • the gain adjustment device of the first embodiment includes a level adjuster, a sensor, and a setting unit.
  • the level adjuster adjusts the level of the audio signal acquired by the microphone.
  • the sensor measures a physical quantity that changes according to the distance.
  • the setting unit sets the gain of the level adjuster according to the measurement result of the sensor.
  • the gain adjustment apparatus acquires a physical quantity (for example, a time from transmission to reception of an electromagnetic wave, or a ratio of signal levels acquired by a plurality of microphones, etc.) that changes according to distance. Since the gain is set accordingly, it is possible to adjust to a constant gain regardless of the distance to the speaker. Further, since the gain setting does not change when the distance does not change, the gain adjusting device can reflect the change of the volume of the speaker when the speaker intentionally changes the volume.
  • a physical quantity for example, a time from transmission to reception of an electromagnetic wave, or a ratio of signal levels acquired by a plurality of microphones, etc.
  • FIG. 1 is a schematic external view showing the configuration of a sound collection device 1 provided with a gain adjustment device.
  • the sound collection device 1 includes a cylindrical case 50, a microphone 15, and a sensor 17.
  • the microphone 15 is disposed on the top surface of the housing 50.
  • the shape of the housing 50 and the arrangement of the microphones are merely an example, and the present invention is not limited to this example.
  • the microphone 15 is, for example, a directional microphone.
  • the microphone 15 has the highest sensitivity in the front (left direction in the drawing) of the device and no sensitivity in the rear (right direction in the drawing).
  • the directivity of the microphone is not limited to this example.
  • the sound collection device 1 includes an interface (I / F) 11, a CPU 12, a RAM 13, a memory 14, a microphone 15, and a sensor 17.
  • the memory 14 is made of a storage medium such as a flash memory or a hard disk drive (HDD).
  • the memory 14 stores an operation program for the CPU 12.
  • the microphone 15 acquires the voice of the speaker.
  • the microphone 15 outputs an audio signal related to the acquired voice to the CPU 12.
  • the CPU 12 performs signal processing on the audio signal input from the microphone 15 and outputs the processed signal to the I / F 11.
  • the sound collection device 1 may include a dedicated processor (DSP: Digital Signal Processor) for signal processing.
  • DSP Digital Signal Processor
  • the DSP performs signal processing in accordance with the instruction of the CPU 12.
  • the I / F 11 outputs an audio signal input from the CPU 12 to the outside.
  • the I / F 11 is, for example, a communication I / F such as USB.
  • the I / F 11 outputs an audio signal to an information processing apparatus or the like.
  • the I / F 11 outputs the audio signal to a storage unit (not shown).
  • the storage unit records the collected sound signal acquired by the microphone 15 as recording data.
  • the CPU 12 performs various operations by reading a program from the memory 14 and temporarily storing the program in the RAM 13.
  • FIG. 3 is a functional block diagram of the CPU 12.
  • the CPU 12 implements the setting unit 121 and the level adjuster 122 by the above program.
  • the setting unit 121, the level adjuster 122, and the sensor 17 implement the gain adjustment device of the present invention.
  • the level adjuster 122 adjusts the level of the audio signal input from the microphone 15 and outputs it to the I / F 11.
  • the level adjuster 122 sets the gain of the level adjuster 122 according to the measurement result of the sensor 17.
  • FIG. 4 is a flowchart showing the operation of the CPU 12.
  • the CPU 12 obtains a distance estimated value from the sensor 17 (S11).
  • the level adjuster 122 inputs an audio signal from the microphone 15 (S12).
  • the setting unit 121 sets the gain of the level adjuster 122 according to the distance estimation value (S13).
  • the level adjuster 122 adjusts the level of the audio signal with the set gain and outputs it (S14).
  • the sensor 17 is a distance measurement sensor in this example.
  • the distance measuring sensor transmits an electromagnetic wave such as infrared light, for example, and receives a reflected wave.
  • the sensor 17 is installed, for example, on the side surface of the housing 50.
  • the sensor 17 transmits an infrared ray to the front (left direction in FIG. 1) of the device, and receives a reflected wave from an object (a speaker in this embodiment).
  • the sensor 17 obtains a time difference from the transmission of the infrared light to the reception thereof. This time difference is an example of a physical quantity that changes according to the distance between the sensor 17 and the speaker.
  • the distance between the sensor 17 and the speaker is estimated from the time difference between transmission and reception of infrared light.
  • the distance estimated value D may be obtained by the sensor 17 or may be obtained by the CPU 12 acquiring the transmission time T1 and the reception time T2 from the sensor 17.
  • the level adjuster 122 sets the gain of the level adjuster 122 in accordance with the distance estimated value D, which is the measurement result of the sensor 17.
  • D the distance estimated value
  • the gain increases as the distance of the speaker increases, so that an audio signal of uniform level is output regardless of the distance between the microphone 15 and the speaker.
  • the level of the audio signal also changes when the speaker intentionally changes the volume. Therefore, the sound collection device 1 can reflect the change in the volume of the speaker.
  • FIG. 5 is an outline schematic view of a sound collection device 1A according to a first modification. Also in FIG. 5, the main configuration relating to sound collection is described, and the other configurations are not described.
  • the sound collection device 1A includes two microphones 15A and a microphone 15B in addition to the example of FIG.
  • the microphones 15A and 15B are disposed on the top surface of the housing 50.
  • the microphones 15A and 15B are, for example, directional microphones.
  • the microphone 15A and the microphone 15B have the highest sensitivity in the front (left direction in the drawing) of the device and no sensitivity in the rear (right direction in the drawing).
  • the microphone 15A is disposed in front of the housing 50, and the microphone 15B is disposed in the rear of the housing 50.
  • the directivity of the two microphones is also not limited to this example.
  • FIG. 6 is a block diagram showing the configuration of the sound collection device 1A.
  • the sound collection device 1A does not include the sensor 17 as compared with the sound collection device of FIG. Further, unlike the sound collection device 1, the sound collection device 1A includes a plurality of (two in this example) microphones 15A and microphones 15B.
  • FIG. 7 is a block diagram showing a functional configuration of the CPU 12.
  • the CPU 12 further includes a calculation unit 123.
  • the calculation unit 123 inputs an audio signal from the microphone 15A and the microphone 15B.
  • the level adjuster 122 receives an audio signal from the microphone 15A.
  • the senor of the present invention is realized by the microphone 15A, the microphone 15B, and the calculation unit 123 (software executed by the CPU 12).
  • the calculator 123 calculates the level ratio of the microphone 15A and the microphone 15B.
  • the calculator 123 calculates, for example, the power of the audio signal of the microphone 15A and the power of the audio signal of the microphone 15B. In addition, the calculation unit 123 averages the calculated power in a predetermined time range. Furthermore, the calculation unit 123 divides the average power value of the audio signal of the microphone 15A by the average power value of the audio signal of the microphone 15B. This division value corresponds to the above level ratio. The division value is an example of the level ratio. The calculator 123 may calculate the level ratio from the instantaneous value of the amplitude, for example.
  • the level of the speech signal decreases as the distance between the microphone and the speaker increases.
  • the level ratio is also an example of a physical quantity that changes according to the distance between the sensor and the speaker.
  • the setting unit 121 sets the gain of the level adjuster 122 according to the level ratio calculated by the calculation unit 123.
  • the gain increases as the distance between the microphone and the speaker increases, so that a voice signal with a uniform level is output regardless of the distance between the microphone 15A and the speaker. Ru. Further, since the gain G does not change when the distance does not change, the sound collection device 1 can reflect the change of the volume of the speaker.
  • FIG. 7 shows an example in which the level adjuster 122 inputs the audio signal of the microphone 15A
  • the audio signal of the microphone 15B may be input to adjust the level of the audio signal of the microphone 15B.
  • the CPU 12 may further include a band pass filter (BPF) 124.
  • the BPF 124 extracts predetermined bands for the audio signal of the microphone 15A and the audio signal of the microphone 15B.
  • the BPF 124 extracts a low band (for example, 1 kHz or less) in which the influence of directivity is small.
  • the physical quantity is calculated using a signal in a band in which the influence of directivity is small (a band in which sound tends to get around easily). Therefore, even if there is an obstacle between microphone 15A and microphone 15B, for example Instead, physical quantities (values that change according to distance) can be calculated with high accuracy.
  • the sound collection device is shown as an example of the device provided with the gain adjustment device of the present invention.
  • the gain adjustment device can also be used for an audio processing device 1B further provided with a speaker 16 as shown in FIG. 9, for example.
  • the voice processing device 1B further includes a speaker 16 in addition to the configuration of the sound collection device 1A shown in FIG.
  • the CPU 12 performs signal processing on the audio signal input from the I / F 11 and outputs the processed signal to the speaker 16.
  • the speaker 16 outputs voice based on the voice signal input from the CPU 12.
  • the voice processing device 1B is connected to the voice processing device 3 installed at a remote place via the network 2 to configure a voice processing system.
  • the voice processing device 3 has the same configuration and function as the voice processing device 1B.
  • the user can use the voice processing device 1B and the voice processing device 3 to conduct a conversation between remote places.
  • the voice processing device 1B and the voice processing device 3 respectively correspond to a remote conversation device.
  • the shape of the voice processing apparatus 1B is not limited to the case shown in FIGS. 1 and 5, and may be, for example, a headset-type case shown in FIG.
  • the microphone 15A is placed at the mouth of the speaker, and the microphone 15B is placed near the ear (speaker 16) remote from the mouth of the speaker.
  • the setting unit 121 increases the gain linearly as the distance to the speaker increases, for example, according to the physical amount measured by the sensor.
  • the setting unit 121 may change the gain nonlinearly according to the distance to the speaker. For example, as the distance between the microphone and the speaker increases, the indirect sound becomes dominant, and the ratio of the direct sound of the speaker decreases. Therefore, the setting unit 121 may increase the amount of gain increase as the distance to the speaker increases.
  • the voice processing system includes a transmitting device (voice processing device 1B) and a receiving device (voice processing device 3) connected via a network.
  • the transmission device includes a microphone, a sensor, a sound pressure measurement unit, and a transmission unit (I / F 11).
  • the sensor measures a physical quantity that changes according to the distance.
  • the sound pressure measurement unit measures the input sound pressure level of the microphone.
  • the transmission unit transmits the measurement result of the sensor and the measurement result of the sound pressure measurement unit.
  • the receiving device includes a receiving unit (I / F 11) and an output sound pressure level adjusting unit. The receiving unit receives the measurement result of the sensor and the measurement result of the sound pressure measurement unit.
  • the output sound pressure level adjustment unit adjusts the output sound pressure level of the speaker.
  • the speech processing system can reproduce the sense of distance between the speaker and the microphone on the transmission side on the reception side. That is, in the voice processing system according to the second embodiment, the second user on the receiving side is as if the first user on the transmitting side is in the space on the receiving side and the conversation sound is emitted from the first user in the same space. You can feel like that.
  • FIG. 12A and 12B are schematic views showing the features of the speech processing system according to the second embodiment.
  • the audio processing system includes an audio processing device 1B and an audio processing device 3 connected via the network 2 as in FIG.
  • the configurations of the transmission side voice processing apparatus 1B and the reception side voice processing apparatus 3 are the same as the configurations shown in the block diagram of FIG.
  • FIG. 12A and FIG. 12B show a configuration in which the speaker 16 is provided on the side surface of the housing 50 as an example.
  • the voice processing system adjusts the output sound pressure level of the speaker 16 on the receiving side according to the distance between the speaker and the device on the transmitting side and the input sound pressure level measured by the microphone 15.
  • the point to do is a feature.
  • the CPU 12 of the voice processing apparatus 1B on the transmission side corresponds to a sound pressure measurement unit, and measures the input sound pressure level of the microphone 15A, that is, the sound pressure (dBSPL).
  • the CPU 12 receives the measured sound pressure and the distance to the speaker (for example, the level ratio calculated by the calculation unit 123 or a physical quantity that changes according to the distance, such as the time difference measured by the sensor 17). It is transmitted to the voice processing device 3.
  • the CPU 12 of the voice processing device 3 corresponds to the output sound pressure level adjustment unit of the speaker, and adjusts the output sound pressure level of the speaker 16 based on the received sound pressure and the distance to the speaker.
  • the voice of the first user 91 is adjusted by adjusting the output sound pressure level of the speaker 16 to the output sound pressure level of 56 dBSPL at the position of the second user 92 located 1 m away from the speaker 16.
  • the microphone 15A and the speaker 16 of the voice processing device 3 have a fixed distance, if the output sound pressure level of the speaker 16 at this fixed distance is measured, the output sound pressure level at the position of the user can be obtained. Can be determined. For example, when the distance between the microphone 15A and the speaker 16 is 5 cm, 82 dBSPL at the position of the microphone 15A results in 56 dBSPL at a position 1 m apart.
  • the speech processing system according to the second embodiment adjusts the output sound pressure level of the speaker on the receiving side so as to reproduce the distance to the speaker on the transmitting side. Therefore, in the voice processing system according to the second embodiment, the second user on the receiving side can feel as if the first user in the same space has made a speech sound.
  • gain adjustment may be performed according to the distance on the transmission side, and the output sound pressure level of the speaker may be adjusted on the reception side.
  • the description of the present embodiment is to be considered in all respects as illustrative and not restrictive.
  • the scope of the present invention is indicated not by the embodiments described above but by the claims. Further, the scope of the present invention is intended to include all modifications within the scope and meaning equivalent to the claims.
  • the sensor may be in the form of a camera and a calculator configured to calculate the size of an image captured by the camera as a physical quantity.
  • the setting unit 121 sets the gain of the level adjuster 122 according to the physical quantity measured by the sensor.

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Otolaryngology (AREA)
  • General Health & Medical Sciences (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Telephone Function (AREA)
  • Telephonic Communication Services (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

ゲイン調整装置は、レベル調整器と、センサと、設定部と、を備えている。レベル調整器は、マイクで取得した音声信号のレベルを調整する。センサは、距離に応じて変化する物理量を測定する。設定部は、前記センサの測定結果に応じて、前記レベル調整器のゲインを設定する。

Description

ゲイン調整装置、遠隔会話装置、ゲイン調整方法、およびゲイン調整プログラム
 本発明の一実施形態は、音声信号のゲインを調整するゲイン調整装置、遠隔会話装置、ゲイン調整方法、およびゲイン調整プログラムに関する。
 特許文献1の音声信号自動レベル調整装置は、入力信号のレベルを監視して、高レベルの信号が入力されたときに、該信号を減衰させる構成が開示されている。
特公昭62-31856号公報
 特許文献1の音声信号自動レベル調整装置は、話者が大きい声で話しても、小さい声で話しても、一定音量に調整してしまうため、話者が意図的に音量を変化させたとしても、同じ音量に調整してしまう。
 本発明の一実施形態は、話者との距離に関わらずレベルを一定とし、かつ話者の音量の変化を反映させることができるゲイン調整装置、遠隔会話装置、ゲイン調整方法、およびゲイン調整プログラムを提供することを目的とする。
 本発明の一実施形態に係るゲイン調整装置は、レベル調整器と、センサと、設定部と、を備えている。レベル調整器は、マイクで取得した音声信号のレベルを調整する。センサは、距離に応じて変化する物理量を測定する。設定部は、前記センサの測定結果に応じて、前記レベル調整器のゲインを設定する。
 本発明の一実施形態によれば、話者との距離に関わらずレベルを一定とし、かつ話者の音量の変化を反映させることができる。
収音装置の構成を示す概略図である。 収音装置の構成を示すブロック図である。 CPUの機能的構成を示すブロック図である。 収音装置の動作を示すフローチャートである。 変形例1に係る収音装置1Aの外観概略図である。 収音装置1Aの構成を示すブロック図である。 CPUの機能的構成を示すブロック図である。 バンドパスフィルタをさらに備えたCPUの機能的構成を示すブロック図である。 スピーカ16をさらに備えた音声処理装置1Bを示す図である。 音声処理システムの構成を示す図である。 ヘッドセット型の筐体を示す図である。 図12(A)および図12(B)は、第2実施形態に係る音声処理システムの特徴を示す概略図である。
 (第1実施形態)
 第1実施形態のゲイン調整装置は、レベル調整器と、センサと、設定部と、を備えている。レベル調整器は、マイクで取得した音声信号のレベルを調整する。センサは、距離に応じて変化する物理量を測定する。設定部は、前記センサの測定結果に応じて、前記レベル調整器のゲインを設定する。
 第1実施形態のゲイン調整装置は、距離に応じて変化する物理量(例えば電磁波の送信から受信までの時間、または複数のマイクで取得される信号レベルの比、等)を取得し、該物理量に応じてゲインを設定するため、話者との距離に関わらず一定のゲインに調整することが可能となる。また、ゲイン調整装置は、距離が変化しない場合には、ゲイン設定も変化しないため、話者が意図的に音量を変化させた場合に、該話者の音量の変化を反映させることができる。
 図1は、ゲイン調整装置を備える収音装置1の構成を示す外観の概略図である。図1においては、収音に係る主構成を記載して、その他の構成は記載していない。収音装置1は、円筒形状の筐体50、マイク15、およびセンサ17を備えている。
 マイク15は、筐体50の上面に配置されている。ただし、筐体50の形状、およびマイクの配置態様は一例であり、この例に限るものではない。マイク15は、例えば指向性マイクである。マイク15は、装置の前方(図中の左方向)の感度が最も強く、後方(図中の右方向)に感度が無い。ただし、マイクの指向性も、この例に限るものではない。
 図2に示すように、収音装置1は、インタフェース(I/F)11、CPU12、RAM13、メモリ14、マイク15、およびセンサ17を備えている。
 メモリ14は、フラッシュメモリまたはハードディスクドライブ(HDD)等の記憶媒体からなる。メモリ14は、CPU12の動作用プログラムを記憶している。
 マイク15は、話者の音声を取得する。マイク15は、取得した音声に係る音声信号をCPU12に出力する。CPU12は、マイク15から入力された音声信号に信号処理を施して、I/F11に出力する。なお、収音装置1は、信号処理の専用プロセッサ(DSP:Digital Signal Processor)を備えていてもよい。この場合、CPU12の指示に従って、DSPが信号処理を行なう。
 I/F11は、CPU12から入力された音声信号を外部に出力する。I/F11は、例えばUSB等の通信I/Fである。I/F11は、情報処理装置等に対して音声信号を出力する。あるいは、I/F11は、該音声信号を、記憶部(不図示)に出力する。記憶部は、マイク15で取得された収音信号を録音データとして記録する。
 CPU12は、メモリ14からプログラムを読み出し、RAM13に一時記憶することで、種々の動作を行う。
 図3は、CPU12の機能ブロック図である。CPU12は、上記プログラムにより、設定部121およびレベル調整器122を実現する。設定部121、レベル調整器122、およびセンサ17により、本発明のゲイン調整装置が実現される。
 レベル調整器122は、マイク15から入力された音声信号のレベルを調整して、I/F11に出力する。レベル調整器122は、センサ17の測定結果に応じて、レベル調整器122のゲインを設定する。
 図4は、CPU12の動作を示すフローチャートである。CPU12は、センサ17から距離推定値を取得する(S11)。CPU12のうち、レベル調整器122は、マイク15から音声信号を入力する(S12)。設定部121は、距離推定値に応じて、レベル調整器122のゲインを設定する(S13)。レベル調整器122は、設定されたゲインで音声信号のレベルを調整し、出力する(S14)。
 センサ17は、この例では、測距センサである。測距センサは、例えば赤外線等の電磁波を送信して、反射波を受信する。図1に示したように、センサ17は、例えば筐体50の側面に設置されている。センサ17は、装置の前方(図1中の左方向)に赤外線を送信し、対象物(本実施形態では話者)からの反射波を受信する。センサ17は、赤外線を送信してから受信するまでの時間差を求める。この時間差は、センサ17と話者との距離に応じて変化する物理量の一例である。この実施形態では、赤外線を送信してから受信するまでの時間差から、センサ17と話者との距離を推定する。例えば、距離推定値Dは、送信時刻T1、受信時刻T2、光速Cを用いて、D=(T2-T1)/Cで表される。距離推定値Dは、センサ17が求めてもよいし、CPU12がセンサ17から送信時刻T1および受信時刻T2を取得することにより、求めてもよい。
 レベル調整器122は、センサ17の測定結果である、距離推定値Dに応じて、レベル調整器122のゲインを設定する。例えば、ゲインGは、基準距離Dhを用いて、G=D/Dhで表される。これにより、話者の距離が遠くなるほどゲインが大きくなるため、マイク15と話者との距離に関わらず、均一なレベルの音声信号が出力される。また、ゲインGは、話者との距離が変化しない場合には変化しないため、話者が意図的に音量を変化させた場合には、音声信号のレベルも変化する。したがって、収音装置1は、話者の音量の変化を反映することができる。
 次に、図5は、変形例1に係る収音装置1Aの外観概略図である。図5においても、収音に係る主構成を記載して、その他の構成は記載していない。収音装置1Aは、図1の例に加えて、2つのマイク15Aおよびマイク15Bを備えている。
 マイク15Aおよびマイク15Bは、筐体50の上面に配置されている。ただし、2つのマイクの配置態様は一例であり、この例に限るものではない。マイク15Aおよびマイク15Bは、例えば指向性マイクである。マイク15Aおよびマイク15Bは、装置の前方(図中の左方向)の感度が最も強く、後方(図中の右方向)に感度が無い。マイク15Aは、筐体50の前方に設置され、マイク15Bは、筐体50の後方に設置されている。2つのマイクの指向性も、この例に限るものではない。
 図6は、収音装置1Aの構成を示すブロック図である。収音装置1Aは、図2の収音装置に比べて、センサ17を備えていない。また、収音装置1Aは、収音装置1とは異なり、複数(この例では2つ)のマイク15Aおよびマイク15Bを備えている。
 図7は、CPU12の機能的構成を示すブロック図である。この例では、CPU12は、さらに計算部123を備えている。計算部123は、マイク15Aおよびマイク15Bから音声信号を入力する。レベル調整器122は、マイク15Aから音声信号を入力する。
 この場合、マイク15A、マイク15B、および計算部123(CPU12の実行するソフトウェア)により、本発明のセンサが実現される。計算部123は、マイク15Aおよびマイク15Bのレベル比を計算する。
 計算部123は、例えば、マイク15Aの音声信号およびマイク15Bの音声信号のパワーをそれぞれ算出する。また、計算部123は、算出したパワーを所定時間範囲で平均化する。さらに、計算部123は、マイク15Aの音声信号における平均パワー値を、マイク15Bの音声信号における平均パワー値で除算する。この除算値が上記レベル比に相当する。なお、当該除算値は、レベル比の一例である。計算部123は、例えば、振幅の瞬時値からレベル比を算出してもよい。
 音声信号のレベルは、マイクと話者との距離が遠くなるにしたがって低下する。よって、上記レベル比も、センサと話者との距離に応じて変化する物理量の一例である。設定部121は、計算部123で算出されたレベル比に応じて、レベル調整器122のゲインを設定する。
 以上のようにして、収音装置1Aにおいても、マイクと話者との距離が遠くなるほどゲインが大きくなるため、マイク15Aと話者との距離に関わらず、均一なレベルの音声信号が出力される。また、ゲインGは、距離が変化しない場合には、変化しないため、収音装置1は、話者の音量の変化を反映することができる。
 なお、図7では、レベル調整器122は、マイク15Aの音声信号を入力する例を示したが、マイク15Bの音声信号を入力して、マイク15Bの音声信号のレベルを調整してもよい。
 また、図8に示すように、CPU12は、さらにバンドパスフィルタ(BPF)124を備えていてもよい。BPF124は、マイク15Aの音声信号およびマイク15Bの音声信号について、それぞれ所定帯域を抽出する。BPF124は、特に、指向性の影響が少ない低域(例えば1kHz以下)の帯域を抽出する。これにより、指向性の影響が少ない帯域(音が回り込み易い帯域)の信号で物理量が計算されるため、例えばマイク15Aとマイク15Bとの間に障害物があった場合でも、障害物に影響されずに、高精度に物理量(距離に応じて変化する値)を計算することができる。
 以上の例においては、本発明のゲイン調整装置を備えた装置の一例として、収音装置を示した。ゲイン調整装置は、例えば図9に示すような、スピーカ16をさらに備えた音声処理装置1Bに用いることも可能である。
 音声処理装置1Bは、図6に示した収音装置1Aの構成に加えて、スピーカ16をさらに備えている。CPU12は、I/F11から入力された音声信号に信号処理を施して、スピーカ16に出力する。スピーカ16は、CPU12から入力された音声信号に基づいて、音声を出力する。
 例えば、図10に示すように、音声処理装置1Bは、ネットワーク2を介して、遠隔地に設置された音声処理装置3と接続され、音声処理システムを構成する。音声処理装置3は、音声処理装置1Bと同じ構成および機能を有する。
 この場合、ユーザは、音声処理装置1Bおよび音声処理装置3を用いて、遠隔地間での会話を行なうことができる。音声処理装置1Bおよび音声処理装置3は、それぞれ遠隔会話装置に対応する。
 なお、音声処理装置1Bの形状は、図1および図5に示した様な筐体形状に限らず、例えば図11に示すようなヘッドセット型の筐体であてもよい。
 この場合、マイク15Aは、話者の口元に配置され、マイク15Bは、話者の口元から離れた耳(スピーカ16)の近くに配置される。
 なお、上述の例では、設定部121は、センサで測定した物理量に応じて、例えば話者との距離が遠くなるほど線形にゲインを大きくする例を示した。しかし、設定部121は、話者との距離に応じて非線形にゲインを変更する態様であってもよい。例えば、マイクと話者との距離が遠くなるほど間接音が優位となり、話者の直接音の割合が減少する。したがって、設定部121は、話者との距離が遠くなるほどゲイン増加量を増大させる態様としてもよい。
 (第2実施形態)
 第2実施形態の音声処理システムは、ネットワークを介して接続される、送信装置(音声処理装置1B)および受信装置(音声処理装置3)を備えている。送信装置は、マイクと、センサと、音圧測定部と、送信部(I/F11)と、を備えている。センサは、距離に応じて変化する物理量を測定する。音圧測定部は、マイクの入力音圧レベルを測定する。送信部は、前記センサの測定結果と、前記音圧測定部の測定結果と、を送信する。受信装置は、受信部(I/F11)と、出力音圧レベル調整部と、を備えている。受信部は、前記センサの測定結果と、前記音圧測定部の測定結果と、を受信する。出力音圧レベル調整部は、スピーカの出力音圧レベルを調整する。
 これにより、第2実施形態の音声処理システムは、受信側において、送信側における話者とマイクとの距離感を再現することができる。すなわち、第2実施形態の音声処理システムでは、受信側の第2ユーザは、送信側の第1ユーザがあたかも受信側の空間に居て、同じ空間にいる第1ユーザから会話音が発せられたように感じることができる。
 図12(A)および図12(B)は、第2実施形態に係る音声処理システムの特徴を示す概略図である。音声処理システムは、図10と同様に、ネットワーク2を介して接続される、音声処理装置1Bおよび音声処理装置3を備えている。送信側の音声処理装置1Bおよび受信側の音声処理装置3の構成は、図9のブロック図で示した構成と同様である。ただし、図12(A)および図12(B)では、一例として筐体50の側面にスピーカ16が設けられた構成を示す。
 第2実施形態の音声処理システムは、送信側における話者と装置との距離、およびマイク15で測定される入力音圧レベル、に応じて、受信側のスピーカ16の出力音圧レベルの調整を行なう点が特徴である。
 送信側の音声処理装置1BのCPU12は、音圧測定部に相当し、マイク15Aの入力音圧レベル、すなわち、音圧(dBSPL)を測定する。CPU12は、測定した音圧と、話者との距離(例えば計算部123で計算したレベル比、あるいはセンサ17で測定した時間差のように、距離に応じて変化する物理量)と、を受信側の音声処理装置3に送信する。音声処理装置3のCPU12は、スピーカの出力音圧レベル調整部に相当し、受信した音圧および話者との距離に基づいて、スピーカ16の出力音圧レベルを調整する。
 例えば、図12(A)および図12(B)に示すように、第1ユーザ91がマイク15Aから1m離れた位置で発話し、マイク15Aで測定された音圧が56dBSPLとすると、受信側の音声処理装置3においては、スピーカ16の出力音圧レベルを、スピーカ16から1m離れた先にいる第2ユーザ92の位置で56dBSPLの出力音圧レベルに調節することで、第1ユーザ91の音声が到達する。例えば、音声処理装置3のマイク15Aとスピーカ16は固定距離であるため、この固定距離でのスピーカ16の出力音圧レベルを測定すれば、ユーザの位置での任意の出力音圧レベルにするための減衰調整係数を求めることができる。例えば、マイク15Aとスピーカ16の距離が5cmのとき、マイク15Aの位置で82dBSPLにすれば、1m離れた位置では56dBSPLになる。
 このように、第2実施形態の音声処理システムは、受信側において、送信側における話者との距離を再現するように、スピーカの出力音圧レベルを調整する。したがって、第2実施形態の音声処理システムでは、受信側の第2ユーザは、あたかも同じ空間に居る第1ユーザから会話音が発せられたように感じることができる。
 なお、第2実施形態においても、送信側で距離に応じたゲイン調整を行い、かつ受信側でスピーカの出力音圧レベルを調整してもよい。
 最後に、本実施形態の説明は、すべての点で例示であって、制限的なものではないと考えられるべきである。本発明の範囲は、上述の実施形態ではなく、特許請求の範囲によって示される。さらに、本発明の範囲には、特許請求の範囲と均等の意味および範囲内でのすべての変更が含まれることが意図される。例えば、センサは、カメラと、該カメラで撮影した画像の大きさを、物理量として計算する計算部と、からなる態様であってもよい。この場合も、設定部121は、センサで測定した物理量に応じてレベル調整器122のゲインを設定する。
1,1A…収音装置
1B,3…音声処理装置
2…ネットワーク
11…I/F
12…CPU
13…RAM
14…メモリ
15…マイク
15A…マイク
15B…マイク
16…スピーカ
17…センサ
50…筐体
62…特公昭
91…ユーザ
92…ユーザ
121…設定部
122…レベル調整器
123…計算部
124…バンドパスフィルタ

Claims (10)

  1.  マイクで取得した音声信号のレベルを調整するレベル調整器と、
     距離に応じて変化する物理量を測定するセンサと、
     前記センサの測定結果に応じて、前記レベル調整器のゲインを設定する設定部と、
     を備えたゲイン調整装置。
  2.  前記物理量は、前記マイクと音源との距離に応じて変化する、
     請求項1に記載のゲイン調整装置。
  3.  前記センサは、
     複数のマイクと、
     前記物理量として、前記複数のマイクにおけるレベル比を計算する計算部と、
     を備えた請求項1または請求項2に記載のゲイン調整装置。
  4.  前記計算部に入力する信号の所定帯域を抽出するフィルタ部を備えた、
     請求項3に記載のゲイン調整装置。
  5.  前記センサは、電磁波を送信し、前記電磁波の送信から受信までの時間差を、前記物理量として計算する計算部、
     を備えた請求項1または請求項2に記載のゲイン調整装置。
  6.  前記センサは、カメラと、
     前記カメラで撮影した画像の大きさを、前記物理量として計算する計算部と、
     を備えた請求項1または請求項2に記載のゲイン調整装置。
  7.  前記設定部は、前記物理量に応じて非線形に前記ゲインを設定する、
     請求項1乃至請求項5のいずれかに記載のゲイン調整装置。
  8.  請求項1乃至請求項7のいずれかに記載のゲイン調整装置と、
     スピーカと、
     を備えた遠隔会話装置。
  9.  距離に応じて変化する物理量を測定し、
     前記センサの測定結果に応じて、マイクで取得した音声信号のレベルを調整する、
     ゲイン調整方法。
  10.  信号処理装置に、
     距離に応じて変化する物理量を測定し、
     前記センサの測定結果に応じて、マイクで取得した音声信号のレベルを調整する、
     処理を実行させるゲイン調整プログラム。
PCT/JP2017/025163 2017-07-10 2017-07-10 ゲイン調整装置、遠隔会話装置、ゲイン調整方法、およびゲイン調整プログラム WO2019012587A1 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
PCT/JP2017/025163 WO2019012587A1 (ja) 2017-07-10 2017-07-10 ゲイン調整装置、遠隔会話装置、ゲイン調整方法、およびゲイン調整プログラム
JP2019529340A JPWO2019012587A1 (ja) 2017-07-10 2017-07-10 ゲイン調整装置、遠隔会話装置、ゲイン調整方法、およびゲイン調整プログラム
US16/710,355 US10893358B2 (en) 2017-07-10 2019-12-11 Gain adjustment device, remote conversation device, and gain adjustment method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2017/025163 WO2019012587A1 (ja) 2017-07-10 2017-07-10 ゲイン調整装置、遠隔会話装置、ゲイン調整方法、およびゲイン調整プログラム

Related Child Applications (1)

Application Number Title Priority Date Filing Date
US16/710,355 Continuation US10893358B2 (en) 2017-07-10 2019-12-11 Gain adjustment device, remote conversation device, and gain adjustment method

Publications (1)

Publication Number Publication Date
WO2019012587A1 true WO2019012587A1 (ja) 2019-01-17

Family

ID=65001862

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2017/025163 WO2019012587A1 (ja) 2017-07-10 2017-07-10 ゲイン調整装置、遠隔会話装置、ゲイン調整方法、およびゲイン調整プログラム

Country Status (3)

Country Link
US (1) US10893358B2 (ja)
JP (1) JPWO2019012587A1 (ja)
WO (1) WO2019012587A1 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115769567A (zh) * 2020-06-10 2023-03-07 高通股份有限公司 音频增益选择

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62149295A (ja) * 1985-12-23 1987-07-03 Canon Inc 録音可能なカメラ
JPS6382197A (ja) * 1986-09-26 1988-04-12 Matsushita Electric Ind Co Ltd 収音装置
JPS63262577A (ja) * 1987-04-20 1988-10-28 Sony Corp マイクロホン装置
JP2001045590A (ja) * 1999-08-03 2001-02-16 Fujitsu Ltd マイクロホンアレイ装置
US20140112483A1 (en) * 2012-10-24 2014-04-24 Alcatel-Lucent Usa Inc. Distance-based automatic gain control and proximity-effect compensation
JP2014216787A (ja) * 2013-04-24 2014-11-17 パナソニック株式会社 会議端末装置及び増幅率登録方法
WO2017073324A1 (ja) * 2015-10-26 2017-05-04 ソニー株式会社 信号処理装置、信号処理方法、並びにプログラム

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5684013A (en) 1979-12-12 1981-07-09 Matsushita Electric Ind Co Ltd Automatic level regulator for sound signal
US6853850B2 (en) * 2000-12-04 2005-02-08 Mobigence, Inc. Automatic speaker volume and microphone gain control in a portable handheld radiotelephone with proximity sensors
JP4247002B2 (ja) * 2003-01-22 2009-04-02 富士通株式会社 マイクロホンアレイを用いた話者距離検出装置及び方法並びに当該装置を用いた音声入出力装置
US20090010453A1 (en) * 2007-07-02 2009-01-08 Motorola, Inc. Intelligent gradient noise reduction system
JP5197458B2 (ja) * 2009-03-25 2013-05-15 株式会社東芝 受音信号処理装置、方法およびプログラム
JP5079761B2 (ja) * 2009-09-01 2012-11-21 日本電信電話株式会社 直間比推定装置、音源距離測定装置、雑音除去装置、各装置の方法と、装置プログラム
KR20110047852A (ko) * 2009-10-30 2011-05-09 삼성전자주식회사 동작 환경에 적응 가능한 음원녹음장치 및 그 방법
JP5834948B2 (ja) * 2012-01-24 2015-12-24 富士通株式会社 残響抑制装置、残響抑制方法及び残響抑制用コンピュータプログラム
US20130202130A1 (en) * 2012-02-03 2013-08-08 Motorola Mobility, Inc. Motion Based Compensation of Uplinked Audio

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62149295A (ja) * 1985-12-23 1987-07-03 Canon Inc 録音可能なカメラ
JPS6382197A (ja) * 1986-09-26 1988-04-12 Matsushita Electric Ind Co Ltd 収音装置
JPS63262577A (ja) * 1987-04-20 1988-10-28 Sony Corp マイクロホン装置
JP2001045590A (ja) * 1999-08-03 2001-02-16 Fujitsu Ltd マイクロホンアレイ装置
US20140112483A1 (en) * 2012-10-24 2014-04-24 Alcatel-Lucent Usa Inc. Distance-based automatic gain control and proximity-effect compensation
JP2014216787A (ja) * 2013-04-24 2014-11-17 パナソニック株式会社 会議端末装置及び増幅率登録方法
WO2017073324A1 (ja) * 2015-10-26 2017-05-04 ソニー株式会社 信号処理装置、信号処理方法、並びにプログラム

Also Published As

Publication number Publication date
JPWO2019012587A1 (ja) 2020-08-13
US20200120420A1 (en) 2020-04-16
US10893358B2 (en) 2021-01-12

Similar Documents

Publication Publication Date Title
US10097921B2 (en) Methods circuits devices systems and associated computer executable code for acquiring acoustic signals
JP7229925B2 (ja) 空間オーディオシステムにおける利得制御
US9997173B2 (en) System and method for performing automatic gain control using an accelerometer in a headset
US10075142B2 (en) Facilitation of headphone audio enhancement
US20160066117A1 (en) Sound Signal Processing Method and Apparatus
WO2014173069A1 (zh) 一种音效调节方法、装置和设备
US10397711B2 (en) Method of determining objective perceptual quantities of noisy speech signals
EP2751806B1 (en) A method and a system for noise suppressing an audio signal
CN106872945B (zh) 声源定位方法、装置和电子设备
EP3016410A1 (en) Measurement device and measurement system
KR20170034405A (ko) 바람 잡음 검출을 위한 방법 및 장치
CN108882115B (zh) 响度调节方法、装置及终端
KR20210017229A (ko) 오디오 줌 기능을 갖는 전자 장치 및 이의 동작 방법
US9967660B2 (en) Signal processing apparatus and method
CN106919225A (zh) 用于移动装置的声处理器
KR102008745B1 (ko) 이동 디바이스들을 위한 서라운드 사운드 레코딩
CN113924620A (zh) 基于频率组成的声音修改
CN115988381A (zh) 定向发声方法及装置、设备
JP6849055B2 (ja) 収音装置および収音方法
US10893358B2 (en) Gain adjustment device, remote conversation device, and gain adjustment method
WO2020035180A1 (en) Method of operating an ear level audio system and an ear level audio system
US8422690B2 (en) Audio reproduction apparatus and control method for the same
EP2916320A1 (en) Multi-microphone method for estimation of target and noise spectral variances
JP5853133B2 (ja) 音響処理装置および音響処理方法
JP2023054779A (ja) 空間オーディオキャプチャ内の空間オーディオフィルタリング

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 17917396

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 2019529340

Country of ref document: JP

Kind code of ref document: A

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 17917396

Country of ref document: EP

Kind code of ref document: A1