WO2018179506A1 - オーディオ装置およびコンピュータで読み取り可能なプログラム - Google Patents
オーディオ装置およびコンピュータで読み取り可能なプログラム Download PDFInfo
- Publication number
- WO2018179506A1 WO2018179506A1 PCT/JP2017/034012 JP2017034012W WO2018179506A1 WO 2018179506 A1 WO2018179506 A1 WO 2018179506A1 JP 2017034012 W JP2017034012 W JP 2017034012W WO 2018179506 A1 WO2018179506 A1 WO 2018179506A1
- Authority
- WO
- WIPO (PCT)
- Prior art keywords
- signal
- voice operation
- audio
- speaker
- parameter
- Prior art date
Links
- 230000005236 sound signal Effects 0.000 claims abstract description 42
- 238000012360 testing method Methods 0.000 claims abstract description 38
- 238000012545 processing Methods 0.000 claims abstract description 33
- 238000001914 filtration Methods 0.000 claims abstract description 8
- 238000005259 measurement Methods 0.000 claims description 19
- 238000000034 method Methods 0.000 description 10
- 230000006870 function Effects 0.000 description 6
- 238000001514 detection method Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 230000007274 generation of a signal involved in cell-cell signaling Effects 0.000 description 4
- 230000004044 response Effects 0.000 description 3
- 238000013500 data storage Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R29/00—Monitoring arrangements; Testing arrangements
- H04R29/004—Monitoring arrangements; Testing arrangements for microphones
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0264—Noise filtering characterised by the type of parameter measurement, e.g. correlation techniques, zero crossing techniques or predictive techniques
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R29/00—Monitoring arrangements; Testing arrangements
- H04R29/001—Monitoring arrangements; Testing arrangements for loudspeakers
- H04R29/002—Loudspeaker arrays
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
- H04R3/04—Circuits for transducers, loudspeakers or microphones for correcting frequency response
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S7/00—Indicating arrangements; Control arrangements, e.g. balance control
- H04S7/30—Control circuits for electronic adaptation of the sound field
- H04S7/302—Electronic adaptation of stereophonic sound system to listener position or orientation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S7/00—Indicating arrangements; Control arrangements, e.g. balance control
- H04S7/30—Control circuits for electronic adaptation of the sound field
- H04S7/305—Electronic adaptation of stereophonic audio signals to reverberation of the listening space
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L2021/02082—Noise filtering the noise being echo, reverberation of the speech
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
- H04S3/008—Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
Definitions
- the present invention relates to an audio apparatus having a voice operation reception function.
- Patent Document 1 discloses a multi-channel compatible audio device that performs multi-channel audio reproduction using a plurality of speakers.
- the test signal output from the speaker is collected by a microphone installed at the user's listening position, and output from each speaker by measuring the delay time and attenuation rate.
- the output characteristics (delay time, acoustic characteristics) of each speaker are set so that the audio signal to be transmitted is optimal at the listening position of the user.
- Patent Document 2 discloses an audio device having a voice operation reception function. According to this audio apparatus, the user can operate music selection, volume level adjustment, and the like by voice, improving usability.
- Patent Document 3 discloses an echo canceller that cancels an echo generated when a voice signal output from a speaker is collected by a microphone in a voice call or the like.
- This echo canceller analyzes the correlation between the audio signal output from the speaker and the collected sound signal of the microphone, and calculates the delay amount of the sneak signal that wraps around from the speaker to the microphone. Then, a delay signal is generated by delaying the audio signal output from the speaker by this delay amount, and the wraparound signal included in the microphone sound collection signal is canceled using this delay signal.
- an audio device accepting function as described in Patent Document 2 is also required in a multi-channel compatible audio apparatus as described in Patent Document 1.
- the voice operation acceptance function is added to the multi-channel compatible audio device, the following problem occurs. That is, when a voice operation is received during multi-channel audio reproduction, audio signals output from a plurality of speakers wrap around the microphone and are collected by the microphone together with a voice signal for voice operation received from the user as a sneak signal. For this reason, there is a possibility that the voice recognition rate of the voice signal for voice operation is lowered and reception of the voice operation fails.
- the present invention has been made in view of the above circumstances, and an object of the present invention is to provide an audio apparatus that can more reliably accept voice operations even during audio playback.
- a test signal output from a speaker is collected by a microphone for accepting voice operation, and the voice operation from the speaker is performed based on the delay time and the attenuation rate.
- An echo back parameter for canceling the sneak signal sneaking into the reception microphone from the collected signal is determined.
- the sound collection signal collected by the voice operation reception microphone during audio playback is filtered by the determined echo back parameter, and the voice recognition processing is performed on the filtered sound collection signal.
- the present invention An audio device having a voice operation reception function, An audio reproduction means for reproducing an audio signal and outputting it to a speaker;
- a voice operation reception microphone for receiving voice operation from a user;
- Parameter determining means for determining an echo back parameter for canceling a sneak signal that wraps around from the speaker to the voice operation reception microphone during audio playback;
- Filter processing means for performing filtering with the echo back parameter determined by the parameter determination means on the collected signal collected by the voice operation reception microphone during audio reproduction;
- Voice operation accepting means for accepting the voice operation by performing voice recognition processing on the collected sound signal filtered by the filter processing means,
- the parameter determination means includes A test signal is output from the speaker and collected by the voice operation reception microphone, and the echo back parameter is determined based on a delay time and a decay rate of the sound collection signal of the voice operation reception microphone with respect to the test signal.
- the test signal output from the speaker is collected by the voice operation reception microphone and the echo back parameter is determined, so that the sound operation sound is collected by the voice operation reception microphone during audio playback.
- the collected sound signal can be filtered with this echo back parameter, and the voice recognition process can be performed on the filtered sound signal. For this reason, the voice recognition rate of the user during audio playback is improved, and voice operations during audio playback can be received more reliably.
- the echo back parameter can be determined prior to audio reproduction, the processing burden during audio reproduction can be reduced, thereby increasing the processing capability required for accepting voice operation during audio reproduction. Can be suppressed.
- FIG. 1 is a schematic configuration diagram of a multi-channel audio system 1 according to an embodiment of the present invention.
- FIG. 2 is a schematic functional configuration diagram of the audio playback device 2.
- FIG. 3 is a flowchart for explaining parameter determination processing of the audio playback device 2.
- FIG. 1 is a schematic configuration diagram of a multi-channel audio system 1 according to the present embodiment.
- the multi-channel audio system 1 is connected to a media server 8 via an access point 6 and a network 7 such as a WAN or a LAN.
- the media server 8 provides multichannel music data to the multichannel audio system 1.
- the multi-channel audio system 1 includes an audio playback device 2, a plurality of speakers 3-1 to 3-5 (hereinafter also simply referred to as speakers 3) connected to the audio playback device 2, and a sound field at a user's listening position.
- a sound field environment measurement microphone 4 used for environment measurement and a remote controller 5 for remotely operating the audio playback device 2 are provided.
- FIG. 1 shows five speakers 3, two or four or more speakers 3 may be used.
- the audio playback apparatus 2 includes voice operation reception microphones 20-1 and 20-2 (hereinafter also simply referred to as a voice operation reception microphone 20), and in addition to remote operation by the remote controller 5, for voice operation reception. Voice operation by the microphone 20 is also accepted. Then, the audio playback device 2 receives music selection of music data from the user by remote operation by the remote controller 5 or voice operation by the voice operation reception microphone 20, downloads the selected music data from the media server 8, and Multi-channel audio reproduction is performed using the speaker 3. At this time, the audio reproduction device 2 outputs the sound from the speakers 3 according to the output characteristic parameters of the speakers 3 determined based on the result of the sound field environment measurement performed in advance using the sound field environment measurement microphone 4. The audio signal is corrected so as to be optimal at the user's listening position.
- the audio playback device 2 performs echo back for canceling the sneak signal that has circulated from each speaker 3 to the voice operation reception microphone 20 from the sound collection signal of the voice operation reception microphone 20 when measuring the sound field environment.
- the parameters are determined.
- the wraparound signal included in the sound collection signal of the voice operation acceptance microphone 20 is canceled.
- the voice recognition rate of the user voice included in the collected sound signal of the voice operation reception microphone 20 is improved, and the voice operation can be received even during multi-channel audio reproduction.
- FIG. 2 is a schematic functional configuration diagram of the audio playback device 2.
- the audio playback apparatus 2 includes voice operation reception microphones 20-1 and 20-2 that are microphones for receiving voice operations from a user, a network interface unit 21, and a sound field environment measurement microphone connection unit. 22, speaker connection unit 23, output characteristic parameter storage unit 24, echo back parameter storage unit 25, multi-channel audio playback unit 26, filter processing unit 27, voice recognition unit 28, and operation reception unit 29 , Parameter determination unit 30, test signal generation unit 31, and main control unit 32.
- the network interface unit 21 is an interface for communicating with the remote controller 5 via the access point 6 or communicating with the media server 8 via the access point 6 and the network 7.
- the sound field environment measurement microphone connection unit 22 is a connection terminal for connecting the sound field environment measurement microphone 4 used in the sound field environment measurement.
- the speaker connection unit 23 is an interface for connecting the speaker 3, and for each channel, the channel 1 connection terminal 230-1 to the channel 5 connection terminal 230- which are connection terminals for connecting the speaker 3 corresponding to the corresponding channel. 5 (hereinafter also simply referred to as channel connection terminal 230).
- the output characteristic parameter storage unit 24 includes, for each channel, output characteristic parameters that are parameters for correcting the output characteristics (delay time, acoustic characteristics) of the audio signal output from the channel connection terminal 230 corresponding to the corresponding channel.
- the echo back parameter storage unit 25 for each voice operation reception microphone 20, a sneak signal that wraps around the corresponding voice operation reception microphone 20 from each speaker 3 is canceled from the collected sound signal of the corresponding voice operation reception microphone 20.
- the echo back parameters for are stored.
- the multi-channel audio reproduction unit 26 reproduces multi-channel compatible music data into audio signals for each channel. Then, for each channel, the reproduced audio signal is corrected according to the output characteristic parameter of the corresponding channel stored in the output characteristic parameter storage unit 24 and output from the channel connection terminal 230 of the corresponding channel. As a result, the music data is reproduced by multi-channel audio.
- the filter processing unit 27 collects the sound collection signal of the corresponding voice operation reception microphone 20 according to the echo back parameter of the corresponding voice operation reception microphone 20 stored in the echo back parameter storage unit 25 for each voice operation reception microphone 20. And the wraparound signal contained in the collected sound signal is canceled.
- the voice recognition unit 28 performs a voice recognition process on the collected sound signal of the voice operation reception microphone 20 filtered by the filter processing unit 27 to identify the user voice.
- the operation reception unit 29 receives a remote operation by the remote controller 5 via the network interface unit 21, or receives a voice operation by the voice operation reception microphone 20 via the filter processing unit 27 and the voice recognition unit 28, Alternatively, an operation is received from an operation panel (not shown).
- the parameter determination unit 30 determines an output characteristic parameter for each channel and stores it in the output characteristic parameter storage unit 24, and determines an echo back parameter for each voice operation reception microphone 20 and stores it in the echo back parameter storage unit 25. To do.
- the test signal generating unit 31 is used when the parameter determining unit 30 determines the output characteristic parameter and the echo back parameter, and pink noise or the like output in order from the channel 1 connection terminal 230-1 to the channel 5 connection terminal 230-5. Generate a test signal.
- the main control unit 32 comprehensively controls the units 20 to 31 of the audio playback device 2.
- the operation reception unit 29 is a user's remote operation received from the remote controller 5 through the network interface unit 21 or a user operation received from the voice operation reception microphone 20 through the filter processing unit 27 and the voice recognition unit 28.
- music data is selected by voice operation or by a user operation received from an operation panel (not shown), the selected music data is notified to the main control unit 32.
- the main control unit 32 accesses the media server 8 via the network interface unit 21 and downloads the selected music data from the media server 8.
- the downloaded music data is output to the multi-channel audio playback unit 26.
- the multi-channel audio reproducing unit 26 When the multi-channel audio reproducing unit 26 receives the music data from the main control unit 32, the multi-channel audio reproducing unit 26 reproduces the music data into an audio signal for each channel. Then, for each channel, the reproduced audio signal is corrected so as to be optimal at the listening position of the user in accordance with the output characteristic parameter of the corresponding channel stored in the output characteristic parameter storage unit 24, and the channel connection terminal 230 of the corresponding channel. Output from. As a result, the music data is reproduced by multi-channel audio.
- the filter processing unit 27 performs the corresponding sound stored in the echo back parameter storage unit 25 with respect to the collected sound signal of the corresponding sound operation receiving microphone 20 for each sound operation receiving microphone 20. Filtering is performed according to the echo back parameter of the operation acceptance microphone 20. By this filtering, the sneak signal mixed in the sound collection signal of the sound operation reception microphone 20 is canceled from each speaker 3 to the sound operation reception microphone 20. Thereafter, the filter processing unit 27 outputs the filtered sound collection signal of each voice operation reception microphone 20 to the voice recognition unit 28.
- the operation accepting unit 29 determines whether or not the recognized content of the user voice received from the voice recognizing unit 28 indicates a voice operation, and if it is a voice operation, notifies the main control unit 32 of the operation content. In response to this, the main control unit 32 executes processing according to the operation content received from the operation receiving unit 29.
- the parameter determination process is performed prior to the multi-channel audio reproduction process, and determines an output characteristic parameter used for the multi-channel audio reproduction process and an echo back parameter used for the voice operation reception process during the multi-channel audio reproduction.
- FIG. 3 is a flowchart for explaining the parameter determination processing of the audio playback device 2.
- the sound reception environment measurement microphone 4 installed at the user's listening position is connected to the sound field environment measurement microphone connection unit 22, and the operation reception unit 29 is remotely connected via the network interface unit 21.
- the process is started by receiving a sound field environment measurement instruction from the controller 5 or from an operation panel (not shown).
- the main control unit 32 sets the count value N to “1” (S1). Then, the main control unit 32 instructs the test signal generation unit 31 to output a test signal to the channel N. In response to this, the test signal generator 31 outputs a test signal to the channel N connection terminal 230-N (S2). The test signal is output from the speaker 3 connected to the channel N connection terminal 230-N and simultaneously input to the parameter determination unit 30.
- the parameter determination unit 30 is output from the speaker 3 so that the audio signal output from the speaker 3 of the channel N is optimal at the listening position of the user.
- Output characteristic parameters (delay time, acoustic characteristics) for correcting the audio signal are determined (S5).
- the test signal output from the speaker 3 connected to the channel N connection terminal 230-N is collected by the voice operation reception microphones 20-1 and 20-2, and each of them is collected by the voice operation reception microphone 20-1. , 20-2 are input to the parameter determination unit 30.
- the parameter determining unit 30 detects a test signal from the collected sound signals of the voice operation receiving microphones 20-1 and 20-2 (S6), each of the detected signals and the test signal input from the test signal generating unit 31 And the delay time and attenuation rate of each detection signal with respect to the test signal are measured (S7).
- the parameter determination unit 30 determines whether or not the count value N has reached the last channel number (matches the total number of channel connection terminals 230) (S9). If the count value N has not reached the last channel number (NO in S9), the count value N is incremented by 1 (S10), and the process returns to S2.
- the parameter determination unit 30 stores the output characteristic parameters of all the channels determined so far in the output characteristic parameter storage unit 24 ( S11).
- the parameter determination unit 30 integrates the echo back parameters of all the channels determined for the voice operation reception microphone 20-1 and stores them in the echo back parameter storage unit 25 as the echo back parameters of the voice operation reception microphone 20-1.
- the echo back parameters of all the channels determined for the voice operation reception microphone 20-2 are integrated and stored in the echo back parameter storage unit 25 as the echo back parameters of the voice operation reception microphone 20-2 (S12). .
- the test signal output from the speaker 3 is collected by the voice operation reception microphone 20 and the echo back parameter is determined to determine the voice operation reception microphone during audio playback.
- the collected sound signal collected at 20 can be filtered with the determined echo back parameter, and the voice recognition process can be performed on the filtered collected sound signal. For this reason, the voice recognition rate of the user voice during audio playback is improved, and voice operations during audio playback can be received more reliably.
- the echo back parameter can be determined prior to audio playback, the processing load during audio playback can be reduced, and thereby the processing capability required for accepting voice operations during audio playback. Can be suppressed.
- voice operation reception microphones 20 In the above embodiment, the case where there are two voice operation reception microphones 20 has been described as an example (voice operation reception microphones 20-1 and 20-2), but one voice operation reception microphone 20 is provided. Or three or more.
- the voice operation reception microphone 20 may be built in the audio playback device 2 or may be externally attached.
- the functional configuration of the audio device 2 shown in FIG. 2 may be realized by an integrated logic IC such as ASIC (Application Specific Integrated Circuit) or FPGA (Field Programmable Gate Array).
- ASIC Application Specific Integrated Circuit
- FPGA Field Programmable Gate Array
- a computer such as a DSP (Digital Signal Processor).
- DSP Digital Signal Processor
- a general-purpose computer such as a PC including a CPU, a memory, an auxiliary storage device such as a flash memory and a hard disk drive, a communication device such as a wireless LAN adapter, and a speaker
- the CPU auxiliary stores a predetermined program. It may be realized by loading from a device onto a memory and executing it.
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Multimedia (AREA)
- General Health & Medical Sciences (AREA)
- Otolaryngology (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Telephone Function (AREA)
- Circuit For Audible Band Transducer (AREA)
- Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)
Abstract
【課題】オーディオ再生中でも音声操作をより確実に受け付けることができるオーディオ装置を提供する。 【解決手段】オーディオ装置2は、オーディオ再生中にスピーカから音声操作受付用マイク20-1、20-2に回り込んだ回り込み信号をキャンセルするためのエコーバックパラメータを決定するパラメータ決定部30と、オーディオ再生中に音声操作受付用マイク20-1、20-2で集音された集音信号に対してエコーバックパラメータによりフィルタリングを行うフィルタ処理部27と、フィルタリングされた集音信号に対して音声認識処理を実施する音声認識部28と、音声認識結果に基づいて音声操作を受け付ける操作受付部29と、を備えている。パラメータ決定部30は、テスト信号をスピーカから出力して音声操作受付用マイク20-1、20-2により集音し、テスト信号に対する集音信号の遅延時間、減衰率に基づいて、エコーバックパラメータを決定する。
Description
本発明は、音声操作受付機能を有するオーディオ装置に関する。
特許文献1には、複数のスピーカを用いてマルチチャンネルオーディオ再生を行うマルチチャネル対応オーディオ装置が開示されている。このマルチチャンネル対応オーディオ装置では、スピーカ毎に、スピーカから出力されたテスト信号をユーザの聴取位置に設置されたマイクで集音し、その遅延時間、減衰率を測定することにより、各スピーカから出力されるオーディオ信号がユーザの聴取位置で最適となるように各スピーカの出力特性(遅延時間、音響特性)を設定している。
また、特許文献2には、音声操作受付機能を有するオーディオ装置が開示されている。このオーディオ装置によれば、ユーザは、楽曲の選曲や音量レベルの調整等を音声により操作することができ、使い勝手が向上する。
また、特許文献3には、音声通話等において、スピーカから出力された音声信号がマイクで集音されることにより発生するエコーをキャンセルするエコーキャンセラが開示されている。このエコーキャンセラでは、スピーカから出力される音声信号とマイクの集音信号との相関を解析し、スピーカからマイクに回り込む回り込み信号の遅延量を算出する。そして、スピーカから出力される音声信号をこの遅延量だけ遅延させた遅延信号を生成し、この遅延信号を用いてマイクの集音信号に含まれている回り込み信号をキャンセルしている。
近年、特許文献1に記載のようなマルチチャンネル対応オーディオ装置においても、特許文献2に記載のような音声操作受付機能が求められている。しかしながら、マルチチャンネル対応オーディオ装置に音声操作受付機能を追加した場合、つぎのような問題が生じる。すなわち、マルチチャンネルオーディオ再生中に音声操作を受け付ける場合、複数のスピーカから出力されたオーディオ信号がマイクに回り込み、回り込み信号として、ユーザから受け付けた音声操作用の音声信号とともにマイクに集音される。このため、音声操作用の音声信号の音声認識率が低下して、音声操作の受付に失敗する可能性がある。
ここで、特許文献3に記載のエコーキャンセラを用いて、複数のスピーカからマイクに回り込んだ回り込み信号をマイクの集音信号からキャンセルすることも考えられる。しかし、このエコーキャンセラでは、複数のスピーカのそれぞれについて、スピーカから出力されるオーディオ信号とマイクの集音信号との相関を解析し、スピーカからマイクに回り込む回り込み信号の遅延量を算出して、スピーカから出力されるオーディオ信号をこの遅延量だけ遅延させた遅延信号を生成し、マイクの集音信号に含まれている回り込み信号をこの遅延信号を用いてキャンセルする。この処理をリアルタイムで実施するためには、大きな処理能力が要求され、コストアップとなる。
本発明は上記事情に鑑みてなされたものであり、その目的は、オーディオ再生中でも音声操作をより確実に受け付けることができるオーディオ装置を提供することにある。
上記課題を解決するために、本発明では、オーディオ再生とは別に、スピーカから出力されたテスト信号を音声操作受付用マイクで集音し、その遅延時間および減衰率に基づいて、スピーカから音声操作受付用マイクに回り込んだ回り込み信号を集音信号からキャンセルするためのエコーバックパラメータを決定する。そして、オーディオ再生中に音声操作受付用マイクで集音された集音信号に対して、この決定されたエコーバックパラメータでフィルタリングを行い、フィルタリングされた集音信号に対して音声認識処理を実施して音声操作を受け付ける。
例えば、本発明は、
音声操作受付機能を有するオーディオ装置であって、
オーディオ信号を再生してスピーカに出力するオーディオ再生手段と、
ユーザから音声操作を受け付けるための音声操作受付用マイクと、
オーディオ再生中に前記スピーカから前記音声操作受付用マイクに回り込んだ回り込み信号をキャンセルするためのエコーバックパラメータを決定するパラメータ決定手段と、
オーディオ再生中に前記音声操作受付用マイクで集音された集音信号に対して、前記パラメータ決定手段により決定されたエコーバックパラメータでフィルタリングを行うフィルタ処理手段と、
前記フィルタ処理手段によりフィルタリングされた集音信号に対して音声認識処理を実施して前記音声操作を受け付ける音声操作受付手段と、を備え、
前記パラメータ決定手段は、
テスト信号を前記スピーカから出力して前記音声操作受付用マイクにより集音し、当該テスト信号に対する前記音声操作受付用マイクの集音信号の遅延時間および減衰率に基づいて、前記エコーバックパラメータを決定する。
音声操作受付機能を有するオーディオ装置であって、
オーディオ信号を再生してスピーカに出力するオーディオ再生手段と、
ユーザから音声操作を受け付けるための音声操作受付用マイクと、
オーディオ再生中に前記スピーカから前記音声操作受付用マイクに回り込んだ回り込み信号をキャンセルするためのエコーバックパラメータを決定するパラメータ決定手段と、
オーディオ再生中に前記音声操作受付用マイクで集音された集音信号に対して、前記パラメータ決定手段により決定されたエコーバックパラメータでフィルタリングを行うフィルタ処理手段と、
前記フィルタ処理手段によりフィルタリングされた集音信号に対して音声認識処理を実施して前記音声操作を受け付ける音声操作受付手段と、を備え、
前記パラメータ決定手段は、
テスト信号を前記スピーカから出力して前記音声操作受付用マイクにより集音し、当該テスト信号に対する前記音声操作受付用マイクの集音信号の遅延時間および減衰率に基づいて、前記エコーバックパラメータを決定する。
本発明では、オーディオ再生に先立って、スピーカから出力されたテスト信号を音声操作受付用マイクで集音してエコーバックパラメータを決定することにより、オーディオ再生中に音声操作受付用マイクで集音された集音信号に対して、このエコーバックパラメータでフィルタリングを行い、フィルタリングされた集音信号に対して音声認識処理を実施することができる。このため、オーディオ再生中におけるユーザの音声認識率が向上し、オーディオ再生中の音声操作をより確実に受け付けることができる。
また、本発明では、オーディオ再生に先立ってエコーバックパラメータを決定することができるので、オーディオ再生中の処理負担を軽減でき、これにより、オーディオ再生中の音声操作受付に要求される処理能力の増大を抑制することができる。
以下に、本発明の一実施の形態について、図面を参照して説明する。
図1は、本実施の形態に係るマルチチャンネルオーディオシステム1の概略構成図である。
図示するように、本実施の形態に係るマルチチャンネルオーディオシステム1は、アクセスポイント6およびWAN、LAN等のネットワーク7を介してメディアサーバ8に接続されている。メディアサーバ8は、マルチチャンネル対応の楽曲データをマルチチャンネルオーディオシステム1に提供する。
マルチチャンネルオーディオシステム1は、オーディオ再生装置2と、オーディオ再生装置2に接続された複数台のスピーカ3-1~3-5(以下、単にスピーカ3とも呼ぶ)と、ユーザの聴取位置における音場環境測定の際に用いられる音場環境測定用マイク4と、オーディオ再生装置2を遠隔操作するためのリモートコントローラ5と、を備えている。なお、図1では5台のスピーカ3を示しているが、スピーカ3は2台あるいは4台以上でもよい。
オーディオ再生装置2は、音声操作受付用マイク20-1、20-2(以下、単に音声操作受付用マイク20とも呼ぶ)を備えており、リモートコントローラ5による遠隔操作に加えて、音声操作受付用マイク20による音声操作も受け付ける。そして、オーディオ再生装置2は、リモートコントローラ5による遠隔操作あるいは音声操作受付用マイク20による音声操作によりユーザから楽曲データの選曲を受け付けて、選曲された楽曲データをメディアサーバ8からダウンロードして、複数のスピーカ3を用いてマルチチャンネルオーディオ再生する。この際、オーディオ再生装置2は、音場環境測定用マイク4を用いて事前実施した音場環境測定の結果に基づいて決定された各スピーカ3の出力特性パラメータに従い、各スピーカ3から出力されるオーディオ信号をユーザの聴取位置で最適となるように補正する。
また、オーディオ再生装置2は、音場環境測定の際に、各スピーカ3から音声操作受付用マイク20に回り込んだ回り込み信号を音声操作受付用マイク20の集音信号からキャンセルするためのエコーバックパラメータを決定している。そして、マルチチャンネルオーディオ再生中、このエコーバックパラメータに従い音声操作受付用マイク20の集音信号をフィルタリングすることにより、音声操作受付用マイク20の集音信号に含まれている回り込み信号をキャンセルする。これにより、音声操作受付用マイク20の集音信号に含まれているユーザ音声の音声認識率を向上させ、マルチチャンネルオーディオ再生中でも音声操作を受付可能としている。
図2は、オーディオ再生装置2の概略機能構成図である。
図示するように、オーディオ再生装置2は、ユーザから音声操作を受け付けるためのマイクである音声操作受付用マイク20-1、20-2と、ネットワークインターフェース部21と、音場環境測定用マイク接続部22と、スピーカ接続部23と、出力特性パラメータ記憶部24と、エコーバックパラメータ記憶部25と、マルチチャンネルオーディオ再生部26と、フィルタ処理部27と、音声認識部28と、操作受付部29と、パラメータ決定部30と、テスト信号発生部31と、主制御部32と、を備えている。
ネットワークインターフェース部21は、アクセスポイント6を介してリモートコントローラ5と通信したり、あるいは、アクセスポイント6およびネットワーク7を介してメディアサーバ8と通信したりするためのインターフェースである。
音場環境測定用マイク接続部22は、音場環境測定の際に用いられる音場環境測定用マイク4を接続するための接続端子である。
スピーカ接続部23は、スピーカ3を接続するためのインターフェースであり、チャンネル毎に該当チャンネルに対応するスピーカ3を接続するための接続端子であるチャンネル1接続端子230-1~チャンネル5接続端子230-5(以下、単にチャンネル接続端子230とも呼ぶ)を有する。
出力特性パラメータ記憶部24には、チャンネル毎に、該当チャンネルに対応するチャンネル接続端子230から出力されるオーディオ信号の出力特性(遅延時間、音響特性)を補正するためのパラメータである出力特性パラメータが記憶される。
エコーバックパラメータ記憶部25には、音声操作受付用マイク20毎に、各スピーカ3から該当音声操作受付用マイク20に回り込んだ回り込み信号を該当音声操作受付用マイク20の集音信号からキャンセルするためのエコーバックパラメータが記憶される。
マルチチャンネルオーディオ再生部26は、マルチチャンネル対応の楽曲データをチャンネル毎のオーディオ信号に再生する。そして、チャンネル毎に、再生したオーディオ信号を、出力特性パラメータ記憶部24に記憶されている該当チャンネルの出力特性パラメータに従って補正して、該当チャンネルのチャンネル接続端子230から出力する。これにより、楽曲データをマルチチャンネルオーディオ再生する。
フィルタ処理部27は、音声操作受付用マイク20毎に、エコーバックパラメータ記憶部25に記憶されている該当音声操作受付用マイク20のエコーバックパラメータに従って、該当音声操作受付用マイク20の集音信号にフィルタリングを行い、この集音信号に含まれている回り込み信号をキャンセルする。
音声認識部28は、フィルタ処理部27によりフィルタリングされた音声操作受付用マイク20の集音信号に対して音声認識処理を行って、ユーザ音声を特定する。
操作受付部29は、ネットワークインターフェース部21を介してリモートコントローラ5による遠隔操作を受け付けたり、または、フィルタ処理部27および音声認識部28を介して音声操作受付用マイク20による音声操作を受け付けたり、あるいは、図示していない操作パネルから操作を受け付けたりする。
パラメータ決定部30は、チャンネル毎に出力特性パラメータを決定して出力特性パラメータ記憶部24に記憶するとともに、音声操作受付用マイク20毎にエコーバックパラメータを決定してエコーバックパラメータ記憶部25に記憶する。
テスト信号発生部31は、パラメータ決定部30が出力特性パラメータおよびエコーバックパラメータを決定する際に用いられ、チャンネル1接続端子230-1~チャンネル5接続端子230-5から順番に出力するピンクノイズ等のテスト信号を発生する。
主制御部32は、オーディオ再生装置2の各部20~31を統括的に制御する。
つぎに、上記構成のオーディオ再生装置2の動作について説明する。
[マルチチャンネルオーディオ再生処理]
操作受付部29は、ネットワークインターフェース部21を介してリモートコントローラ5から受け付けたユーザの遠隔操作により、または、フィルタ処理部27および音声認識部28を介して音声操作受付用マイク20から受け付けたユーザの音声操作により、あるいは、図示していない操作パネルから受け付けたユーザの操作により、楽曲データが選曲されると、選曲された楽曲データを主制御部32に通知する。
操作受付部29は、ネットワークインターフェース部21を介してリモートコントローラ5から受け付けたユーザの遠隔操作により、または、フィルタ処理部27および音声認識部28を介して音声操作受付用マイク20から受け付けたユーザの音声操作により、あるいは、図示していない操作パネルから受け付けたユーザの操作により、楽曲データが選曲されると、選曲された楽曲データを主制御部32に通知する。
これを受けて、主制御部32は、ネットワークインターフェース部21を介してメディアサーバ8にアクセスして、メディアサーバ8から、選曲された楽曲データをダウンロードする。そして、ダウンロードした楽曲データをマルチチャンネルオーディオ再生部26に出力する。
マルチチャンネルオーディオ再生部26は、主制御部32から楽曲データを受け取ると、この楽曲データをチャンネル毎のオーディオ信号に再生する。そして、チャンネル毎に、再生したオーディオ信号を、出力特性パラメータ記憶部24に記憶されている該当チャンネルの出力特性パラメータに従ってユーザの聴取位置で最適となるように補正し、該当チャンネルのチャンネル接続端子230から出力する。これにより、楽曲データをマルチチャンネルオーディオ再生する。
[マルチチャンネルオーディオ再生中の音声操作受付処理]
マルチチャンネルオーディオ再生中において、フィルタ処理部27は、音声操作受付用マイク20毎に、該当音声操作受付用マイク20の集音信号に対して、エコーバックパラメータ記憶部25に記憶されている該当音声操作受付用マイク20のエコーバックパラメータに従ってフィルタリングを行う。このフィルタリングにより、各スピーカ3から音声操作受付用マイク20に回り込み、この音声操作受付用マイク20の集音信号に混入した回り込み信号がキャンセルされる。その後、フィルタ処理部27は、フィルタリングされた各音声操作受付用マイク20の集音信号を音声認識部28に出力する。
マルチチャンネルオーディオ再生中において、フィルタ処理部27は、音声操作受付用マイク20毎に、該当音声操作受付用マイク20の集音信号に対して、エコーバックパラメータ記憶部25に記憶されている該当音声操作受付用マイク20のエコーバックパラメータに従ってフィルタリングを行う。このフィルタリングにより、各スピーカ3から音声操作受付用マイク20に回り込み、この音声操作受付用マイク20の集音信号に混入した回り込み信号がキャンセルされる。その後、フィルタ処理部27は、フィルタリングされた各音声操作受付用マイク20の集音信号を音声認識部28に出力する。
音声認識部28は、フィルタ処理部27から受け取った各音声操作受付用マイク20の集音信号に対して音声認識処理を行って、ユーザ音声を特定する。そして、特定したユーザ音声の認識内容を操作受付部29に渡す。
操作受付部29は、音声認識部28から受け取ったユーザ音声の認識内容が音声操作を示しているか否かを判断し、音声操作ならばその操作内容を主制御部32に通知する。これを受けて、主制御部32は、操作受付部29より受け付けた操作内容に従った処理を実行する。
[パラメータ決定処理]
パラメータ決定処理は、マルチチャンネルオーディオ再生処理に先立って実施され、マルチチャンネルオーディオ再生処理に用いる出力特性パラメータ、およびマルチチャンネルオーディオ再生中の音声操作受付処理に用いるエコーバックパラメータを決定する。
パラメータ決定処理は、マルチチャンネルオーディオ再生処理に先立って実施され、マルチチャンネルオーディオ再生処理に用いる出力特性パラメータ、およびマルチチャンネルオーディオ再生中の音声操作受付処理に用いるエコーバックパラメータを決定する。
図3は、オーディオ再生装置2のパラメータ決定処理を説明するためのフロー図である。このフローは、ユーザの聴取位置に設置された音場環境測定用マイク4が音場環境測定用マイク接続部22に接続された状態で、操作受付部29が、ネットワークインターフェース部21を介してリモートコントローラ5から、あるいは、図示していない操作パネルから、音場環境の測定指示を受け付けることにより開始される。
まず、主制御部32は、カウント値Nを「1」に設定する(S1)。それから、主制御部32は、テスト信号発生部31にチャンネルNへのテスト信号出力を指示する。これを受けて、テスト信号発生部31は、チャンネルN接続端子230-Nにテスト信号を出力する(S2)。このテスト信号は、チャンネルN接続端子230-Nに接続されたスピーカ3から出力されると同時にパラメータ決定部30に入力される。
さて、チャンネルN接続端子230-Nに接続されたスピーカ3から出力されたテスト信号は、音場環境測定用マイク接続部22に接続された音場環境測定用マイク4で集音され、音場環境測定用マイク4の集音信号としてパラメータ決定部30に入力される。パラメータ決定部30は、音場環境測定用マイク4の集音信号からテスト信号を検出すると(S3)、この検出信号と、テスト信号発生部31から入力されたテスト信号とを比較し、ユーザの聴取位置におけるチャネルNの音場環境として、検出信号のテスト信号に対する遅延時間、減衰率を測定する(S4)。
それから、パラメータ決定部30は、測定したチャネルNの音場環境に基づいて、チャンネルNのスピーカ3から出力されるオーディオ信号がユーザの聴取位置で最適となるように、このスピーカ3から出力されるオーディオ信号を補正するための出力特性パラメータ(遅延時間、音響特性)を決定する(S5)。
また、チャンネルN接続端子230-Nに接続されたスピーカ3から出力されたテスト信号は、音声操作受付用マイク20-1、20-2で集音され、それぞれ、音声操作受付用マイク20-1、20-2の集音信号としてパラメータ決定部30に入力される。パラメータ決定部30は、音声操作受付用マイク20-1、20-2各々の集音信号からテスト信号を検出すると(S6)、各検出信号と、テスト信号発生部31から入力されたテスト信号とを比較し、テスト信号に対する各検出信号の遅延時間、減衰率を測定する(S7)。
それから、パラメータ決定部30は、音声操作受付用マイク20-1について測定した遅延時間、減衰率に基づいて、チャンネルNのスピーカ3から音声操作受付用マイク20-1に回り込んだ回り込み信号を音声操作受付用マイク20-1の集音信号からキャンセルするためのチャンネルNのエコーバックパラメータ(フィルタリングのパラメータ)を決定する。同様に、音声操作受付用マイク20-2について測定した遅延時間、減衰率に基づいて、チャンネルNのスピーカ3から音声操作受付用マイク20-2に回り込んだ回り込み信号を音声操作受付用マイク20-2の集音信号からキャンセルするためのチャンネルNのエコーバックパラメータを決定する(S8)。
つぎに、パラメータ決定部30は、カウント値Nが最後のチャンネル番号(チャンネル接続端子230の総数と一致)に達しているか否かを判断する(S9)。カウント値Nが最後のチャンネル番号に達していない場合(S9でNO)、カウント値Nを一つインクリメントして(S10)、S2に戻る。
一方、カウント値Nが最後のチャンネル番号に達している場合(S9でYES)、パラメータ決定部30は、これまでに決定したすべてのチャンネルの出力特性パラメータを出力特性パラメータ記憶部24に記憶する(S11)。
また、パラメータ決定部30は、音声操作受付用マイク20-1について決定したすべてのチャンネルのエコーバックパラメータを統合し、音声操作受付用マイク20-1のエコーバックパラメータとしてエコーバックパラメータ記憶部25に記憶する。同様に、音声操作受付用マイク20-2について決定したすべてのチャンネルのエコーバックパラメータを統合し、音声操作受付用マイク20-2のエコーバックパラメータとしてエコーバックパラメータ記憶部25に記憶する(S12)。
以上、本発明の一実施の形態について説明した。
本実施の形態では、オーディオ再生に先立って、スピーカ3から出力されたテスト信号を音声操作受付用マイク20で集音してエコーバックパラメータを決定することにより、オーディオ再生中に音声操作受付用マイク20で集音された集音信号に対して、この決定されたエコーバックパラメータでフィルタリングを行い、フィルタリングされた集音信号に対し音声認識処理を実施することができる。このため、オーディオ再生中におけるユーザ音声の音声認識率が向上し、オーディオ再生中の音声操作をより確実に受け付けることができる。
また、本実施の形態では、オーディオ再生に先立ってエコーバックパラメータを決定することができるので、オーディオ再生中の処理負担を軽減でき、これにより、オーディオ再生中の音声操作受付に要求される処理能力の増大を抑制することができる。
また、本実施の形態では、各スピーカ3から出力される共通のテスト信号を用いて、エコーバックパラメータおよび出力特性パラメータの両方を決定しているので、エコーバックパラメータおよび出力特性パラメータを決定するための作業をそれぞれ別途に行う必要がなく、使い勝手が向上する。また、エコーバックパラメータおよび出力特性パラメータの両方ともに、スピーカ3から出力されるテスト信号に対する検出信号の遅延時間、減衰率に基づいて決定しているので、エコーバックパラメータ決定のための機能ブロックおよび出力特性パラメータ決定のための機能ブロックを実現するハードウエアあるいはソフトウエアを共用することが可能となり、その分、コストを下げることができる。
なお、本発明は上記の実施の形態に限定されるものではなく、その要旨の範囲内で数々の変形が可能である。
例えば、上記の実施の形態では、スピーカ3が複数台ある場合を例にとり説明したが、本発明はこれに限定されない。スピーカ3がマルチチャンネル対応のスピーカである場合、スピーカ3は1台であってもよい。
また、上記の実施の形態では、音声操作受付用マイク20が2つある場合を例にとり説明したが(音声操作受付用マイク20-1、20-2)、音声操作受付用マイク20は1つまたは3つ以上でもよい。また、音声操作受付用マイク20は、オーディオ再生装置2に内蔵されていてもよいし、あるいは外付けされているものでもよい。
また、上記の実施の形態では、メディアサーバ8から楽曲データをダウンロードして再生する場合を例にとり説明したが、本発明はこれに限定されない。例えば、オーディオ再生装置2に、楽曲データを記憶する楽曲データ記憶部、あるいは楽曲データが記憶されたメディアから楽曲データを読み取る楽曲データ読取部を設けて、楽曲データ記憶部から、あるいは楽曲データ読取部を介してメディアから、楽曲データを取得し再生するようにしてもよい。
また、上記の実施の形態において、図2に示すオーディオ装置2の機能構成は、ASIC(Application Specific Integrated Circuit)、FPGA(Field Programmable Gate Array)等の集積ロジックICによりハード的に実現されるものでもよいし、あるいはDSP(Digital Signal Processor)等の計算機によりソフトウエア的に実現されるものでもよい。または、CPUと、メモリと、フラッシュメモリ、ハードディスクドライブ等の補助記憶装置と、無線LANアダプタ等の通信装置と、スピーカと、を備えたPC等の汎用コンピュータにおいて、CPUが所定のプログラムを補助記憶装置からメモリ上にロードして実行することにより実現されるものでもよい。
1:マルチチャンネルオーディオシステム、2:オーディオ再生装置、 3、3-1~3-5:スピーカ、 4:音場環境測定用マイク、 5:リモートコントローラ、 6:アクセスポイント、 7:ネットワーク、 8:メディアサーバ、 20、20-1、20-2:音声操作受付用マイク、 21:ネットワークインターフェース部、 22:音場環境測定用マイク接続部、 23:スピーカ接続部、 24:出力特性パラメータ記憶部、 25:エコーバックパラメータ記憶部、 26:マルチチャンネルオーディオ再生部、 27:フィルタ処理部、 28:音声認識部、 29:操作受付部、 30:パラメータ決定部、 31:テスト信号発生部、 32:主制御部、 230、230-1~230-5:チャンネル接続端子
Claims (4)
- 音声操作受付機能を有するオーディオ装置であって、
オーディオ信号を再生してスピーカに出力するオーディオ再生手段と、
ユーザから音声操作を受け付けるための音声操作受付用マイクと、
オーディオ再生中に前記スピーカから前記音声操作受付用マイクに回り込んだ回り込み信号をキャンセルするためのエコーバックパラメータを決定するパラメータ決定手段と、
オーディオ再生中に前記音声操作受付用マイクで集音された集音信号に対して、前記パラメータ決定手段により決定されたエコーバックパラメータでフィルタリングを行うフィルタ処理手段と、
前記フィルタ処理手段によりフィルタリングされた集音信号に対して音声認識処理を実施して前記音声操作を受け付ける音声操作受付手段と、を備え、
前記パラメータ決定手段は、
テスト信号を前記スピーカから出力して前記音声操作受付用マイクにより集音し、当該テスト信号に対する前記音声操作受付用マイクの集音信号の遅延時間および減衰率に基づいて、前記エコーバックパラメータを決定する
ことを特徴とするオーディオ装置。 - 請求項1に記載のオーディオ装置であって、
前記オーディオ再生手段は、
マルチチャンネルオーディオ信号を再生して複数のスピーカから出力するものであり、
前記パラメータ決定手段は、
前記テスト信号を前記複数のスピーカから順番に出力して前記音声操作受付用マイクにより集音し、前記スピーカ毎に当該テスト信号に対する前記音声操作受付用マイクの集音信号の遅延時間および減衰率を測定し、前記スピーカ毎に測定した前記遅延時間および前記減衰率に基づいて前記エコーバックパラメータを決定する
ことを特徴とするオーディオ装置。 - 請求項2に記載のオーディオ装置であって、
音場環境測定用マイクをさらに備え、
前記パラメータ決定手段は、
前記エコーバックパラメータの決定に際して、前記複数のスピーカから順番に出力した前記テスト信号を、ユーザの聴取位置に設置された前記音場環境測定用マイクにより集音し、前記スピーカ毎に当該テスト信号に対する前記音場環境測定用マイクの集音信号の遅延時間および減衰率を測定し、前記スピーカ毎に測定した前記遅延時間および前記減衰率に基づいて、前記スピーカ各々の出力特性パラメータを決定し、
前記オーディオ再生手段は、
前記スピーカ毎に、前記パラメータ決定手段により決定された前記スピーカの出力特性パラメータに従って当該スピーカから出力するオーディオ信号を補正する
ことを特徴とするオーディオ装置。 - コンピュータで読み取り可能なプログラムであって、
前記プログラムは、前記コンピュータを、音声操作受付機能を有するオーディオ装置として機能させ、
前記オーディオ装置は、
オーディオ信号を再生してスピーカに出力するオーディオ再生手段と、
オーディオ再生中に、ユーザの音声操作を受け付けるための音声操作受付用マイクに前記スピーカから回り込んだ回り込み信号をキャンセルするためのエコーバックパラメータを決定するパラメータ決定手段と、
オーディオ再生中に前記音声操作受付用マイクで集音された集音信号に対して、前記パラメータ決定手段により決定されたエコーバックパラメータでフィルタリングを行うフィルタ処理手段と、
前記フィルタ処理手段によりフィルタリングされた集音信号に対して音声認識処理を実施して前記音声操作を受け付ける音声操作受付手段と、を備え、
前記パラメータ決定手段は、
テスト信号を前記スピーカから出力して前記音声操作受付用マイクにより集音し、当該テスト信号に対する前記音声操作受付用マイクの集音信号の遅延時間および減衰率に基づいて、前記エコーバックパラメータを決定する
ことを特徴とするコンピュータで読み取り可能なプログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP17903325.3A EP3605535A4 (en) | 2017-03-28 | 2017-09-21 | AUDIO DEVICE AND COMPUTER READABLE PROGRAM |
US16/498,477 US20200029162A1 (en) | 2017-03-28 | 2017-09-21 | Audio device and computer readable program |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017063309A JP6873549B2 (ja) | 2017-03-28 | 2017-03-28 | オーディオ装置およびコンピュータで読み取り可能なプログラム |
JP2017-063309 | 2017-03-28 |
Publications (1)
Publication Number | Publication Date |
---|---|
WO2018179506A1 true WO2018179506A1 (ja) | 2018-10-04 |
Family
ID=63677691
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
PCT/JP2017/034012 WO2018179506A1 (ja) | 2017-03-28 | 2017-09-21 | オーディオ装置およびコンピュータで読み取り可能なプログラム |
Country Status (4)
Country | Link |
---|---|
US (1) | US20200029162A1 (ja) |
EP (1) | EP3605535A4 (ja) |
JP (1) | JP6873549B2 (ja) |
WO (1) | WO2018179506A1 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10825440B2 (en) * | 2018-02-01 | 2020-11-03 | Cirrus Logic International Semiconductor Ltd. | System and method for calibrating and testing an active noise cancellation (ANC) system |
KR102527842B1 (ko) * | 2018-10-12 | 2023-05-03 | 삼성전자주식회사 | 전자 장치 및 그 제어 방법 |
WO2021136605A1 (en) * | 2019-12-30 | 2021-07-08 | Harman Becker Automotive Systems Gmbh | Method for performing acoustic measurements |
CN111312274B (zh) * | 2020-02-21 | 2022-06-28 | 思必驰科技股份有限公司 | 语音信号处理方法、装置、系统、电子设备、及存储介质 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000354300A (ja) | 1999-06-11 | 2000-12-19 | Accuphase Laboratory Inc | マルチチャンネルオーディオ再生装置 |
JP2005318636A (ja) * | 2004-04-29 | 2005-11-10 | Harman Becker Automotive Systems Gmbh | 車両用キャビンのための屋内通信システム |
JP2006014359A (ja) | 2005-07-27 | 2006-01-12 | Fujitsu Ltd | エコー抑制処理システム |
JP2009017331A (ja) * | 2007-07-06 | 2009-01-22 | Pioneer Electronic Corp | 音声処理装置、音声処理方法、音声処理プログラム及びその記録媒体 |
JP2009216835A (ja) * | 2008-03-07 | 2009-09-24 | Fujitsu Ten Ltd | 音響エコー除去装置、車載装置および音響エコー除去方法 |
JP2014219614A (ja) | 2013-05-10 | 2014-11-20 | アルパイン株式会社 | オーディオ装置、ビデオ装置及びコンピュータプログラム |
WO2016024345A1 (ja) * | 2014-08-13 | 2016-02-18 | 三菱電機株式会社 | エコーキャンセラ装置 |
-
2017
- 2017-03-28 JP JP2017063309A patent/JP6873549B2/ja active Active
- 2017-09-21 US US16/498,477 patent/US20200029162A1/en not_active Abandoned
- 2017-09-21 EP EP17903325.3A patent/EP3605535A4/en active Pending
- 2017-09-21 WO PCT/JP2017/034012 patent/WO2018179506A1/ja unknown
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000354300A (ja) | 1999-06-11 | 2000-12-19 | Accuphase Laboratory Inc | マルチチャンネルオーディオ再生装置 |
JP2005318636A (ja) * | 2004-04-29 | 2005-11-10 | Harman Becker Automotive Systems Gmbh | 車両用キャビンのための屋内通信システム |
JP2006014359A (ja) | 2005-07-27 | 2006-01-12 | Fujitsu Ltd | エコー抑制処理システム |
JP2009017331A (ja) * | 2007-07-06 | 2009-01-22 | Pioneer Electronic Corp | 音声処理装置、音声処理方法、音声処理プログラム及びその記録媒体 |
JP2009216835A (ja) * | 2008-03-07 | 2009-09-24 | Fujitsu Ten Ltd | 音響エコー除去装置、車載装置および音響エコー除去方法 |
JP2014219614A (ja) | 2013-05-10 | 2014-11-20 | アルパイン株式会社 | オーディオ装置、ビデオ装置及びコンピュータプログラム |
WO2016024345A1 (ja) * | 2014-08-13 | 2016-02-18 | 三菱電機株式会社 | エコーキャンセラ装置 |
Non-Patent Citations (2)
Title |
---|
KOGA, KENTARO ET AL.: "Improvement of In-Car Speech Recognition by Acoustic Echo Canceller with Maximum Likelihood", 15TH WORLD CONGRESS ON ITS, November 2008 (2008-11-01), pages 1 - 4, XP055541322 * |
See also references of EP3605535A4 * |
Also Published As
Publication number | Publication date |
---|---|
JP6873549B2 (ja) | 2021-05-19 |
EP3605535A1 (en) | 2020-02-05 |
US20200029162A1 (en) | 2020-01-23 |
JP2018165787A (ja) | 2018-10-25 |
EP3605535A4 (en) | 2021-01-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2018179506A1 (ja) | オーディオ装置およびコンピュータで読み取り可能なプログラム | |
US20100142719A1 (en) | Acoustic apparatus and method of controlling an acoustic apparatus | |
US11711061B2 (en) | Customized automated audio tuning | |
EP3671740B1 (en) | Method of compensating a processed audio signal | |
US20230079741A1 (en) | Automated audio tuning launch procedure and report | |
JP2010157852A (ja) | 音響補正装置、音響測定装置、音響再生装置、音響補正方法及び音響測定方法 | |
US11950082B2 (en) | Method and apparatus for audio processing | |
US20050053246A1 (en) | Automatic sound field correction apparatus and computer program therefor | |
US20230146772A1 (en) | Automated audio tuning and compensation procedure | |
JP5691224B2 (ja) | パラメータ設定方法および音響処理装置 | |
CN114071220B (zh) | 音效调节方法、装置、存储介质及电子设备 | |
US20230101944A1 (en) | Multi-channel audio system, multi-channel audio device, program, and multi-channel audio playback method | |
US20150023507A1 (en) | Speaker Protection in Small Form Factor Devices | |
US7907737B2 (en) | Acoustic apparatus | |
WO2024093536A1 (zh) | 音频信号处理方法及装置、音频播放设备、存储介质 | |
WO2021135235A1 (zh) | 一种扬声器自动调试方法及系统 | |
JP5064248B2 (ja) | フィルタ特性設定装置及び方法、オーディオシステム、並びにプログラム | |
WO2023081534A1 (en) | Automated audio tuning launch procedure and report | |
JP5348179B2 (ja) | 音響処理装置およびパラメータ設定方法 | |
CN117178567A (zh) | 测量音频环境的语音清晰度 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
121 | Ep: the epo has been informed by wipo that ep was designated in this application |
Ref document number: 17903325 Country of ref document: EP Kind code of ref document: A1 |
|
NENP | Non-entry into the national phase |
Ref country code: DE |
|
ENP | Entry into the national phase |
Ref document number: 2017903325 Country of ref document: EP Effective date: 20191028 |