JP2007288565A - Vehicle-mounted equipment - Google Patents
Vehicle-mounted equipment Download PDFInfo
- Publication number
- JP2007288565A JP2007288565A JP2006114235A JP2006114235A JP2007288565A JP 2007288565 A JP2007288565 A JP 2007288565A JP 2006114235 A JP2006114235 A JP 2006114235A JP 2006114235 A JP2006114235 A JP 2006114235A JP 2007288565 A JP2007288565 A JP 2007288565A
- Authority
- JP
- Japan
- Prior art keywords
- audio
- unit
- audio data
- sound
- subband
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Circuit For Audible Band Transducer (AREA)
Abstract
Description
本発明は車載機に係わり、特にオーディオ音を再生してスピーカより出力するオーディオ機能と該オーディオ音をキャンセルして話者音声を出力するオーディオキャンセル機能とを備えた車載機に関する。 The present invention relates to an in-vehicle device, and more particularly to an in-vehicle device having an audio function for reproducing audio sound and outputting it from a speaker, and an audio canceling function for canceling the audio sound and outputting speaker voice.
近年、オーディオ機能とナビゲーション機能を統合したAVNシステム(Audio Visual Navigation System)が車載機の主流になっている。このAVNシステムにおけるオーディオ装置は、オーディオデータがMP3,AACなどの圧縮オーディオデータであれば伸張処理により生のオーディオ信号を復元して再生する。また、オーディオデータが圧縮されていなければ(非圧縮オーディオデータ)、アナログに変換して再生すると共に、該非圧縮オーディオデータに圧縮処理を施してハードディスクに記録する(リッピング)。リッピングすることにより、以後、ハードディスクに記録した圧縮オーディオデータを用いて再生することが可能になる。
また、AVNシステムにおけるナビゲーション装置は、自車位置周辺の地図を表示すると共に、目的地までの経路を探索して地図上に表示して経路誘導を行なう。かかるナビゲーション装置に対してユーザが所定の制御の実行を指示する手段としてリモコン、タッチパネルに加えて音声認識装置を装備したものが多くなっている。かかる音声認識装置は、雑音を抑圧した話者音声が入力されると音声認識率を向上する。このため、マイクで受音したオーディオ再生音と話者音声とが混じった音から適応フィルタを用いてオーディオ音のみを抑圧して音声認識装置に入力するオーディオ音キャンセルシステム (ASCシステム:Audio Sound Cancellation System)が、該音声認識装置の前段に設けられている。
In recent years, an AVN system (Audio Visual Navigation System) that integrates an audio function and a navigation function has become the mainstream of in-vehicle devices. The audio device in this AVN system restores and reproduces a raw audio signal by decompression processing if the audio data is compressed audio data such as MP3 or AAC. If the audio data is not compressed (uncompressed audio data), it is converted to analog and reproduced, and the uncompressed audio data is compressed and recorded (ripped). By ripping, it becomes possible to reproduce using the compressed audio data recorded on the hard disk.
The navigation device in the AVN system displays a map around the vehicle position, searches for a route to the destination, displays it on the map, and performs route guidance. As a means for a user to instruct execution of predetermined control for such a navigation device, a device equipped with a voice recognition device in addition to a remote control and a touch panel is increasing. Such a speech recognition apparatus improves the speech recognition rate when a speaker speech with suppressed noise is input. For this reason, an audio sound cancellation system (ASC system: Audio Sound Cancellation) that suppresses only the audio sound from the mixed audio playback sound received by the microphone and the speaker's sound using an adaptive filter and inputs it to the speech recognition device. System) is provided in front of the speech recognition apparatus.
図8は従来のAVNシステムの構成図であり、ASCシステム1の第1、第2入力端子には、それぞれマイクロホン2により検出された検出音信号Sdとオーディオ部3から出力されるオーディオ信号Saが入力される。ASCシステム1は適応信号処理により、マイクロホン2で検出した検出音信号よりオーディオ再生音を抑圧して音声認識装置4に入力する。オーディオ部3において、CDデッキ等のオーディオソース5あるいはハードディスク6から読み出されたオーディオデータはソース切替部7を介して出力切換部8に入力する。出力切換部8は入力オーディオデータが圧縮されているか否かにより出力先を選択するもので、圧縮オーディオデータを圧縮オーディオデコード部9に入力し、非圧縮オーディオデータ(PCMオーディオデータ)を圧縮オーディオエンコード部10と入力切換部11に入力する。
圧縮オーディオデコード部9は圧縮オーディオデータに伸張処理(復元処理)を施してオーディオデータを復元して入力切換部11に入力する。入力切換部11は圧縮オーディオデコード部9から入力するオーディオデータあるいは出力切換部8から入力するオーディオデータをASCシステム1に入力すると共に、オーディオ回路12に入力する。オーディオ回路12は入力されたオーディオデータSaをアナログに変換してスピーカ13から音響空間に再生音を出力する。
非圧縮オーディオデータの場合、以上と並行して圧縮オーディオエンコード部10は非圧縮オーディオデータ(PCMオーディオデータ)に圧縮処理を施してディスク制御部14に入力する。ディスク制御部14は入力された圧縮オーディオデータをハードディスク6に記録する(リッピング)。また、ディスク制御部14は図示しない操作部からの要求により、ハードディスク6に記録されている所定曲の圧縮オーディオデータを読み出してソース切替部7に入力する。
FIG. 8 is a configuration diagram of a conventional AVN system. A detection sound signal Sd detected by the
The compressed
In the case of uncompressed audio data, the compressed
図9はASCシステム1の構成図(特許文献1)であり、オーディオデータSaはオーディオ回路12を介してスピーカ13に入力し、該スピーカより車室内音響空間に再生音が放射される。マイクロホン2は放射されたオーディオ音を検出し、アンプ21、及びAD変換器22を介して誤差演算部23に入力する。又、前記オーディオデータSaは参照信号として適応信号処理部24に入力する。適応信号処理部24は、参照信号としてのオーディオデータx(n)にフィルタリング処理を施して出力する適応フィルタ24aと、誤差演算部23ら出力する誤差信号e(n)のパワーが最小となるようにLMS適応信号処理を行って適応フィルタの24aのフィルタ係数を決定するLMS演算部(係数更新部)24bを備えている。
FIG. 9 is a configuration diagram of the ASC system 1 (Patent Document 1). Audio data Sa is input to a
適応フィルタ24aはLMS演算部24bにより決定された係数に従って参照信号x(n)にデジタルフィルタ処理を施してオーディオ音キャンセル信号y(n)を出力する。誤差演算部23はオーディオ音キャンセル信号y(n)とマイクロホン検出信号d(n)の差を誤差信号e(n)として出力する。適応フィルタ24aはNタップのFIR型デジタルフィルタで構成される。
LMS演算部24b は、1サンプリング時刻Ts後の次の時刻(n+1)・Tsにおける適応フィルタ24aの係数W(n+1)を、現時刻n・Tsにおける適応フィルタの係数W(n)とエラー信号e(n)を用いて次式
図9のオーディオキャンセルシステムによれば、スピーカからマイクロホンまでの伝達特性を模擬するように、換言すれば、オーディオ音をキャンセルするように適応フィルタ24aの係数が決定される。この結果、オーディオ音が出力されている状態において話者が音声を発声すると、マイクロホン2により該オーディオ音と発話音声の合成音が検出され、誤差発生部23は該合成音信号d(n)よりオーディオ音キャンセル信号y(n)を除いた誤差信号e(n)を発話音声信号として音声認識装置4に入力し、音声認識装置4は該発話音声信号に基づいて音声認識処理を実行する。
The
The LMS calculation unit 24b uses the coefficient W (n + 1) of the
According to the audio cancellation system of FIG. 9, the coefficient of the
図8におけるASCシステム1におけるオーディ音キャンセル処理やオーディオ部3におけるエンコード/デコード処理はDSP(Digital Signal Processor)を用いて実現されている。このASCシステム1におけるDSPの単位時間当たりの処理量を減少するための技術としてマルチレート信号処理技術が知られている。マルチレート信号処理技術は、フィルタバンクを用いて信号を帯域分割し、これにより信号処理を行うサンプリング周波数を下げることで単位時間当たりの処理量を減少し、低スペックなDSPでも複雑な信号処理を可能としている。
Audio sound cancellation processing in the
図10はマルチレート信号処理技術を採用したASCシステム1の構成図であり、オーディオデータSa及びマイクロホン検出音信号Sdをそれぞれフィルタバンク31,32を用いてn個(例えば32個)の帯域に分割し、帯域毎に適応信号処理し、各帯域の適応フィルタ出力を合成して出力するようになっている。フィルタバンク31,32はそれぞれn個のバンドパスフィルタBPFを備え、オーディオデータSa及びマイクロホン検出音信号Sdをそれぞれn個の帯域に分割し、ダウンサンプリング部33,34はn個のサンプリング部DNを備えて各帯域の信号成分をダウンサンプリングして出力する。
FIG. 10 is a block diagram of the
オーディオ音キャンセルコントロール部35は、帯域毎に適応信号処理部ASPを備え、帯域毎に誤差信号のパワーが最小となるようにLMS適応信号処理を行なう。誤差信号発生部36は帯域毎に誤差演算部COMを備え、対応する帯域の適応信号処理部の出力信号とマイクロホン検出音信号との差を計算して誤差信号として適応信号処理部ASPにフィードバックする。オーディオ音キャンセルコントロール部35において、各帯域の適応信号処理部ASPの適応フィルタ(FIR)は対応する帯域のオーディオデータにフィルタリング処理を施して出力し、LMS演算部(LMS)は対応する帯域の誤差演算部から出力する誤差信号のパワーが最小となるようにLMS適応信号処理を行って適応フィルタFIRのフィルタ係数を決定する。
ポストフィルタ37は各帯域の誤差信号に所定のバンドパスフィルタ処理を施し、合成部38はポストフィルタ37の各バンドパスフィルタ出力を合成し、アップサンプリング部(UP)39は合成信号をアップサンプリングして出力する。
以上により、マイクロホン2がオーディオ再生音のみを検出しているとき、各帯域のオーディオ音のパワーが最小となるフィルタ係数が適応フィルタFIRに設定される。この結果、マイクロホン2がオーディオ再生音と話者音声が混じった合成音を検出すると、オーディオ再生音が抑圧されて話者音声信号がアップサンプリング部(UP)39から出力する。
The
As described above, when the
マルチレート信号処理技術によれば、フィルタバンクを用いて信号を帯域分割することにより単位時間当たりの処理量を減少できるが、フィルタバンクが余計に必要になる。
以上から、本発明の目的は、オーディオデータの帯域信号成分を出力するASCキャンセルシステムにおけるフィルタバンクを除去してシステムのハードウェア負担を軽減することである。
According to the multi-rate signal processing technique, the amount of processing per unit time can be reduced by dividing a signal into bands using a filter bank, but an extra filter bank is required.
As described above, an object of the present invention is to remove a filter bank in an ASC cancellation system that outputs a band signal component of audio data, thereby reducing the hardware burden of the system.
本発明は、オーディオ再生してスピーカより出力するオーディオ機能とオーディオ音をキャンセルして話者音声を出力するオーディオキャンセル機能とを備えた車載機であり、非圧縮のオーディオデータを入力されてオーディオ音を音響空間に放射するオーディオ回路、前記オーディオデータを複数のサブバンドオーディオデータにして出力するフィルタバンク、前記フィルタバンクから出力される各サブバンドのオーディオデータを圧縮してメモリに記憶する圧縮部、前記フィルタバンクから出力される各サブバンドのオーディオデータにオーディオ音キャンセル処理を施して合成するオーディオ音キャンセル部を備えている。
本発明の車載機は更に、オーディオソースから出力するオーディオデータが圧縮されているか否かを判定する判定部、圧縮オーディオデータを復号する復号部、前記復号部から出力する圧縮オーディオデータに伸張処理を施して前記オーディオ回路に入力する伸張部、前記オーディオソースから出力するオーディオデータが圧縮されていれば、前記復号部の出力データを前記オーディオ音キャンセル部に入力し、圧縮されていなければ前記フィルタバンクから出力するサブバンドオーディオデータを前記オーディオ音キャンセル部に入力する切替部を備えている。
The present invention is an in-vehicle device having an audio function for reproducing audio and outputting from a speaker, and an audio canceling function for canceling audio sound and outputting a speaker's voice. An audio circuit that radiates the sound data into a sound space, a filter bank that outputs the audio data as a plurality of subband audio data, and a compression unit that compresses and stores the audio data of each subband output from the filter bank in a memory; An audio sound cancellation unit is provided that performs audio sound cancellation processing on the audio data of each subband output from the filter bank and synthesizes the data.
The in-vehicle device of the present invention further includes a determination unit that determines whether audio data output from an audio source is compressed, a decoding unit that decodes compressed audio data, and a decompression process on the compressed audio data output from the decoding unit. If the audio data output from the audio source and compressed from the audio source is compressed, the output data of the decoding unit is input to the audio sound canceling unit, and if not compressed, the filter bank Is provided with a switching unit for inputting the subband audio data to be output from the audio sound canceling unit.
本発明によれば、フィルタバンクでオーディオデータを複数のサブバンドのオーディオデータに分割し、該フィルタバンクから出力される各サブバンドオーディオデータを圧縮してメモリに記憶すると共に、前記フィルタバンクから出力される各サブバンドオーディオデータを用いてASCシステムはマルチレート信号処理によりオーディオ音をキャンセルするようにしたから、オーディオ部の圧縮に用いるフィルタバンクをオーディオ音キャンセル処理に共用することができ、ASCシステムにおけるフィルタバンクを省略することができる。 According to the present invention, the audio data is divided into a plurality of sub-band audio data by the filter bank, each sub-band audio data output from the filter bank is compressed and stored in the memory, and output from the filter bank. Since the ASC system cancels the audio sound by multi-rate signal processing using each sub-band audio data, the filter bank used for the compression of the audio part can be shared with the audio sound canceling process. The filter bank in can be omitted.
(A)車載機の要部構成
図1は本発明の車載機の要部構成図である。ASCシステム51は後述するようにマルチレート信号処理技術を採用した構成を備えており、その第1入力端子側にはマイクロホン52により検出された検出音信号Sdがフィルタバンク部53を介して入力され、第2入力端子側にはオーディオ部54からオーディオ信号Saが入力される。ASCシステム51は、後述するようにオーディオ部の圧縮に用いるフィルタバンク72aをオーディオ音キャンセル処理に共用する点に特徴を有している。
フィルタバンク部53はマイクロホン検出音信号Sdをn個の帯域、例えば32個のサブバンドに分割して出力するもので、図示しないがフィルタバンクとダウンサンプリング部で構成されている(図10のフィルタバンク32、ダウンサンプリング部34を参照)。すなわち、フィルタバンク部53はマイクロホン検出音信号Sdを32サブバンドに分割し、各サブバンドの信号成分をダウンサンプリングしてASCシステム51に入力する。
オーディオ部54において、CDデッキ等のオーディオ再生部61あるいはハードディスク62から読み出されたオーディオデータは、ソース切替部63、オーディオソース種別判別部64を介して出力切換部65に入力される。ソース切替部63は所定のオーディオソースからのオーディオデータを選択し、オーディオソース種別判別部64は該オーディオデータが圧縮されているか、圧縮されていないかを判別し、判別結果を出力切換部65と第1、第2の入力切替部66、67に入力する。
出力切換部65は入力オーディオデータが圧縮されているか否かにより出力先を選択するもので、圧縮されていればオーディオデータを復号/伸張部71に入力し、圧縮されていなければオーディオデータ(PCMオーディオデータ)を第2の入力切替部67と圧縮/符号化部72に入力する。
(A) Main part structure of onboard equipment FIG. 1: is a principal part block diagram of the onboard equipment of this invention. As will be described later, the
The
In the
The
入力オーディオデータが圧縮されていれば、復号/伸張部71の復号器71aは符号化されている圧縮オーディオデータを復号し、第1の入力切替部66を介して復号結果をASCシステム51に入力すると共に、該復号結果を伸張部71bに入力する。伸張部71bは圧縮オーディオデータに伸張処理を施して元のオーディオデータを復元し、第2の入力切替部67を介してオーディオ回路74に入力する。オーディオ回路74は入力されたオーディオデータをアナログに変換してスピーカ75から音響空間に再生音を出力する。
入力オーディオデータが圧縮されていなければ、第2の入力切替部67は該非圧縮のオーディオデータ(PCMオーディオデータ)をオーディオ回路74に入力し、オーディオ回路74は入力されたオーディオデータをアナログに変換してスピーカ75から音響空間に再生音を出力する。また、圧縮/符号化部72の分析部(フィルタバンク部)72aは、非圧縮のオーディオデータをn個の帯域(サブバンド)、例えば32個のサブバンドに分割し、第1の入力切替部66を介してASCシステム51に入力すると共に、各サブバンドオーディオデータを圧縮部72bに入力する。圧縮部72bはMPEGオーディオ圧縮方式、例えば32サブバンド・コーディング(帯域分割符号化)方式に従って圧縮/符号化処理を行い、処理結果をディスク制御部76に入力する。ディスク制御部76は入力された圧縮オーディオデータをハードディスク62に記録する(リッピング)。また、ディスク制御部76は図示しない操作部からの要求により、ハードディスク62に記録されている所定曲の圧縮オーディオデータを読み出してソース切替部63に入力して再生する。
If the input audio data is compressed, the
If the input audio data is not compressed, the second
(B)圧縮/符号化部
図2は圧縮/符号化部72の構成図であり、分析部(フィルタバンク部)72aと圧縮部72bとで構成されている。
フィルタバンク部72aは32個のバンドパスフィルタBPFを備え、オーディオデータを32個のサブバンドオーディオデータにして出力する。なお、32サブバンドオーディオデータは第1の入力切替部66を介してASCシステム51に入力される。圧縮部72bはMPEGオーディオ圧縮方式、例えば、32サブバンド分割符号化方式により圧縮/符号化する。32サブバンド分割符号化方式は、聴感心理的な特性を利用して高能率の圧縮を実現する。
(B) Compression / Encoding Unit FIG. 2 is a block diagram of the compression /
The
・32サブバンド分割符号化方式
人間の耳はあるレベル以下の音を聞き取ることができず、このレベルを各帯域毎にプロットしてできる特性曲線は最小マスキングしきい値曲線(最小可聴限界曲線)MTCと呼ばれている(図3参照)。マスキング効果は周囲の音の状況により変化し、最小マスキングしきい値曲線MTC以上のレベルを有する音であっても小さな音は大きな音により聞こえなくなってしまう。これは、大きな音によりマスキングしきい値曲線が図3のMTC′のように変化するからであり、該曲線以下の音成分A,Bはマスキングされて人間の耳に聞こえず、マスキングしきい値曲線MTC′より上の音成分C,Dは聞こえる。
以上を考慮して、マスキングしきい値レベルMTC′以下の音A,Bは量子化せず、マスキングしきい値レベル以上の音C,Dを量子化する。又、量子化する場合には、各サブバンドにおけるオーディオレベルとマスキングしきい値レベルの差の大きさに応じて量子化ビット数を割り当てて量子化し、量子化データと割り当てビット数等を出力する。
32 sub-band division coding method The human ear cannot hear sound below a certain level, and the characteristic curve that can be plotted for each band is the minimum masking threshold curve (minimum audible limit curve) It is called MTC (see FIG. 3). The masking effect changes depending on the surrounding sound conditions, and even a sound having a level higher than the minimum masking threshold curve MTC cannot be heard by a loud sound. This is because the masking threshold curve changes as shown by MTC 'in FIG. 3 due to a loud sound, and the sound components A and B below the curve are masked and cannot be heard by human ears. Sound components C and D above the curve MTC 'can be heard.
Considering the above, the sounds A and B below the masking threshold level MTC ′ are not quantized, and the sounds C and D above the masking threshold level are quantized. In the case of quantization, the quantization bit number is assigned and quantized according to the difference between the audio level and the masking threshold level in each subband, and the quantized data and the assigned bit number are output. .
具体的には、図4に示すように36サブフレーム(32サンプル/サブフレーム)サンプルのオーディオ信号で1フレームを構成し、各サブフレームのオーディオ信号をそれぞれ32のサブバンド(帯域)に細分化し、32バンドのサブバンド符号化を行う。すなわち、全帯域を32の等間隔の周波数幅に分割し、それぞれのサンプル信号を後述の各サブバンドの量子化ビット数に応じて量子化して符号化を行い、1152(=36×32)サンプルデータを1フレームとする。
1つのサブバンドの36サンプルデータに対して共通に1つのスケールファクタが決められる。すなわち、36個のそれぞれの波形の最大値が1.0になるように正規化し、その正規化倍率がスケールファクタとして符号化される。
又、各サブバンドの量子化ビット数を決定し、割り当てビット数とする。臨界帯域幅を考慮したマスキングレベルぎりぎりまでの量子化精度(量子化ビット数)を指定することにより、マスキング効果を最も効果的に利用できる。マスキングの結果、聴感系に認識されないレベルの信号しか含まれないバンドについては、完全に情報をなくすことができ、かかる場合はサンプルデータとしてビットを割り当てない。すなわち、各サブバンドにおけるサンプルデータの量子化ビット数が0の場合、サンプリングデータは存在しない。
Specifically, as shown in FIG. 4, an audio signal of 36 subframes (32 samples / subframe) samples constitute one frame, and the audio signal of each subframe is subdivided into 32 subbands (bands). , 32 band sub-band encoding is performed. That is, the entire band is divided into 32 equally-spaced frequency widths, and each sample signal is quantized and encoded according to the number of quantization bits of each subband, which will be described later, and 1152 (= 36 × 32) samples. The data is one frame.
One scale factor is determined in common for 36 sample data of one subband. That is, normalization is performed so that the maximum value of each of the 36 waveforms is 1.0, and the normalization magnification is encoded as a scale factor.
In addition, the number of quantization bits for each subband is determined and set as the number of assigned bits. The masking effect can be used most effectively by specifying the quantization accuracy (number of quantization bits) up to the limit of the masking level in consideration of the critical bandwidth. As a result of the masking, it is possible to completely eliminate information about a band including only a signal of a level that is not recognized by the auditory system. In such a case, no bit is assigned as sample data. That is, when the number of quantization bits of sample data in each subband is 0, there is no sampling data.
図5はオーディオ・ビット・ストリームの1フレームの構造説明図である。100は1つ1つでオーディオ信号に復号できる最小ユニットで、常に一定のサンプル数=1152(=36×32)サンプルのデータを含んでいる。最小ユニット100は32ビットのヘッダ部101と、エラーチェックコード(オプション)102と、オーディオデータ部103で構成され、オーディオデータ部103はサブバンド毎の量子化ビット数(アロケーションデータ)103a、スケールファクタ103b、サンプルデータ103cを備えている。ヘッダ部101には、12ビットのオール"1"の同期ワード101a、常に"1"のID101b、その他レイヤ識別101c、ビットレートインデックス、サンプリング周波数、モード等の情報が含まれている。
FIG. 5 is an explanatory diagram of the structure of one frame of an audio bit stream. 100 is the smallest unit that can be decoded into an audio signal one by one, and always contains data of a fixed number of samples = 11152 (= 36 × 32) samples. The
・圧縮部
図2に戻って、圧縮部72bにおいて、心理聴覚モデル81は、1フレームm(=1152)サンプリングのオーディオデータが入力される毎にマスキングしきい値特性MTC′(図3参照)を求め、このマスキングしきい値特性MTC′の各サブバンドにおけるマスクレベルと信号レベルとからサブバンド(N=32)毎に量子化ビット数、スケールファクタを決定し、各サブバンドの調節部821〜8232はスケールファクタに基づいてビットシフト量を決定し、ビットシフト部831〜8332は各サブバンド信号のビットをシフトして符号化部84に入力する。符号化部84はシフト後のサブバンドデータを量子化ビット数で符号化すると共に、各サブバンドの量子化ビット数、スケールファクタを符号化して出力する。
Compression unit Returning to FIG. 2, in the
(C)復号/伸張部
図6は復号/伸張部71の構成図であり、復号器71aと伸張部71bとで構成されている。復号器71aは符号化されている圧縮オーディオデータを復号し、各サブバンドの圧縮オーディオデータとスケールファクタを伸張部71bに入力すると共に、第1の入力切替部66に入力する。
伸張部71bにおける各サブバンドの調節部851〜8532はスケールファクタに基づいてビットシフト量を決定し、ビットシフト部861〜8632は各サブバンドデータのビットを圧縮時と逆方向にシフトして伸張する。各サブバンドのポストフィルタ(バンドパスフィルタBPF)は伸張された各サブバンド信号に所定のBPF特性を付与し、合成部88は全ポストフィルタ出力を合成してオーディオ信号を復元して出力する。
(C) Decoding / Expanding Unit FIG. 6 is a block diagram of the decoding / decompressing unit 71, which includes a
Adjusting portion 85 1-85 32 of each sub-band in the
(D)ASCシステム
図7は本発明のASCシステム51の構成図であり、フィルタバンク部53及び入力切替部66からマイクロホン検出音信号Sdおよびオーディオ信号Saが32個のサブバンドに分割されて入力している。すなわち、フィルタバンク部53はマイクロホン検出音信号Sdを32サブバンドの信号成分に分割し、各サブバンドの信号成分をダウンサンプリングしてASCシステム51に入力する。また、入力切替部66は、非圧縮オーディオデータ再生時、圧縮/符号化部72のフィルタバンク部72aから出力する32サブバンドオーディオデータをASCシステム51に入力し、圧縮オーディオデータ再生時、復号/伸張部71の復号器71aから出力する32サブバンドオーディオデータ及びスケールファクタをASCシステム51に入力する。
(D) ASC System FIG. 7 is a block diagram of the
・非圧縮オーディオデータ再生時
非圧縮オーディオデータ再生時、入力切替部66は圧縮/符号化部72のフィルタバンク部72aが出力する32サブバンドオーディオデータをASCシステム51に入力する。ASCシステム51のダウンサンプリング部91はサブバンド毎にサンプリング部(DS)を備え、各サブバンドオーディオデータをダウンサンプリングして出力する。
オーディオ音キャンセルコントロール部92は、サブバンド毎に適応信号処理部ASPを備え、サブバンド毎に誤差信号のパワーが最小となるようにLMS適応信号処理を行なう。誤差信号発生部93はサブバンド毎に誤差演算部COMを備え、対応するサブバンドの適応信号処理部の出力信号とマイクロホン検出音信号との差を計算して誤差信号として適応信号処理部ASPにフィードバックする。オーディオ音キャンセルコントロール部92において、各サブバンドの適応信号処理部ASPの適応フィルタ(FIR)は対応するサブバンドのオーディオデータにフィルタリング処理を施して出力し、LMS演算部(LMS)は対応するサブバンドの誤差演算部から出力する誤差信号のパワーが最小となるようにLMS適応信号処理を行って適応フィルタFIRのフィルタ係数を決定する。なお、非圧縮オーディオデータ再生時においてスケールファクタは0である。このため、ビットシフト量は0であり、各サブバンドのビットシフト部941〜9432はビットシフトをしない。
ポストフィルタ96は各サブバンドの誤差信号に所定のバンドパスフィルタ処理を施し、合成部97はポストフィルタ96の各バンドパスフィルタ出力を合成し、アップサンプリング部(UP)98は合成信号をアップサンプリングして話者音声として音声認識装置に出力する。
When playing back uncompressed audio data When playing back uncompressed audio data, the
The audio sound cancel
The
・圧縮オーディオデータ再生時
圧縮オーディオデータ再生時、入力切替部66は復号/伸張部71の復号器71aが出力する32サブバンドオーディオデータ及びスケールファクタをASCシステム51に入力する。ASCシステム51のダウンサンプリング部91は各サブバンドのオーディオデータをダウンサンプリングして出力する。
オーディオ音キャンセルコントロール部92は、サブバンド毎に適応信号処理部ASPを備え、サブバンド毎に誤差信号のパワーが最小となるようにLMS適応信号処理を行なう。各サブバンドの調節部951〜9532はスケールファクタに基づいてビットシフト量を決定し、ビットシフト部941〜9432は各サブバンドの適応フィルタFIRから出力するデータのビットを圧縮時とは逆方向にシフトして伸張する。誤差信号発生部93はサブバンド毎に誤差演算部COMを備え、対応するサブバンドの適応信号処理部ASPの適応フィルタ出力信号とマイクロホン検出音信号との差を計算して誤差信号として該適応信号処理部ASPにフィードバックする。
オーディオ音キャンセルコントロール部92において、各サブバンドの適応信号処理部ASPの適応フィルタ(FIR)はサブバンドのオーディオデータにフィルタリング処理を施して出力し、LMS演算部(LMS)は対応するサブバンドの誤差演算部から出力する誤差信号のパワーが最小となるようにLMS適応信号処理を行って適応フィルタFIRのフィルタ係数を決定する。ポストフィルタ96は各サブバンドの誤差信号に所定のバンドパスフィルタ処理を施し、合成部97はポストフィルタ96の各バンドパスフィルタ出力を合成し、アップサンプリング部(UP)98は合成信号をアップサンプリングして話者音声として音声認識装置に出力する。
At the time of reproducing compressed audio data At the time of reproducing compressed audio data, the
The audio sound cancel
In the audio sound canceling
以上本発明によれば、フィルタバンクで非圧縮オーディオデータを複数のサブバンドオーディオデータに分割し、該フィルタバンクから出力される各サブバンドオーディオデータを圧縮してハードディスクなどに記憶すると共に、ASCシステムにおいて該フィルタバンクから出力される各サブバンドオーディオデータを用いてマルチレート信号処理によりオーディオ音をキャンセルするようにしたから、オーディオ部の圧縮に用いるフィルタバンクをオーディオ音キャンセル処理に共用することができ、ASCキャンセルシステムにおけるフィルタバンクを省略することができる。 As described above, according to the present invention, the uncompressed audio data is divided into a plurality of subband audio data by the filter bank, each subband audio data output from the filter bank is compressed and stored in the hard disk, and the ASC system. Since the audio sound is canceled by multi-rate signal processing using each subband audio data output from the filter bank, the filter bank used for compression of the audio part can be shared for audio sound cancellation processing. The filter bank in the ASC cancellation system can be omitted.
51 ASCシステム
52 マイクロホン
53 フィルタバンク部
54 オーディオ部
61 CDデッキ等のオーディオ再生部
62 ハードディスク
63 ソース切替部
64 オーディオソース種別判別部
65 出力切換部
66,67 第1、第2の入力切替部
71 復号/伸張部
71a 復号器
71b 伸張部
72 圧縮/符号化部
72a フィルタバンク部
72b 圧縮部
74 オーディオ部76 ディスク制御部
51
Claims (2)
非圧縮のオーディオデータを入力されてオーディオ音を音響空間に放射するオーディオ回路、
前記オーディオデータを複数のサブバンドオーディオデータにして出力するフィルタバンク、
前記フィルタバンクから出力される各サブバンドのオーディオデータを圧縮してメモリに記憶する圧縮部、
前記フィルタバンクから出力される各サブバンドのオーディオデータにオーディオ音キャンセル処理を施して合成するオーディオ音キャンセル部、
を備えたことを特徴とする車載機。 In an in-vehicle device equipped with an audio function for audio playback and output from a speaker and an audio cancel function for canceling audio sound and outputting speaker voice,
An audio circuit that receives uncompressed audio data and radiates audio sound into the acoustic space;
A filter bank for outputting the audio data as a plurality of subband audio data;
A compression unit for compressing and storing the audio data of each subband output from the filter bank in a memory;
An audio sound cancellation unit that performs audio sound cancellation processing on the audio data of each subband output from the filter bank,
An in-vehicle device characterized by comprising:
圧縮オーディオデータを復号する復号部、
前記復号部から出力する圧縮オーディオデータに伸張処理を施して前記オーディオ回路に入力する伸張部、
前記オーディオソースから出力するオーディオデータが圧縮されていれば、前記復号部の出力データを前記オーディオ音キャンセル部に入力し、圧縮されていなければ前記フィルタバンクから出力するサブバンドオーディオデータを前記オーディオ音キャンセル部に入力する切替部、
を備えたことを特徴とする請求項1記載の車載機。 A determination unit for determining whether or not the audio data output from the audio source is compressed;
A decoding unit for decoding the compressed audio data;
A decompression unit that decompresses compressed audio data output from the decoding unit and inputs the compressed audio data to the audio circuit;
If the audio data output from the audio source is compressed, the output data of the decoding unit is input to the audio sound canceling unit, and if not compressed, the subband audio data output from the filter bank is input to the audio sound. A switching unit to input to the cancellation unit,
The in-vehicle device according to claim 1, further comprising:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006114235A JP4817949B2 (en) | 2006-04-18 | 2006-04-18 | In-vehicle machine |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006114235A JP4817949B2 (en) | 2006-04-18 | 2006-04-18 | In-vehicle machine |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2007288565A true JP2007288565A (en) | 2007-11-01 |
JP4817949B2 JP4817949B2 (en) | 2011-11-16 |
Family
ID=38759908
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006114235A Active JP4817949B2 (en) | 2006-04-18 | 2006-04-18 | In-vehicle machine |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4817949B2 (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012093641A (en) * | 2010-10-28 | 2012-05-17 | Toshiba Corp | Portable electronic apparatus |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000207845A (en) * | 1999-01-13 | 2000-07-28 | Alpine Electronics Inc | Voice recording and reproducing device |
JP2001094370A (en) * | 1999-09-27 | 2001-04-06 | Alpine Electronics Inc | Audio input/output system |
-
2006
- 2006-04-18 JP JP2006114235A patent/JP4817949B2/en active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000207845A (en) * | 1999-01-13 | 2000-07-28 | Alpine Electronics Inc | Voice recording and reproducing device |
JP2001094370A (en) * | 1999-09-27 | 2001-04-06 | Alpine Electronics Inc | Audio input/output system |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012093641A (en) * | 2010-10-28 | 2012-05-17 | Toshiba Corp | Portable electronic apparatus |
Also Published As
Publication number | Publication date |
---|---|
JP4817949B2 (en) | 2011-11-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101373004B1 (en) | Apparatus and method for encoding and decoding high frequency signal | |
JP5547081B2 (en) | Speech decoding method and apparatus | |
JP4132109B2 (en) | Speech signal reproduction method and device, speech decoding method and device, and speech synthesis method and device | |
JP4899359B2 (en) | Signal encoding apparatus and method, signal decoding apparatus and method, program, and recording medium | |
JP6559741B2 (en) | Audio signal resampling for low-delay encoding / decoding | |
US20070239294A1 (en) | Hearing instrument having audio feedback capability | |
EP2596496B1 (en) | A reverberation estimator | |
JP4733939B2 (en) | Signal decoding apparatus and signal decoding method | |
JP5730303B2 (en) | Decoding device, encoding device and methods thereof | |
KR20010014352A (en) | Method and apparatus for speech enhancement in a speech communication system | |
JPWO2007116809A1 (en) | Stereo speech coding apparatus, stereo speech decoding apparatus, and methods thereof | |
KR20080114578A (en) | Digital signal processing device, digital signal processing method, and digital signal processing program | |
JP4760278B2 (en) | Interpolation device, audio playback device, interpolation method, and interpolation program | |
JP5027966B2 (en) | Articles of manufacture comprising a method and apparatus for vocoding an input signal and a medium having computer readable signals therefor | |
JPWO2008132850A1 (en) | Stereo speech coding apparatus, stereo speech decoding apparatus, and methods thereof | |
JP4558734B2 (en) | Signal decoding device | |
KR101850693B1 (en) | Apparatus and method for extending bandwidth of earset with in-ear microphone | |
JP2000152394A (en) | Hearing aid for moderately hard of hearing, transmission system having provision for the moderately hard of hearing, recording and reproducing device for the moderately hard of hearing and reproducing device having provision for the moderately hard of hearing | |
JPH10124089A (en) | Processor and method for speech signal processing and device and method for expanding voice bandwidth | |
JP4817949B2 (en) | In-vehicle machine | |
CN102959618A (en) | Speech recognition apparatus | |
JPH1083623A (en) | Signal recording method, signal recorder, recording medium and signal processing method | |
JP4373693B2 (en) | Hierarchical encoding method and hierarchical decoding method for acoustic signals | |
KR100653783B1 (en) | Mobile communication terminal enable to decode broadband speech and its operating method | |
JP4271588B2 (en) | Encoding method and encoding apparatus for digital data |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20090220 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110822 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110830 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110830 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140909 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4817949 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |