JP2008058470A - Audio signal processor and audio signal reproduction system - Google Patents

Audio signal processor and audio signal reproduction system Download PDF

Info

Publication number
JP2008058470A
JP2008058470A JP2006233559A JP2006233559A JP2008058470A JP 2008058470 A JP2008058470 A JP 2008058470A JP 2006233559 A JP2006233559 A JP 2006233559A JP 2006233559 A JP2006233559 A JP 2006233559A JP 2008058470 A JP2008058470 A JP 2008058470A
Authority
JP
Japan
Prior art keywords
frequency
unit
auditory
audio signal
correction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2006233559A
Other languages
Japanese (ja)
Inventor
Hitoshi Shiba
仁史 芝
Morihiro Kakumoto
盛弘 角本
Makoto Ochiai
誠 落合
Yasushi Sato
寧 佐藤
Kentaro Oda
謙太郎 小田
Atsuko Ryu
敦子 龍
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kyushu Institute of Technology NUC
Maxell Holdings Ltd
Original Assignee
Kyushu Institute of Technology NUC
Hitachi Maxell Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kyushu Institute of Technology NUC, Hitachi Maxell Ltd filed Critical Kyushu Institute of Technology NUC
Priority to JP2006233559A priority Critical patent/JP2008058470A/en
Publication of JP2008058470A publication Critical patent/JP2008058470A/en
Withdrawn legal-status Critical Current

Links

Images

Landscapes

  • Circuit For Audible Band Transducer (AREA)
  • Tone Control, Compression And Expansion, Limiting Amplitude (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To reproduce an audio signal of high sound quality such that differences in bodily sensation effect due to individual differences in auditory characteristic are suppressed as much as possible by varying frequency characteristic of a high frequency range according to auditory characteristics of a user. <P>SOLUTION: An audio signal processor includes a frequency analyzer which analyzes frequency characteristics of an input audio signal; a correction amount predicting unit which detects the tendency of the frequency characteristics analyzed by the frequency analyzer, and predicts a correction amount for the high frequency range; an auditory parameter setter 41 which can set an auditory parameter based upon the auditory characteristics of the user; an auditory sensitivity corrector 40 which corrects the correction amount predicted by the correction amount predicting unit with the auditory parameter set by the auditory parameter setter 41; and an equalizer 33 which corrects the frequency characteristics of an audio signal output from a high-frequency-range interpolation processing unit 32 based upon the correction amount output from the auditory sensitivity corrector 40. <P>COPYRIGHT: (C)2008,JPO&INPIT

Description

本発明は、再生されるデジタル音声信号の高域成分を補正する音声信号処理装置に関する。また、その音声信号再生装置を備えた音声信号再生システムに関する。   The present invention relates to an audio signal processing apparatus that corrects high frequency components of a reproduced digital audio signal. The present invention also relates to an audio signal reproduction system including the audio signal reproduction device.

近年、MP3(MPEG1 audio layer 3)やWMA(Windows Media Audio。なお「Windows」はマイクロソフト社の登録商標)などの形式で圧縮された楽曲データの配信が、急速に普及し始めている。これらの形式の楽曲データは、音声帯域が過度に広くなることによるデータ量の増大や占有帯域幅の広がりを避けるため、圧縮過程において所定周波数以上の周波数成分が除去されている。例えば、MP3形式では、約16kHz以上の周波数成分が除去されている。このように、一定値以上の周波数成分が除去された楽曲データに基づき再生される音楽等は、高域成分がカットされているため音質が悪い。   In recent years, distribution of music data compressed in a format such as MP3 (MPEG1 audio layer 3) or WMA (Windows Media Audio, “Windows” is a registered trademark of Microsoft Corporation) has been rapidly spreading. In these types of music data, frequency components of a predetermined frequency or higher are removed in the compression process in order to avoid an increase in the amount of data and an increase in occupied bandwidth due to an excessively wide audio band. For example, in the MP3 format, frequency components of about 16 kHz or more are removed. Thus, music and the like reproduced based on music data from which frequency components of a certain value or more have been removed have poor sound quality because the high frequency components are cut off.

そこで、特許文献1〜3には、上記のような音質低下を防ぐための構成が開示されている。まず、特許文献1には、約20kHz以上の音信号を発生させ、原オーディオ信号に重畳させる構成が開示されている。また、特許文献2には、源オーディオ信号の高域成分に基づき、可聴帯域外のn次高調波成分(例えば20kHz以上)を生成し、原オーディオ信号に加算する構成が開示されている。また、特許文献3には、ランダムノイズを遅延させた高域成分を原オーディオ信号に付加する構成が開示されている。
特許第2643349号公報 特許第3137289号公報 特許第3605706号公報
Therefore, Patent Documents 1 to 3 disclose configurations for preventing the above-described deterioration in sound quality. First, Patent Document 1 discloses a configuration in which a sound signal of about 20 kHz or more is generated and superimposed on an original audio signal. Patent Document 2 discloses a configuration in which an n-order harmonic component (for example, 20 kHz or more) outside the audible band is generated based on the high frequency component of the source audio signal and added to the original audio signal. Patent Document 3 discloses a configuration in which a high frequency component obtained by delaying random noise is added to an original audio signal.
Japanese Patent No. 2643349 Japanese Patent No. 3137289 Japanese Patent No. 3605706

しかしながら特許文献1〜3に開示されている構成は、いずれも原オーディオ信号に、擬似的に生成した高域成分を補間するのみの構成である。このような高域補正では、補間特性が一定であるため、使用者において体感できる補正効果に大きな差が生じてしまう。すなわち、人間の聴覚特性(可聴周波数特性など)には個人差があり、特に高域成分については、使用者の年齢、性別、生活環境によって、音の聞こえ方に大きな差がある。例えば、女性や年少者や静穏な環境で生活している人などは、高域成分を聞き取る能力が高いと言われている。したがって、特許文献1〜3に開示されているように、一定の補間特性に基づき高域補正を行った場合、高域補正によって心地よい音質を体感できる人と、補正効果をほとんど感じることができない人とが生じてしまう。   However, all of the configurations disclosed in Patent Documents 1 to 3 are configurations that simply interpolate a pseudo high frequency component in the original audio signal. In such a high frequency correction, since the interpolation characteristic is constant, a large difference occurs in the correction effect that can be experienced by the user. That is, there are individual differences in human auditory characteristics (such as audible frequency characteristics), and particularly with respect to high frequency components, there is a large difference in how sounds are heard depending on the age, sex, and living environment of the user. For example, women, young people, and people living in a quiet environment are said to have high ability to hear high-frequency components. Therefore, as disclosed in Patent Documents 1 to 3, when high-frequency correction is performed based on certain interpolation characteristics, a person who can feel comfortable sound quality by high-frequency correction and a person who can hardly feel the correction effect Will occur.

本発明は、上記の問題点に鑑み、使用者の聴覚特性に合わせて高域の周波数特性を変化させることで、聴覚特性の個人差による体感効果の差を極力抑えた、高音質な音声信号を再生することができる音声信号補正装置を提供することを目的とする。   In view of the above problems, the present invention provides a high-quality audio signal that suppresses the difference in the bodily sensation effect due to individual differences in auditory characteristics as much as possible by changing the high frequency characteristics in accordance with the user's auditory characteristics. An object of the present invention is to provide an audio signal correction apparatus capable of reproducing the sound.

上記目的を達成するために本発明の音声信号処理装置は。入力される音声信号の高域成分を補間する高域補間処理部を含む高域補正部を備えた音声信号処理装置であって、前記高域補正部は、入力される音声信号の周波数特性を解析する周波数解析部と、前記周波数解析部で解析された周波数特性の傾向を検出し、高域の補正量を予測し、補正結果を出力する補正量予測部と、使用者の聴覚特性に基づく聴覚パラメータを設定可能な聴覚パラメータ設定部と、前記補正量予測部から出力される補正結果を、前記聴覚パラメータ設定部において設定されている聴覚パラメータによって補正する聴覚感度補正部と、前記高域補間処理部から出力される音声信号の周波数特性を補正するイコライザとを、さらに備え、前記イコライザは、前記高域補間処理部から出力される音声信号の周波数特性を、前記聴覚感度補正部から出力される補正結果に基づき補正するものである。   In order to achieve the above object, an audio signal processing apparatus of the present invention is provided. An audio signal processing apparatus including a high frequency correction unit including a high frequency interpolation processing unit for interpolating a high frequency component of an input audio signal, wherein the high frequency correction unit has a frequency characteristic of an input audio signal. Based on a frequency analysis unit to analyze, a tendency of the frequency characteristic analyzed by the frequency analysis unit, a correction amount prediction unit for predicting a high frequency correction amount and outputting a correction result, and a user's auditory characteristic An auditory parameter setting unit capable of setting an auditory parameter, an auditory sensitivity correction unit that corrects a correction result output from the correction amount prediction unit by an auditory parameter set in the auditory parameter setting unit, and the high-frequency interpolation An equalizer that corrects a frequency characteristic of the audio signal output from the processing unit, and the equalizer receives the frequency characteristic of the audio signal output from the high-frequency interpolation processing unit. It is corrected based on the correction result output from the sensitivity correction unit.

また、本発明の音声信号処理装置は、入力される音声信号の高域成分を補間する高域補間処理部を含む高域補正部を備えた音声信号処理装置であって、前記高域補正部は、入力される音声信号の周波数特性を解析する周波数解析部と、前記周波数解析部における周波数解析結果を回帰分析して回帰分析結果を導出し、前記回帰分析結果を高域側へ反映して高域の補正量を予測し、補正結果を出力する補正量予測部と、前記高域補間処理部から出力される音声信号の周波数特性を補正するイコライザとを、さらに備え、前記イコライザは、前記補正量予測部から出力される補正結果に基づき、音声信号を周波数特性を補正するものである。   The audio signal processing device of the present invention is an audio signal processing device including a high frequency correction unit including a high frequency interpolation processing unit that interpolates a high frequency component of an input audio signal, and the high frequency correction unit The frequency analysis unit that analyzes the frequency characteristics of the input audio signal, the frequency analysis result in the frequency analysis unit is subjected to regression analysis, the regression analysis result is derived, and the regression analysis result is reflected to the high frequency side A correction amount prediction unit that predicts a high-frequency correction amount and outputs a correction result; and an equalizer that corrects a frequency characteristic of an audio signal output from the high-frequency interpolation processing unit. Based on the correction result output from the correction amount prediction unit, the frequency characteristic of the audio signal is corrected.

また、本発明の音声信号再生システムは、入力される音声信号の高域成分を補間する高域補間処理部を備えた高域補正部と、前記高域補正部から出力される音声信号を外部へ出力可能な出力端子と、本システムにおける各種操作命令を入力可能な操作部とを備えた音声信号再生システムであって、前記高域補正部は、入力される音声信号の周波数特性を解析する周波数解析部と、前記周波数解析部で解析された周波数特性の傾向を検出し、高域の補正量を予測し、補正結果を出力する補正量予測部と、使用者の聴覚特性に基づく聴覚パラメータを設定可能な聴覚パラメータ設定部と、前記補正量予測部から出力される補正結果を、前記聴覚パラメータ設定部において設定されている聴覚パラメータによって補正する聴覚感度補正部と、前記高域補間処理部から出力される音声信号の周波数特性を補正するイコライザとを、さらに備え、前記イコライザは、前記高域補間処理部から出力される音声信号の周波数特性を、前記聴覚感度補正部から出力される補正結果に基づき補正するものである。   In addition, the audio signal reproduction system of the present invention includes a high frequency correction unit including a high frequency interpolation processing unit that interpolates a high frequency component of an input audio signal, and an audio signal output from the high frequency correction unit. An audio signal reproduction system comprising an output terminal capable of outputting to the system and an operation unit capable of inputting various operation commands in the system, wherein the high frequency correction unit analyzes the frequency characteristics of the input audio signal A frequency analysis unit, a correction amount prediction unit that detects a tendency of the frequency characteristic analyzed by the frequency analysis unit, predicts a high-frequency correction amount, and outputs a correction result; and an auditory parameter based on a user's auditory characteristic An auditory parameter setting unit that can set a correction result output from the correction amount prediction unit using an auditory parameter that is set in the auditory parameter setting unit; An equalizer that corrects a frequency characteristic of the audio signal output from the interpolation processing unit; and the equalizer outputs the frequency characteristic of the audio signal output from the high-frequency interpolation processing unit from the auditory sensitivity correction unit. Correction is performed based on the correction result.

本発明は、使用者の聴覚特性に合わせた高音質な音声信号を再生することができる。   The present invention can reproduce a high-quality sound signal that matches the auditory characteristics of the user.

本発明の音声信号処理装置は、前記周波数解析部は、入力されるステレオ音声信号において、左チャンネル及び右チャンネルの音声信号を減算処理し、差信号を抽出する差信号抽出部と、前記差信号抽出部から出力される差信号を高速フーリエ変換処理して周波数解析を行う高速フーリエ変換処理部と、前記高速フーリエ変換処理部から出力される周波数解析結果のピーク検出を行うエンベロープ検波部とを備えた構成としてもよい。この構成により、音声信号の周波数エンベロープから高域補正の予測を行うので、従来のようなトーンコントロールではなく、音楽の状況(曲調など)に応じた動的な音質制御を行うことができる。よって、違和感がない自然な音を出力することができる。   In the audio signal processing device according to the present invention, the frequency analysis unit subtracts the left channel and right channel audio signals from the input stereo audio signal and extracts a difference signal; and the difference signal A fast Fourier transform processing unit for performing frequency analysis by performing a fast Fourier transform process on the difference signal output from the extraction unit; and an envelope detection unit for performing peak detection of the frequency analysis result output from the fast Fourier transform processing unit. It is good also as a structure. With this configuration, since high-frequency correction is predicted from the frequency envelope of the audio signal, dynamic sound quality control according to the state of music (musical tone, etc.) can be performed instead of conventional tone control. Therefore, it is possible to output a natural sound without a sense of incongruity.

また、前記補正量予測部は、前記周波数解析部における周波数解析結果を回帰分析する回帰分析部を備えた構成としてもよい。この構成により、入力される音楽データの曲調を把握し、把握した曲調に合わせて回帰線の傾きを補正するため、音楽情報(音楽の曲調やリズムなど)に適応したイコライジングが可能となり、自然で心地よい音質での高域補間が実現できる。また、回帰分析による補間周波数予測と、使用者の聴覚特性とを併用することで、単なる高域強調のイコライジングではなく、音楽情報に適応したイコライジングが可能となり、より自然で心地よい音質での高域補間が実現できる。   The correction amount prediction unit may include a regression analysis unit that performs a regression analysis of the frequency analysis result in the frequency analysis unit. With this configuration, the tune of the input music data is grasped, and the inclination of the regression line is corrected according to the tune to be grasped, so that it is possible to perform equalization adapted to music information (music tune, rhythm, etc.). High frequency interpolation with comfortable sound quality can be realized. In addition, by combining interpolation frequency prediction by regression analysis and user's auditory characteristics, equalization that is suitable for music information is possible, not just high-frequency emphasis equalization, and high frequency with more natural and comfortable sound quality. Interpolation can be realized.

また、前記補正量予測部は、前記回帰分析部における回帰分析結果の変動の高周波成分を除去するフィルターを、さらに備えた構成としてもよい。この構成により、回帰分析部における回帰線(一次式)の係数a,bの変化を曲調に合わせて滑らかに変化させることができ、回帰線の傾きも曲調に合わせて滑らかに変化させることができる。よって、回帰線が曲調に合わせて急激に変化する際に発生するノイズを防止することができる。   The correction amount prediction unit may further include a filter that removes high-frequency components of fluctuations in the regression analysis result in the regression analysis unit. With this configuration, the change of the coefficients a and b of the regression line (primary formula) in the regression analysis unit can be smoothly changed according to the tone, and the slope of the regression line can also be smoothly changed according to the tone. . Therefore, it is possible to prevent noise that occurs when the regression line changes abruptly according to the tone of music.

また、本発明の音声信号処理装置または音声信号再生システムは、通常モードと、使用者の聴覚特性を測定可能な聴覚測定モードとを備え、前記聴覚パラメータ設定部は、予め所定の周波数に設定されている純粋音を、レベルを変えながら発生する周波数発振部と、前記周波数発振部において純粋音を発生させている時に、前記操作部が操作された時の周波数及びレベルを記録するメモリーとを備え、本システムが前記聴覚測定モードに移行されると、前記周波数発振部は前記純粋音をレベルを変えながら発生し、発生した純粋音を前記出力端子から出力し、前記純粋音が出力されている時に使用者によって前記操作部が操作されると、その時の前記純粋音の周波数及びレベルを前記メモリーに記録し、前記メモリーに記録されている周波数及びレベルの情報に基づき聴覚パラメータを設定する構成としてもよい。この構成により、使用者ごとに最適な高域特性を得ることができる。よって、使用者にとっては、心地よい音質で音楽を楽しむことができる。   The audio signal processing device or the audio signal reproduction system of the present invention includes a normal mode and an audio measurement mode capable of measuring a user's audio characteristics, and the audio parameter setting unit is set to a predetermined frequency in advance. A frequency oscillating unit that generates a pure sound while changing the level, and a memory that records a frequency and a level when the operating unit is operated when a pure sound is generated in the frequency oscillating unit. When the system is shifted to the auditory measurement mode, the frequency oscillating unit generates the pure sound while changing the level, outputs the generated pure sound from the output terminal, and the pure sound is output. Sometimes when the operation unit is operated by the user, the frequency and level of the pure sound at that time are recorded in the memory, and the frequency recorded in the memory It may set the auditory parameters based on micro-level information. With this configuration, optimum high frequency characteristics can be obtained for each user. Therefore, the user can enjoy music with comfortable sound quality.

(実施の形態1)
〔1.全体構成〕
図1は、実施の形態1における音声信号処理装置の構成を示すブロック図である。
(Embodiment 1)
[1. overall structure〕
FIG. 1 is a block diagram showing the configuration of the audio signal processing apparatus according to the first embodiment.

図1において、音声信号処理装置1は、例えばMP3形式などの音楽データを再生可能なパソコンや携帯型音楽プレーヤーなどに相当するものであるが、本実施の形態ではパソコンを一例として挙げている。音声信号処理装置1には、情報媒体11、音声データ処理部12、高域補正部13、デジタルインターフェース(以下、デジタルIFと称する)14、操作部15、および制御部16が含まれている。なお、図1には、便宜上、本実施の形態の説明において必要な構成のみ示しており、実際には中央演算処理装置(CPU)や半導体メモリーなど、図示の構成以外の構成も含まれる。なお、音声信号処理装置1で再生可能な音楽データは、MP3形式に限らず、WMA形式やリニアPCM形式など少なくともデジタル信号で構成されている音楽データであればよい。以下の説明では、MP3形式を取り上げて説明する。   In FIG. 1, an audio signal processing apparatus 1 corresponds to, for example, a personal computer or a portable music player that can reproduce music data in the MP3 format or the like. In this embodiment, a personal computer is taken as an example. The audio signal processing device 1 includes an information medium 11, an audio data processing unit 12, a high frequency correction unit 13, a digital interface (hereinafter referred to as a digital IF) 14, an operation unit 15, and a control unit 16. For convenience, FIG. 1 shows only the components necessary for the description of the present embodiment, and actually includes components other than those shown in the figure, such as a central processing unit (CPU) and a semiconductor memory. Note that the music data that can be played back by the audio signal processing apparatus 1 is not limited to the MP3 format, but may be music data composed of at least a digital signal such as a WMA format or a linear PCM format. In the following description, the MP3 format will be taken up and described.

情報媒体11は、ハードディスクドライブや半導体メモリーなど、少なくともデジタルデータを書き込みまたは読み出し可能な媒体で構成されている。また、情報媒体11には、MP3形式でデータ圧縮された音楽データなどが記録されている。   The information medium 11 is composed of a medium capable of writing or reading at least digital data, such as a hard disk drive or a semiconductor memory. The information medium 11 stores music data compressed in MP3 format.

音声データ処理部12は、情報媒体11に記録されている音楽データを読み出し、PCM(Pulse Code Modulation)信号に復調して出力する。   The audio data processing unit 12 reads out music data recorded on the information medium 11, demodulates it into a PCM (Pulse Code Modulation) signal, and outputs it.

高域補正部13は、音声データ処理部12から出力されるPCM信号に対して、約16kHz以上の高域成分を補間するとともに、使用者の聴覚特性に合わせた周波数特性に処理するものである。なお、高域補正部13の詳しい構成については、後述する。   The high frequency correction unit 13 interpolates a high frequency component of about 16 kHz or more with respect to the PCM signal output from the audio data processing unit 12, and processes the frequency characteristic according to the auditory characteristic of the user. . A detailed configuration of the high frequency correction unit 13 will be described later.

デジタルIF14は、高域補正部13において高域補正されたPCM信号を、装置外へ出力可能なインターフェースである。デジタルIF14は、例えばUSB(Universal Serial Bus)インターフェースで構成され、USB規格に準拠したポートが含まれている。なお、DAC21のようなUSB対応機器を動作制御可能なドライバソフトウェアは、予め音声信号処理装置1に組み込まれているものとする。   The digital IF 14 is an interface that can output the PCM signal that has been subjected to high-frequency correction in the high-frequency correction unit 13 to the outside of the apparatus. The digital IF 14 is configured by a USB (Universal Serial Bus) interface, for example, and includes a port compliant with the USB standard. It is assumed that driver software that can control the operation of a USB-compatible device such as the DAC 21 is incorporated in the audio signal processing apparatus 1 in advance.

操作部15は、音声信号処理装置1における各種命令を入力可能なものであり、例えば音声信号処理装置1がパソコンで構成されている場合はキーボードやマウスに相当し、携帯型音楽プレーヤーで構成されている場合は音楽データを再生する命令を入力可能な再生ボタンや、音楽データの再生を停止させる命令を入力可能な停止ボタンなどが含まれている。   The operation unit 15 can input various commands in the audio signal processing device 1. For example, when the audio signal processing device 1 is configured by a personal computer, it corresponds to a keyboard or a mouse, and is configured by a portable music player. In this case, a playback button capable of inputting a command for reproducing music data and a stop button capable of inputting a command for stopping the reproduction of music data are included.

制御部16は、操作部15において操作された内容に基づき、少なくとも音声データ処理部12及び高域補正部13を動作制御する。   The control unit 16 controls the operation of at least the audio data processing unit 12 and the high frequency correction unit 13 based on the contents operated by the operation unit 15.

また、音声信号処理装置1には、ヘッドホン22がDAC21を介して接続されている。DAC(Digital-Analog Converter)21は、デジタルIF14から出力されるPCM信号をアナログ音声信号に変換するものであり、音声信号処理装置1およびヘッドホン22とは独立したユニットで構成されている。DAC21には、USB規格に準拠したUSB端子が備わっており、ケーブルを介してデジタルIF14に接続することができる。また、DAC21には、アナログ音声信号に対応したヘッドホン22を接続可能なアナログ端子(例えばステレオミニジャック)が備わっており、ヘッドホン22を接続することができる。   In addition, a headphone 22 is connected to the audio signal processing device 1 via a DAC 21. The DAC (Digital-Analog Converter) 21 converts the PCM signal output from the digital IF 14 into an analog audio signal, and is configured as a unit independent of the audio signal processing device 1 and the headphones 22. The DAC 21 is provided with a USB terminal conforming to the USB standard, and can be connected to the digital IF 14 via a cable. Further, the DAC 21 includes an analog terminal (for example, a stereo mini jack) to which headphones 22 corresponding to analog audio signals can be connected, and the headphones 22 can be connected.

上記構成の音声信号処理装置1で音楽データを聴取する場合は、まず、ヘッドホン22をDAC21のアナログ端子に接続し、DAC21のUSB端子をデジタルIF14に接続する。すると、音楽信号処理装置1においてDAC21が接続されたことを検出し、音声信号処理装置1は、音楽データ(PCM信号)をデジタルIF14から出力可能な状態になる。   When listening to music data with the audio signal processing apparatus 1 having the above configuration, first, the headphones 22 are connected to the analog terminal of the DAC 21, and the USB terminal of the DAC 21 is connected to the digital IF 14. Then, it is detected that the DAC 21 is connected in the music signal processing apparatus 1, and the audio signal processing apparatus 1 is ready to output music data (PCM signal) from the digital IF 14.

次に、使用者によって操作部15が操作されて、音楽データの再生命令が入力されると、制御部16は音声データ処理部12に対して再生命令を出力する。音声データ処理部12は、入力される再生命令に基づき、情報媒体11に記録されている音楽データの中から所望の音楽データを読み出し、PCM信号に復調する。復調されたPCM信号は高域補正部13に出力される。PCM信号は、MP3形式に圧縮処理される際に約16kHz以上の高域成分が除去されるため、復調後のPCM信号も16kHz以上の高域成分が除去されている。   Next, when the operation unit 15 is operated by the user and a music data playback command is input, the control unit 16 outputs the playback command to the audio data processing unit 12. The audio data processing unit 12 reads out desired music data from the music data recorded on the information medium 11 based on the input reproduction command and demodulates it into a PCM signal. The demodulated PCM signal is output to the high frequency correction unit 13. When the PCM signal is compressed into the MP3 format, the high frequency component of about 16 kHz or more is removed, so that the demodulated PCM signal also has the high frequency component of 16 kHz or more removed.

高域補正部13では、入力されるPCM信号において、約16kHz以上の高域成分が付加されるとともに、使用者の聴覚特性に合わせた周波数特性に補正される。具体的な周波数特性の補正動作については後述する。   The high frequency correction unit 13 adds a high frequency component of about 16 kHz or more to the input PCM signal and corrects the frequency characteristic according to the user's auditory characteristics. A specific frequency characteristic correction operation will be described later.

高域補正部13から出力されるPCM信号は、デジタルIF14を介してDAC21に出力される。DAC21では、入力されるPCM信号に基づきアナログ音声信号を生成し、ヘッドホン22へ出力する。これにより、ヘッドホン22から音声が出力され、使用者は出力される音声を聴取することができる。   The PCM signal output from the high frequency correction unit 13 is output to the DAC 21 via the digital IF 14. The DAC 21 generates an analog audio signal based on the input PCM signal and outputs it to the headphones 22. Thereby, a sound is output from the headphones 22, and the user can listen to the output sound.

〔2.高域補正部13の構成〕
図2は、高域補正部13の構成を示すブロック図である。図2に示すように、高域補正部13は、入力端子31、高域補間処理部32、イコライザ33、出力端子34、差信号抽出部35、高速フーリエ変換処理部(以下、FFT処理部と称する)36、エンベロープ検波部37、回帰分析部38、LPF39、聴覚感度補正部40、および聴覚パラメータ設定部41を備えている。
[2. Configuration of high-frequency correction unit 13]
FIG. 2 is a block diagram showing the configuration of the high frequency correction unit 13. As shown in FIG. 2, the high frequency correction unit 13 includes an input terminal 31, a high frequency interpolation processing unit 32, an equalizer 33, an output terminal 34, a difference signal extraction unit 35, a fast Fourier transform processing unit (hereinafter referred to as an FFT processing unit). 36), envelope detection unit 37, regression analysis unit 38, LPF 39, auditory sensitivity correction unit 40, and auditory parameter setting unit 41.

入力端子31は、音声データ処理部12から出力されるPCM信号が入力される端子である。   The input terminal 31 is a terminal to which a PCM signal output from the audio data processing unit 12 is input.

高域補間処理部32は、入力端子31に入力されるPCM信号に対して、高域成分を補間する。本実施の形態では、入力端子31に入力されるPCM信号は、約16kHz以上の周波数の信号が除去されているため、高域補間処理部32では約16kHz以上の周波数の信号が補間される。なお、高域補間処理部32の具体的な構成及び動作については、例えば特開2002−73096号公報における周波数補間部の説明に開示されている構成及び動作と同様であるため、詳細な説明は省略する。   The high frequency interpolation processing unit 32 interpolates high frequency components for the PCM signal input to the input terminal 31. In the present embodiment, since the PCM signal input to the input terminal 31 has a signal with a frequency of about 16 kHz or more removed, the high-frequency interpolation processing unit 32 interpolates a signal with a frequency of about 16 kHz or more. The specific configuration and operation of the high-frequency interpolation processing unit 32 are the same as the configuration and operation disclosed in, for example, the description of the frequency interpolation unit in Japanese Unexamined Patent Application Publication No. 2002-73096. Omitted.

イコライザ33は、高域補間処理部32から出力されるPCM信号に対して、聴覚感度補正部40から出力される聴覚特性のパラメータに基づき、周波数の特性を補正する。なお、イコライザ33は、本実施の形態ではIIR型フィルタ(IIR:Infinite duration Impluse Response)で構成され、伝達関数は(数1)に示す通りである。   The equalizer 33 corrects the frequency characteristic of the PCM signal output from the high frequency interpolation processing unit 32 based on the auditory characteristic parameter output from the auditory sensitivity correction unit 40. In the present embodiment, the equalizer 33 is configured by an IIR filter (IIR: Infinite duration Impluse Response), and the transfer function is as shown in (Equation 1).

Figure 2008058470
Figure 2008058470

出力端子34は、イコライザ33から出力されるPCM信号を外部(図1のデジタルIF14)へ出力する端子である。   The output terminal 34 is a terminal that outputs the PCM signal output from the equalizer 33 to the outside (digital IF 14 in FIG. 1).

差信号抽出部35は、入力端子31に入力されるステレオのPCM信号において、左チャンネル(Lch)の信号と右チャンネル(Rch)の信号とを減算処理して差信号を抽出する。これにより、残響的な信号を抽出することができる。なお、本実施の形態では、入力されるPCM信号はステレオ信号としたが、モノラル信号であってもよい。モノラル信号である場合は、減算処理を行っても差信号(残響成分)を抽出することができないが、その場合は直接、周波数解析処理を行う。   The difference signal extraction unit 35 subtracts the left channel (Lch) signal and the right channel (Rch) signal from the stereo PCM signal input to the input terminal 31 to extract a difference signal. Thereby, a reverberant signal can be extracted. In the present embodiment, the input PCM signal is a stereo signal, but may be a monaural signal. In the case of a monaural signal, a difference signal (reverberation component) cannot be extracted even if subtraction processing is performed. In this case, frequency analysis processing is directly performed.

FFT処理部36は、差信号抽出部35から出力されるPCM信号に対して、高速フーリエ変換(FFT)の手法を用いて、当該PCM信号のスペクトルの離散的な分布を複素数の集合(具体的には、この複素数の実数部及び虚数部を表す2個の値から構成される組の集合)として表し、周波数解析を行う。なお、FFT処理部36の具体的な動作については、例えば特開2002−175092号公報や特開2002−171588号公報(特許第3713200号公報)に開示されている構成及び動作と同様であるため、詳細な説明は省略する。   The FFT processing unit 36 uses a fast Fourier transform (FFT) technique for the PCM signal output from the difference signal extraction unit 35 to convert the spectrum distribution of the PCM signal into a set of complex numbers (specifically, Is expressed as a set of two values representing the real part and imaginary part of the complex number), and frequency analysis is performed. The specific operation of the FFT processing unit 36 is the same as the configuration and operation disclosed in, for example, Japanese Unexamined Patent Application Publication Nos. 2002-175092 and 2002-171588 (Japanese Patent No. 3713200). Detailed description will be omitted.

エンベロープ検波部37は、FFT処理部36において周波数解析された結果における、各ビンのピークのみを検出し、検波処理を施す。すなわち、FFT処理部36において解析された結果は、X軸が周波数であるのに対し、エンベロープ検波部37ではX軸を時間軸として考えて、波形処理を行うことになる。よって、エンベロープ検波部37から出力される情報は、周波数の音質的な傾向(高域のエネルギーの傾き)を表す情報となる。   The envelope detection unit 37 detects only the peak of each bin in the result of frequency analysis performed by the FFT processing unit 36, and performs detection processing. That is, the result analyzed by the FFT processing unit 36 is that the X axis is the frequency, whereas the envelope detection unit 37 performs the waveform processing considering the X axis as the time axis. Therefore, the information output from the envelope detection unit 37 is information representing the sound quality tendency of the frequency (high frequency energy gradient).

回帰分析部38は、エンベロープ検波部37から出力される情報の回帰分析を行う。例えば、FFT処理部36におけるFFTの精度が2048ポイントであれば、2048個のデータを対象にして回帰分析を行う。なお、回帰分析の手法には、1次回帰や指数回帰など多くの手法があるが、どの手法を使用して分析を行ってもよい。しかし、リアルタイムで回帰分析処理を行うことを想定すると、演算量が少ない「直線回帰分析」を使用することが好ましい。本実施の形態では、直線回帰分析を用い、その結果として1次式(y=ax+b)に必要なパラメータである係数a,bを出力している。また、回帰分析を行う際の対象データ数は、少ない方が音声信号処理装置1におけるCPU(中央演算処理装置)にかかる負担を軽減できるため、例えば256個であることが好ましい。   The regression analysis unit 38 performs regression analysis of information output from the envelope detection unit 37. For example, if the FFT accuracy in the FFT processing unit 36 is 2048 points, regression analysis is performed on 2048 pieces of data. There are many regression analysis methods such as linear regression and exponential regression, but any method may be used for analysis. However, assuming that the regression analysis process is performed in real time, it is preferable to use “linear regression analysis” with a small amount of calculation. In the present embodiment, linear regression analysis is used, and as a result, coefficients a and b, which are parameters necessary for the linear expression (y = ax + b), are output. In addition, the smaller the number of target data when performing regression analysis, for example, 256 is preferable because the burden on the CPU (central processing unit) in the audio signal processing device 1 can be reduced.

LPF39は、回帰分析部38から出力される係数a,bにおける高周波成分を除去する。FFTによる解析処理は、比較的短時間の周期で行われるため、回帰分析部38から出力される分析結果をそのまま制御に用いると、曲調の変化に合わせて急激に回帰線の傾きが変化し、雑音のような違和感が発生することになる。よって、係数a,bをLPF39に通すことで、係数a,bの変化を曲調に合わせて滑らかに変化させることができ、回帰線の傾きも曲調に合わせて滑らかに変化させることができる。なお、本実施の形態では、LPF39は、2次のIIR型フィルタで構成することができ、伝達関数は(数2)に示す通りである。   The LPF 39 removes high frequency components in the coefficients a and b output from the regression analysis unit 38. Since the analysis processing by FFT is performed in a relatively short cycle, if the analysis result output from the regression analysis unit 38 is used for control as it is, the slope of the regression line changes abruptly in accordance with the change in tune, A sense of incongruity such as noise will occur. Therefore, by passing the coefficients a and b through the LPF 39, the changes of the coefficients a and b can be smoothly changed according to the tune, and the inclination of the regression line can also be changed smoothly according to the tune. In the present embodiment, the LPF 39 can be composed of a second-order IIR filter, and the transfer function is as shown in (Expression 2).

Figure 2008058470
Figure 2008058470

聴覚感度補正部40は、LPF39から出力される係数a,bを、聴覚パラメータ設定部41から得られる聴覚パラメータに基づいて補正する。   The auditory sensitivity correction unit 40 corrects the coefficients a and b output from the LPF 39 based on the auditory parameter obtained from the auditory parameter setting unit 41.

聴覚パラメータ設定部41は、使用者の聴覚特性を測定する機能を備えている。聴覚特性の測定結果は、Q、f、ゲインの3つのパラメータをテーブル化して記憶される。なお、Qは、高域強調特性における特性線(図7参照)の先鋭度を表している。fはピーク周波数を表している。聴覚パラメータの設定方法については、後ほど詳細に説明する。   The auditory parameter setting unit 41 has a function of measuring a user's auditory characteristics. The measurement result of the auditory characteristic is stored as a table of three parameters Q, f, and gain. Q represents the sharpness of the characteristic line (see FIG. 7) in the high frequency emphasis characteristic. f represents the peak frequency. The method for setting the auditory parameter will be described in detail later.

なお、周波数解析部は、差信号抽出部35とFFT処理部36とエンベロープ検波部37が含まれている。また、補正量予測部は、回帰分析部38とLPF39が含まれている。   The frequency analysis unit includes a difference signal extraction unit 35, an FFT processing unit 36, and an envelope detection unit 37. The correction amount prediction unit includes a regression analysis unit 38 and an LPF 39.

以下、動作について説明する。   The operation will be described below.

図2において、音声データ処理部12から出力されるPCM信号は、入力端子31を介して高域補間処理部32と差信号抽出部35とに入力される。   In FIG. 2, the PCM signal output from the audio data processing unit 12 is input to the high frequency interpolation processing unit 32 and the difference signal extraction unit 35 via the input terminal 31.

差信号抽出部35では、入力されるステレオのPCM信号におけるLch信号とRch信号との減算処理を行い、差信号(残響成分)を抽出する。次に、差信号抽出部35から出力される差信号はFFT処理部36に入力され、差信号に対してFFT処理が行われ、周波数解析が行われる。その周波数解析の結果は、エンベロープ検波部37に入力される。エンベロープ検波部37では、入力される解析結果の各ビンのピーク検出を行い、検波処理を施す。検波処理によって得られた情報は、周波数の音質的な傾向を表す情報になる。以上の処理により、入力されるPCM信号の周波数特性を解析することができる。   The difference signal extraction unit 35 performs a subtraction process between the Lch signal and the Rch signal in the input stereo PCM signal to extract a difference signal (reverberation component). Next, the difference signal output from the difference signal extraction unit 35 is input to the FFT processing unit 36, where FFT processing is performed on the difference signal, and frequency analysis is performed. The result of the frequency analysis is input to the envelope detector 37. The envelope detection unit 37 detects the peak of each bin of the input analysis result and performs detection processing. The information obtained by the detection process is information that represents the sound quality tendency of the frequency. Through the above processing, the frequency characteristics of the input PCM signal can be analyzed.

次に、回帰分析部38において、エンベロープ検波部37から出力される情報に基づき回帰分析を行う。図3は、入力されるPCM信号をFFTにより周波数解析した結果を示すグラフであり、X軸は周波数、Y軸は利得を表している。図3に示すPCM信号に対して回帰分析(本実施の形態では直線回帰分析)を行うと、図4に示すような一次式の分析結果が得られる。一般に、音声は周波数が高くなるにつれて利得が下がる傾向にあるため、回帰分析の結果も図4に示すように傾斜した特性となる。   Next, the regression analysis unit 38 performs a regression analysis based on the information output from the envelope detection unit 37. FIG. 3 is a graph showing the result of frequency analysis of an input PCM signal by FFT, where the X axis represents frequency and the Y axis represents gain. When regression analysis (in this embodiment, linear regression analysis) is performed on the PCM signal shown in FIG. 3, a linear analysis result as shown in FIG. 4 is obtained. In general, since the gain of the voice tends to decrease as the frequency increases, the result of the regression analysis also has a sloped characteristic as shown in FIG.

図4に示すように回帰分析した結果により、一次式の係数a,bが決まるので、高域補間後の高域強調の度合いを予測することができる。図5は、図3に示すグラフをもとにX軸の最大値を25kHzまで拡大して表したグラフである。図5に示すように、入力されるPCM信号は、約16kHz以上の周波数成分が除去されている。図6は、図5に示す特性に基づき回帰分析を行った結果に、予測分を追加したグラフを示している。すなわち、図6において、16kHzまでの特性は図5に示す特性に基づき回帰分析した結果で、16kHz以上の特性は回帰分析の結果に基づき予測された特性である。図6に示すように、回帰分析により算出された一次式の係数a,bに基づき、16kHzまでの回帰線(線形モデル)を高域側へ延長させることで、16kHz以上の特性を予測することができる。なお、係数a,bを補正するための演算式は(数3)に示す通りである。   As shown in FIG. 4, since the coefficients a and b of the linear expression are determined based on the result of regression analysis, the degree of high frequency emphasis after high frequency interpolation can be predicted. FIG. 5 is a graph obtained by enlarging the maximum value of the X axis to 25 kHz based on the graph shown in FIG. As shown in FIG. 5, the frequency component of about 16 kHz or more is removed from the input PCM signal. FIG. 6 shows a graph obtained by adding a predicted amount to the result of the regression analysis based on the characteristics shown in FIG. That is, in FIG. 6, the characteristics up to 16 kHz are the results of regression analysis based on the characteristics shown in FIG. 5, and the characteristics above 16 kHz are the characteristics predicted based on the results of the regression analysis. As shown in FIG. 6, based on the linear coefficients a and b calculated by the regression analysis, the regression line up to 16 kHz (linear model) is extended to the high frequency side to predict the characteristics of 16 kHz or higher. Can do. An arithmetic expression for correcting the coefficients a and b is as shown in (Equation 3).

Figure 2008058470
Figure 2008058470

次に、回帰分析部38で回帰分析された結果である一次式の係数a,bにおける高周波成分を除去する。これにより、係数a,bの変化を曲調に合わせて滑らかに変化させることができるため、ノイズの発生を抑えることができる。LPF39から出力される係数a,bは、聴覚感度補正部40に入力される。   Next, high-frequency components in the coefficients a and b of the linear expression, which are the results of regression analysis performed by the regression analysis unit 38, are removed. Thereby, since the change of the coefficients a and b can be smoothly changed according to the tune, the generation of noise can be suppressed. The coefficients a and b output from the LPF 39 are input to the auditory sensitivity correction unit 40.

なお、上記のような回帰分析に基づく周波数特性の補正は、リアルタイムに実行している。   Note that the correction of the frequency characteristics based on the regression analysis as described above is executed in real time.

一方、聴覚パラメータ設定部41では、使用者の聴覚特性に合わせた聴覚パラメータが設定される。聴覚パラメータ設定部41で設定される聴覚パラメータは、使用者が任意に入力してもよいし、所定の聴覚測定方法に基づき測定を行って決定してもよい。なお、聴覚測定方法の一例については後述する。   On the other hand, the auditory parameter setting unit 41 sets an auditory parameter that matches the auditory characteristics of the user. The auditory parameters set by the auditory parameter setting unit 41 may be arbitrarily input by the user, or may be determined by measurement based on a predetermined auditory measurement method. An example of the auditory measurement method will be described later.

聴覚パラメータに基づく特性の一例を図7に示す。聴覚パラメータは、図7に示すように所定の周波数付近の利得を若干強調するように、Q(図7に示す特性の先鋭度)と、f(ピーク周波数)と、ゲインとから構成される。すなわち、これらの3つの聴覚パラメータによって、図7に示す特性のカーブが決まる。   An example of characteristics based on auditory parameters is shown in FIG. The auditory parameter is composed of Q (sharpness of characteristics shown in FIG. 7), f (peak frequency), and gain so that the gain around a predetermined frequency is slightly emphasized as shown in FIG. That is, the characteristic curve shown in FIG. 7 is determined by these three auditory parameters.

設定された3つの聴覚パラメータは、聴覚感度補正部40へ出力される。聴覚感度補正部40は、LPF39から出力される一次式で表される回帰分析結果(図6参照)を、聴覚パラメータ設定部41から出力される聴覚パラメータに基づき補正する。補正後の周波数特性を図8の実線に示す。なお、図8において、点線の特性は、聴覚感度補正部40における補正前の特性である(すなわち図6に示す特性)。また、図8に示す補正後の周波数特性は、Q=0.707、f=16kHz、ゲインが12dBである。聴覚感度補正部40において補正された聴覚パラメータは、イコライザ33に出力される。   The set three auditory parameters are output to the auditory sensitivity correction unit 40. The auditory sensitivity correction unit 40 corrects the regression analysis result (see FIG. 6) expressed by the linear expression output from the LPF 39 based on the auditory parameter output from the auditory parameter setting unit 41. The corrected frequency characteristic is shown by the solid line in FIG. In FIG. 8, the dotted line characteristic is the characteristic before correction in the auditory sensitivity correction unit 40 (that is, the characteristic shown in FIG. 6). Further, the corrected frequency characteristics shown in FIG. 8 are Q = 0.707, f = 16 kHz, and the gain is 12 dB. The auditory parameter corrected by the auditory sensitivity correction unit 40 is output to the equalizer 33.

イコライザ33は、聴覚感度補正部40から出力される聴覚パラメータに基づき、高域補間処理部32から出力されるPCM信号を補正する。具体的には、図8に示す特性に基づき周波数特性を補正するため、図9に示すように16kHz付近のレベルが強調するよう補正される。図9は、イコライザ33から出力されるPCM信号の周波数特性を示しており、約16kHz以上の周波数が補間処理により追加されていることを示している。   The equalizer 33 corrects the PCM signal output from the high-frequency interpolation processing unit 32 based on the auditory parameter output from the auditory sensitivity correction unit 40. Specifically, in order to correct the frequency characteristic based on the characteristic shown in FIG. 8, the level around 16 kHz is corrected to be emphasized as shown in FIG. FIG. 9 shows the frequency characteristics of the PCM signal output from the equalizer 33, and shows that a frequency of about 16 kHz or more is added by the interpolation process.

イコライザ33から出力されるPCM信号は、出力端子34を介してデジタルIF14(図1)に出力される。   The PCM signal output from the equalizer 33 is output to the digital IF 14 (FIG. 1) via the output terminal 34.

〔3.聴覚パラメータの設定方法〕
次に、聴覚パラメータの設定方法の一例について説明する。
[3. Auditory parameter setting method)
Next, an example of an auditory parameter setting method will be described.

本実施の形態では、使用者において自身の聴覚特性を測定可能な構成を備えている。聴覚測定機能は、使用者において任意に実行されるものであるため、操作部15を操作することで聴覚測定モードへ移行可能なように構成されている。具体的には、聴覚測定を行うことができるソフトウェアを実行させることで、聴覚測定モードへ移行させることができる。   In the present embodiment, the user has a configuration capable of measuring his / her own auditory characteristics. Since the auditory measurement function is arbitrarily executed by the user, the auditory measurement function can be shifted to the auditory measurement mode by operating the operation unit 15. Specifically, it is possible to shift to the audio measurement mode by executing software capable of performing audio measurement.

聴覚測定を行うために、図1に示すように音声信号処理装置1には周波数発振部17を備えている。周波数発振部17は、聴覚測定モードに移行された時、制御部16からの制御により、複数の周波数の純粋音(sin波)を順次発生する。発生した純粋音は、デジタルIF14に出力される。   In order to perform auditory measurement, the audio signal processing apparatus 1 includes a frequency oscillating unit 17 as shown in FIG. When the frequency oscillating unit 17 shifts to the auditory measurement mode, the frequency oscillating unit 17 sequentially generates pure sounds (sin waves) having a plurality of frequencies under the control of the control unit 16. The generated pure sound is output to the digital IF 14.

以下、動作について説明する。   The operation will be described below.

図1において、聴覚測定を行う際は、音声信号処理装置1のデジタルIF14にDAC21が接続され、DAC21にヘッドホン22が接続されている必要がある。次に、操作部15を操作して音声信号処理装置1を聴覚測定モードへ移行させる。具体的には、聴覚測定ソフトウェアを起動させる。なお、聴覚測定モードへ移行させた際、情報媒体11に記録されている音楽データの再生動作が行われている場合は、制御部16は音声データ処理部12に対して、音楽データの再生動作を停止させるように制御する。   In FIG. 1, when performing auditory measurement, the DAC 21 needs to be connected to the digital IF 14 of the audio signal processing apparatus 1, and the headphones 22 need to be connected to the DAC 21. Next, the operation unit 15 is operated to shift the audio signal processing device 1 to the auditory measurement mode. Specifically, the auditory measurement software is activated. When the music data recorded on the information medium 11 is being played back when the auditory measurement mode is entered, the control unit 16 causes the audio data processing unit 12 to play back the music data. Control to stop.

次に、聴覚測定を開始させると、制御部16は周波数発振部17に対して、所定の周波数の純粋音を発生させるよう制御する。具体的には、まず、周波数が10kHzで利得が−50dBの連続的な純粋音を発生させる。その後、周波数を一定にしたまま、利得を1秒毎に5dBづつ上昇させていく。このようにして発生した純粋音は、デジタルIF14を介してDAC21へ出力され、アナログ信号に変換された後、ヘッドホン22に出力される。よって、ヘッドホン22からは、周波数が一定で、レベルが極小から徐々に大きくなっていく音が出力される。   Next, when auditory measurement is started, the control unit 16 controls the frequency oscillation unit 17 to generate a pure sound having a predetermined frequency. Specifically, first, a continuous pure sound having a frequency of 10 kHz and a gain of −50 dB is generated. Thereafter, the gain is increased by 5 dB every second while the frequency is kept constant. The pure sound generated in this way is output to the DAC 21 via the digital IF 14, converted into an analog signal, and then output to the headphones 22. Therefore, the headphone 22 outputs a sound with a constant frequency and a level gradually increasing from a minimum.

使用者は、ヘッドホン22から出力される純粋音を聞き、聞こえたタイミングで操作部15を操作する。本実施の形態では、純粋音が聞こえたタイミングで、パソコンに付属しているキーボードのENTERキーを操作することで、音が聞こえたタイミングを決定することができる。なお、聴覚測定時に操作する操作部15は、キーボードに限らず、専用の押しボタンを設けてもよい。その場合は、押しボタンをヘッドホン22のケーブル上に設けてもよい。   The user listens to the pure sound output from the headphones 22 and operates the operation unit 15 at the time when the user hears the pure sound. In the present embodiment, the timing at which a sound is heard can be determined by operating the ENTER key of the keyboard attached to the personal computer at the timing when the pure sound is heard. Note that the operation unit 15 operated at the time of auditory measurement is not limited to a keyboard, and a dedicated push button may be provided. In that case, a push button may be provided on the cable of the headphones 22.

次に、操作部15を操作した時点の、純粋音の利得の値(例えば−20dB)が周波数発振部17に含まれているメモリーに記録される。すなわち、10kHzの音を聞くことができる最低のレベル(可聴利得)がメモリーに記録されるわけである。よって、10kHzの信号を聞き取る能力が優れている人は、可聴利得の値が低くなる。   Next, the value of the pure sound gain (for example, −20 dB) at the time when the operation unit 15 is operated is recorded in the memory included in the frequency oscillation unit 17. That is, the lowest level (audible gain) at which a 10 kHz sound can be heard is recorded in the memory. Therefore, a person who has an excellent ability to hear a 10 kHz signal has a low audible gain value.

次に、制御部16は、周波数発振部17に対して12kHzの連続的な純粋音を発生させるよう制御する、周波数発振部17は、周波数が12kHzで利得が−50dBの純粋音を発生させ、その後、1秒毎に5dBづつ利得を上昇させていく。使用者は、前述同様、ヘッドホン22から純粋音が聞こえたタイミングで操作部15を操作する。操作部15を操作した時における、純粋音の利得(例えば−14dB)が周波数発振部17におけるメモリーに記録される。   Next, the control unit 16 controls the frequency oscillating unit 17 to generate a continuous pure sound of 12 kHz. The frequency oscillating unit 17 generates a pure sound having a frequency of 12 kHz and a gain of −50 dB, Thereafter, the gain is increased by 5 dB every second. As described above, the user operates the operation unit 15 at a timing when a pure sound is heard from the headphones 22. The gain of pure sound (for example, −14 dB) when the operation unit 15 is operated is recorded in the memory in the frequency oscillation unit 17.

以降、前述と同様に、14kHz、16kHz、18kHz、および20kHzの純粋音で測定を行う。   Thereafter, as described above, measurement is performed with pure sounds of 14 kHz, 16 kHz, 18 kHz, and 20 kHz.

周波数発振部17から出力される純粋音は、レベルが−50dBから0dBまで段階的に上昇されるが、0dBが出力されているにもかかわらず使用者によって操作部15が操作されない場合は、その時の周波数の音が使用者には聞き取ることができないと判断し、メモリーには可聴利得の値が記録されない。すなわち、「測定不能」という結果になる。   The level of the pure sound output from the frequency oscillating unit 17 is gradually increased from −50 dB to 0 dB. If the operating unit 15 is not operated by the user even though 0 dB is output, It is determined that the user cannot hear the sound having the frequency of, and the value of the audible gain is not recorded in the memory. That is, the result is “impossible to measure”.

これにより、12〜20kHzの各周波数における可聴利得がメモリーに記録される。測定結果の一例を(表1)に示す。   Thereby, the audible gain at each frequency of 12 to 20 kHz is recorded in the memory. An example of the measurement results is shown in (Table 1).

Figure 2008058470
Figure 2008058470

(表1)に示す結果を出した被測定者は、低周波の音は良く聞こえるが、高周波の音は聞こえにくく、特に16kHz以上の音はほとんど聞こえない(測定不能)という聴覚特性を有していることになる。   The person to be measured who gave the results shown in (Table 1) can hear low-frequency sounds well, but it is difficult to hear high-frequency sounds. Will be.

上記のようにして得られた聴覚測定の結果に基づき、聴覚パラメータを設定する。具体的には、図7に示すように16kHz付近の利得を若干強調するように、Q(図7に示す特性の先鋭度)、f(ピーク周波数)、ゲインの3つの聴覚パラメータを設定する。すなわち、この3つの聴覚パラメータによって、図7に示す特性のカーブが決まる。なお、図7に示す周波数特性は、Q=0.707、f=16kHz、ゲイン=12dBである。   Auditory parameters are set based on the result of the auditory measurement obtained as described above. Specifically, as shown in FIG. 7, three auditory parameters of Q (sharpness of characteristics shown in FIG. 7), f (peak frequency), and gain are set so that the gain around 16 kHz is slightly emphasized. That is, the characteristic curve shown in FIG. 7 is determined by these three auditory parameters. The frequency characteristics shown in FIG. 7 are Q = 0.707, f = 16 kHz, and gain = 12 dB.

設定された3つの聴覚パラメータは、聴覚感度補正部40へ出力される。聴覚感度補正部40は、LPF39から出力される一次式で表される回帰分析結果(図6参照)を、聴覚パラメータ設定部41から出力される聴覚パラメータに基づき補正する。補正後の周波数特性を図8に示す(実線)。なお、図8において、点線の特性は、聴覚感度補正部40における補正前の特性である(すなわち図6に示す特性)。聴覚感度補正部40において補正された聴覚パラメータは、イコライザ33に出力される。   The set three auditory parameters are output to the auditory sensitivity correction unit 40. The auditory sensitivity correction unit 40 corrects the regression analysis result (see FIG. 6) expressed by the linear expression output from the LPF 39 based on the auditory parameter output from the auditory parameter setting unit 41. FIG. 8 shows the frequency characteristics after correction (solid line). In FIG. 8, the dotted line characteristic is the characteristic before correction in the auditory sensitivity correction unit 40 (that is, the characteristic shown in FIG. 6). The auditory parameter corrected by the auditory sensitivity correction unit 40 is output to the equalizer 33.

イコライザ33は、聴覚感度補正部40から出力される聴覚パラメータに基づき、高域補間処理部32から出力されるPCM信号を補正する。具体的には、図8に示す特性に基づき周波数特性を補正するため、16kHz付近のレベルが強調するよう補正される。   The equalizer 33 corrects the PCM signal output from the high-frequency interpolation processing unit 32 based on the auditory parameter output from the auditory sensitivity correction unit 40. Specifically, in order to correct the frequency characteristics based on the characteristics shown in FIG. 8, the level around 16 kHz is corrected to be emphasized.

イコライザ33から出力されるPCM信号は、出力端子34を介してデジタルIF14(図1)に出力される。   The PCM signal output from the equalizer 33 is output to the digital IF 14 (FIG. 1) via the output terminal 34.

〔4.実施の形態の効果、他〕
以上のように本実施の形態によれば、聴覚パラメータ設定部41において、使用者の聴覚特性に合わせた聴覚パラメータを設定し、その聴覚パラメータに基づきイコライザ33におけるPCM信号の高域を補正する構成であるため、使用者ごとに最適な高域特性を得ることができる。よって、使用者にとっては、心地よい音質で音楽を楽しむことができる。
[4. Effects of the embodiment, etc.]
As described above, according to the present embodiment, the auditory parameter setting unit 41 sets the auditory parameter according to the user's auditory characteristics, and corrects the high frequency of the PCM signal in the equalizer 33 based on the auditory parameter. Therefore, optimum high frequency characteristics can be obtained for each user. Therefore, the user can enjoy music with comfortable sound quality.

また、回帰分析部38によって、入力される音楽データの曲調を把握し、把握した曲調に合わせて回帰線の傾きを補正するため、音楽情報(音楽の曲調やリズムなど)に適応したイコライジングが可能となり、自然で心地よい音質での高域補間が実現できる。   In addition, the regression analysis unit 38 grasps the tune of the input music data, and corrects the slope of the regression line according to the tune to be grasped, so that equalization adapted to music information (music tune, rhythm, etc.) is possible. Thus, high-frequency interpolation with natural and comfortable sound quality can be realized.

また、回帰分析による補間周波数予測と、使用者の聴覚特性とを併用することで、単なる高域強調のイコライジングではなく、音楽情報に適応したイコライジングが可能となり、より自然で心地よい音質での高域補間が実現できる。   In addition, by combining interpolation frequency prediction by regression analysis and user's auditory characteristics, equalization that is suitable for music information is possible, not just high-frequency emphasis equalization, and high frequency with more natural and comfortable sound quality. Interpolation can be realized.

すなわち、一般的に人間の脳は、音楽を聴く場合、音楽情報の周波数的な傾きを予測しながら聴いているため、本実施の形態のように使用者の聴覚特性に合わせて周波数を補正することで、使用者に補正感を程良く認識させ、心地よい音質の音楽を楽しむことができる。例えば、シンバルなど高域を強調するような楽器の場合は、その音がある程度続くと、響きなどの心地よさを認識できるようになる。つまり、心地よい音は、連続して続くような音源に対して有効である。本実施の形態では、そのような音に対して周波数強調を行うことで、響き感がある音を作ることができる。よって、回帰分析の予測通りに高域の音を補正することで、自然で聞こえやすい音質を実現することができる。さらに、予測以上の高域を補正すれば、クリアな音を実現できる。   That is, generally, when listening to music, the human brain listens while predicting the frequency gradient of the music information, so that the frequency is corrected in accordance with the user's auditory characteristics as in this embodiment. In this way, the user can recognize the correction feeling moderately and enjoy music with pleasant sound quality. For example, in the case of a musical instrument that emphasizes the high range, such as a cymbal, if the sound continues to some extent, it becomes possible to recognize comfort such as reverberation. That is, a pleasant sound is effective for a sound source that continues continuously. In the present embodiment, a sound with a feeling of reverberation can be created by performing frequency enhancement on such a sound. Therefore, sound quality that is natural and easy to hear can be realized by correcting the high frequency sound as predicted by the regression analysis. Furthermore, a clear sound can be realized by correcting a higher frequency than expected.

また、音の響き感は、残響音の量と比例的な関係がある。そこで、本実施の形態では、差信号抽出部35において抽出されるLchとRchの差信号が残響的な音であることから、差信号の量を測定することで、響き感の量を予測することができる。そして、差信号のエンベロープをもとに高域補正の予測を行うことで、響き感を悪化させずに高域補正が可能になる。   In addition, the reverberation of sound has a proportional relationship with the amount of reverberant sound. Therefore, in this embodiment, since the difference signal between Lch and Rch extracted by the difference signal extraction unit 35 is a reverberant sound, the amount of reverberation is predicted by measuring the amount of the difference signal. be able to. Then, by performing the high frequency correction prediction based on the envelope of the difference signal, the high frequency correction can be performed without deteriorating the feeling of sound.

また、高域の感度には個人差があり、同じ高域強調の度合いであったとしても、過度な高域強調であると感じたり、高域強調されていることに気付かない場合がある。よって、本実施の形態では、使用者の聴覚周波数特性を測定し、高域の感度が高い使用者の場合は高域補正量を抑え、高域の感度が低い使用者の場合には、通常補正以上の高域補正(イコライジング)を行うことで、高域感度の個人差に合わせた音質を実現することができる。   In addition, there are individual differences in high-frequency sensitivity, and even if the degree of high-frequency emphasis is the same, it may be felt that the high-frequency emphasis is excessive or high-frequency emphasis is not noticed. Therefore, in this embodiment, the user's auditory frequency characteristics are measured, and the high frequency correction amount is suppressed for a user with high sensitivity in the high frequency range, and the normal for the user with low sensitivity in the high frequency range. By performing high-frequency correction (equalizing) that is higher than the correction, it is possible to achieve sound quality that matches individual differences in high-frequency sensitivity.

また、本実施の形態では、PCM信号の周波数エンベロープから高域補正の予測を行うので、従来のようなトーンコントロールではなく、音楽の状況(曲調など)に応じた動的な音質制御を行うことができる。よって、違和感がない自然な音を出力することができる。   In the present embodiment, since high-frequency correction is predicted from the frequency envelope of the PCM signal, dynamic sound quality control according to the state of music (musical tone, etc.) is performed instead of conventional tone control. Can do. Therefore, it is possible to output a natural sound without a sense of incongruity.

また、本実施の形態では、LPF39を配したことで、回帰分析部38における回帰線(一次式)の係数a,bの変化を曲調に合わせて滑らかに変化させることができ、回帰線の傾きも曲調に合わせて滑らかに変化させることができる。よって、回帰線が曲調に合わせて急激に変化する際に発生するノイズを防止することができる。   In the present embodiment, the LPF 39 is arranged so that the change of the coefficients a and b of the regression line (primary expression) in the regression analysis unit 38 can be smoothly changed according to the tone of the curve, and the slope of the regression line Can be changed smoothly according to the tune. Therefore, it is possible to prevent noise that occurs when the regression line changes abruptly according to the tone of music.

また、本実施の形態による高域補間は、ヘッドホンなどのように再生周波数帯域が高域まで広くカバーされている音声出力機器において、より強く補正効果を実感できる。   Further, the high-frequency interpolation according to the present embodiment can realize the correction effect more strongly in an audio output device whose reproduction frequency band is widely covered up to a high frequency such as headphones.

なお、聴覚測定時に周波数発振部17から発生する周波数は、(表1)に示す10〜20kHzの範囲に限らず、他の値で測定してもよい。また、聴覚測定するサンプル数は、(表1)に示す6個に限らず、7個以上としてもよい。サンプル数を増やすことで、より細かく聴覚感度を測定することができ、より細かく高域補正を行うことができる。   The frequency generated from the frequency oscillating unit 17 at the time of auditory measurement is not limited to the range of 10 to 20 kHz shown in (Table 1), and may be measured with other values. Further, the number of samples for auditory measurement is not limited to six shown in (Table 1), and may be seven or more. By increasing the number of samples, the auditory sensitivity can be measured more finely, and the high-frequency correction can be performed more finely.

また、本実施の形態で示す聴覚測定方法は一例であり、他の方法で聴覚パラメータを設定する構成でもよい。例えば、年齢、性別、生活環境などの情報の組み合わせに応じた聴覚パラメータを規定値として予めテーブル化しておき、使用者が自身の年齢や性別などの情報を入力することで、入力された情報に最適な聴覚パラメータをテーブルから選出する方法でもよい。また、聴覚パラメータの実数を使用者に入力させる方法でもよい。   Further, the auditory measurement method shown in the present embodiment is an example, and a configuration in which auditory parameters are set by other methods may be used. For example, an auditory parameter corresponding to a combination of information such as age, sex, and living environment is tabulated in advance as a specified value, and the user inputs information such as his / her age and gender to the input information. A method may be used in which optimal hearing parameters are selected from a table. Alternatively, the method may be such that the user inputs the real number of the auditory parameter.

また、上記測定方法にて測定された聴覚パラメータは、使用者毎にメモリーに記録させておく構成としてもよい。このように構成することで、複数の使用者でパソコンを共有している場合、自分自身が音楽を聴く場合に自分自身の聴覚パラメータを読み出すだけでよいので、音楽を聴くたびに聴覚測定を行う必要がなくなり、使い勝手が向上する。   The auditory parameter measured by the above measuring method may be recorded in a memory for each user. With this configuration, if you share a computer with multiple users, you only need to read your own auditory parameters when you listen to the music, so each time you listen to the music, you make an auditory measurement Eliminates the need for improved usability.

また、本実施の形態では、MP3形式の音楽データの高域補正について説明したが、MP3形式以外の形式の音楽データであっても、同様に高域補正を行うことができる。特に、圧縮によって高域成分が除去されている音楽データにおいて、高音質化を図ることができる。   In the present embodiment, the high-frequency correction of music data in the MP3 format has been described. However, high-frequency correction can be similarly performed for music data in a format other than the MP3 format. In particular, it is possible to achieve high sound quality in music data from which high frequency components have been removed by compression.

また、本実施の形態における情報媒体は必須ではなく、例えばネットワーク上から取得した音楽データを再生する場合や、ネットワーク上から取得した音声ストリームをストリーミング再生する場合や、デジタルラジオ放送を受信して得られた音声データを再生する場合も、本実施の形態は有効である。特に、圧縮によって高域成分が除去されている音楽データにおいて、高音質化を図ることができる。   In addition, the information medium in the present embodiment is not indispensable. For example, when reproducing music data acquired from the network, streaming playback of an audio stream acquired from the network, or receiving digital radio broadcasting, the information medium can be obtained. The present embodiment is also effective when reproducing the recorded audio data. In particular, it is possible to achieve high sound quality in music data from which high frequency components have been removed by compression.

また、本実施の形態では、高域補正部13や周波数発振部17など、聴覚特性に基づき高域補正を行う構成を音声信号処理装置1(パソコン)に備える構成としたが、DAC21やヘッドホン22などの外部機器に備える構成としてもよい。このような構成にする場合は、聴覚測定時に使用者が操作する操作部を、外部機器に備える。このように構成することで、パソコンに、高域補正を行うためのソフトウェアをインストールする作業が不要になるため、使い勝手を向上させることができる。また、パソコンに限らず、様々な音響機器に接続して利用することができる。   In the present embodiment, the audio signal processing device 1 (personal computer) includes a configuration that performs high frequency correction based on auditory characteristics, such as the high frequency correction unit 13 and the frequency oscillation unit 17. It is good also as a structure with which external apparatuses, such as are equipped. In the case of such a configuration, an external device is provided with an operation unit that is operated by the user during auditory measurement. With this configuration, it is not necessary to install software for performing high frequency correction on a personal computer, so that the usability can be improved. Moreover, it can connect and use not only a personal computer but various audio equipment.

また、DAC21は、ヘッドホン22に対して独立したユニットで構成されているが、ヘッドホン22内に組み込む構成としてもよい。その場合は、ヘッドホン22には、ステレオミニプラグに替えてUSB端子(雄ピン)を備える。   The DAC 21 is configured as a unit independent of the headphones 22, but may be configured to be incorporated in the headphones 22. In that case, the headphone 22 includes a USB terminal (male pin) instead of the stereo mini plug.

また、DAC21は、音声信号処理装置1に対して独立したユニットで構成されているが、音声信号処理装置1内に組み込む構成としてもよい。その場合は、デジタルIF14は、ステレオミニジャックなどのアナログIFで構成する。例えば、音声信号処理装置1が携帯型音楽プレーヤーに含まれている場合は、音声信号処理装置1内にDAC21を備え、音声出力端子としてステレオミニジャックを備える。このような構成においても、本実施の形態の特徴である聴覚特性に基づく高域補正を実現することができる。   The DAC 21 is configured as a unit independent of the audio signal processing device 1, but may be configured to be incorporated in the audio signal processing device 1. In this case, the digital IF 14 is configured by an analog IF such as a stereo mini jack. For example, when the audio signal processing device 1 is included in a portable music player, the audio signal processing device 1 includes a DAC 21 and a stereo mini jack as an audio output terminal. Even in such a configuration, it is possible to realize high-frequency correction based on the auditory characteristic that is a feature of the present embodiment.

本発明の音声信号処理装置は、音楽信号や音楽データを再生可能な機器に有用である。例えば、アンプ、スピーカー、ヘッドホン、パソコン、携帯電話機、携帯型音楽プレーヤーなどに有用である。   The audio signal processing apparatus of the present invention is useful for a device capable of reproducing music signals and music data. For example, it is useful for amplifiers, speakers, headphones, personal computers, mobile phones, portable music players, and the like.

本発明の実施の形態1における音声信号処理装置の構成を示すブロック図The block diagram which shows the structure of the audio | voice signal processing apparatus in Embodiment 1 of this invention. 実施の形態1における高域補正部の構成を示すブロック図FIG. 3 is a block diagram showing a configuration of a high frequency correction unit in the first embodiment. 実施の形態1における1次回帰演算における入力信号の特性図Characteristic diagram of input signal in linear regression calculation in embodiment 1 実施の形態1における1次回帰演算における回帰線の特性図Characteristic diagram of regression line in linear regression calculation in embodiment 1 実施の形態1における1次回帰演算における入力信号の特性図Characteristic diagram of input signal in linear regression calculation in embodiment 1 実施の形態1における1次回帰演算における高域補間後の回帰線の特性図Characteristic diagram of regression line after high-frequency interpolation in primary regression calculation in Embodiment 1 実施の形態1における聴覚測定結果に基づく周波数強調特性の一例を示す特性図Characteristic diagram showing an example of frequency emphasis characteristics based on auditory measurement results in the first embodiment 実施の形態1における聴覚測定結果を追加した回帰線を示す特性図The characteristic view which shows the regression line which added the auditory measurement result in Embodiment 1 実施の形態1における高域補間後の周波数特性を示す特性図Characteristic diagram showing frequency characteristics after high-frequency interpolation in the first embodiment

符号の説明Explanation of symbols

1 音声信号処理装置
11 情報媒体
12 音声データ処理部
13 高域補正部
14 デジタルIF
15 操作部
16 制御部
17 周波数発振部
21 DAC
22 ヘッドホン
32 高域補間処理部
33 イコライザ
35 差信号抽出部
36 FFT処理部
37 エンベロープ検波部
38 回帰分析部
39 LPF
40 聴覚感度補正部
41 聴覚パラメータ設定部
DESCRIPTION OF SYMBOLS 1 Audio | voice signal processing apparatus 11 Information medium 12 Audio | voice data processing part 13 High region correction | amendment part 14 Digital IF
15 Operation unit 16 Control unit 17 Frequency oscillation unit 21 DAC
22 Headphones 32 High-frequency interpolation processing unit 33 Equalizer 35 Difference signal extraction unit 36 FFT processing unit 37 Envelope detection unit 38 Regression analysis unit 39 LPF
40 Auditory sensitivity correction unit 41 Auditory parameter setting unit

Claims (8)

入力される音声信号の高域成分を補間する高域補間処理部を含む高域補正部を備えた音声信号処理装置であって、
前記高域補正部は、
入力される音声信号の周波数特性を解析する周波数解析部と、
前記周波数解析部で解析された周波数特性の傾向を検出し、高域の補正量を予測し、補正結果を出力する補正量予測部と、
使用者の聴覚特性に基づく聴覚パラメータを設定可能な聴覚パラメータ設定部と、
前記補正量予測部から出力される補正結果を、前記聴覚パラメータ設定部において設定されている聴覚パラメータによって補正する聴覚感度補正部と、
前記高域補間処理部から出力される音声信号の周波数特性を補正するイコライザとを、さらに備え、
前記イコライザは、前記聴覚感度補正部から出力される補正結果に基づき、音声信号の周波数特性を補正することを特徴とする音声信号処理装置。
An audio signal processing device including a high frequency correction unit including a high frequency interpolation processing unit for interpolating a high frequency component of an input audio signal,
The high-frequency correction unit is
A frequency analyzer that analyzes the frequency characteristics of the input audio signal;
Detecting a tendency of the frequency characteristic analyzed by the frequency analysis unit, predicting a correction amount in a high range, and outputting a correction result;
An auditory parameter setting unit capable of setting an auditory parameter based on the user's auditory characteristics;
An auditory sensitivity correction unit that corrects a correction result output from the correction amount prediction unit using an auditory parameter set in the auditory parameter setting unit;
An equalizer that corrects a frequency characteristic of an audio signal output from the high-frequency interpolation processing unit;
The equalizer corrects a frequency characteristic of an audio signal based on a correction result output from the auditory sensitivity correction unit.
入力される音声信号の高域成分を補間する高域補間処理部を含む高域補正部を備えた音声信号処理装置であって、
前記高域補正部は、
入力される音声信号の周波数特性を解析する周波数解析部と、
前記周波数解析部における周波数解析結果を回帰分析して回帰分析結果を導出し、前記回帰分析結果を高域側へ反映して高域の補正量を予測し、補正結果を出力する補正量予測部と、
前記高域補間処理部から出力される音声信号の周波数特性を補正するイコライザとを、さらに備え、
前記イコライザは、前記補正量予測部から出力される補正結果に基づき、音声信号を周波数特性を補正することを特徴とする音声信号処理装置。
An audio signal processing device including a high frequency correction unit including a high frequency interpolation processing unit for interpolating a high frequency component of an input audio signal,
The high-frequency correction unit is
A frequency analyzer that analyzes the frequency characteristics of the input audio signal;
A correction amount prediction unit that performs regression analysis of the frequency analysis result in the frequency analysis unit to derive a regression analysis result, reflects the regression analysis result to a high frequency side, predicts a high frequency correction amount, and outputs a correction result When,
An equalizer that corrects a frequency characteristic of an audio signal output from the high-frequency interpolation processing unit;
The equalizer corrects a frequency characteristic of an audio signal based on a correction result output from the correction amount prediction unit.
前記周波数解析部は、
入力されるステレオ音声信号において、左チャンネル及び右チャンネルの音声信号を減算処理し、差信号を抽出する差信号抽出部と、
前記差信号抽出部から出力される差信号を高速フーリエ変換処理して周波数解析を行う高速フーリエ変換処理部と、
前記高速フーリエ変換処理部から出力される周波数解析結果のピーク検出を行うエンベロープ検波部とを備えている、請求項1または2記載の音声信号処理装置。
The frequency analysis unit
In the input stereo audio signal, a difference signal extraction unit that subtracts the audio signal of the left channel and the right channel and extracts a difference signal;
A fast Fourier transform processing unit for performing a frequency analysis by performing a fast Fourier transform on the difference signal output from the difference signal extraction unit;
The audio signal processing device according to claim 1, further comprising an envelope detection unit that detects a peak of a frequency analysis result output from the fast Fourier transform processing unit.
前記補正量予測部は、
前記周波数解析部における周波数解析結果を回帰分析する回帰分析部を備えた、請求項1記載の音声信号処理装置。
The correction amount prediction unit
The audio signal processing apparatus according to claim 1, further comprising a regression analysis unit that performs regression analysis on a frequency analysis result in the frequency analysis unit.
前記補正量予測部は、
前記回帰分析部における回帰分析結果の変動の高周波成分を除去するフィルターを、さらに備えた請求項2または4記載の音声信号処理装置。
The correction amount prediction unit
The audio signal processing apparatus according to claim 2, further comprising a filter that removes a high-frequency component of fluctuation of the regression analysis result in the regression analysis unit.
通常モードと、使用者の聴覚特性を測定可能な聴覚測定モードとを備え、
前記聴覚パラメータ設定部は、
予め所定の周波数に設定されている純粋音を、レベルを変えながら発生する周波数発振部と、
前記周波数発振部において純粋音を発生させている時に、前記操作部が操作された時の周波数及びレベルを記録するメモリーとを備え、
本システムが前記聴覚測定モードに移行されると、
前記周波数発振部は前記純粋音をレベルを変えながら発生し、
発生した純粋音を前記出力端子から出力し、
前記純粋音が出力されている時に使用者によって前記操作部が操作されると、その時の前記純粋音の周波数及びレベルを前記メモリーに記録し、
前記メモリーに記録されている周波数及びレベルの情報に基づき聴覚パラメータを設定する、
請求項1記載の音声信号処理装置。
It has a normal mode and an audio measurement mode that can measure the user's audio characteristics,
The auditory parameter setting unit
A frequency oscillating unit that generates a pure sound set at a predetermined frequency in advance while changing the level;
A memory for recording a frequency and a level when the operation unit is operated when generating a pure sound in the frequency oscillating unit;
When the system enters the auditory measurement mode,
The frequency oscillator generates the pure sound while changing the level,
The generated pure sound is output from the output terminal,
When the operation unit is operated by a user when the pure sound is being output, the frequency and level of the pure sound at that time are recorded in the memory,
Set auditory parameters based on frequency and level information recorded in the memory;
The audio signal processing apparatus according to claim 1.
入力される音声信号の高域成分を補間する高域補間処理部を備えた高域補正部と、
前記高域補正部から出力される音声信号を外部へ出力可能な出力端子と、
本システムにおける各種操作命令を入力可能な操作部とを備えた音声信号再生システムであって、
前記高域補正部は、
入力される音声信号の周波数特性を解析する周波数解析部と、
前記周波数解析部で解析された周波数特性の傾向を検出し、高域の補正量を予測し、補正結果を出力する補正量予測部と、
使用者の聴覚特性に基づく聴覚パラメータを設定可能な聴覚パラメータ設定部と、
前記補正量予測部から出力される補正結果を、前記聴覚パラメータ設定部において設定されている聴覚パラメータによって補正する聴覚感度補正部と、
前記高域補間処理部から出力される音声信号の周波数特性を補正するイコライザとを、さらに備え、
前記イコライザは、前記聴覚感度補正部から出力される補正結果に基づき、音声信号の周波数特性を補正することを特徴とする音声信号再生システム。
A high-frequency correction unit having a high-frequency interpolation processing unit for interpolating a high-frequency component of the input audio signal;
An output terminal capable of outputting the audio signal output from the high frequency correction unit to the outside;
An audio signal reproduction system including an operation unit capable of inputting various operation commands in the system,
The high-frequency correction unit is
A frequency analyzer that analyzes the frequency characteristics of the input audio signal;
Detecting a tendency of the frequency characteristic analyzed by the frequency analysis unit, predicting a correction amount in a high range, and outputting a correction result;
An auditory parameter setting unit capable of setting an auditory parameter based on the user's auditory characteristics;
An auditory sensitivity correction unit that corrects a correction result output from the correction amount prediction unit using an auditory parameter set in the auditory parameter setting unit;
An equalizer that corrects a frequency characteristic of an audio signal output from the high-frequency interpolation processing unit;
The equalizer corrects frequency characteristics of an audio signal based on a correction result output from the auditory sensitivity correction unit.
通常モードと、使用者の聴覚特性を測定可能な聴覚測定モードとを備え、
前記聴覚パラメータ設定部は、
予め所定の周波数に設定されている純粋音を、レベルを変えながら発生する周波数発振部と、
前記周波数発振部において純粋音を発生させている時に、前記操作部が操作された時の周波数及びレベルを記録するメモリーとを備え、
本システムが前記聴覚測定モードに移行されると、
前記周波数発振部は前記純粋音をレベルを変えながら発生し、
発生した純粋音を前記出力端子から出力し、
前記純粋音が出力されている時に使用者によって前記操作部が操作されると、その時の前記純粋音の周波数及びレベルを前記メモリーに記録し、
前記メモリーに記録されている周波数及びレベルの情報に基づき聴覚パラメータを設定する、
請求項7記載の音声信号再生システム。
It has a normal mode and an audio measurement mode that can measure the user's audio characteristics,
The auditory parameter setting unit
A frequency oscillating unit that generates a pure sound set at a predetermined frequency in advance while changing the level;
A memory for recording a frequency and a level when the operation unit is operated when generating a pure sound in the frequency oscillating unit;
When the system enters the auditory measurement mode,
The frequency oscillator generates the pure sound while changing the level,
The generated pure sound is output from the output terminal,
When the operation unit is operated by a user when the pure sound is being output, the frequency and level of the pure sound at that time are recorded in the memory,
Set auditory parameters based on frequency and level information recorded in the memory;
The audio signal reproduction system according to claim 7.
JP2006233559A 2006-08-30 2006-08-30 Audio signal processor and audio signal reproduction system Withdrawn JP2008058470A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006233559A JP2008058470A (en) 2006-08-30 2006-08-30 Audio signal processor and audio signal reproduction system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006233559A JP2008058470A (en) 2006-08-30 2006-08-30 Audio signal processor and audio signal reproduction system

Publications (1)

Publication Number Publication Date
JP2008058470A true JP2008058470A (en) 2008-03-13

Family

ID=39241303

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006233559A Withdrawn JP2008058470A (en) 2006-08-30 2006-08-30 Audio signal processor and audio signal reproduction system

Country Status (1)

Country Link
JP (1) JP2008058470A (en)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009134260A (en) * 2007-10-30 2009-06-18 Nippon Telegr & Teleph Corp <Ntt> Voice musical sound false broadband forming device, voice speech musical sound false broadband forming method, and its program and its record medium
JP5147851B2 (en) * 2007-10-26 2013-02-20 株式会社ディーアンドエムホールディングス Audio signal interpolation apparatus and audio signal interpolation method
JP2013251802A (en) * 2012-06-01 2013-12-12 Mitsubishi Electric Corp Equalizer
WO2014192675A1 (en) * 2013-05-31 2014-12-04 クラリオン株式会社 Signal processing device and signal processing method
WO2016152742A1 (en) * 2015-03-23 2016-09-29 国立大学法人九州工業大学 Biological signal detection device
WO2021172054A1 (en) * 2020-02-25 2021-09-02 ソニーグループ株式会社 Signal processing device, method, and program

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5147851B2 (en) * 2007-10-26 2013-02-20 株式会社ディーアンドエムホールディングス Audio signal interpolation apparatus and audio signal interpolation method
JP2009134260A (en) * 2007-10-30 2009-06-18 Nippon Telegr & Teleph Corp <Ntt> Voice musical sound false broadband forming device, voice speech musical sound false broadband forming method, and its program and its record medium
JP4733727B2 (en) * 2007-10-30 2011-07-27 日本電信電話株式会社 Voice musical tone pseudo-wideband device, voice musical tone pseudo-bandwidth method, program thereof, and recording medium thereof
JP2013251802A (en) * 2012-06-01 2013-12-12 Mitsubishi Electric Corp Equalizer
CN105324815A (en) * 2013-05-31 2016-02-10 歌拉利旺株式会社 Signal processing device and signal processing method
JP2014235274A (en) * 2013-05-31 2014-12-15 クラリオン株式会社 Signal processing apparatus and signal processing method
WO2014192675A1 (en) * 2013-05-31 2014-12-04 クラリオン株式会社 Signal processing device and signal processing method
US20160104499A1 (en) * 2013-05-31 2016-04-14 Clarion Co., Ltd. Signal processing device and signal processing method
US10147434B2 (en) 2013-05-31 2018-12-04 Clarion Co., Ltd. Signal processing device and signal processing method
WO2016152742A1 (en) * 2015-03-23 2016-09-29 国立大学法人九州工業大学 Biological signal detection device
JP2016174869A (en) * 2015-03-23 2016-10-06 国立大学法人九州工業大学 Biological signal detector
US10058304B2 (en) 2015-03-23 2018-08-28 Kyushu Institute Of Technology Biological signal detection device
WO2021172054A1 (en) * 2020-02-25 2021-09-02 ソニーグループ株式会社 Signal processing device, method, and program

Similar Documents

Publication Publication Date Title
JP3670562B2 (en) Stereo sound signal processing method and apparatus, and recording medium on which stereo sound signal processing program is recorded
US8436241B2 (en) Beat enhancement device, sound output device, electronic apparatus and method of outputting beats
JP4591557B2 (en) Audio signal processing apparatus, audio signal processing method, and audio signal processing program
US9848266B2 (en) Pre-processing of a channelized music signal
WO2016153825A1 (en) System and method for improved audio perception
JP5585401B2 (en) REPRODUCTION DEVICE, REPRODUCTION METHOD, PROVIDING DEVICE, AND REPRODUCTION SYSTEM
JP2008058470A (en) Audio signal processor and audio signal reproduction system
JP2008060759A (en) Noise cancel headphone and its noise cancel method
JP4237768B2 (en) Voice processing apparatus and voice processing program
JP2008527882A (en) Signal processing apparatus, sound system and method for amplifying sound level of sound signal depending on frequency
WO2012081315A1 (en) Sound reproduction device, reproduction sound adjustment method, acoustic property adjustment device, acoustic property adjustment method, and computer program
JP2007180922A (en) Noise canceling headphone
JP2002330498A (en) Speaker detector
JP2011244197A (en) Audio signal processing apparatus and method, program, and recording medium
JP4458269B2 (en) Noise cancellation headphones
JP2002247699A (en) Stereophonic signal processing method and device, and program and recording medium
JP5202021B2 (en) Audio signal conversion apparatus, audio signal conversion method, control program, and computer-readable recording medium
JP2004163681A (en) Device and computer program for speech signal processing
US8195317B2 (en) Data reproduction apparatus and data reproduction method
JP4815986B2 (en) Interpolation device, audio playback device, interpolation method, and interpolation program
JP4715385B2 (en) Interpolation device, audio playback device, interpolation method, and interpolation program
JP2007189530A (en) Noise canceling headphone, and noise canceling method in headphone
JP6807769B2 (en) Sound equipment and sound quality adjustment method
JP6519507B2 (en) Acoustic signal transfer method and reproduction apparatus
JP6544276B2 (en) Sound signal transfer method

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20091110