JP2012213114A - Acoustic signal processing apparatus and acoustic signal processing method - Google Patents

Acoustic signal processing apparatus and acoustic signal processing method Download PDF

Info

Publication number
JP2012213114A
JP2012213114A JP2011078552A JP2011078552A JP2012213114A JP 2012213114 A JP2012213114 A JP 2012213114A JP 2011078552 A JP2011078552 A JP 2011078552A JP 2011078552 A JP2011078552 A JP 2011078552A JP 2012213114 A JP2012213114 A JP 2012213114A
Authority
JP
Japan
Prior art keywords
sound pressure
pressure level
level
sound
signal processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2011078552A
Other languages
Japanese (ja)
Inventor
Toshiko Murata
寿子 村田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
JVCKenwood Corp
Original Assignee
JVCKenwood Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by JVCKenwood Corp filed Critical JVCKenwood Corp
Priority to JP2011078552A priority Critical patent/JP2012213114A/en
Publication of JP2012213114A publication Critical patent/JP2012213114A/en
Withdrawn legal-status Critical Current

Links

Images

Landscapes

  • Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
  • Control Of Amplification And Gain Control (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

PROBLEM TO BE SOLVED: To adjust an amplification characteristic more appropriately.SOLUTION: An acoustic signal processing apparatus 100 includes a noise level analysis section 90 for analyzing an ambient noise level, an audiometric section 40 for outputting a variable volume sound and measuring a user's auditory characteristic according to the amount of variation of the volume, and a signal processing section 60a for generating, in accordance with the noise level and the auditory characteristic data measured by the audiometric section 40, an output signal characteristic that, in an intermediate sound pressure level region in an input signal range from a minimum sound pressure level to a maximum sound pressure level, excluding a predetermined range of a low sound pressure level region in the minimum sound pressure level and a predetermined range of a high sound pressure level region in the maximum sound pressure level, increases gradually to a first sound pressure level in the intermediate sound pressure level region from the low sound pressure level region side and then decreases gradually from the first sound pressure level toward the high sound pressure level region side, and performing signal processing according to the output signal characteristic.

Description

本発明は、ユーザの聴力特性に応じて信号処理する音響信号処理装置及び音響信号処理方法に関する。   The present invention relates to an acoustic signal processing apparatus and an acoustic signal processing method for performing signal processing according to a hearing characteristic of a user.

通常のヘッドホンやイヤホン再生では音像が頭の中に定位してしまうので、音像を頭の外に定位させる頭外定位ヘッドホンや頭外定位信号処理がすでに知られている。この技術は、例えば特許文献1に示されるように、予め定位させたい方向における頭部伝達関数を複数そろえ、定位させたい音声信号と畳み込み、さらにヘッドホンと鼓膜間の伝達関数の逆特性を畳み込むことで実現することができる。音声信号がバイノーラル音声、すなわち両耳の鼓膜位置、あるいは鼓膜位置から外耳道入り口付近までの間にマイクをセットして録音した音声信号の場合は、ヘッドホンとマイク間の伝達関数の逆特性を畳み込むことで頭外定位を実現する。   In normal headphone or earphone playback, the sound image is localized in the head, so out-of-head localization headphones and out-of-head localization signal processing for localizing the sound image outside the head are already known. As shown in Patent Document 1, for example, this technique has a plurality of head-related transfer functions in the direction to be localized in advance, convolves with the audio signal to be localized, and further convolves the inverse characteristics of the transfer function between the headphones and the eardrum. Can be realized. If the audio signal is binaural audio, that is, the audio signal recorded by setting the microphone between the eardrum position of both ears or the eardrum position near the ear canal entrance, convolve the inverse characteristics of the transfer function between the headphones and the microphone. To achieve out-of-head localization.

しかしながら、頭部伝達関数やヘッドホンと鼓膜間の伝達関数、あるいはヘッドホンとマイク間の伝達関数は、個人の頭部や耳介の形によって異なり、他人の伝達関数では定位効果が低い。また、高齢になると聴力も衰えてくることから、正しい信号が伝わらず定位どころかどんな音かも聴き取れない。   However, the head-related transfer function, the transfer function between the headphone and the eardrum, or the transfer function between the headphone and the microphone varies depending on the shape of the individual's head and auricle, and the localization effect is low in the transfer function of others. In addition, hearing ability declines as you get older, so the correct signal is not transmitted and you can't hear any sound.

そこで、本出願人は、個人の聴力特性に応じて聴感的に聴き取りやすい再生音を得るための技術を提案している(特許文献2参照)。この従来技術では、音声信号を複数の周波数帯域に分割し、各周波数帯域の音圧レベルについて、最小音圧レベルから所定の範囲の低音圧レベル領域、最大音圧レベルから所定の範囲の高音圧レベル領域、その間の中間音圧レベル領域の3つの領域を設ける。そして、低音圧レベル領域側から中間音圧レベル領域内の中間点までは音圧レベルを順次大きくし、中間点から高音圧レベル領域側までは音圧レベルを順次小さくする増幅特性で増幅し、増幅された複数の周波数帯域の音声信号を加算するようになっている。   In view of this, the present applicant has proposed a technique for obtaining a reproduced sound that is audibly perceptible according to the individual hearing characteristics (see Patent Document 2). In this prior art, the audio signal is divided into a plurality of frequency bands, and the sound pressure level of each frequency band is set to a low sound pressure level region in a predetermined range from the minimum sound pressure level and a high sound pressure in a predetermined range from the maximum sound pressure level. Three areas are provided: a level area and an intermediate sound pressure level area therebetween. Then, the sound pressure level is gradually increased from the low sound pressure level region side to the intermediate point in the intermediate sound pressure level region, and is amplified with an amplification characteristic that sequentially decreases the sound pressure level from the intermediate point to the high sound pressure level region side, The amplified audio signals of a plurality of frequency bands are added.

特許第2924539号公報Japanese Patent No. 2924539 特開2009−077378号公報JP 2009-077378 A

前記特許文献2に開示される技術によると、個人の聴力特性を考慮した音声提供が可能であるが、より個人の聴力特性に合った、聴き取りやすくて自然な定位感のある再生音を得ることが望まれている。すなわち、高齢化が進むに連れ、より個人の聴力特性を考慮した頭外定位ヘッドホンや、自然な定位感のある聴力補助器の重要性が増している。   According to the technique disclosed in Patent Document 2, it is possible to provide a sound that takes into account the individual's hearing characteristics, but it is possible to obtain a reproduction sound that is more suitable for the individual's hearing characteristics and is easy to listen to and has a natural orientation. It is hoped that. That is, as aging progresses, the importance of out-of-head localization headphones that take into account individual hearing characteristics and hearing aids with a natural sense of localization are increasing.

本発明はこのような課題を解決するためになされたものであり、その目的は、増幅特性をより良く調整することのできる音響信号処理装置及び音響信号処理方法を提供することである。   The present invention has been made to solve such a problem, and an object thereof is to provide an acoustic signal processing device and an acoustic signal processing method capable of better adjusting the amplification characteristics.

前記課題を解決するために、本発明の実施形態に係る音響信号処理装置(100)は、周囲の騒音レベルを分析する騒音レベル分析部(90)と、出力する音の音量を可変でき、前記音量の変化量に基づいてユーザの聴力特性を測定する聴力測定部(40)と、前記騒音レベルと前記聴力測定部(40)により測定された聴力特性データとに応じて、入力信号の最小音圧レベルから最大音圧レベルまでの範囲における前記最小音圧レベルから所定の範囲の低音圧レベル領域と前記最大音圧レベルから所定の範囲の高音圧レベル領域とを除く中間音圧レベル領域で、前記低音圧レベル領域側から前記中間音圧レベル領域内の第1の音圧レベルまで順次大きくし、前記第1の音圧レベルから前記高音圧レベル領域側まで順次小さくする出力信号特性を生成し、前記出力信号特性に応じて信号処理を行う信号処理部(60a)とを備えることを特徴とする。   In order to solve the above-mentioned problem, an acoustic signal processing device (100) according to an embodiment of the present invention can change a sound level of a sound level and a noise level analysis unit (90) for analyzing a surrounding noise level, The minimum sound of the input signal according to the hearing measurement unit (40) that measures the hearing characteristic of the user based on the amount of change in volume, and the hearing characteristic data measured by the noise level and the hearing measurement unit (40) An intermediate sound pressure level region excluding a low sound pressure level region in a predetermined range from the minimum sound pressure level and a high sound pressure level region in a predetermined range from the maximum sound pressure level in a range from a pressure level to a maximum sound pressure level, An output signal characteristic that is sequentially increased from the low sound pressure level region side to the first sound pressure level in the intermediate sound pressure level region and gradually decreased from the first sound pressure level to the high sound pressure level region side. It generates, characterized in that it comprises a signal processing unit for performing signal processing (60a) in response to the output signal characteristics.

前記音響信号処理装置(100)において、前記騒音レベル分析部(90)は、周囲音に基づいてピッチ抽出を行い、前記ピッチが抽出された場合は、前記周囲音の音圧レベルを会話音の音圧レベルとして算出し、前記ピッチが抽出されない場合は、前記周囲音の音圧レベルを騒音の音圧レベルとして算出し、所定回数のピッチ抽出にて算出された前記会話音の音圧レベルと前記騒音の音圧レベルの平均値に基づいて前記第1の音圧レベルを設定してもよい。   In the acoustic signal processing device (100), the noise level analysis unit (90) performs pitch extraction based on the ambient sound, and when the pitch is extracted, the sound pressure level of the ambient sound is determined from the conversation sound. When the sound pressure level is calculated and the pitch is not extracted, the sound pressure level of the ambient sound is calculated as the sound pressure level of the noise, and the sound pressure level of the conversation sound calculated by the predetermined number of pitch extractions The first sound pressure level may be set based on an average value of sound pressure levels of the noise.

前記音響信号処理装置(100)において、前記聴力測定部(40)は、ユーザの最適聴取レベル(Best)を測定し、前記信号処理部(60a)は、前記最適聴取レベルに基づいて前記中間音圧レベル領域と前記高音圧レベル領域との変化点(P2)を設定してもよい。   In the acoustic signal processing device (100), the hearing measurement unit (40) measures an optimum listening level (Best) of a user, and the signal processing unit (60a) determines the intermediate sound based on the optimum listening level. A change point (P2) between the pressure level region and the high sound pressure level region may be set.

前記課題を解決するために、本発明の実施形態に係る音響信号処理方法は、周囲の騒音レベルを分析する騒音レベル分析ステップと、出力する音の音量を可変でき、前記音量の変化量に基づいてユーザの聴力特性を測定する聴力測定ステップと、前記騒音レベルと前記聴力測定ステップで測定された聴力特性データとに応じて、入力信号の最小音圧レベルから最大音圧レベルまでの範囲における前記最小音圧レベルから所定の範囲の低音圧レベル領域と前記最大音圧レベルから所定の範囲の高音圧レベル領域とを除く中間音圧レベル領域で、前記低音圧レベル領域側から前記中間音圧レベル領域内の第1の音圧レベルまで順次大きくし、前記第1の音圧レベルから前記高音圧レベル領域側まで順次小さくする出力信号特性を生成し、前記出力信号特性に応じて信号処理を行う信号処理ステップとを備えることを特徴とする。   In order to solve the above-mentioned problem, an acoustic signal processing method according to an embodiment of the present invention can vary a noise level analysis step for analyzing a surrounding noise level, a volume of a sound to be output, and based on a change amount of the volume. And a hearing measurement step for measuring a hearing characteristic of the user, and the sound signal in the range from the minimum sound pressure level to the maximum sound pressure level of the input signal according to the noise level and the hearing characteristic data measured in the hearing measurement step. An intermediate sound pressure level region excluding a low sound pressure level region in a predetermined range from a minimum sound pressure level and a high sound pressure level region in a predetermined range from the maximum sound pressure level, and the intermediate sound pressure level from the low sound pressure level region side Generating an output signal characteristic that sequentially increases to a first sound pressure level in a region and decreases gradually from the first sound pressure level to the high sound pressure level region side, Characterized in that it comprises a signal processing step of performing signal processing in accordance with the No. characteristics.

本発明によれば、増幅特性をより良く調整することのできる音響信号処理装置及び音響信号処理方法を提供することが可能である。   ADVANTAGE OF THE INVENTION According to this invention, it is possible to provide the acoustic signal processing apparatus and acoustic signal processing method which can adjust an amplification characteristic better.

第1実施形態における音響信号処理装置を示すブロック図である。It is a block diagram which shows the acoustic signal processing apparatus in 1st Embodiment. 第1実施形態におけるイヤホンとマイクの概観図である。It is a general-view figure of the earphone and microphone in a 1st embodiment. 第1実施形態における聴力測定部の動作を示すフローチャートである。It is a flowchart which shows operation | movement of the audiometry part in 1st Embodiment. 第1実施形態における操作部の概観図である。It is a general-view figure of the operation part in a 1st embodiment. 第1実施形態における再生信号処理部の詳細を示すブロック図である。It is a block diagram which shows the detail of the reproduction | regeneration signal processing part in 1st Embodiment. 第1実施形態におけるゲインカーブの特徴を示す図である。It is a figure which shows the characteristic of the gain curve in 1st Embodiment. 第1実施形態における聴力測定部により測定された聴力特性データの最小可聴レベルとリファレンスである最小可聴レベルの一例を示す図である。It is a figure which shows an example of the minimum audible level which is the minimum audible level of a hearing characteristic data measured by the audiometry part in 1st Embodiment, and a reference. 第1実施形態におけるゲインカーブの特徴を示す図である。It is a figure which shows the characteristic of the gain curve in 1st Embodiment. 第2実施形態におけるゲインカーブの特徴を示す図である。It is a figure which shows the characteristic of the gain curve in 2nd Embodiment. 第2実施形態におけるゲインカーブのパラメータを示す図である。It is a figure which shows the parameter of the gain curve in 2nd Embodiment. 第3実施形態における音響信号処理装置を示すブロック図である。It is a block diagram which shows the acoustic signal processing apparatus in 3rd Embodiment. 第3実施形態における再生信号処理部の詳細を示すブロック図である。It is a block diagram which shows the detail of the reproduction | regeneration signal processing part in 3rd Embodiment. 第3実施形態における騒音レベル分析部の動作を示すフローチャートである。It is a flowchart which shows operation | movement of the noise level analysis part in 3rd Embodiment. 他の(または第4)実施形態におけるゲインカーブの特徴を示す図である。It is a figure which shows the characteristic of the gain curve in other (or 4th) embodiment.

以下、本発明の音響信号処理装置及び方法の各実施形態について、添付図面を参照して説明する。各実施形態をハードウェア構成のブロック図を用いて説明するが、各実施形態の一部をソフトウェアとして構成してもよい。ソフトウェアとして構成することが可能な部分を全てソフトウェアで構成してもよく、ハードウェアとソフトウェアの使い分けは任意でよい。   Embodiments of an acoustic signal processing apparatus and method according to the present invention will be described below with reference to the accompanying drawings. Although each embodiment is described using a block diagram of a hardware configuration, a part of each embodiment may be configured as software. All parts that can be configured as software may be configured by software, and the use of hardware and software may be arbitrarily selected.

<第1実施形態>
図1は、第1実施形態における音響信号処理装置100を示すブロック図である。この音響信号処理装置100は、ユーザの聴力特性に応じて信号処理する頭外定位ヘッドホン等であって、マイク10と、イヤホン20と、インパルス応答測定部30と、聴力測定部40と、操作部50と、再生信号処理部60と、データ入出力部70と、メモリ80とを備えている。マイク10及びイヤホン20は、図2に示すように、左右2チャンネルをもち、一体化している。インパルス応答測定部30は、出力端子1からパルスを出力し、マイク10で受けた信号をスイッチ2aを介して取り込む。聴力測定部40は、測定音を出力し、ユーザの聴力特性を測定する。ユーザは、スイッチ3aを介してイヤホン20から出た測定音が聴こえるかどうかを判断して操作部50のボタンを操作する。操作部50では、聴こえてくる測定音の音量を可変したり、その時のレベルを決定することができる。これらの操作内容は聴力測定部40に通知されるようになっている。データ入出力部70は、インパルス応答測定部30や聴力測定部40で得られた結果を受けとってメモリ80に保存したり、再生信号処理部60にデータを渡したりする。再生信号処理部60には、スイッチ2b及び4aを介してマイク10から音声信号が入力され、また、スイッチ4bを介してDVDプレーヤやテレビチューナーなどから音声信号が入力される。再生信号処理部60は、聴力測定やインパルス応答測定で得られた結果をもとに信号処理し、音響信号を出力する。これにより、ユーザにとって聴きやすい自然な定位の音がスイッチ3bを介してイヤホンから再生される。
<First Embodiment>
FIG. 1 is a block diagram illustrating an acoustic signal processing apparatus 100 according to the first embodiment. The acoustic signal processing device 100 is an out-of-head localization headphone or the like that performs signal processing according to a user's hearing characteristics, and includes a microphone 10, an earphone 20, an impulse response measurement unit 30, an audio measurement unit 40, and an operation unit. 50, a reproduction signal processing unit 60, a data input / output unit 70, and a memory 80. As shown in FIG. 2, the microphone 10 and the earphone 20 have two left and right channels and are integrated. The impulse response measuring unit 30 outputs a pulse from the output terminal 1 and takes in a signal received by the microphone 10 via the switch 2a. The hearing measurement unit 40 outputs a measurement sound and measures the hearing characteristics of the user. The user operates the buttons of the operation unit 50 by determining whether or not the measurement sound emitted from the earphone 20 can be heard via the switch 3a. The operation unit 50 can vary the volume of the measurement sound to be heard and determine the level at that time. These operation contents are notified to the hearing measurement unit 40. The data input / output unit 70 receives the results obtained by the impulse response measurement unit 30 and the hearing measurement unit 40 and stores them in the memory 80 or passes the data to the reproduction signal processing unit 60. The reproduction signal processing unit 60 receives an audio signal from the microphone 10 via the switches 2b and 4a, and receives an audio signal from a DVD player, a TV tuner, or the like via the switch 4b. The reproduction signal processing unit 60 performs signal processing based on the results obtained by the hearing measurement or the impulse response measurement, and outputs an acoustic signal. As a result, a natural localized sound that is easy for the user to listen to is reproduced from the earphone via the switch 3b.

以下、音響信号処理装置100の構成をさらに詳細に説明する。インパルス応答測定部30は、ユーザの頭部伝達関数を測定するものである。ブルーレイディスクなどのマルチチャンネル音声ディスクを試聴するためには、7個のスピーカ配置(L,R,C,SL,SR,SBL,SBR)と試聴位置間の頭部伝達関数の測定が必要である。この測定では、図示されないアンプ及びスピーカを部屋の所望の場所に設置し、出力端子1をそのアンプに接続する。ユーザは、試聴位置にてイヤホン20を両耳にしっかりと装着する。こうすることでマイク10が耳介内にセットされる。測定が開始されると、インパルス応答測定部30からインパルスが出力され、図示されないアンプ及びスピーカからインパルス音が出力される。インパルスとは、時間t=t1において振幅最大、t≠t1で振幅0の信号である。インパルス応答測定部30は、マイク10で受けた左右2チャンネルの信号をそれぞれ保存する。部屋の大きさや残響時間によって保存する信号の長さを変えてもよい。また、S/N比を良くするために同期加算してもよい。測定方法はこの方法に限ることなく、TSP法やクロススペクトル法などを採用することもできる。このようにして、各スピーカ配置にて左右の頭部伝達関数HLl、HLr、HRl,HRr,HCl,HCr,HSLl、HSLr,HSRl,HSRr,HSBLl,HSBLr,HSBRl,HSBRrを測定する。測定で得られた頭部伝達関数データはデータ入出力部70によりメモリ80に保存される。 Hereinafter, the configuration of the acoustic signal processing apparatus 100 will be described in more detail. The impulse response measurement unit 30 measures a user's head-related transfer function. In order to audition a multi-channel audio disc such as a Blu-ray disc, it is necessary to measure the head-related transfer function between the seven speaker arrangements (L, R, C, SL, SR, SBL, SBR) and the audition position. . In this measurement, an amplifier and a speaker (not shown) are installed in a desired place in the room, and the output terminal 1 is connected to the amplifier. The user wears the earphone 20 firmly on both ears at the listening position. By doing so, the microphone 10 is set in the auricle. When the measurement is started, an impulse response is output from the impulse response measurement unit 30, and an impulse sound is output from an amplifier and a speaker (not shown). An impulse is a signal having a maximum amplitude at time t = t1, and a zero amplitude at t ≠ t1. The impulse response measurement unit 30 stores the left and right two-channel signals received by the microphone 10. The length of the stored signal may be changed depending on the size of the room and the reverberation time. Further, synchronous addition may be performed in order to improve the S / N ratio. The measurement method is not limited to this method, and a TSP method, a cross spectrum method, or the like can also be adopted. In this way, the left and right head related transfer functions H Ll , H Lr , H Rl , H Rr , H Cl , H Cr , H SLl , H SLr , H SRl , H SRr , H SBLl , H in each speaker arrangement. SBLr , H SBRl , and H SBRr are measured. Head-related transfer function data obtained by the measurement is stored in the memory 80 by the data input / output unit 70.

自然な定位感を得るには、個人差がもっとも出る高い周波数において忠実な再生が必要である。したがって、先に測定された頭部伝達関数を忠実に再現すればよいのだが、高齢になるにつれ、一般的に高い周波数の聴力が衰えてしまう。ハードウェアがいくら忠実に再現できても、その音が聴こえなければ定位感は損なわれるのである。   In order to obtain a natural feeling of localization, it is necessary to reproduce faithfully at a high frequency where the individual difference is the highest. Therefore, it is only necessary to faithfully reproduce the previously measured head-related transfer function. However, as a person grows older, hearing at a high frequency generally decreases. No matter how faithfully the hardware can be reproduced, if you can't hear the sound, the sense of orientation is lost.

そこで、聴力測定部40は、個人差の大きい高い周波数領域、ここでは1kHz〜8kHzにおいて聴力測定を行う。測定時、0dBFS(FSはフルスケールを意味する)の信号が、音圧レベル100dB(以降、音圧レベルはdBの後にSPLと表示)の音量でイヤホン20から出るよう聴力測定部40の図示されないアンプのボリュームが設定される。100dBSPLという値は一例であり、難聴度合いに応じてさらに上げてもよい。   Therefore, the hearing measurement unit 40 performs the hearing measurement in a high frequency region with a large individual difference, here 1 kHz to 8 kHz. The hearing measurement unit 40 is not shown so that a signal of 0 dBFS (FS means full scale) is output from the earphone 20 at a sound pressure level of 100 dB (hereinafter, the sound pressure level is displayed as SPL after dB) during measurement. The volume of the amplifier is set. The value of 100 dBSPL is an example, and may be further increased according to the degree of hearing loss.

図3は、聴力測定部40の動作を示すフローチャートである。図4は、操作部50の概観図である。以下、これらの図を用いて聴力測定時の動作を詳細に説明する。   FIG. 3 is a flowchart showing the operation of the hearing measurement unit 40. FIG. 4 is an overview diagram of the operation unit 50. Hereinafter, the operation during the hearing measurement will be described in detail with reference to these drawings.

まず、聴力測定部40はステップS1にて所定の周波数の純音をイヤホン20からフルスケール(0dBFS)より小さい音量(−XdBFS,ここではX=30)で出力する。例えば、まず1kHzの純音を出力する。ユーザは、イヤホン20から出力される音量が、大きくもなく小さくもなくちょうど良い音量になるまで操作部50の上下ボタン51を押して音量を可変する。聴力測定部40は操作部50から送られる信号に基づいて上下ボタン51が押し下げられたか否かを判断する。(ステップS3:Yes、ステップS4に進む)。   First, the hearing measurement unit 40 outputs a pure tone of a predetermined frequency from the earphone 20 at a volume (−XdBFS, here X = 30) smaller than full scale (0 dBFS) in step S1. For example, a 1 kHz pure sound is output first. The user changes the sound volume by pressing the up / down button 51 of the operation unit 50 until the sound volume output from the earphone 20 becomes a sound volume that is neither large nor small. The hearing measurement unit 40 determines whether or not the up / down button 51 is pressed based on a signal sent from the operation unit 50. (Step S3: Yes, proceed to Step S4).

ユーザは、上下ボタン51の操作によりちょうど良い音量となると操作部50のOKボタン52を押す。聴力測定部40は操作部50からOKボタン52が押されたことを示す信号を取得すると(ステップS2:YES)、信号取得時点での音圧レベルをユーザの最適聴取レベルBestとして音圧レベル(dBSPL)の値で図示されない内部メモリに一時保存する(ステップS5)。1kHzの純音を出力した際のユーザの最適聴取レベルはBest1kとする。   The user presses the OK button 52 of the operation unit 50 when the volume is just right by the operation of the up / down button 51. When the hearing measurement unit 40 acquires a signal indicating that the OK button 52 has been pressed from the operation unit 50 (step S2: YES), the sound pressure level at the time of signal acquisition is set as the user's optimum listening level Best (the sound pressure level ( The value is temporarily stored in an internal memory (not shown) with the value of dBSPL) (step S5). The optimum listening level of the user when outputting a pure sound of 1 kHz is Best1k.

続いて聴力測定部40は、ステップS1にて2kHzの純音を出力し、ステップS2〜ステップS4を経てユーザの最適聴取レベルBest2kを取得し、保存する。同様にして、4kHzにおけるユーザの最適聴取レベルBest4k、8kHzにおけるユーザの最適聴取レベルBest8kを取得する。   Subsequently, the hearing measurement unit 40 outputs a pure sound of 2 kHz in step S1, acquires and stores the optimum listening level Best2k of the user through steps S2 to S4. Similarly, the user's optimum listening level Best4k at 4 kHz and the user's optimum listening level Best8k at 8 kHz are acquired.

続いて聴力測定部40は、ユーザの最小可聴レベルを求める。上述した最適聴取レベルBestを取得する動作と同様の動作フローにて行う。最初にステップS1にて、1kHzの純音を出力する。ユーザは、聴こえるぎりぎりのレベルの音量になるまで、操作部50の上下ボタン51を押して音量を可変する。聴力測定部40は操作部50から送られる信号に基づいて上下ボタン51が押し下げられたか否かを判断する(ステップS3:Yes、ステップS4に進む)。そしてユーザは、音が聴こえるぎりぎりのレベルになったら操作部50のOKボタン52を押す。聴力測定部40は操作部50からOKボタン52が押されたことを示す信号を取得すると(ステップS2:YES)、聴力測定部40は、このときの音圧レベルをユーザの最小可聴レベルMinを音圧レベル(dBSPL)の値で図示されない内部メモリに一時保存する。1kHzの純音を出力した際のユーザの最小可聴レベルはMin1kとする。   Subsequently, the hearing measurement unit 40 obtains the minimum audible level of the user. The operation flow is the same as the operation for obtaining the optimum listening level Best described above. First, in step S1, a pure tone of 1 kHz is output. The user changes the volume by pressing the up / down button 51 of the operation unit 50 until the volume reaches a barely audible level. The hearing measurement unit 40 determines whether or not the up / down button 51 has been pressed based on a signal sent from the operation unit 50 (step S3: Yes, proceed to step S4). Then, the user presses the OK button 52 of the operation unit 50 when the sound level is reached. When the hearing measurement unit 40 acquires a signal indicating that the OK button 52 has been pressed from the operation unit 50 (step S2: YES), the hearing measurement unit 40 sets the sound pressure level at this time to the minimum audible level Min of the user. The sound pressure level (dBSPL) value is temporarily stored in an internal memory (not shown). The minimum audible level of the user when a 1 kHz pure tone is output is Min1k.

同様に聴力測定部40は、ステップS1にて2kHzの純音を出力し、ステップS2〜ステップS4を経てユーザの聴こえるぎりぎりの音圧レベルである最小可聴レベルMin2kを取得し、一時保存する。このようにして、4kHz,8kHzについても、ユーザの最小可聴レベルMin4k、Min8kを求める。   Similarly, the hearing measurement unit 40 outputs a 2 kHz pure sound in step S1, acquires the minimum audible level Min2k that is the sound pressure level that the user can hear through step S2 to step S4, and temporarily stores it. In this manner, the minimum audible level Min4k and Min8k of the user is obtained for 4 kHz and 8 kHz.

以上にて測定を終了する。聴力取得部40が取得したBest1k、Best2k、Best4k、Best8k、Min1k、Min2k,Min4k,Min8k(以降、この8つのデータをまとめて「聴力特性データ」と呼ぶ)は、データ入出力部70に送られ、メモリ80に保存される。   This completes the measurement. The Best1k, Best2k, Best4k, Best8k, Min1k, Min2k, Min4k, and Min8k acquired by the hearing acquisition unit 40 (hereinafter, these eight data are collectively referred to as “auditory characteristic data”) are sent to the data input / output unit 70. Stored in the memory 80.

図5は、再生信号処理部60の詳細を示すブロック図である。再生信号処理部60は、聴力特性データを利用してユーザの聴力特性に合わせた聴きやすい音響信号を生成する。すなわち、BDプレーヤ等の音声出力信号は、入力端子4からスイッチ4bを介して再生信号処理部60に入力される。その際、音声信号がドルビーデジタルなどのストリームの場合は、図示されないデコーダで復調処理され、7.1チャンネルの信号に分離される。WFチャンネルを除く7チャンネルの信号は畳み込み部61に入力される。一方、データ入出力部70は、メモリ80から頭部伝達関数データHLl、HLr、HRl,HRr,HCl,HCr,HSLl、HSLr,HSRl,HSRr,HSBLl,HSBLr,HSBRl,HSBRrを読み出し、畳み込み部61へ渡す。畳み込み部61は、L信号とHLl、HLr、R信号とHRl,HRr,・・・のように、各信号に対して両耳の頭部伝達関数を畳み込んで、計14チャンネルの信号を加算部62に出力する。加算部62は、左耳のチャンネル同士、右耳のチャンネル同士を加算し、2チャンネルの信号にする。復調後のWFチャンネル信号は増幅器63にて増幅され、分岐された後、加算器64aにて左右2チャンネルの信号に加算される。次に、帯域分割部65は、左右2チャンネル各々について、750Hz以下の低域と、中心周波数が1kHz、2kHz、4kHzのオクターブ帯域と、8kHz以上の高域の5帯域に分割する。そして、音圧レベル増幅部66は、ユーザの聴力特性データから得られたゲインカーブに基づいて音圧レベルを増幅する。さらに、加算部67は、5帯域の信号を加算し、再び左右2チャンネルの信号として出力する。 FIG. 5 is a block diagram showing details of the reproduction signal processing unit 60. The reproduction signal processing unit 60 generates an acoustic signal that is easy to listen to according to the hearing characteristic of the user using the hearing characteristic data. That is, an audio output signal from a BD player or the like is input from the input terminal 4 to the reproduction signal processing unit 60 via the switch 4b. At this time, if the audio signal is a stream such as Dolby Digital, it is demodulated by a decoder (not shown) and separated into a 7.1-channel signal. The signals of the seven channels excluding the WF channel are input to the convolution unit 61. On the other hand, the data input / output unit 70 receives the head-related transfer function data H Ll , H Lr , H Rl , H Rr , H Cl , H Cr , H SLl , H SLr , H SRl , H SRr , H SBLl , H SBLr , H SBRl , and H SBRr are read and passed to the convolution unit 61. The convolution unit 61 convolves the head transfer function of both ears with each signal such as L signal and H Ll , H Lr , R signal and H Rl , H Rr ,. Is output to the adder 62. The adder 62 adds the left-ear channels and the right-ear channels to a 2-channel signal. The demodulated WF channel signal is amplified by the amplifier 63, branched, and added to the left and right channel signals by the adder 64a. Next, the band dividing unit 65 divides the left and right two channels into five bands, a low band of 750 Hz or less, an octave band having a center frequency of 1 kHz, 2 kHz, 4 kHz, and a high band of 8 kHz or more. The sound pressure level amplifying unit 66 amplifies the sound pressure level based on a gain curve obtained from the user's hearing characteristic data. Further, the adder 67 adds the signals of the five bands and outputs the signals as two left and right channel signals again.

音圧レベル増幅部66は、メモリ80に保存された聴力特性データをデータ入出力部70から受け取り、図6に示すゲインカーブを特徴とするダイナミックレンジ圧縮を行う。このダイナミックレンジ圧縮では、各周波数帯域の音圧レベルについて、最小音圧レベルから最小音圧レベルよりも大きい音圧レベル(第1の音圧レベル)までの所定の範囲の低音圧レベル領域R1、最大音圧レベルから最大音圧レベルよりも小さい音圧レベル(第2の音圧レベル)までの所定の範囲の高音圧レベル領域R2、その間(第1の音圧レベルから第2の音圧レベルまで)の中間音圧レベル領域R3の3つの領域を設ける。   The sound pressure level amplification unit 66 receives the hearing characteristic data stored in the memory 80 from the data input / output unit 70, and performs dynamic range compression characterized by a gain curve shown in FIG. In this dynamic range compression, for the sound pressure level in each frequency band, a low sound pressure level region R1 in a predetermined range from a minimum sound pressure level to a sound pressure level (first sound pressure level) greater than the minimum sound pressure level, A high sound pressure level region R2 in a predetermined range from a maximum sound pressure level to a sound pressure level smaller than the maximum sound pressure level (second sound pressure level), in the meantime (from the first sound pressure level to the second sound pressure level) 3) of the intermediate sound pressure level region R3.

図6のゲインカーブは、低音圧レベル領域R1と高音圧レベル領域R2とにおいては、入力信号を増幅させない非増幅領域とすることが好ましい。低音圧レベル領域R1と高音圧レベル領域R2とを非増幅領域とすることにより、楽曲の音楽性をほとんど損ねることがない。低音圧レベル領域R1と高音圧レベル領域R2との間の中間音圧レベル領域R3においては、破線で示す非増幅の状態を実線で示す特性で増幅させた状態とする増幅領域としている。図6に示すように、増幅領域である中間音圧レベル領域R3においては、低音圧レベル領域R1側である点P1から中間音圧レベル領域R3内の中間点である変曲点Piまでは入力信号の音圧レベルが大きくなるに従って増幅度を順次大きくし、変曲点Piから高音圧レベル領域R2側である点P2までは入力信号の音圧レベルが大きくなるに従って増幅度を順次小さくする特性となっている。図6では、点P1から変曲点Piまで線形に増幅度を大きくし、変曲点Piから点P2まで線形に増幅度を小さくする例を示している。   The gain curve in FIG. 6 is preferably a non-amplified region where the input signal is not amplified in the low sound pressure level region R1 and the high sound pressure level region R2. By making the low sound pressure level region R1 and the high sound pressure level region R2 non-amplified regions, the musicality of the music is hardly impaired. In the intermediate sound pressure level region R3 between the low sound pressure level region R1 and the high sound pressure level region R2, the non-amplified state indicated by the broken line is an amplified region that is amplified by the characteristic indicated by the solid line. As shown in FIG. 6, in the intermediate sound pressure level region R3 that is an amplification region, an input is performed from a point P1 on the low sound pressure level region R1 side to an inflection point Pi that is an intermediate point in the intermediate sound pressure level region R3. A characteristic of increasing the amplification level sequentially as the sound pressure level of the signal increases, and decreasing the amplification level sequentially as the sound pressure level of the input signal increases from the inflection point Pi to the point P2 on the high sound pressure level region R2 side. It has become. FIG. 6 shows an example in which the amplification degree is linearly increased from the point P1 to the inflection point Pi and the amplification degree is linearly reduced from the inflection point Pi to the point P2.

ここで、本実施形態では、ゲインカーブのパラメータをユーザの聴力特性データに応じて設定するようになっている。具体的には、再生信号処理部60は、聴力測定部40により測定された聴力特性データの最小可聴レベルMinとリファレンスである最小可聴レベルRefとの差を点Piにおける最大ゲインGaに設定する。また、周波数ごとに、高音圧レベル領域R2と中間音圧レベル領域R3の境界をユーザの最適聴取レベルBestに設定する。   Here, in this embodiment, the gain curve parameters are set according to the user's hearing characteristic data. Specifically, the reproduction signal processing unit 60 sets the difference between the minimum audible level Min of the audio characteristic data measured by the audio measurement unit 40 and the minimum audible level Ref as a reference to the maximum gain Ga at the point Pi. For each frequency, the boundary between the high sound pressure level region R2 and the intermediate sound pressure level region R3 is set to the user's optimum listening level Best.

図7は、聴力測定部40により測定された聴力特性データの最適聴取レベルBest、最小可聴レベルMinとリファレンスである最小可聴レベルRefの一例を示す図である。ここで最小可聴レベルRefは、40歳台の健聴者の最小可聴レベルRefを例示している。   FIG. 7 is a diagram illustrating an example of the optimum listening level Best, the minimum audible level Min, and the minimum audible level Ref as a reference of the hearing characteristic data measured by the hearing measurement unit 40. Here, the minimum audible level Ref exemplifies the minimum audible level Ref of a normal hearing person in the 40s.

1kHzにおけるユーザの最小可聴レベルMin1kが40dBSPLということは、健聴者が聴こえているはずの20dBSPL(最小可聴レベルRef1k)の音では+20dB上げないと音が聴こえない、ということである。したがって図8(a)に示す、−80dBFSの入力信号を+20dB増幅させた信号を出力するゲインカーブを作成する。ここで、本実施形態は100dBSPL=0dBFSのシステムであるため、20dBSPLは−80dBFSである。20dB増幅させると、出力信号は−60dBFSとなる(40dBSPL=−60dBFS)。   When the minimum audible level Min1k of the user at 1 kHz is 40 dBSPL, the sound of 20 dBSPL (minimum audible level Ref1k) that should be heard by a normal hearing person cannot be heard unless it is increased by +20 dB. Therefore, a gain curve that outputs a signal obtained by amplifying a −80 dBFS input signal by +20 dB shown in FIG. 8A is created. Here, since this embodiment is a system of 100 dBSPL = 0 dBFS, 20 dBSPL is −80 dBFS. When amplified by 20 dB, the output signal becomes −60 dBFS (40 dBSPL = −60 dBFS).

すなわち、変曲点Piは入力信号が−80dBFSで、最大ゲインGa=20dBとなる点である。そして図7より1kHzにおける最適聴取レベルBest1kが70dBSPLであるので70dBSPL以上の音が入力された場合は増幅しない、つまり0dBの増幅をする。したがって中間音圧レベル領域R3の中間音圧レベル領域R3と高音圧レベル領域R2の境界である点P2は−30dBFSとなる。このようにして、1kHz帯域のゲインカーブは図8(a)のように決定される。他の帯域についても同様、2kHz帯域のゲインカーブは図8(b)のように決定され、4kHz帯域のゲインカーブは図8(c)のように決定され、8kHz帯域のゲインカーブは図8(d)のように決定される。8kHz帯域では図7に示すようにユーザの最小可聴レベルMin8kが健聴者の最小可聴レベルRef8kと同じであるため、最大ゲインGa=0dB増幅となり、ゲインカーブは直線となる。高齢者は高い周波数で補充現象を起こしやすいので、この例のように最適聴取レベルBest8kが他の帯域より低くなる場合がある。今回、中間音圧レベル領域R3における低音圧レベル領域R1側の端部である点P1(以降、単に「P1点」または「P1」という。)は16ビット量子化の最小値−90dBFSとした。高音圧レベル領域R2側の端部である点P2(以降、単に「P2点」または「P2」という。)は聴力測定で求めた最適聴取レベルBestで決定したが、「ちょうど良い音量」を決定することがユーザにとって難しいときは、たとえば1kHz、70dBSPLと同じ大きさに感じる各周波数の音圧レベルを求めてP2とすることで、より聴力特性に合った音声を届けることができる。   That is, the inflection point Pi is a point where the input signal is −80 dBFS and the maximum gain Ga = 20 dB. From FIG. 7, since the optimum listening level Best1k at 1 kHz is 70 dBSPL, when a sound of 70 dBSPL or higher is input, it is not amplified, that is, it is amplified by 0 dB. Therefore, the point P2 which is the boundary between the intermediate sound pressure level region R3 and the high sound pressure level region R2 in the intermediate sound pressure level region R3 is −30 dBFS. In this way, the gain curve in the 1 kHz band is determined as shown in FIG. Similarly for the other bands, the gain curve of the 2 kHz band is determined as shown in FIG. 8B, the gain curve of the 4 kHz band is determined as shown in FIG. 8C, and the gain curve of the 8 kHz band is shown in FIG. It is determined as in d). In the 8 kHz band, as shown in FIG. 7, since the user's minimum audible level Min8k is the same as the normal hearing person's minimum audible level Ref8k, the maximum gain Ga = 0 dB is amplified, and the gain curve is a straight line. Since an elderly person tends to cause a supplementary phenomenon at a high frequency, the optimal listening level Best8k may be lower than other bands as in this example. This time, a point P1 (hereinafter simply referred to as “P1 point” or “P1”) at the end of the intermediate sound pressure level region R3 on the low sound pressure level region R1 side is set to a minimum value of −90 dBFS of 16-bit quantization. The point P2 (hereinafter simply referred to as “P2 point” or “P2”) at the end of the high sound pressure level region R2 side is determined by the optimum listening level Best obtained by the hearing measurement, but “just right volume” is determined. When it is difficult for the user to perform, for example, the sound pressure level of each frequency that feels as large as 1 kHz and 70 dBSPL is obtained and set to P2, so that it is possible to deliver sound that better matches the hearing characteristics.

以上のように、本実施形態によれば、ゲインカーブのパラメータをユーザの最小可聴レベルMinや最適聴取レベルBestに応じて設定するようにしているので、増幅特性をより良く調整することができる。このようにして生成された音響信号は、部屋にマルチチャンネルスピーカ再生した場合の信号をユーザの頭部や耳介だけでなくユーザの聴力も考慮して忠実に再現しているので、ユーザにとって聴こえやすく自然な定位で楽しむことができる。これにより、ユーザは聴き疲れしにくいので、長時間の聴取を十分に楽しむことが可能である。   As described above, according to the present embodiment, the gain curve parameters are set according to the minimum audible level Min and the optimum listening level Best of the user, so that the amplification characteristics can be adjusted better. The sound signal generated in this way is faithfully reproduced in consideration of not only the user's head and auricle but also the user's hearing, when the multi-channel speaker is reproduced in the room. It is easy to enjoy with natural orientation. Accordingly, the user is less likely to get tired of listening, and thus can enjoy listening for a long time.

なお、本実施形態では、聴力測定を両耳聴にて行ったが、左右別々に行ってもよい。その場合は、左右で異なるゲインカーブを使ったダイナミックレンジ圧縮が行われる。   In this embodiment, the hearing measurement is performed by binaural listening, but may be performed separately on the left and right. In that case, dynamic range compression using different gain curves on the left and right is performed.

<第2実施形態>
本実施形態では、音響信号処理装置100を集音器として使用する場合について説明する。基本構成は図1と変わらない。第1実施形態と異なる点は、(1)聴力測定の内容、(2)マイク10で集音された音を再生信号処理部60に入力し、帯域別のより細かな音圧レベルに増幅する点、(3)音像を頭外に定位させて自然な音場となるようイヤホン20の特性補正を行う点である。以下、この3点について説明する。
Second Embodiment
In the present embodiment, a case where the acoustic signal processing device 100 is used as a sound collector will be described. The basic configuration is the same as in FIG. The difference from the first embodiment is that (1) the contents of the hearing measurement, (2) the sound collected by the microphone 10 is input to the reproduction signal processing unit 60 and amplified to a finer sound pressure level for each band. (3) Characteristic correction of the earphone 20 is performed so that the sound image is localized out of the head and a natural sound field is obtained. Hereinafter, these three points will be described.

聴力測定部40は、測定が開始されると、操作説明のガイド音声を約70dBSPLでイヤホン20から出力する。ユーザは、はっきりと聴こえる音量になるまで操作部50の上下ボタン51を押して音量を可変する。聴力測定部40は、この音量レベルの変化量をデータ入出力部70に送る。次に、左耳から最小可聴レベルの測定を始める。250Hz,500Hz,1kHz,2kHZ,4kHz、8kHzの純音をランダムにレベル可変してもよいし、順にレベルを下げてもよい。測定時間を短縮するため、ある集団の最小可聴レベルを正規分布にのせ、2分木法で提示してもよい。   When the measurement is started, the hearing measurement unit 40 outputs a guide voice for explaining the operation from the earphone 20 at about 70 dBSPL. The user changes the volume by pressing the up / down button 51 of the operation unit 50 until the volume is clearly audible. The hearing measurement unit 40 sends the change amount of the volume level to the data input / output unit 70. Next, measurement of the minimum audible level is started from the left ear. The level of pure sounds of 250 Hz, 500 Hz, 1 kHz, 2 kHz, 4 kHz, and 8 kHz may be varied randomly, or the levels may be lowered in order. In order to shorten the measurement time, the minimum audible level of a certain group may be placed on a normal distribution and presented by the binary tree method.

ユーザは、音が聴こえたら操作部50のOKボタン52を押す。聴力測定部40はOKボタン52が押された最小のレベルを最小可聴レベルデータとしてデータ入出力部70に送る。右耳も同じように聴力測定部40が最小可聴レベルを測定し、右耳の最小可聴レベルデータを取得する。最小可聴レベルの測定が終わったら、最大許容レベルを測定する。ユーザは各周波数ごとに上下ボタン52を押して大きいと感じるレベルにてOKボタン52を押す。これも左右について測定を行う。聴力測定部40はOKボタン52が押された最大のレベルを最大許容レベルデータとしてデータ入出力部70に送る。最小可聴レベルデータ及び最大許容レベルはメモリ80に保存される。ここで、ガイド音声の可変レベルをLg、最小可聴レベルをMin(i)dBFS(ただし、iは帯域ナンバー0(250Hz)〜6(8kHz))、最大許容レベルをMax(i)dBFS(ただし、iは帯域ナンバー0〜6)とする。   When the user hears a sound, the user presses the OK button 52 of the operation unit 50. The hearing measurement unit 40 sends the minimum level at which the OK button 52 is pressed to the data input / output unit 70 as minimum audible level data. Similarly, the hearing ability measuring unit 40 measures the minimum audible level of the right ear, and acquires the minimum audible level data of the right ear. When the minimum audible level is measured, the maximum allowable level is measured. The user presses the up / down button 52 for each frequency and presses the OK button 52 at a level that feels large. This is also measured on the left and right. The hearing measurement unit 40 sends the maximum level at which the OK button 52 is pressed to the data input / output unit 70 as maximum allowable level data. The minimum audible level data and the maximum allowable level are stored in the memory 80. Here, the variable level of the guide voice is Lg, the minimum audible level is Min (i) dBFS (where i is the band number 0 (250 Hz) to 6 (8 kHz)), and the maximum allowable level is Max (i) dBFS (where i is a band number 0 to 6).

音圧レベル増幅部66におけるダイナミックレンジ圧縮の入出力特性としては、図9に示すように、高音圧レベル領域R2の増幅が音圧レベルP3以下に抑えられるようなゲインカーブが使用される。この場合のパラメータは、聴力測定結果に基づいて図10のように設定される。図10中のRefmin(i)は健聴者の最小可聴レベル、Ref70phonは健聴者の70phonの等感曲線データをFSスケールに変換したもの(このシステムでは校正によって0dBFS=100dBSPL)、iは帯域ナンバーである。70phonという大きさは、健聴者にとって大きくもなく小さくもないちょうど良い大きさである。ガイド音声の音量調整は、ユーザにとってちょうど良いレベルに決定していることになる。図9に示すゲインカーブはP2以上の高音圧レベル領域R2では指数関数の特性を有する曲線となる。P2以上の入力信号では、P2からP2以上の所定の入力信号の音圧レベル(以下、入力音圧レベル)(dBSPL)までは、出力信号の音圧レベル(以下、出力音圧レベル)を圧縮することなく入力音圧レベルと同じレベルで提供するが、所定の入力音圧レベルを超えると入力音圧レベルが増大するに連れて出力音圧レベルがP3に限りなく近づくような指数関数曲線(漸近線がy=P3となるようなy=A、Aは正の数)に沿った増幅特性とする。つまり、ユーザは音圧レベルP3を最大許容レベルとしているため、それ以上の増幅はしないような特性とする。なお、より簡単な増幅特性として入力音圧レベルP2からP3までは出力音圧レベルを圧縮することなく提供し、P3以上の入力音圧レベルでは、出力音圧レベルを一定(P3)とする直線的な増幅特性を採用してもよい。 As the input / output characteristics of the dynamic range compression in the sound pressure level amplifier 66, as shown in FIG. 9, a gain curve is used so that the amplification in the high sound pressure level region R2 is suppressed to the sound pressure level P3 or less. The parameters in this case are set as shown in FIG. 10 based on the hearing measurement result. In FIG. 10, Refmin (i) is the minimum audible level of the normal hearing person, Ref 70 phon is a conversion of the 70 phon isosensitive curve data of the normal hearing person to the FS scale (in this system, 0 dBFS = 100 dBSPL by calibration), and i is the band number. is there. The size of 70 phon is just right for a normal hearing person, neither big nor small. The volume of the guide voice is adjusted to a level that is just right for the user. The gain curve shown in FIG. 9 is a curve having exponential characteristics in the high sound pressure level region R2 of P2 or higher. For input signals of P2 or higher, the sound pressure level of the output signal (hereinafter referred to as output sound pressure level) is compressed from P2 to the sound pressure level (hereinafter referred to as input sound pressure level) (hereinafter referred to as input sound pressure level) of P2 or higher. Without being performed, but is provided at the same level as the input sound pressure level, but when the input sound pressure level exceeds a predetermined input sound pressure level, the output sound pressure level approaches the P3 as much as possible as the input sound pressure level increases ( Amplification characteristics along y = A x where A is an asymptotic line and A is a positive number). That is, since the user sets the sound pressure level P3 to the maximum allowable level, the characteristic is set such that no further amplification is performed. As a simpler amplification characteristic, the input sound pressure levels P2 to P3 are provided without being compressed, and the input sound pressure level equal to or higher than P3 is a straight line that makes the output sound pressure level constant (P3). General amplification characteristics may be employed.

第1実施形態では、中間点Piを健聴者の最小可聴レベルRefに設定したが、入力音がマイク集音の場合、最小可聴レベルの音を増幅すると非常にうるさくなる。そこで本実施形態では、Piの初期値は静かな会話音(50dBSPL)を対象にしており、−50dBFSに設定している。   In the first embodiment, the intermediate point Pi is set to the minimum audible level Ref of the normal hearing person. However, when the input sound is the microphone sound collection, it becomes very noisy if the sound of the minimum audible level is amplified. Therefore, in this embodiment, the initial value of Pi is for a quiet conversation sound (50 dBSPL), and is set to −50 dBFS.

このような入出力特性が決定された後、あらかじめメモリ80に保存しておいたイヤホン20の周波数特性の逆特性をデータ入出力部70が読み出し、畳み込み部61が畳み込み処理を行う。この処理により、イヤホン固有の特性がキャンセルされるので、集音された音がユーザの聴力特性を考慮して補正され、忠実な音声信号が耳に届けられる。これにより、聴き取りやすく自然な定位感が感じられることになる。   After such input / output characteristics are determined, the data input / output unit 70 reads out the inverse characteristics of the frequency characteristics of the earphone 20 stored in the memory 80 in advance, and the convolution unit 61 performs convolution processing. By this process, the characteristic unique to the earphone is canceled, so that the collected sound is corrected in consideration of the hearing characteristic of the user, and a faithful audio signal is delivered to the ear. As a result, it is easy to hear and a natural orientation is felt.

なお、本音響信号処理装置100で測定したデータを別の音響機器でも利用できるように、データ入出力部70にUSB端子等を設けてデータのコピーを可能としてもよい。このようにすれば、マイク10や測定機能のないテレビやオーディオアンプなどの音響機器でも、再生信号処理さえ備わっていれば常にユーザの聴力特性に合わせた音響信号を提供することができる。   Note that the data input / output unit 70 may be provided with a USB terminal or the like so that the data measured by the acoustic signal processing apparatus 100 can be used in another acoustic device. In this way, even a sound device such as a microphone 10 or a television or an audio amplifier without a measurement function can always provide an acoustic signal that matches the hearing characteristics of the user as long as it has playback signal processing.

<第3実施形態>
ところで、従来の音響信号処理装置によると、集音器などのマイク収録音を対象とした場合はノイズが強調され、逆に聴きにくくなってしまっていた。そこで、本実施形態では、この問題を解決するために、以下の手法を採用している。
<Third Embodiment>
By the way, according to a conventional acoustic signal processing apparatus, when a microphone recording sound such as a sound collector is targeted, noise is emphasized, and conversely, it is difficult to hear. Therefore, in the present embodiment, the following method is adopted to solve this problem.

図11は、第3実施形態における音響信号処理装置100を示すブロック図である。この音響信号処理装置100は、ユーザの聴力特性に応じて信号処理する集音器等であって、マイク10と、イヤホン20と、聴力測定部40と、操作部50と、再生信号処理部60aと、データ入出力部70と、メモリ80と、騒音レベル分析部90とを備えている。マイク10は、その場の音を集音して分岐し、一方を騒音レベル分析部90に送り、他方を再生信号処理部60aに送る。騒音レベル分析部90は、いわゆる暗騒音(聴きたい音以外の音)の騒音レベルや、聴きたい音(ここでは話し相手の会話音)の騒音レベルを分析する。分析された結果は、騒音レベルデータとしてデータ入出力部70に送られ、メモリ80に保存される。再生信号処理部60aは、メモリ80に保存されている騒音レベルデータに応じて信号処理する。その他の処理部は、第1または第2実施形態と基本的に同じである。   FIG. 11 is a block diagram illustrating an acoustic signal processing device 100 according to the third embodiment. The acoustic signal processing device 100 is a sound collector or the like that performs signal processing according to the hearing characteristics of the user, and includes a microphone 10, an earphone 20, an audio measurement unit 40, an operation unit 50, and a reproduction signal processing unit 60a. A data input / output unit 70, a memory 80, and a noise level analysis unit 90. The microphone 10 collects the current sound and branches it, sends one to the noise level analysis unit 90, and sends the other to the reproduction signal processing unit 60a. The noise level analysis unit 90 analyzes the noise level of so-called background noise (a sound other than the sound to be heard) and the noise level of the sound to be heard (here, the conversational sound of the other party). The analyzed result is sent to the data input / output unit 70 as noise level data and stored in the memory 80. The reproduction signal processing unit 60 a performs signal processing according to the noise level data stored in the memory 80. Other processing units are basically the same as those in the first or second embodiment.

以下、本実施形態における音響信号処理装置100の構成をさらに詳細に説明する。まず、マイク10及びイヤホン20の校正が必要である。すなわち、マイク10については、音圧レベル100dBSPLが0dBFSとなるようマイクアンプが調整されている。また、0dBFSの信号が再生されたときのイヤホン出力音圧レベルを測定しておく。たとえば、250Hzから8kHzまでの純音を再生し、オクターブごとに測定する。この値がわかると、ユーザの最小可聴レベルを音圧レベルで知ることができる。この作業は工場出荷時に行えばよい。   Hereinafter, the configuration of the acoustic signal processing apparatus 100 in the present embodiment will be described in more detail. First, calibration of the microphone 10 and the earphone 20 is necessary. That is, for the microphone 10, the microphone amplifier is adjusted so that the sound pressure level 100 dBSPL is 0 dBFS. Further, the earphone output sound pressure level when the 0 dBFS signal is reproduced is measured in advance. For example, a pure tone from 250 Hz to 8 kHz is reproduced and measured every octave. If this value is known, the minimum audible level of the user can be known from the sound pressure level. This operation may be performed at the time of factory shipment.

ユーザは、音響信号処理装置100で自分の聴力を測定する。測定が開始されると、データ入出力部70は、操作方法を説明するガイドデータをメモリ80より読み出し、聴力測定部40に送る。このガイドデータは約−30dBFSのレベルであり、イヤホン20で聴くと70dBSPLで再生される。健聴者にとっては音量的に大きくもなく小さくもないごく普通のレベルであるが、難聴者は少し小さいと感じるかもしれない。ユーザは操作部50の上下ボタン51を押し、イヤホン20から出力されるガイドデータの音声レベルを可変することができる。ユーザは聴こえやすい音量になったら、操作部50のOKボタン52を押し、聴力測定部40はOKボタン52が押されると測定を始める。このときのガイドデータのレベル変量(70dBSPLからの)は聴力測定部40からデータ入出力部70に送られる。聴力測定部40は250Hzから8kHzまでオクターブごとに様々なレベルで音を提示し、ユーザは、聴こえたら操作部50のOKボタン52を押す。聴こえない場合は、OKボタン52は押されない。聴力測定部40がランダムに提示したレベルのうち、OKボタン52が押されたレベルの最小値がユーザの最小可聴レベルである。左耳の測定が終わったら右耳の測定を続けて行う。ここでは、測定時間を無駄に長くしないため、聴力測定部40は過去のデータを用いて2分木法で提示するレベルを決定している。すなわち、ある集団で最小可聴レベルを測定した結果を正規分布にのせ、中間値を第1提示、聴こえた場合はさらにレベルの小さい方の中間値を第2提示とする。一方で第1提示した値をユーザが聴きとれない場合は第1提示した値よりレベルの大きい方の中間値を第2提示とする。すると、早い人で3〜4回、母集団の端の人でも7〜8回の音の提示で一つの周波数の最小可聴レベルを決定することができる。最小可聴レベルが決定されると、聴力測定部40は測定データをデータ入出力部70に送る。   The user measures his / her hearing ability with the acoustic signal processing apparatus 100. When the measurement is started, the data input / output unit 70 reads guide data explaining the operation method from the memory 80 and sends the guide data to the hearing measurement unit 40. This guide data is at a level of about −30 dBFS, and when it is listened to by the earphone 20, it is reproduced at 70 dBSPL. Although it is a normal level that is neither loud nor small for a normal hearing person, a hearing-impaired person may feel that it is a little small. The user can change the sound level of the guide data output from the earphone 20 by pressing the up / down button 51 of the operation unit 50. When the volume is easy to hear, the user presses the OK button 52 of the operation unit 50, and the hearing measurement unit 40 starts measurement when the OK button 52 is pressed. The level variation (from 70 dBSPL) of the guide data at this time is sent from the hearing measurement unit 40 to the data input / output unit 70. The hearing measurement unit 40 presents sound at various levels from 250 Hz to 8 kHz for each octave, and the user presses the OK button 52 of the operation unit 50 when listening. If it cannot be heard, the OK button 52 is not pressed. Of the levels presented randomly by the hearing measurement unit 40, the minimum value of the level at which the OK button 52 is pressed is the minimum audible level of the user. When the left ear measurement is complete, continue with the right ear measurement. Here, in order not to unnecessarily lengthen the measurement time, the hearing measurement unit 40 determines the level to be presented by the binary tree method using past data. That is, the result of measuring the minimum audible level in a certain group is placed on a normal distribution, and if the intermediate value is presented as the first presentation and heard, the intermediate value with the lower level is designated as the second presentation. On the other hand, when the user cannot listen to the first presented value, the intermediate value having a higher level than the first presented value is set as the second presentation. Then, the minimum audible level of one frequency can be determined by presenting the sound 3 to 4 times for an early person and 7 to 8 times for the person at the end of the population. When the minimum audible level is determined, the hearing measurement unit 40 sends measurement data to the data input / output unit 70.

図12は、第3実施形態における再生信号処理部60aの詳細を示すブロック図である。帯域分割部65は、マイク10によって集音された音声信号を帯域分割する。音圧レベル増幅部66は、帯域ごとにダイナミックレンジ圧縮を行う。ダイナミックレンジ圧縮は人の聴力特性の高齢化に合わせたもので、小さい音は聴こえるレベルまで増幅し、大きい音は補充現象が起きるため、増幅率は徐々に落としていく。   FIG. 12 is a block diagram showing details of the reproduction signal processing unit 60a in the third embodiment. The band dividing unit 65 divides the audio signal collected by the microphone 10 into bands. The sound pressure level amplification unit 66 performs dynamic range compression for each band. Dynamic range compression is adapted to the aging of human hearing characteristics. Amplification is gradually reduced because small sounds are amplified to a level where they can be heard, and loud sounds are supplemented.

第1実施形態では、最小可聴レベルは聴こえるぎりぎりの音量であるので、健聴者の最小可聴レベルに対してその差分だけ振幅を増幅すればよいと考え、健聴者の最小可聴レベルRefとユーザの最小可聴レベルMinとの差を最大ゲインGaとした。しかしながら、実際に動作させると小さかった空調ノイズや暗騒音が非常に大きくなり、一番聴きたかった話し相手の声と暗騒音などが同等の音圧レベルとなるため、会話が聴き取りにくいことがわかった。そのためなるべく暗騒音は増幅せず、相手の会話音の音圧レベル付近を最大限に増幅するために、CDや放送などの音声信号とは異なるマイク音声ならではの設定方法が必要である。   In the first embodiment, since the minimum audible level is the barely audible volume, it is considered that it is sufficient to amplify the amplitude by the difference with respect to the minimum audible level of the normal hearing person, and the minimum audible level Ref of the normal hearing person and the minimum of the user The difference from the audible level Min was taken as the maximum gain Ga. However, when actually operated, the air conditioning noise and background noise, which were small, become very large, and the voice of the other party who wanted to hear the most and the background noise have the same sound pressure level. It was. Therefore, in order to amplify the vicinity of the sound pressure level of the other party's conversation sound as much as possible without amplifying the background noise, a setting method unique to the microphone sound different from the sound signal such as CD or broadcast is necessary.

そこで、本実施形態では、中間点PiとP1を決定するために、騒音レベル分析部90はマイク10から入力された信号を分析し、周波数帯域ごとに暗騒音の音圧レベルと会話音の音圧レベルを求める。騒音レベル分析部90は暗騒音であるか否かをピッチ抽出ができたかどうかで判断することができる。つまり、ピッチ抽出ができればその信号区間は会話音であり、ピッチ抽出ができなければその区間は暗騒音のみである。   Therefore, in the present embodiment, in order to determine the intermediate points Pi and P1, the noise level analysis unit 90 analyzes the signal input from the microphone 10, and the sound pressure level of background noise and the sound of conversational sound for each frequency band. Find the pressure level. The noise level analysis unit 90 can determine whether or not the noise is background noise based on whether or not the pitch has been extracted. That is, if the pitch can be extracted, the signal section is a conversational sound, and if the pitch cannot be extracted, the section is only background noise.

図13は、騒音レベル分析部90の動作を示すフローチャートである。騒音レベル分析部90は、フレーム処理を行っており、例えば1フレームはサンプリング周波数32kHzに対し、320サンプルである。この値は会話音声の振幅変動幅が10ミリ秒以下であることから決定したが、帯域毎に振幅の変動幅をみて決定しても良いし、暗騒音の特徴から決定しても良い。また本実施形態の騒音レベル分析部90では5フレーム毎の平均音圧レベルを求めてPiを決定しているが、平均を求めるためのフレーム数はこれに限ったものではなくその場の音の環境に応じて変更してよい。ここでは暗騒音と会話音の音圧レベルからPiを求めることが目的であるから、例えば朗読のような長い時間にわたって音声が続く場合は暗騒音のみの時間が少ないので、暗騒音部分が確実に確保できるように比較的大きなフレーム数にすると良い。   FIG. 13 is a flowchart showing the operation of the noise level analysis unit 90. The noise level analysis unit 90 performs frame processing. For example, one frame has 320 samples with respect to a sampling frequency of 32 kHz. This value is determined because the amplitude fluctuation width of the conversational voice is 10 milliseconds or less, but may be determined by looking at the amplitude fluctuation width for each band or may be determined from the characteristics of background noise. In addition, the noise level analysis unit 90 of this embodiment determines Pi by determining the average sound pressure level every five frames, but the number of frames for determining the average is not limited to this, and the sound of the sound on the spot is not limited. It may be changed according to the environment. Here, the purpose is to obtain Pi from the sound pressure level of the background noise and the conversation sound. For example, when the voice continues for a long time such as reading, the time for only the background noise is small. A relatively large number of frames is preferable so as to be secured.

騒音レベル分析部90は、まず初期化を行う(ステップS11)。Timeは平均を取った回数、Lnsum[j]、Lvsum[j]はそれぞれ、帯域番号jにおける暗騒音、会話音の音圧レベルの合計、Ln[j],Lv[j]は暗騒音、会話音の帯域番号jにおける1フレーム内の音圧レベルの合計、Lnave[j],Lvave[j]は帯域番号jの暗騒音、会話音の平均レベルである。   The noise level analysis unit 90 first performs initialization (step S11). Time is the averaged number of times, Lnsum [j], Lvsum [j] are the background noise in the band number j, and the total sound pressure level of the conversation sound, Ln [j], Lv [j] are the background noise, conversation The sum of the sound pressure levels in one frame in the sound band number j, Lnave [j], Lave [j] is the average level of background noise and conversational sound of band number j.

続くステップS12にてTimeを1加算し(例えばTime=0からTime=1となる)、Time(=1)フレーム目のピッチ抽出を行う(ステップS13)。ピッチ抽出ができた場合は(ステップS14:YES)、その区間を会話音とみなして帯域分割を行う(ステップS15)。次に、帯域jごとにフレームの会話音の音圧レベルLv[j]を求め(ステップS16)、Time(=1)フレームまでの会話音の平均レベルLvave[j]を求める(ステップS17)。   In subsequent step S12, 1 is added to Time (for example, from Time = 0 to Time = 1), and pitch extraction of the Time (= 1) frame is performed (step S13). If pitch extraction is possible (step S14: YES), the section is regarded as a conversation sound and band division is performed (step S15). Next, the sound pressure level Lv [j] of the conversational sound of the frame is obtained for each band j (step S16), and the average level Lvave [j] of the conversational sound up to the Time (= 1) frame is obtained (step S17).

一方、ステップS14でピッチ抽出ができなかった場合は(ステップS14:NO)、その区間を暗騒音とみなし、この場合も帯域分割を行う(ステップS18)。同じく帯域jごとにフレームの暗騒音の音圧レベルLn[j]を求め(ステップS19)、Time(=1)フレームまでの暗騒音の平均レベルLnave[j]を求める(ステップS20)。Timeが5の倍数であると判断すると(Time%5=0)(ステップS21:YES)暗騒音レベルと会話音レベルの平均をその帯域jの点Piとする(ステップS22)。このようなPiを変曲点Piに設定すると、ちょうど会話音レベルと暗騒音レベルの間に変曲点Piがくる。そのため、音量の小さい会話音はしっかりと増幅され、暗騒音は会話音に比べ小さい増幅率もしくは増幅率1として増幅されることになる。Timeが5の倍数でない場合は(ステップS21:NO)ステップS12に戻り、ステップS12にてTimeが1増加され、次のフレームのピッチ抽出に移る(ステップS13)。このようにして5回に一回の割合で点Piを更新していく。   On the other hand, when pitch extraction cannot be performed in step S14 (step S14: NO), the section is regarded as background noise, and also in this case, band division is performed (step S18). Similarly, the sound pressure level Ln [j] of the background noise of the frame is obtained for each band j (step S19), and the average level Lnave [j] of the background noise up to the Time (= 1) frame is obtained (step S20). If it is determined that Time is a multiple of 5 (Time% 5 = 0) (step S21: YES), the average of the background noise level and the conversational sound level is set as a point Pi of the band j (step S22). When such Pi is set as the inflection point Pi, the inflection point Pi is just between the conversation sound level and the background noise level. Therefore, the conversation sound with a low volume is firmly amplified, and the background noise is amplified with a smaller amplification factor or amplification factor 1 than the conversation sound. If Time is not a multiple of 5 (step S21: NO), the process returns to step S12, time is increased by 1 in step S12, and the process moves to pitch extraction for the next frame (step S13). In this way, the point Pi is updated at a rate of once every five times.

次に、P1の設定について説明する。先に変曲点Piは暗騒音の平均レベルと会話音の平均レベルの中間値に設定したから暗騒音は会話音に比べれば小さい増幅率になると述べた。しかし暗騒音が瞬間的に大きな音になった場合やダイナミックレンジが広い変動騒音の場合は、フレーム単位ごとに音が大きく増幅されたり増幅されなかったりするので断続ノイズのように聴こえてしまう。そこで、本実施形態では、中間点Piから緩やかな傾斜で低音圧レベル領域R1に達するレベル(Pi−15dB〜Pi−20dB程度)をP1に設定することとしている。点P1から中間点Piへの増幅が緩やかな増幅でない場合、処理フレーム毎に騒音の音量が大きすぎたり小さすぎたりするおそれがある。これは、増幅の変化がフレーム毎に激しくなり、騒音が連続的な音でなく断続的な音になるためである。点P1を中間点Piより15dB〜20dB程度小さい値に設定することで、騒音の増幅を極力おさえる(カットする)、あるいは騒音の増幅が生じてもその増幅率が小さいものにでき、各フレームで音量の変化を少なくできる効果が得られた。なお、20dB以上小さい値、例えば中間点Piから30dB小さい値(P1=Pi−30)とした場合、騒音そのものが増幅されてしまった。   Next, the setting of P1 will be described. The inflection point Pi was previously set to an intermediate value between the average level of background noise and the average level of conversation sound, so that background noise has a smaller amplification factor than that of conversation sound. However, when the background noise suddenly becomes louder or when the noise is fluctuating with a wide dynamic range, the sound is greatly amplified or not amplified every frame unit, so that it sounds like intermittent noise. Therefore, in the present embodiment, the level (about Pi-15 dB to Pi-20 dB) reaching the low sound pressure level region R1 with a gentle inclination from the intermediate point Pi is set to P1. If the amplification from the point P1 to the intermediate point Pi is not a gradual amplification, the noise volume may be too high or too low for each processing frame. This is because the change in amplification becomes intense from frame to frame, and the noise becomes intermittent rather than continuous. By setting the point P1 to a value about 15 dB to 20 dB smaller than the intermediate point Pi, noise amplification can be suppressed (cut) as much as possible, or even if noise amplification occurs, the amplification factor can be reduced. The effect of reducing the change in volume was obtained. Note that when the value is 20 dB or more, for example, 30 dB smaller than the intermediate point Pi (P1 = Pi-30), the noise itself is amplified.

騒音レベル分析部90は、このように帯域ごとに中間点Pi及びP1を計算し、データ入出力部70にこれらのデータを送る。データ入出力部70は、騒音レベル分析部90から受け取ったデータをメモリ80に保存する。再生信号処理部60aは、入力された音声信号を帯域分割部65で帯域分割し、データ入出力部70より受け取った帯域毎のP1,Pi,Ga,P2,P3を、音圧レベル増幅部66の各パラメータに設定し、これらのパラメータに特徴付けられたゲインカーブにしたがって音圧レベル増幅部66にて音圧が増幅された後、加算部67で各帯域が加算され、左右2チャンネルの信号に戻されてイヤホン20に出力される。   The noise level analysis unit 90 thus calculates the intermediate points Pi and P1 for each band, and sends these data to the data input / output unit 70. The data input / output unit 70 stores the data received from the noise level analysis unit 90 in the memory 80. The reproduction signal processing unit 60a divides the input audio signal by the band dividing unit 65, and the P1, Pi, Ga, P2, and P3 for each band received from the data input / output unit 70 are converted into the sound pressure level amplifying unit 66. The sound pressure level amplifying unit 66 amplifies the sound pressure in accordance with the gain curves characterized by these parameters, and then the adder 67 adds the bands to obtain the left and right two-channel signals. Is returned to the earphone 20.

以上のように、本実施形態によれば、ゲインカーブのパラメータを周囲の騒音レベル及び会話音レベルに応じて設定するようにしているので、増幅特性をより良く調整することができる。すなわち、なるべく暗騒音は増幅せず相手の会話音付近を最大限に増幅することができる。これにより、ユーザは聴き疲れしにくいので、長時間の聴取及び会話を十分に楽しむことが可能である。   As described above, according to the present embodiment, since the gain curve parameters are set according to the ambient noise level and the conversational sound level, the amplification characteristic can be adjusted better. That is, it is possible to amplify the vicinity of the conversational sound of the other party as much as possible without amplifying the background noise. Thereby, since the user is less tired of listening, it is possible to fully enjoy long-term listening and conversation.

最大ゲインGaの他の設定方法を図14を用いて説明する。第1実施形態では、ユーザの最小可聴レベルMinと健聴者の最小可聴レベルRefとの差を最大ゲインGaとしたが、以下の方法で最大ゲインGaを設定してもよい。   Another setting method of the maximum gain Ga will be described with reference to FIG. In the first embodiment, the difference between the minimum audible level Min of the user and the minimum audible level Ref of the normal hearing person is the maximum gain Ga, but the maximum gain Ga may be set by the following method.

一実施例として、所定の周波数帯域におけるユーザの最小可聴レベルMinが−40dBFS、健聴者の最小可聴レベルRefが−70dBFS、ユーザの最適聴取レベルBestが70dBSPLである場合、まず高音圧レベル領域R2の境界である点P2は−30dBFSに設定される。点P1については、第1実施形態と同様の値とした。次に、変曲点Piを上述した方法である会話音レベルと暗騒音レベルの平均レベルに設定する。本実施例では平均レベルは−65dBFSとする。続いて、ユーザの最小可聴レベルMinと健聴者の最小可聴レベルRefとを結んだ線分と、ユーザの最小可聴レベルMinと点P2(最適聴取レベルBest)とを結んだ線分とからなる仮特性線を設定し、仮特性線上から求められる会話音レベルと暗騒音レベルの平均レベルでの出力信号の値との差を、最大ゲインGaとする。すなわち、本実施例においては入力信号が−65dBFSの仮特性線上での出力信号は−38dBFSとなり、その差である27dBFSが最大ゲインGaとなる。   As an example, when the minimum audible level Min of the user in a predetermined frequency band is −40 dBFS, the minimum audible level Ref of the normal hearing person is −70 dBFS, and the optimum listening level of the user is 70 dBSPL, first, the high sound pressure level region R2 The boundary point P2 is set to −30 dBFS. The point P1 has the same value as in the first embodiment. Next, the inflection point Pi is set to the average level of the conversation sound level and the background noise level, which is the method described above. In this embodiment, the average level is −65 dBFS. Subsequently, a temporary segment consisting of a line segment connecting the minimum audible level Min of the user and the minimum audible level Ref of the normal hearing person, and a line segment connecting the minimum audible level Min of the user and the point P2 (optimum listening level Best). A characteristic line is set, and the difference between the value of the output signal at the average level of the conversational sound level and the background noise level obtained from the temporary characteristic line is defined as a maximum gain Ga. That is, in this embodiment, the output signal on the temporary characteristic line with the input signal of −65 dBFS becomes −38 dBFS, and the difference of 27 dBFS becomes the maximum gain Ga.

このように求めた各点、変曲点Pi(入力信号−65dBFS、出力信号−38dBFS)と点P2(入力信号、出力信号共に−30dBFS)と、点P1(入力信号、出力信号共に−90dBFS)とを結んだゲインカーブに基づいて出力信号の特性を調整してもよい。   Each point thus obtained, inflection point Pi (input signal -65 dBFS, output signal -38 dBFS) and point P2 (both input signal and output signal are -30 dBFS), and point P1 (both input signal and output signal are -90 dBFS). The characteristics of the output signal may be adjusted based on a gain curve that connects

1 出力端子
2 マイク入力端子
3 イヤホン接続端子
4 オーディオ入力端子
10 マイク
20 イヤホン
30 インパルス応答測定部
40 聴力測定部
50 操作部
60 再生信号処理部
61 畳み込み部
62 加算部
63 増幅器
64 加算器
65 帯域分割部
66 音圧レベル増幅部
67 加算部
70 データ入出力部
80 メモリ
90 騒音レベル分析部
DESCRIPTION OF SYMBOLS 1 Output terminal 2 Microphone input terminal 3 Earphone connection terminal 4 Audio input terminal 10 Microphone 20 Earphone 30 Impulse response measurement part 40 Auditory measurement part 50 Operation part 60 Playback signal processing part 61 Convolution part 62 Adder part 63 Amplifier 64 Adder 65 Band division Unit 66 sound pressure level amplification unit 67 addition unit 70 data input / output unit 80 memory 90 noise level analysis unit

Claims (4)

周囲の騒音レベルを分析する騒音レベル分析部と、
出力する音の音量を可変でき、前記音量の変化量に基づいてユーザの聴力特性を測定する聴力測定部と、
前記騒音レベルと前記聴力測定部により測定された聴力特性データとに応じて、入力信号の最小音圧レベルから最大音圧レベルまでの範囲における前記最小音圧レベルから所定の範囲の低音圧レベル領域と前記最大音圧レベルから所定の範囲の高音圧レベル領域とを除く中間音圧レベル領域で、前記低音圧レベル領域側から前記中間音圧レベル領域内の第1の音圧レベルまで順次大きくし、前記第1の音圧レベルから前記高音圧レベル領域側まで順次小さくする出力信号特性を生成し、前記出力信号特性に応じて信号処理を行う信号処理部と、
を備えることを特徴とする音響信号処理装置。
A noise level analyzer that analyzes the ambient noise level;
An audio measurement unit that can vary the volume of the sound to be output and measures the user's audio characteristics based on the amount of change in the volume;
A low sound pressure level region from the minimum sound pressure level to a predetermined range in the range from the minimum sound pressure level to the maximum sound pressure level of the input signal according to the noise level and the hearing characteristic data measured by the hearing measurement unit. And the intermediate sound pressure level region excluding the maximum sound pressure level and the high sound pressure level region within a predetermined range, and gradually increasing from the low sound pressure level region side to the first sound pressure level in the intermediate sound pressure level region. A signal processing unit that generates an output signal characteristic that sequentially decreases from the first sound pressure level to the high sound pressure level region side, and that performs signal processing according to the output signal characteristic;
An acoustic signal processing device comprising:
前記騒音レベル分析部は、周囲音に基づいてピッチ抽出を行い、前記ピッチが抽出された場合は、前記周囲音の音圧レベルを会話音の音圧レベルとして算出し、前記ピッチが抽出されない場合は、前記周囲音の音圧レベルを騒音の音圧レベルとして算出し、所定回数のピッチ抽出にて算出された前記会話音の音圧レベルと前記騒音の音圧レベルの平均値に基づいて前記第1の音圧レベルを設定する
ことを特徴とする請求項1記載の音響信号処理装置。
The noise level analysis unit performs pitch extraction based on the ambient sound, and when the pitch is extracted, calculates the sound pressure level of the ambient sound as the sound pressure level of the conversation sound, and the pitch is not extracted Calculates the sound pressure level of the ambient sound as the sound pressure level of the noise, and based on the average value of the sound pressure level of the conversation sound and the sound pressure level of the noise calculated by a predetermined number of pitch extraction The acoustic signal processing device according to claim 1, wherein the first sound pressure level is set.
前記聴力測定部は、ユーザの最適聴取レベルを測定し、
前記信号処理部は、前記最適聴取レベルに基づいて前記中間音圧レベル領域と前記高音圧レベル領域との変化点を設定することを特徴とする請求項1または2記載の音響信号処理装置。
The hearing measurement unit measures the optimum listening level of the user,
The acoustic signal processing device according to claim 1, wherein the signal processing unit sets a change point between the intermediate sound pressure level region and the high sound pressure level region based on the optimum listening level.
周囲の騒音レベルを分析する騒音レベル分析ステップと、
出力する音の音量を可変でき、前記音量の変化量に基づいてユーザの聴力特性を測定する聴力測定ステップと、
前記騒音レベルと前記聴力測定ステップで測定された聴力特性データとに応じて、入力信号の最小音圧レベルから最大音圧レベルまでの範囲における前記最小音圧レベルから所定の範囲の低音圧レベル領域と前記最大音圧レベルから所定の範囲の高音圧レベル領域とを除く中間音圧レベル領域で、前記低音圧レベル領域側から前記中間音圧レベル領域内の第1の音圧レベルまで順次大きくし、前記第1の音圧レベルから前記高音圧レベル領域側まで順次小さくする出力信号特性を生成し、前記出力信号特性に応じて信号処理を行う信号処理ステップと、
を備えることを特徴とする音響信号処理方法。
A noise level analysis step for analyzing the ambient noise level;
An audio measurement step that can vary the volume of the sound to be output and measures the user's audio characteristics based on the amount of change in the volume;
A low sound pressure level region from the minimum sound pressure level to a predetermined range in the range from the minimum sound pressure level to the maximum sound pressure level of the input signal according to the noise level and the hearing characteristic data measured in the hearing measurement step. And the intermediate sound pressure level region excluding the maximum sound pressure level and the high sound pressure level region within a predetermined range, and gradually increasing from the low sound pressure level region side to the first sound pressure level in the intermediate sound pressure level region. A signal processing step of generating an output signal characteristic that sequentially decreases from the first sound pressure level to the high sound pressure level region side, and performing signal processing according to the output signal characteristic;
An acoustic signal processing method comprising:
JP2011078552A 2011-03-31 2011-03-31 Acoustic signal processing apparatus and acoustic signal processing method Withdrawn JP2012213114A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011078552A JP2012213114A (en) 2011-03-31 2011-03-31 Acoustic signal processing apparatus and acoustic signal processing method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011078552A JP2012213114A (en) 2011-03-31 2011-03-31 Acoustic signal processing apparatus and acoustic signal processing method

Publications (1)

Publication Number Publication Date
JP2012213114A true JP2012213114A (en) 2012-11-01

Family

ID=47266708

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011078552A Withdrawn JP2012213114A (en) 2011-03-31 2011-03-31 Acoustic signal processing apparatus and acoustic signal processing method

Country Status (1)

Country Link
JP (1) JP2012213114A (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106131747A (en) * 2016-06-16 2016-11-16 广东欧珀移动通信有限公司 A kind of audio adding method and user terminal
CN111264030A (en) * 2017-10-16 2020-06-09 弗劳恩霍夫应用研究促进协会 Method for the adaptive setting of parameters for an audio signal
WO2024014267A1 (en) * 2022-07-13 2024-01-18 株式会社Jvcケンウッド Measurement device, measurement method, and program

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106131747A (en) * 2016-06-16 2016-11-16 广东欧珀移动通信有限公司 A kind of audio adding method and user terminal
CN111264030A (en) * 2017-10-16 2020-06-09 弗劳恩霍夫应用研究促进协会 Method for the adaptive setting of parameters for an audio signal
JP2020537470A (en) * 2017-10-16 2020-12-17 フラウンホファー ゲセルシャフト ツール フェールデルンク ダー アンゲヴァンテン フォルシュンク エー.ファオ. How to set parameters for personal application of audio signals
US11544034B2 (en) 2017-10-16 2023-01-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method for setting parameters for individual adaptation of an audio signal
JP7440415B2 (en) 2017-10-16 2024-02-28 フラウンホファー ゲセルシャフト ツール フェールデルンク ダー アンゲヴァンテン フォルシュンク エー.ファオ. Method for setting parameters for personal application of audio signals
CN111264030B (en) * 2017-10-16 2024-03-29 弗劳恩霍夫应用研究促进协会 Method for setting parameters for personal adaptation of an audio signal
WO2024014267A1 (en) * 2022-07-13 2024-01-18 株式会社Jvcケンウッド Measurement device, measurement method, and program

Similar Documents

Publication Publication Date Title
US7564979B2 (en) Listener specific audio reproduction system
US9943253B2 (en) System and method for improved audio perception
US8005246B2 (en) Hearing aid apparatus
KR100636213B1 (en) Method for compensating audio frequency characteristic in real-time and sound system thereof
JP2015529413A (en) Hearing aid with level and frequency dependent gain
US20090060209A1 (en) Audio-signal processing apparatus and method
JP2008527882A (en) Signal processing apparatus, sound system and method for amplifying sound level of sound signal depending on frequency
JP2012213114A (en) Acoustic signal processing apparatus and acoustic signal processing method
JP2005318521A (en) Amplifying device
JP5062055B2 (en) Audio signal processing apparatus and method
CN110313188A (en) The outer location processing method of the outer positioning treatment apparatus of head, head and the outer localization process program of head
CN110268722B (en) Filter generation device and filter generation method
JPH11261356A (en) Sound reproducing device
JP2012213113A (en) Acoustic signal processing apparatus and acoustic signal processing method
JP3981223B2 (en) Audio sound correction device
JP2005309212A (en) Sound field correcting device, method for controlling sound field correcting device, control program, and recording medium
JP6295988B2 (en) Sound field reproduction apparatus, sound field reproduction method, and sound field reproduction program
US20230114777A1 (en) Filter generation device and filter generation method
JP2021503863A (en) Live public addressing method in headsets that takes into account the auditory characteristics of the listener
CN112673648B (en) Processing device, processing method, reproduction method, and storage medium
US20230040821A1 (en) Processing device and processing method
JP2023047707A (en) Filter generation device and filter generation method
JP2023047706A (en) Filter generation device and filter generation method
JPH11103226A (en) Acoustic reproducing device
JP2017175442A (en) Music reproduction device, music reproduction method and music reproduction program

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20140603