JP2011186187A - Speech processor, speech processing method and speech processing program - Google Patents
Speech processor, speech processing method and speech processing program Download PDFInfo
- Publication number
- JP2011186187A JP2011186187A JP2010051360A JP2010051360A JP2011186187A JP 2011186187 A JP2011186187 A JP 2011186187A JP 2010051360 A JP2010051360 A JP 2010051360A JP 2010051360 A JP2010051360 A JP 2010051360A JP 2011186187 A JP2011186187 A JP 2011186187A
- Authority
- JP
- Japan
- Prior art keywords
- value
- sample
- digital audio
- audio signal
- correction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Abstract
Description
本発明は、デジタル音声信号を分析し、その分析結果に応じてデジタル音声信号を処理する音声処理装置、音声処理方法および音声処理プログラムに関する。 The present invention relates to a sound processing apparatus, a sound processing method, and a sound processing program for analyzing a digital sound signal and processing the digital sound signal according to the analysis result.
近年、音声符号化技術の進歩により、CD(Compact Disc)等に収録されている楽曲の音質を極力維持したままファイルサイズを小さくすることが可能となり、その結果として、メモリタイプのポータブルオーディオプレーヤに大量の楽曲を収録して携帯することが可能となった。 In recent years, due to advances in audio coding technology, it has become possible to reduce the file size while maintaining the sound quality of music recorded on CDs (Compact Discs) as much as possible. A large amount of music can be recorded and carried.
しかし、上述した音声符号化技術は、人間の聴覚特性を利用して通常聞き取れない高周波数帯域の音声信号をカットしたり、マスキング効果により聞き取れない音のデータを間引いたりしているため、デジタル化する前の原音と比較すると、音の伸び、広がり、ダイナミックレンジ、艶っぽさに乏しくなる。そのため、音声符号化技術により圧縮されたデジタル音声信号の音質を改善する技術が開発されている。 However, the above-described speech coding technology cuts out high-frequency band speech signals that are not normally audible using human auditory characteristics, or thins out unacceptable sound data due to the masking effect. Compared to the original sound before the sound, it will be less stretched, spread, dynamic range and glossy. Therefore, a technique for improving the sound quality of a digital audio signal compressed by an audio encoding technique has been developed.
例えば、本発明の発明者は、デジタル音声信号の極値のサンプルとその極値の直前のサンプルとの差分値に、極値間のサンプル数に応じた係数を乗算した値をデジタル音声信号に加算することで、所定周波数以上の高周波数成分をデジタル音声信号に付加する技術を提案した(例えば、特許文献1、2)。
For example, the inventor of the present invention sets a value obtained by multiplying a difference value between an extreme value sample of a digital audio signal and a sample immediately before the extreme value by a coefficient corresponding to the number of samples between the extreme values in the digital audio signal. A technique for adding a high-frequency component equal to or higher than a predetermined frequency to a digital audio signal by addition is proposed (for example,
上記の特許文献1、2の技術のように、高周波数成分を付加することにより音質を改善する音質改善処理は、CD規格を始め、MPEG(Moving Picture Expert Group)−2、AAC(登録商標)(Advanced Audio Coding)、ATRAC(登録商標)(Adaptive TRansform Acoustic Coding)、MP3(MPEG Audio Layer-3)、WMA(Windows(登録商標) Media Audio)等の規格に基づくデジタル音声信号に対して、エンコードおよびデコードを施す種々の場面で適応することができる。そのため、すでに音質改善処理が為されているデジタル音声信号に対して、音質改善処理が重複して施される場合が生じる。
The sound quality improvement processing for improving the sound quality by adding a high frequency component as in the techniques of
しかし、すでに音質改善処理が為されているデジタル音声信号に対して、音質改善処理が為されていない通常のデジタル音声信号と同等の音質改善処理を施すと、高周波数成分が過剰に付加され、再生される音の中高音域のバランス感が変わる等、原音から離れた音となってしまう。 However, if a sound quality improvement process equivalent to a normal digital sound signal that has not been subjected to sound quality improvement processing is applied to a digital sound signal that has already been subjected to sound quality improvement processing, an excessive amount of high frequency components will be added, For example, the balance of the mid- and high-frequency ranges of the reproduced sound changes, resulting in a sound that is far from the original sound.
本発明は、このような課題に鑑み、取得したデジタル音声信号に応じて適切に高周波数成分を付加することで、より原音に近いデジタル音声信号を生成可能な音声処理装置、音声処理方法および音声処理プログラムを提供することを目的としている。 In view of such a problem, the present invention provides a sound processing device, a sound processing method, and sound that can generate a digital sound signal closer to the original sound by appropriately adding a high frequency component according to the acquired digital sound signal. The purpose is to provide a processing program.
上記課題を解決するために、本発明の音声処理装置は、所定周波数以上かつ所定音圧以上の高周波数成分がデジタル音声信号に含まれているか否かを判断する信号分析部と、信号分析部がデジタル音声信号に高周波数成分が含まれていると判断したか否かに応じて異なる係数に基づき、デジタル音声信号の振幅を拡大するような補正値を生成する補正値生成部と、デジタル音声信号に補正値を加算する加算部と、を備えることを特徴とする。 In order to solve the above-described problems, a speech processing apparatus according to the present invention includes a signal analysis unit that determines whether or not a high-frequency component having a predetermined frequency or higher and a predetermined sound pressure or higher is included in a digital audio signal; A correction value generation unit that generates a correction value that expands the amplitude of the digital audio signal based on a coefficient that differs depending on whether or not the digital audio signal includes a high-frequency component, and digital audio And an addition unit for adding a correction value to the signal.
上記信号分析部は、デジタル音声信号の任意の極値から次の極値までのサンプル数が所定数より少なく、任意の極値および次の極値のうち、いずれか大きい方の極値である極大値と、任意の極値および次の極値のうち、いずれか小さい方の極値である極小値との差分である極値間差分値が所定値を超えている場合、デジタル音声信号に高周波数成分が含まれていると判断してもよい。 The signal analysis unit has a smaller number of samples from an arbitrary extreme value to the next extreme value of the digital audio signal than a predetermined number, and is the larger extreme value between the arbitrary extreme value and the next extreme value. If the difference value between the extreme values, which is the difference between the local maximum value and any local extreme value or the next local extreme value, whichever is the smaller extreme value, exceeds a predetermined value, the digital audio signal It may be determined that a high frequency component is included.
上記信号分析部は、デジタル音声信号の任意の極値から次の極値までのサンプル数が所定数より少ない複数のサンプル全体に対して、任意の極値および次の極値のうち、いずれか大きい方の極値である極大値と、任意の極値および次の極値のうち、いずれか小さい方の極値である極小値との差分である極値間差分値が所定値を超えているサンプルが占める占有率が所定比率を超えていると、デジタル音声信号に高周波数成分が含まれていると判断してもよい。 The signal analysis unit is configured to select any one of an extreme value and a next extreme value for a plurality of samples in which the number of samples from an arbitrary extreme value to the next extreme value of the digital audio signal is less than a predetermined number. The difference value between extreme values that is the difference between the maximum value that is the larger extreme value and the minimum value that is the smaller extreme value of any extreme value or the next extreme value exceeds the predetermined value. If the occupation ratio occupied by a certain sample exceeds a predetermined ratio, it may be determined that a high frequency component is included in the digital audio signal.
上記補正値生成部は、信号分析部がデジタル音声信号に高周波数成分が含まれていると判断した場合、信号分析部がデジタル音声信号に高周波数成分が含まれていないと判断した場合より小さい係数に基づいて補正値を生成してもよい。 The correction value generation unit is smaller than when the signal analysis unit determines that the digital audio signal does not include a high frequency component when the signal analysis unit determines that the digital audio signal includes a high frequency component. A correction value may be generated based on the coefficient.
上記補正値生成部は、デジタル音声信号のフォーマットに応じて異なる係数に基づき補正値を生成してもよい。 The correction value generation unit may generate a correction value based on different coefficients depending on the format of the digital audio signal.
上記信号分析部は、デジタル音声信号のフォーマットに基づいて所定数と所定値とを決定してもよい。 The signal analysis unit may determine a predetermined number and a predetermined value based on a format of the digital audio signal.
上記音声処理装置は、音声処理装置が取得したデジタル音声信号をアップサンプリングする第1変換部と、加算部が補正値を加算した後のデジタル音声信号を、第1変換部によってアップサンプリングされる前のサンプリング周波数へとダウンサンプリングする第2変換部と、をさらに備えてもよい。 The audio processing device includes a first conversion unit that upsamples a digital audio signal acquired by the audio processing device, and a digital audio signal after the addition unit adds a correction value before the first conversion unit upsamples the digital audio signal. And a second conversion unit that down-samples to the sampling frequency.
上記補正値生成部は、デジタル音声信号の極大値と、その極大値となったサンプルの1サンプル前のサンプルの値との差分である極大差分値に係数を乗算すると共に、デジタル音声信号の極小値と、その極小値となったサンプルの1サンプル前のサンプルの値との差分である極小差分値に係数を乗算することで補正値を生成し、極大差分値に基づいて生成した補正値が極大値に加算されるように極大値となったサンプルに対応付け、極小差分値に基づいて生成した補正値が極小値から減算されるように極小値となったサンプルに対応付けてもよい。 The correction value generation unit multiplies the maximum difference value, which is the difference between the maximum value of the digital audio signal and the value of the sample one sample before the sample having the maximum value, by the coefficient, and the minimum of the digital audio signal. A correction value is generated by multiplying the minimum difference value, which is the difference between the value and the value of the sample one sample before the sample that is the minimum value, by a coefficient, and the correction value generated based on the maximum difference value is The correction value generated based on the minimum difference value may be associated with the sample having the minimum value so that the correction value generated based on the minimum difference value is subtracted from the minimum value so as to be added to the maximum value.
上記補正値生成部は、デジタル音声信号の極大値の1サンプル前のサンプルおよび1サンプル後のサンプルそれぞれの値と極大値との差分それぞれに係数を乗算すると共に、デジタル音声信号の極小値の1サンプル前のサンプルおよび1サンプル後のサンプルそれぞれの値と極小値との差分それぞれに係数を乗算することで補正値を生成し、極大値の1サンプル前のサンプルの値と極大値との差分に基づいて生成した補正値が極大値の1サンプル前のサンプルの値に加算されるように極大値の1サンプル前のサンプルに対応付け、極大値の1サンプル後のサンプルの値と極大値との差分に基づいて生成した補正値が極大値の1サンプル後のサンプルの値に加算されるように極大値の1サンプル後のサンプルに対応付け、極小値の1サンプル前のサンプルの値と極小値との差分に基づいて生成した補正値が極小値の1サンプル前のサンプルの値から減算されるように極小値の1サンプル前のサンプルに対応付け、極小値の1サンプル後のサンプルの値と極小値との差分に基づいて生成した補正値が極小値の1サンプル後のサンプルの値から減算されるように極小値の1サンプル後のサンプルに対応付けてもよい。 The correction value generation unit multiplies the difference between the maximum value of the sample one sample before and one sample after the maximum value of the digital audio signal by the coefficient, and 1 of the minimum value of the digital audio signal. A correction value is generated by multiplying the difference between the value of each of the sample before the sample and the sample after one sample and the minimum value by a coefficient, and the difference between the value of the sample one sample before the maximum value and the maximum value is obtained. Corresponding to the sample one sample before the maximum value so that the correction value generated based on the sample value one sample before the maximum value is added, the value of the sample one sample after the maximum value and the maximum value The correction value generated based on the difference is associated with the sample after one sample of the maximum value so that it is added to the value of the sample after one sample of the maximum value, and one sample before the minimum value Corresponding to the sample one sample before the minimum value so that the correction value generated based on the difference between the sample value and the minimum value is subtracted from the value of the sample one sample before the minimum value, one sample of the minimum value The correction value generated based on the difference between the value of the subsequent sample and the minimum value may be associated with the sample after one sample of the minimum value so as to be subtracted from the value of the sample after one sample of the minimum value.
上記課題を解決するために、本発明の音声処理方法は、所定周波数以上かつ所定音圧以上の高周波数成分がデジタル音声信号に含まれているか否かを判断し、デジタル音声信号に高周波数成分が含まれているか否かに応じて異なる係数に基づき、デジタル音声信号の振幅を拡大するような補正値を生成し、デジタル音声信号に補正値を加算することを特徴とする。 In order to solve the above problems, the audio processing method of the present invention determines whether or not a high-frequency component having a predetermined frequency or higher and a predetermined sound pressure or higher is included in the digital audio signal, and the high-frequency component is included in the digital audio signal. A correction value that expands the amplitude of the digital audio signal is generated based on a coefficient that differs depending on whether or not the signal is included, and the correction value is added to the digital audio signal.
上記課題を解決するために、本発明の音声処理プログラムは、コンピュータに、所定周波数以上かつ所定音圧以上の高周波数成分がデジタル音声信号に含まれているか否かを判断するステップと、デジタル音声信号に高周波数成分が含まれているか否かに応じて異なる係数に基づき、デジタル音声信号の振幅を拡大するような補正値を生成するステップと、デジタル音声信号に補正値を加算するステップと、を実行させることを特徴とする。 In order to solve the above-described problem, the audio processing program of the present invention includes a step of determining whether a digital audio signal includes a high frequency component having a frequency equal to or higher than a predetermined frequency and higher than a predetermined sound pressure. Generating a correction value for enlarging the amplitude of the digital audio signal based on different coefficients depending on whether or not the signal contains a high frequency component; and adding the correction value to the digital audio signal; Is executed.
以上説明したように本発明によれば、取得したデジタル音声信号に応じて適切に高周波数成分を付加することで、より原音に近いデジタル音声信号を生成可能となる。 As described above, according to the present invention, it is possible to generate a digital audio signal closer to the original sound by appropriately adding a high frequency component according to the acquired digital audio signal.
以下に添付図面を参照しながら、本発明の好適な実施形態について詳細に説明する。かかる実施形態に示す寸法、材料、その他具体的な数値等は、発明の理解を容易とするための例示にすぎず、特に断る場合を除き、本発明を限定するものではない。なお、本明細書及び図面において、実質的に同一の機能、構成を有する要素については、同一の符号を付することにより重複説明を省略し、また本発明に直接関係のない要素は図示を省略する。 Hereinafter, preferred embodiments of the present invention will be described in detail with reference to the accompanying drawings. The dimensions, materials, and other specific numerical values shown in the embodiments are merely examples for facilitating the understanding of the invention, and do not limit the present invention unless otherwise specified. In the present specification and drawings, elements having substantially the same function and configuration are denoted by the same reference numerals, and redundant description is omitted, and elements not directly related to the present invention are not illustrated. To do.
(音声処理装置100)
図1は、音声処理装置100の利用状態を説明するための説明図である。音声処理装置100は、放送局102から放送波を通じて、コンテンツサーバ104から通信網106を通じて、または、記憶媒体108から直接、デジタル音声信号を取得し、そのデジタル音声信号に高周波数成分を付加することで、デジタル音声信号の音質を改善する。ユーザは、改善されたデジタル音声信号を、音声処理装置100から直接、または、ポータブルオーディオプレーヤや携帯電話といった再生装置110に転送して聴くことができる。
(Speech processor 100)
FIG. 1 is an explanatory diagram for explaining a usage state of the
また、コンテンツサーバ104が、音声処理装置100を有してもよく、その場合、コンテンツサーバ104の音声処理装置100によって高周波数成分が付加された音声信号は、通信網106を通じて、パーソナルコンピュータやポータブルオーディオプレーヤ、携帯電話といった再生装置110へ配信される。
In addition, the
また、ポータブルオーディオプレーヤ、携帯電話といった再生装置110が音声処理装置100を有してもよい。その場合、コンテンツサーバ104から通信網106を通じて配信されたデジタル音声信号は、ポータブルオーディオプレーヤ、携帯電話といった再生装置110の音声処理装置100によって、高周波数成分が付加されて再生される。
Further, the
音声処理装置100が音質改善することができるデジタル音声信号は、例えば、CDやDVD(Digital Versatile Disc)規格に基づいた音声信号、MPEG−2、AAC(登録商標)、HE−AAC、ATRAC(登録商標)、MP3、WMA等の音声符号化処理によって高周波数帯域がカットされた音声信号である。
Examples of digital audio signals that can be improved by the
通常、音声信号は、デジタル化する際に、サンプリング周波数の半分以下の周波数成分に制限されてしまう。さらに、デジタル化された音声信号(デジタル音声信号)は、通信網106を経由させる際、通信網106での通信負荷を軽減するため、圧縮処理が施される場合もある。そのため、デジタル音声信号、またはデジタル化されてさらに圧縮されたデジタル音声信号は、高周波数成分を有さず、原音の再現性に乏しくなる。そこで、高周波数成分を付加する音質改善処理を施す場合がある。なお、原音とはデジタル化される前の音声信号である。
Normally, when an audio signal is digitized, the audio signal is limited to a frequency component equal to or less than half the sampling frequency. Further, when the digitized audio signal (digital audio signal) passes through the
この音質改善処理は、原音に近づけるために、デジタル化後、または圧縮処理後に、高周波数成分を付加するだけではなく、例えば、圧縮処理で高周波数成分が損なわれることを予測し、圧縮処理後に適度な高周波数成分が含まれるように、予め、原音以上に高周波数成分を付加する場合も含む。 This sound quality improvement process not only adds high-frequency components after digitization or compression processing in order to approximate the original sound, but also predicts that high-frequency components will be damaged by compression processing, for example, after compression processing This includes the case where a high frequency component is added to the original sound in advance so that an appropriate high frequency component is included.
そのため、音声処理装置100が取得したデジタル音声信号は、音質改善処理が施されている場合も施されていない場合もあり得る。このような状況下で、音声処理装置100がデジタル音声信号に対して一律に高周波数成分を付加すると、デジタル音声信号にすでに高周波数成分が付加されている場合、高周波数成分が過剰に加えられることとなり、中高音域のバランス感が変わる等、原音から離れた音となってしまう。
Therefore, the digital audio signal acquired by the
本実施形態の音声処理装置100は、取得したデジタル音声信号に、すでに音質改善処理が施されているか否かに応じて適切に高周波数成分を付加するので、より原音に近いデジタル音声信号を生成することが可能となる。以下、音声処理装置100の詳細な構成を説明する。
The
図2は、音声処理装置100の全体構成を説明するための機能ブロック図である。音声処理装置100は、信号取得部120と、極値特定部122と、信号分析部124と、テーブル選択部126と、係数記憶部128と、補正値生成部130と、遅延部132と、加算部134と、信号出力部136と、第1変換部138と、第2変換部140とを含んで構成される。
FIG. 2 is a functional block diagram for explaining the overall configuration of the
本実施形態の音声処理装置100は、取得したデジタル音声信号に高周波数成分が含まれているか否かに応じて係数テーブルを選択する選択処理を行い、その後、その選択した係数テーブルを用いた補正処理を行う。以下、選択処理と補正処理とを順に説明する。
The
(選択処理)
選択処理において、まず、信号取得部120は、デジタル音声信号を取得する。そして、信号取得部120は、デジタル音声信号のヘッダ情報や、デジタル音声信号のCD、AAC(登録商標)、ATRAC(登録商標)、MP3等の規格に関する情報に基づいて、取得したデジタル音声信号の量子化ビット数やサンプリング周波数を特定する。ただし、CDプレーヤのように、入力されるデジタル音声信号が常に同様な形式のデジタル音声信号となる場合、信号取得部120は、量子化ビット数やサンプリング周波数を特定する機能を有していなくてもよい。
(Selection process)
In the selection process, first, the
第1変換部138は、信号取得部120が取得したデジタル音声信号をアップサンプリングして極値特定部122に出力する。なお、アップサンプリングすることは必須ではなく、第1変換部138を含まない構成としてもよい。
The
極値特定部122は、信号取得部120が取得したデジタル音声信号の極値である極大値と極小値とを特定する。具体的に、極値特定部122は、デジタル音声信号のサンプルの値(サンプルの音圧値)を順次比較し、サンプルの値が増加または増減無しから減少に転じた場合、減少に転じる直前のサンプルの値を極大値とし、サンプルの値が減少または増減無しから増加に転じた場合、増加に転じる直前のサンプルの値を極小値とする。そして、極値特定部122は、任意の極値からその次の極値までのサンプル数、すなわち、極大値から極小値までのサンプル数、または極小値から極大値までのサンプル数を計数する。このサンプル数から、デジタル音声信号における、そのサンプル数を計数した極値から次の極値までの部分に対応する周波数がわかる。
The extreme
図3は、任意の極値からその次の極値までのサンプル数と、その任意の極値とその次の極値を含む半周期のデジタル音声信号に対応する周波数との関係を説明するための説明図である。図3(a)はサンプリング周波数が44.1kHzの場合、図3(b)はサンプリング周波数が96kHzの場合を示す。図3(a)、(b)に示すように、任意の極値から次の極値までのサンプル数が少ない程、その半周期のデジタル音声信号は、波形の周期が短く、高い周波数帯域の信号であると言える。例えば、CD規格では、サンプリング周波数が44.1kHzであるため図3(a)に示す関係を用い、任意の極値から次の極値までのサンプル数が1であった場合、任意の極値とその次の極値を含む半周期のデジタル音声信号は11.025〜22.050kHzの周波数帯域に含まれる信号であり、任意の極値から次の極値までのサンプル数が2であった場合、任意の極値とその次の極値を含む半周期のデジタル音声信号は7.35〜11.025kHzの周波数帯域に含まれる信号である。 FIG. 3 illustrates the relationship between the number of samples from an arbitrary extreme value to the next extreme value, and the frequency corresponding to the half-period digital audio signal including the arbitrary extreme value and the next extreme value. It is explanatory drawing of. 3A shows a case where the sampling frequency is 44.1 kHz, and FIG. 3B shows a case where the sampling frequency is 96 kHz. As shown in FIGS. 3 (a) and 3 (b), the smaller the number of samples from any extreme value to the next extreme value, the shorter the half-cycle digital audio signal, the shorter the waveform period, and the higher the frequency band. It can be said that it is a signal. For example, in the CD standard, since the sampling frequency is 44.1 kHz, the relationship shown in FIG. 3A is used, and when the number of samples from one extreme value to the next extreme value is 1, any extreme value And a half-cycle digital audio signal including the next extreme value is a signal included in the frequency band of 11.0525 to 22.050 kHz, and the number of samples from any extreme value to the next extreme value is 2. In this case, a half-cycle digital audio signal including an arbitrary extreme value and the next extreme value is a signal included in the frequency band of 7.35 to 11.025 kHz.
信号分析部124は、例えば、信号取得部120がデジタル音声信号を取得し始めてから所定期間分のデジタル音声信号について、所定周波数以上かつ所定音圧以上の高周波数成分がデジタル音声信号に含まれているか否かを判断する。所定期間は、予め設定された期間でもよいし、デジタル音声信号が楽曲等所定の時間単位で区切ることが可能な音声信号であれば、その楽曲1曲分の期間であってもよい。デジタル音声信号には、AD変換時や伝送時に生じる雑音信号が含まれる場合があり、この雑音信号にも所定周波数以上の周波数成分が含まれる。この雑音信号は音圧が低いため、本実施形態では、高周波数成分を所定周波数以上かつ所定音圧以上の周波数成分として雑音信号と区別する。所定音圧は、例えば、雑音信号の平均音圧と、雑音信号を除いたデジタル音声信号の高周波数成分の平均音圧との中間の音圧としたり、雑音信号の平均音圧の所定倍の音圧としたりする。
The
具体的に、信号分析部124は、極値特定部122が計数した、デジタル音声信号の任意の極値から次の極値までのサンプル数が所定数(以下、サンプル数閾値と称する)より少なく、任意の極値および次の極値のうち、いずれか大きい方の極値である極大値のレベルと、任意の極値および次の極値のうち、いずれか小さい方の極値である極小値のレベルとの差分(任意の極値と次の極値との差分、または、次の極値と任意の極値との差分)である極値間差分値が所定値(以下、極値レベル閾値と称する)を超えている場合、デジタル音声信号に高周波数成分が含まれていると判断する。
Specifically, the
なお、サンプル数閾値は、任意の極値とその次の極値を含む半周期のデジタル音声信号が所定周波数以上の音声信号であるか否かを判定するための閾値であり、取得されるデジタル音声信号の規格やサンプリング周波数等で決定される。CDプレーヤのように取得されるデジタル音声信号が常に同様なサンプリング周波数のデジタル音声信号であれば、サンプル数閾値は常に同じ値でよい。パーソナルコンピュータのように様々なサンプリング周波数や様々な規格のデジタル音声信号が取得される場合、信号分析部124は、サンプリング周波数や規格に応じて、サンプル数閾値を設定する。具体的に、信号分析部124は、ヘッダ情報や規格に関する情報に基づいて、取得したデジタル音声信号のサンプリング周波数を検出し、そのサンプリング周波数において含まれる周波数成分よりも高い周波数成分が対応するサンプル数をサンプル数閾値とする。
The sample number threshold is a threshold for determining whether or not a half-cycle digital audio signal including an arbitrary extreme value and the next extreme value is an audio signal having a predetermined frequency or higher, and is acquired digitally. It is determined by the audio signal standard, sampling frequency, and the like. If the digital audio signal acquired like a CD player is always a digital audio signal having the same sampling frequency, the sample number threshold may always be the same value. When digital audio signals with various sampling frequencies and various standards are acquired as in a personal computer, the
また、極値レベル閾値は、任意の極値とその次の極値を含む半周期のデジタル音声信号が所定音圧以上であるか否かを判定するための閾値であり、雑音信号の影響を排除するための閾値である。 The extreme level threshold is a threshold for determining whether or not a half-cycle digital audio signal including an arbitrary extreme value and the next extreme value is equal to or higher than a predetermined sound pressure. This is a threshold value for exclusion.
図4は、信号分析部124の処理を説明するための説明図である。図4(a)は、音質改善処理が施されたデジタル音声信号150の周波数スペクトルと音質改善処理が施されていないデジタル音声信号152の周波数スペクトルとを重ね合わせて示し、図4(b)は、音質改善処理が施されたデジタル音声信号150の周波数スペクトルのみを、図4(c)は、音質改善処理が施されていないデジタル音声信号152の周波数スペクトルのみを示している。
FIG. 4 is an explanatory diagram for explaining the processing of the
図4(a)に示すように、音質改善処理が施されたデジタル音声信号150は、音質改善処理が施されていないデジタル音声信号152には含まれていない高周波数成分(図4(a)にハッチングで示す)が含まれている。
As shown in FIG. 4A, the
そのため、例えば周波数f1以上の範囲(実質的に周波数f1〜f2の範囲)の周波数成分154が所定音圧以上の音圧であった場合に、図4(c)に示すデジタル信号152の周波数成分ではなく、図4(b)に示す音質改善処理が施されたデジタル音声信号150にしか含まれない高周波数成分であると判断できる。言い換えると、デジタル音声信号の任意の極値から次の極値までのサンプル数がサンプル数閾値より少なく、その任意の極値から次の極値の差分である極値間差分値が極値レベル閾値を超えている場合、そのデジタル音声信号は、音質改善処理が施されていなければ含まれないはずの周波数成分を有しており、過去に音質改善処理が施されたデジタル音声信号であると判断できる。
Therefore, for example, when the
ここで、信号分析部124は、デジタル音声信号の任意の極値から次の極値までのサンプル数がサンプル数閾値より少なく、極値間差分値が極値レベル閾値を超えるサンプルが所定期間分のデジタル音声信号に1つでも含まれると、高周波数成分が含まれ、音質改善処理が施されたデジタル音声信号であると判断する。しかし、かかる場合に限定されず、信号分析部124は、例えば、そのようなサンプルの数が、所定閾値を超えていると、そのデジタル音声信号は高周波数成分が含まれ、音質改善処理が施されたデジタル音声信号であると判断してもよい。
Here, the
任意の極値から次の極値までのサンプル数がサンプル数閾値より少なく極値間差分値が極値レベル閾値を超えている場合、信号分析部124は、デジタル音声信号に所定周波数以上かつ所定音圧以上の高周波数成分が含まれていると判断する。信号分析部124は、取得されたデジタル音声信号に高周波数成分が含まれているか否かを、周波数帯域を特定するためのサンプル数閾値と任意の極値から次の極値までのサンプル数との比較と、その高周波数成分が雑音信号であるか否かを識別するための極値間差分値と極値レベル閾値との比較という簡易な処理で判断するので、音声処理装置100は、処理負荷の増大を抑制しつつ音質改善処理を遂行することが可能となる。
When the number of samples from any extreme value to the next extreme value is less than the sample number threshold value and the difference value between extreme values exceeds the extreme value level threshold value, the
また、信号分析部124が極値間差分値と極値レベル閾値とを比較する構成により、信号分析部124が、デジタル音声信号にまだ音質改善処理が施されていないにもかかわらず、雑音信号等の影響によって、音質改善処理が施されていると誤判断してしまう事態を回避できる。
Further, the
次に、デジタル音声信号がすでに音質改善処理されたデジタル音声信号であるか否かを判断する方法の他の例について説明する。この例において、信号分析部124は、例えば、信号取得部120が所定期間に取得したデジタル音声信号について、任意の極値から次の極値までのサンプル数がサンプル数閾値より少ない複数のサンプル全体に対して、極値間差分値が極値レベル閾値を超えているサンプルが占める占有率が所定比率を超えていると、デジタル音声信号に高周波数成分が含まれていると判断する。ここで占有率は、サンプル数がサンプル数閾値より少ない複数のサンプルの総数に対する、極値間差分値が極値レベル閾値を超えているサンプルの数の比率をいう。
Next, another example of a method for determining whether or not a digital audio signal is a digital audio signal that has already undergone sound quality improvement processing will be described. In this example, the
図5は、信号分析部124が行う、占有率が所定比率を超えているか否かに応じて、デジタル音声信号に高周波数成分が含まれているか否かを判断する処理を説明するための説明図である。図4(a)と同様に、図5(a)は、音質改善処理が施されたデジタル音声信号156の周波数スペクトルと音質改善処理が施されていないデジタル音声信号158の周波数スペクトルとを重ね合わせて示し、図5(b)は、音質改善処理が施されたデジタル音声信号156の周波数スペクトルのみを、図5(c)は、音質改善処理が施されていないデジタル音声信号158の周波数スペクトルのみを示している。
FIG. 5 is a diagram for explaining processing performed by the
図5(a)においても、音質改善処理が施されたデジタル音声信号の周波数スペクトル156は、音質改善処理が施されていない周波数スペクトル158には含まれていない高周波数成分(図5(a)にハッチングで示す)が含まれている。しかし、その音質改善処理による高周波数成分の周波数帯域が判定基準となる周波数帯域(周波数f3〜f4)より狭く、任意の極値から次の極値までのサンプル数で特定できる周波数f3〜f4の範囲に音質改善処理による高周波数成分と、音質改善処理による高周波数成分以外の周波数成分とが包含される場合に、図4を用いて説明した極値レベル閾値と比較するのみの処理では、音質改善処理が施されているか否かを判断できない場合がある。なお、以下の図5に関する説明において、デジタル音声信号のサンプリング周波数を44.1kHz、周波数f3〜f4の範囲を11.025kHz〜22.050kHzとする。また、サンプル数閾値を2とする。
Also in FIG. 5A, the
図5に示すように、ある極値とその次の極値を含む半周期のデジタル音声信号が示す周波数成分160が、図5(b)における音質改善処理が施されたデジタル音声信号の周波数スペクトル156にも図5(c)における音質改善処理が施されていない周波数スペクトル158にも含まれる場合、そのデジタル音声信号が周波数f3〜f4の範囲に含まれる周波数成分を有することのみをもって、すでに音質改善処理が施されているか否かを判断できない。つまり、任意の極値から次の極値までのサンプル数がサンプル数閾値よりも少ない「1」であっても、その極値と次の極値までのサンプルを含む半周期のデジタル音声信号が有する周波数成分が11.025kHz〜22.050kHzの範囲の周波数成分であることしか特定することができず、その半周期のデジタル音声信号の周波数成分が、音質改善処理によって付加されたものであるか否かを判断することができない。
As shown in FIG. 5, a
そこで、信号分析部124は、任意の極値から次の極値までのサンプル数がサンプル数閾値より少ない複数のサンプル、すなわち、周波数f3以上の範囲(実質的に周波数f3〜f4の範囲)に含まれる複数のサンプルについて、極値間差分値が極値レベル閾値を超えているか否かを判断する。そして、信号分析部124は、例えば所定期間における、任意の極値から次の極値までのサンプル数がサンプル数閾値より少ないサンプル全体に対して、極値間差分値が極値レベル閾値を超えているサンプルが占める占有率を導出する。具体的には、信号分析部124は、任意の極値から次の極値までのサンプル数が2より少ない半周期のデジタル音声信号のうち、極値間差分値が極値レベル閾値を超えている半周期のデジタル音声信号の占有率を導出する。
Therefore, the
図5(b)、(c)のクロスハッチングで示す領域を比較してわかるように、任意の極値から次の極値までのサンプル数がサンプル数閾値より少ない周波数f3〜f4の周波数成分において、極値間差分値が極値レベル閾値を超えている比率は、図5(b)に示す、音質改善処理による高周波数成分を含むデジタル音声信号の場合の方が高くなる。そのため、信号分析部124は、極値間差分値が極値レベル閾値を超えているサンプルの占有率を予め設定した所定比率(例えば50%)と比較することで、デジタル音声信号にすでに音質改善処理が施されているか否かを判断する。
As can be seen by comparing the areas indicated by cross-hatching in FIGS. 5B and 5C, in the frequency components of the frequencies f3 to f4 where the number of samples from any extreme value to the next extreme value is less than the sample number threshold. The ratio at which the difference value between extreme values exceeds the extreme value level threshold is higher in the case of a digital audio signal including a high frequency component by sound quality improvement processing shown in FIG. Therefore, the
このように、デジタル音声信号のサンプリング周波数と、高周波数成分の周波数帯域との組み合わせよっては、ある半周期のデジタル音声信号に高周波数成分が含まれているか否かを、その半周期のサンプルで判断できない場合であっても、本実施形態の信号分析部124は、複数の周期に跨ってサンプルを分析することで、その複数の周期のデジタル音声信号に、すでに音質改善処理が施されているか否かを確実に判断できる。
Thus, depending on the combination of the sampling frequency of the digital audio signal and the frequency band of the high frequency component, whether or not the high frequency component is included in the digital audio signal of a certain half cycle can be determined by the sample of the half cycle. Even if it cannot be determined, the
次に、信号分析部124が、デジタル音声信号のフォーマットに基づいてサンプル数閾値と極値レベル閾値とを決定する手段について説明する。
Next, a description will be given of a means for the
図6は、デジタル音声信号のフォーマットと、サンプル数閾値および極値レベル閾値との関係の一例を示す説明図である。図6に示すように、信号分析部124は、デジタル音声信号のフォーマット(例えば、AAC(登録商標)、HE−AAC、MP3)と、ビットレートによって、任意の極値から次の極値までのサンプル数閾値と、極値レベル閾値とを決定する。図6において、極値レベル閾値は、その極値レベル閾値に相当する音圧がAD変換された場合に、AD変換の量子化単位であるLSB(Least Significant Bit)の何倍(例えば128)となるかで示している。
FIG. 6 is an explanatory diagram showing an example of the relationship between the format of the digital audio signal, the sample number threshold value, and the extreme value level threshold value. As shown in FIG. 6, the
図6に示すように、デジタル音声信号のフォーマットによって、デジタル化や圧縮処理等で除去されてしまう周波数帯域が定まり、音質改善処理によって付加されている可能性がある周波数帯域が定まる。したがって、デジタル音声信号のフォーマットおよびビットレートが定まれば、サンプリング周波数と任意の極値から次の極値までのサンプル数とに基づいてデジタル音声信号の周波数が導出される。また、デジタル音声信号に含まれる雑音信号の音圧レベルも、量子化ビット数やビットレート等によって定められる。そのため、信号分析部124は、サンプル数閾値と極値レベル閾値とを、フォーマットに基づいて決定することで、音質改善処理がすでに施されているか否かを確実に判断できる。
As shown in FIG. 6, the frequency band that is removed by digitization or compression processing is determined by the format of the digital audio signal, and the frequency band that may be added by the sound quality improvement processing is determined. Therefore, if the format and bit rate of the digital audio signal are determined, the frequency of the digital audio signal is derived based on the sampling frequency and the number of samples from an arbitrary extreme value to the next extreme value. The sound pressure level of the noise signal included in the digital audio signal is also determined by the number of quantization bits, the bit rate, and the like. Therefore, the
テーブル選択部126は、信号分析部124がデジタル音声信号に高周波数成分が含まれていると判断したか否かに応じて、係数を選択するための複数の係数テーブルのうち1の係数テーブルを選択する。このとき、テーブル選択部126は、デジタル音声信号に高周波数成分が含まれている場合、デジタル音声信号に高周波数成分が含まれていない場合より小さい係数が含まれる係数テーブルを選択する。後述する補正値生成部130は、この係数テーブルに含まれる係数に基づいて補正値を生成する。
The
デジタル音声信号に高周波数成分が含まれている場合、すでに音質改善処理が施されていると判断できる。テーブル選択部126は、音質改善処理が施されたデジタル音声信号には、より小さい係数が含まれる係数テーブルを選択することで補正量を抑制し、過剰な音質改善処理を確実に回避する。
If the digital audio signal contains high frequency components, it can be determined that the sound quality improvement processing has already been performed. The
係数記憶部128は、RAM(Random Access Memory)、EEPROM、不揮発性RAM、フラッシュメモリ、HDD(Hard Disk Drive)等で構成され、第1係数テーブル群と第2係数テーブル群とが予め記憶されている。
The
図7は、係数テーブル群および係数テーブルを説明するための説明図である。図7(a)、(b)に示すように、係数テーブル群(第1係数テーブル群166、第2係数テーブル群168)には、第1係数テーブル群166に係数テーブルAの係数、係数テーブルBの係数、・・・、第2係数テーブル群168に係数テーブルA’の係数、係数テーブルB’の係数、・・・の列でそれぞれ示すように、例えばデジタル音声信号のフォーマット(規格)毎に、サンプル数に応じた係数が設定されている。ここでは、理解を容易にするため、係数テーブルA、B、A’、B’、・・・の係数を係数テーブル群の列で示しているが、より詳細には、係数テーブルA、B、A’、B’、・・・それぞれにおいて、サンプル数と係数とが1対1に対応付けられている。 FIG. 7 is an explanatory diagram for explaining a coefficient table group and a coefficient table. As shown in FIGS. 7A and 7B, the coefficient table group (the first coefficient table group 166 and the second coefficient table group 168) includes the coefficient of the coefficient table A and the coefficient table in the first coefficient table group 166. B coefficient,..., For example, for each format (standard) of the digital audio signal, as shown in the second coefficient table group 168 by the columns of the coefficient table A ′, the coefficient table B ′ coefficient,. In addition, a coefficient corresponding to the number of samples is set. Here, for ease of understanding, the coefficients of the coefficient tables A, B, A ′, B ′,... Are shown in columns of the coefficient table group, but more specifically, the coefficient tables A, B, In each of A ′, B ′,..., The number of samples and the coefficient are associated one-to-one.
また、図7(a)に示す第1係数テーブル群166は、音質改善処理が施されていないデジタル音声信号に対して、図7(b)に示す第2係数テーブル群168は、音質改善処理が施されたデジタル音声信号に対して用いられる。本実施形態においては、第2係数テーブル群168の係数テーブル(係数テーブルA’、係数テーブルB’、・・・)の係数は、第1係数テーブル群166の対応するそれぞれの係数テーブル(係数テーブルA、係数テーブルB、・・・)の係数と異なり、ここでは第1係数テーブル群166の対応するそれぞれの係数テーブル(係数テーブルA、係数テーブルB、・・・)の係数の1/2の値となっている。係数テーブルAおよび係数テーブルA´は、取得したデジタル音声信号のサンプリング周波数が例えば44.1kHzの場合に用いる係数テーブルであり、係数テーブルBおよび係数テーブルB´は、例えば、取得したデジタル音声信号のサンプリング周波数が例えば96kHzの場合に用いる係数テーブルである。図7に示すように同じサンプリング周波数のデジタル音声信号に対しても、音質改善処理がすでに施されているか否かに応じて、係数テーブルを異ならせている。 Further, the first coefficient table group 166 shown in FIG. 7A is a digital sound signal that has not been subjected to the sound quality improvement process, and the second coefficient table group 168 shown in FIG. This is used for digital audio signals subjected to. In the present embodiment, the coefficients of the coefficient tables (coefficient table A ′, coefficient table B ′,...) Of the second coefficient table group 168 are the corresponding coefficient tables (coefficient tables) of the first coefficient table group 166. Unlike the coefficients of A, coefficient table B,..., Here, half of the coefficients of the corresponding coefficient tables (coefficient table A, coefficient table B,...) Of the first coefficient table group 166 are used. It is a value. The coefficient table A and the coefficient table A ′ are coefficient tables used when the sampling frequency of the acquired digital audio signal is, for example, 44.1 kHz. The coefficient table B and the coefficient table B ′ are, for example, the acquired digital audio signal. It is a coefficient table used when a sampling frequency is 96 kHz, for example. As shown in FIG. 7, the coefficient tables are made different depending on whether or not the sound quality improvement processing has already been performed for digital audio signals having the same sampling frequency.
また、第1係数テーブル群166と第2係数テーブル群168とを1つのテーブルにまとめ、例えば、テーブルに、音質改善処理を施すか否かに対応した識別情報の項目(列)を付加しておき、テーブル選択部126は、デジタル音声信号のフォーマットに加え、識別情報に基づいて係数テーブルを選択してもよい。
Also, the first coefficient table group 166 and the second coefficient table group 168 are combined into one table, and for example, an identification information item (column) corresponding to whether or not sound quality improvement processing is performed is added to the table. The
テーブル選択部126は、まず、第1係数テーブル群166と第2係数テーブル群168のうち、デジタル音声信号に高周波数成分が含まれているか否かに応じて1の係数テーブル群を選択し、さらに、選択された1の係数テーブル群を用いて、デジタル音声信号のフォーマットに対応した1の係数テーブルを選択する。後述する補正値生成部130は、テーブル選択部126が選択した係数テーブルを用いて補正値を生成する。
The
ここで、図7(a)、(b)の第1係数テーブル群166の係数テーブルA、B、第2係数テーブル群168の係数テーブルA´、B´において、サンプル数が多いほど係数の値が小さいのは以下の理由からである。すなわち、任意の極値から次の極値までのサンプル数が多い場合、そのデジタル音声信号の周波数は低い。そのため、例えば、すでに22.1kHzの低域通過フィルタ(LPF:Low Pass Filter)でフィルタリングが施されていても、その低周波数の周波数成分の高調波は抑制されずに残っている。したがって、大きな高周波数成分を付加しなくとも十分に高音質を維持できるので、係数は小さくて済む。 Here, in the coefficient tables A and B of the first coefficient table group 166 and the coefficient tables A ′ and B ′ of the second coefficient table group 168 in FIGS. 7A and 7B, the coefficient value increases as the number of samples increases. Is small for the following reasons. That is, when the number of samples from an arbitrary extreme value to the next extreme value is large, the frequency of the digital audio signal is low. Therefore, for example, even if filtering has already been performed with a 22.1 kHz low-pass filter (LPF), the harmonics of the low-frequency frequency components remain without being suppressed. Therefore, a sufficiently high sound quality can be maintained without adding a large high-frequency component, and the coefficient can be small.
一方、任意の極値から次の極値までのサンプル数が少ない場合、そのデジタル音声信号の周波数は高い。そのため、例えば、すでに22.1kHzの低域通過フィルタでフィルタリングが施されていると、その高周波数の周波数成分の高調波はほとんど削減されている。したがって、高周波数成分を十分に付加しないと音質の改善を図ることができないので、係数は大きい必要がある。 On the other hand, when the number of samples from any extreme value to the next extreme value is small, the frequency of the digital audio signal is high. Therefore, for example, if filtering has already been performed with a 22.1 kHz low-pass filter, the harmonics of the high-frequency frequency components are almost reduced. Therefore, the sound quality cannot be improved unless sufficient high-frequency components are added, so the coefficient needs to be large.
そこで、テーブル選択部126は、任意の極値から次の極値までのサンプル数に応じて係数が関連付けられた第1係数テーブル群166の係数テーブルA、Bと第2係数テーブル群168の係数テーブルA´、B´とを用い、サンプル数に応じて適切な補正量となるように係数テーブルを選択する。
Therefore, the
このように、テーブル選択部126は、デジタル音声信号に音質改善処理がすでに施されている場合、まだ施されていない場合に用いる第1係数テーブル群166よりも全体的に小さい値の係数を関連付けた係数テーブルを含む第2係数テーブル群168を選択し、その係数テーブル群の中からさらに1の係数テーブルを選択する。かかる構成により、音声処理装置100は、デジタル音声信号の周波数帯域と、音質改善処理がすでに施されているか否かに合わせて、適切な補正を施すことができる。
As described above, the
上述した選択処理によって、高周波数成分が含まれているか否かに応じた適切な係数テーブルが選択される。続いて、音声処理装置100は、その選択された係数テーブルを用いて補正処理を行う。補正処理においては、信号取得部120がデジタル音声信号を再度取得し直し、第1変換部138および極値特定部122の処理が行われる。また、信号取得部120は、デジタル音声信号を再度取得し直さず、図示しないバッファ部にデジタル音声信号を一時的に保持しておいてもよい。信号取得部120から極値特定部122までの処理は、第1変換部138がアップサンプリングしたデジタル音声信号を遅延部132にも出力する点を除いて、選択処理と実質的に等しいため説明は省略し、補正値生成部130の処理から、補正処理を説明する。
By the selection process described above, an appropriate coefficient table is selected according to whether or not a high frequency component is included. Subsequently, the
(補正処理)
補正処理において、補正値生成部130は、デジタル音声信号の振幅が拡大されるような補正値を係数テーブルから選択した係数に応じて生成する。具体的に、補正値生成部130は、デジタル音声信号の極大値と、その極大値となったサンプル(以下、極大値サンプルと称する)の1サンプル前のサンプルの値との差分である極大差分値に、テーブル選択部126が選択した係数テーブルにおけるサンプル数に応じた係数を乗算することでその極大値のサンプルに加算する補正値を生成すると共に、デジタル音声信号の極小値と、その極小値となったサンプル(以下、極小値サンプルと称する)の1サンプル前のサンプルの値との差分である極小差分値にテーブル選択部126が選択した係数テーブルにおけるサンプル数に応じた係数を乗算することでその極小値のサンプルから減算する補正値を生成する。
(Correction process)
In the correction process, the correction
例えば、信号取得部120が取得したデジタル音声信号のサンプリング周波数が44.1kHzであり、信号分析部124がそのデジタル音声信号は過去に音質改善処理が施されていないと判断した場合、テーブル選択部126は係数テーブルAを選択する。補正値生成部130は、補正対象の極大値サンプルの1サンプル前の極小値サンプルから補正対象の極大値サンプルまでのサンプル数を極値特定部122から取得し、係数記憶部128に記憶された係数テーブルAの中からそのサンプル数に応じた1の係数を選択し、その係数を極大差分値に乗算することでその極大値のサンプルに加算する補正値を生成する。つまり、テーブル選択部126によって係数テーブルAが選択された場合、図7(a)に示すように、補正値生成部130は、サンプル数が1〜5であれば1/2、サンプル数が6〜9であれば1/4、サンプル数が10〜14であれば1/8、サンプル数が15以上であれば1/16を極大差分値に乗算することでその極大値のサンプルに加算する補正値を生成する。
For example, if the sampling frequency of the digital audio signal acquired by the
なお、信号分析部124が補正対象のデジタル音声信号が過去に音質改善処理が施されていると判断した場合、テーブル選択部126が係数テーブルA’を選択するため、サンプル数が同じとき、補正値生成部130は、信号分析部124がそのデジタル音声信号は過去に音質改善処理が施されていないと判断した場合よりも小さい係数を用いて補正値を生成することになる。
Note that when the
同様にして、補正値生成部130は、補正対象の極小値サンプルの1サンプル前の極大値サンプルから補正対象の極小値サンプルまでのサンプル数を極値特定部122から取得し、係数テーブルAの中からそのサンプル数に応じた1の係数を選択し、その係数を極小差分値に乗算することでその極小値サンプルに加算する補正値を生成する。つまり、テーブル選択部122によって係数テーブルAが選択された場合、図7(a)に示すように、補正値生成部130は、サンプル数が1〜5であれば1/2、サンプル数が6〜9であれば1/4、サンプル数が10〜14であれば1/8、サンプル数が15以上であれば1/16を極小差分値に乗算することでその極小値サンプルに加算する補正値を生成する。
Similarly, the correction
極小値サンプルの補正値生成においても、信号分析部124が補正対象のデジタル音声信号が過去に音質改善処理が施されていると判断した場合、テーブル選択部126が係数テーブルA’を選択するため、サンプル数が同じとき、補正値生成部130は、信号分析部124がそのデジタル音声信号は過去に音質改善処理が施されていないと判断した場合よりも小さい係数を用いて補正値を生成することになる。
Even in the generation of the correction value of the minimum value sample, when the
そして、補正値生成部130は、極大差分値に基づいて生成した補正値が極大値に加算されるように極大値サンプルに対応付け、極小差分値に基づいて生成した補正値が極小値から減算されるように極小値サンプルに対応付ける。
Then, the correction
また、補正値生成部130は、極大差分値から生成された補正値が、対応する極大値サンプルに加算され、かつ、極小差分値から生成された補正値が、対応するデジタル音声信号の極小値サンプルから減算されるように、補正値を配した補正信号を生成する。
Further, the correction
加算部134は、デジタル音声信号に、補正値生成部130によって生成された補正信号を加算する。本実施形態において、デジタル音声信号への補正値の加算は、デジタル音声信号への補正信号の加算によって行われる。
The
その結果、加算部134において、次の2式で表わされるように、係数を乗算した極大差分値が、極大値に加算され、係数を乗算した極小差分値が、極小値から減算される。ここで、補正信号を加算する前の極大値をVmax、補正信号を加算する前の極小値をVmin、補正信号を加算した後の極大値をV’max、補正信号を加算した後の極小値をV’min、極大差分値をdl0、極小差分値をds0、テーブル選択部126が選択した係数の中から、補正値生成部130がサンプル数に基づいて選択した1の係数をAmax、Aminとすると、補正信号を加算した後の極大値および極小値はそれぞれ、以下の数式1および数式2のように表される。
V’max=Vmax+Amax×dl0 …(数式1)
V’min=Vmin−Amin×ds0 …(数式2)
As a result, as shown in the following two equations, the adding
V′max = Vmax + Amax × dl0 (Formula 1)
V′min = Vmin−Amin × ds0 (Formula 2)
図8は、デジタル音声信号に補正信号を加算する処理をさらに詳細に説明するための説明図である。なお、Amax・dl0=Δdl0、Amin・ds0=Δds0とする。図8(a)に示すようなデジタル音声信号170を取得すると、補正値生成部130は、極大差分値dl0と極小差分値ds0それぞれに係数Amax、Aminを乗算して補正値であるΔdl0、Δds0を導出し、図8(b)に示すような補正信号172を生成する。そして、加算部134がデジタル音声信号に補正信号172を加算すると、図8(c)に白抜き矢印で示すように、補正後のデジタル音声信号174は極大値と極小値とにおいて振幅が大きくなる。
FIG. 8 is an explanatory diagram for explaining the process of adding the correction signal to the digital audio signal in more detail. Note that Amax · dl0 = Δdl0 and Amin · ds0 = Δds0. When the
上述したように高周波数成分がカットされたデジタル音声信号は、例えば、音の伸び、広がり、ダイナミックレンジ、艶っぽさ等が乏しくなってしまう場合がある。本実施形態の補正値生成部130および加算部134は、以上のようにデジタル音声信号の極大値および極小値の絶対値を大きくする簡易な処理で、カットされてしまった高周波数成分を補完するため、より原音に近いデジタル音声信号を生成可能である。
As described above, a digital audio signal from which high-frequency components have been cut may have poor sound expansion, spread, dynamic range, glossiness, and the like. As described above, the correction
次に、補正値生成部130が生成する補正値の他の例について説明する。補正値生成部130は、デジタル音声信号の極大値の1サンプル前のサンプルおよび1サンプル後のサンプルそれぞれの値と極大値との差分それぞれにテーブル選択部126が選択した係数テーブルの係数を乗算すると共に、デジタル音声信号の極小値の1サンプル前のサンプルおよび1サンプル後のサンプルそれぞれの値と極小値との差分それぞれにテーブル選択部126が選択した係数テーブルの係数を乗算することで補正値を生成する。
Next, another example of the correction value generated by the correction
そして、補正値生成部130は、極大値の1サンプル前のサンプルの値と極大値との差分に基づいて生成した補正値が極大値の1サンプル前のサンプルの値に加算されるように極大値の1サンプル前のサンプルに対応付け、極大値の1サンプル後のサンプルの値と極大値との差分に基づいて生成した補正値が極大値の1サンプル後のサンプルの値に加算されるように極大値の1サンプル後のサンプルに対応付け、極小値の1サンプル前のサンプルの値と極小値との差分に基づいて生成した補正値が極小値の1サンプル前のサンプルの値から減算されるように極小値の1サンプル前のサンプルに対応付け、極小値の1サンプル後のサンプルの値と極小値との差分に基づいて生成した補正値が極小値の1サンプル後のサンプルの値から減算されるように極小値の1サンプル後のサンプルに対応付ける。
Then, the correction
ここでは、極値の1サンプル前のサンプルおよび1サンプル後のサンプルについて補正値を生成しているが、かかる場合に限定されず、極値の2つ以上前、極値の2つ以上後のサンプルについても補正値を生成してもよい。この場合、極大および極小近傍差分値は、補正値を生成する対象となるサンプルの値とそのサンプルより極値に1サンプル近いサンプルの値との差分となる。以下、図9および図10を用いて、補正値生成部130のそのような処理について説明する。
Here, the correction value is generated for the sample one sample before the extreme value and the sample one sample after the extreme value. However, the correction value is not limited to such a case, and two or more before the extreme value and two or more after the extreme value. Correction values may also be generated for samples. In this case, the local maximum and local minimum difference values are the difference between the value of the sample for which the correction value is to be generated and the value of the sample closer to the extreme value than that sample. Hereinafter, such processing of the correction
図9においても、図8(a)と同様、信号取得部120が取得したデジタル音声信号のサンプリング周波数が44.1kHzであり、信号分析部124がそのデジタル音声信号は過去に音質改善処理が施されていないと判断した場合、テーブル選択部126は係数テーブルAを選択する。図9(a)に示すようなデジタル音声信号170が取得されると、補正値生成部130は、補正対象の極大近傍サンプルが対応する極大値サンプルの1つ前の極小値サンプルから補正対象の極大近傍サンプルが対応する極大値サンプルまでのサンプル数を極値特定部122から取得する。そして、補正値生成部130は、係数記憶部128に記憶された係数テーブルAの中からそのサンプル数に応じた1の係数を取得し、極大近傍サンプルの値と、極大値との差分(極大近傍差分値)であるdl1、dl2に、その係数を乗算して、図9(b)に示すように、補正値Δdl1、Δdl2を生成する。
Also in FIG. 9, as in FIG. 8A, the sampling frequency of the digital audio signal acquired by the
同様に、補正値生成部130は、補正対象の極小近傍サンプルが対応する極大値サンプルの1つ前の極大値サンプルから補正対象の極小近傍サンプルが対応する極小値サンプルまでのサンプル数を極値特定部122から取得し、係数記憶部128に記憶された係数テーブルAの中からそのサンプル数に応じた1の係数を選択し、極小近傍サンプルの値と、極小値との差分(極小近傍差分値)であるds1、ds2に、その係数を乗算して、図9(b)に示すように、補正値Δds1、Δds2を生成する。
Similarly, the correction
そして、補正値生成部130は、Δdl1を極大値サンプル(極大値となったサンプル)から1サンプル前のサンプルと、Δdl2を極大値サンプルから1サンプル後のサンプルと、Δds1を極小値サンプル(極小値となったサンプル)から1サンプル前のサンプルと、Δds2を極小値サンプルから1サンプル後のサンプルと、それぞれ対応付けて補正信号176を生成し、加算部134がデジタル音声信号に補正信号を加算する。すると、極大近傍差分値dl1、dl2に基づいて生成した補正値Δdl1、Δdl2が、対応する極大近傍サンプルの値に加算され、極小近傍差分値ds1、ds2に基づいて生成した補正値Δds1、Δds2が、極小近傍サンプルの値から減算される。その結果、図9(c)に白抜き矢印で示すように、補正後のデジタル音声信号178の波形は矩形波に近づく。
Then, the correction
本実施形態の補正値生成部130および加算部134は、デジタル音声信号のうち、極大近傍サンプルの値および極小近傍サンプルの値の絶対値を大きくする簡易な処理で補正して矩形波に近づけるため、より原音に近いデジタル音声信号を生成可能である。
The correction
また、極大値サンプル、極小値サンプル、極大近傍サンプル、極小近傍サンプルすべてについて、補正値を生成して補正してもよい。仮に、極大差分値と極大値サンプル前後の極大近傍差分値とが等しくdl3であり、極小差分値と極小値サンプル前後の極小近傍差分値とが等しくds3であるとする。その場合、図10(a)に示すようなデジタル音声信号170が取得されると、補正値生成部130は、図10(b)に示すように、極大値サンプルと前後の極大近傍サンプルに補正値Δdl3を、極小値サンプルと前後の極小近傍サンプルに補正値Δds3を対応付けて補正信号180を生成し、加算部134がデジタル音声信号に補正信号180を加算する。補正値生成部130および加算部134の処理の結果、図10(c)に白抜き矢印で示す補正後のデジタル音声信号182は、図8と図9とを用いて説明した補正の効果を兼ね備えるため、さらに、原音に近い音の再現が可能となる。
Further, a correction value may be generated and corrected for all of the maximum value sample, the minimum value sample, the local maximum sample, and the local minimum sample. Assume that the local maximum difference value and the local maximum difference value before and after the local maximum sample are equal to dl3, and the local minimum difference value and the local minimum difference value before and after the local minimum sample are equal to ds3. In this case, when the
本実施形態では、補正値生成部130が補正信号を生成し、加算部134がデジタル音声信号に補正信号を加算することとしたが、かかる場合に限定されず、補正値生成部130が補正信号を生成せず補正値のみを加算部134に出力し、加算部134が、補正値の符号やタイミングを調整して、デジタル音声信号に補正値を加算してもよい。
In this embodiment, the correction
なお、遅延部132は、信号取得部120から入力されたデジタル音声信号を、第1変換部138から第2変換部140までの各機能部における処理時間の合計分だけ遅延させ、第1変換部138から第2変換部140までの各機能部を経由したデジタル音声信号と同期させる。
Note that the
上述したように、音質改善処理が施されたデジタル音声信号には高周波数成分が含まれている。信号分析部124は、デジタル音声信号の周波数分析を行い高周波数成分の有無を識別することで音質改善処理が施されているか否かを判断する。そして、テーブル選択部126は、音質改善処理がすでに施されているか否かに応じた適切な係数を選択して、補正値生成部130が補正信号を生成する。かかる構成により、音声処理装置100は、取得するデジタル音声信号に対しすでに音質改善処理が施されているか否かに応じて適切な音質改善処理を施し、中高音域のバランス感を保ち、より原音に近いデジタル音声信号を生成可能である。
As described above, the high-frequency component is included in the digital audio signal that has been subjected to the sound quality improvement processing. The
次に第1変換部138および第2変換部140の動作について説明する。第1変換部138は、サンプリング周波数を変更して、高周波数成分を付加する領域を確保することができる。
Next, operations of the
第1変換部138は、信号取得部120が取得したデジタル音声信号をアップサンプリングして極値特定部122、補正値生成部130、および遅延部132に出力する。第2変換部140は、加算部134が補正信号を加算した後のデジタル音声信号を、第1変換部138によってアップサンプリングされる前のサンプリング周波数へとダウンサンプリングする。
The
図11は、第1変換部138の処理を説明するための説明図である。図11(a)に示すサンプリング周波数がfsであるデジタル音声信号に対して、補正処理に伴いサンプリング周波数の1/2以上の周波数成分がデジタル音声信号に付加されると、折り返しノイズが生じてしまう場合がある。
FIG. 11 is an explanatory diagram for explaining processing of the
そこで、図11(b)に示すように、第1変換部138は、デジタル音声信号のサンプリング周波数を2倍にアップサンプリングする。そして、この信号に対して、図11(c)に示すように、上述したように高周波数成分(図11(c)中ハッチングで示す)を付加する。その後、第2変換部140は、補正されたデジタル音声信号をダウンサンプリングしてサンプリング周波数を元のサンプリング周波数にすることで、折り返しノイズの発生を抑制することができる。
Therefore, as shown in FIG. 11B, the
(コンピュータ200)
上述した音声処理装置100は、コンピュータを用いて実現することができる。以下、音声処理装置100をコンピュータを用いて実現する例について説明する。
(Computer 200)
The
図12は、音声処理装置100による音質改善処理が可能なコンピュータ(情報処理装置)200の典型例を示した機能ブロック図である。コンピュータ200は、中央処理装置210と、一時記憶装置212と、外部記憶装置214と、取得部216と、出力部218とを含んで構成される。
FIG. 12 is a functional block diagram showing a typical example of a computer (information processing apparatus) 200 that can perform sound quality improvement processing by the
中央処理装置(CPU)210は、一時記憶装置212や外部記憶装置214のプログラムやアプリケーションによりコンピュータ200全体を制御する。一時記憶装置212は、RAM、EEPROM、不揮発性RAM等から構成され、中央処理装置210で処理されるデジタル音声信号等を一時的に記憶する。外部記憶装置214は、フラッシュメモリ、HDD等で構成され、中央処理装置210で処理されるプログラムを記憶する。取得部216は、デジタル音声信号を取得し、一時記憶装置212に一時的に保持させる。出力部218は、当該コンピュータ200によって補正されたデジタル音声信号を再生装置110等に出力する。
A central processing unit (CPU) 210 controls the
中央処理装置210は、プログラムを実行することによって、極値特定部122と、信号分析部124と、テーブル選択部126と、補正値生成部130と、遅延部132と、加算部134と、第1変換部138と、第2変換部140として機能する。したがって、本実施形態において、コンピュータ200に、所定周波数以上かつ所定音圧以上の高周波数成分がデジタル音声信号に含まれているか否かを判断するステップと、デジタル音声信号に高周波数成分が含まれているか否かに応じて異なる係数に基づき、デジタル音声信号の振幅を拡大するような補正値を生成するステップと、デジタル音声信号に補正値を加算するステップと、を実行させる音声処理プログラムも提供される。また、このプログラムは、記憶媒体から読みとられてコンピュータに取り込まれてもよいし、通信網106を介してコンピュータ200に取り込まれてもよい。
The
(音声処理方法)
次に、上述した音声処理装置100を用いてデジタル音声信号を分析し、その分析結果を用いてデジタル音声信号を補正する音声処理方法を説明する。
(Audio processing method)
Next, an audio processing method for analyzing a digital audio signal using the above-described
図13、14は、音声処理方法の全体的な流れを示したフローチャートである。ここでは、音声処理方法を大きく2つに分け、図13を用いて、係数テーブルを選択する処理を説明し、図14を用いて、その選択された係数テーブルに基づく補正処理を説明する。 13 and 14 are flowcharts showing the overall flow of the voice processing method. Here, the voice processing method is roughly divided into two, the process of selecting a coefficient table will be described using FIG. 13, and the correction process based on the selected coefficient table will be described using FIG.
当該係数テーブルの選択処理が開始されると、まず、所定期間のカウント(図示せず)が開始される。次に、図13に示すように、信号取得部120がデジタル音声信号を取得し(S300のYES)、極値特定部122が、信号取得部120が取得したデジタル音声信号の極値である極大値と極小値とを特定すると(S302のYES)、極値特定部122は、任意の極値から次の極値までのサンプル数を計数して(S304)、極大値と極小値との差分である極値間差分値(極大差分値と極小差分値)を導出する(S306)。
When the coefficient table selection process is started, first, counting for a predetermined period (not shown) is started. Next, as shown in FIG. 13, the
続いて、信号分析部124は、任意の極値から次の極値までのサンプル数がサンプル数閾値より少ないか否かを判断する(S308)。任意の極値から次の極値までのサンプル数がサンプル数閾値より少ない場合(S308のYES)、信号分析部124は、極大値と極小値との差分である極値間差分値が極値レベル閾値を超えているか否かを判断する(S310)。極値間差分値が極値レベル閾値を超えている場合(S310のYES)、デジタル音声信号に高周波数成分が含まれていると判断し、テーブル選択部126は、第2係数テーブル群168からデジタル信号のフォーマットに基づいて係数テーブルを選択する(S312)。したがって、第2係数テーブル群168から係数テーブルが選択された場合、所定期間の経過を待たずに当該係数テーブルの選択処理が終了する。
Subsequently, the
信号取得部120がデジタル音声信号を取得していないとき(S300のNO)、極値特定部122が、信号取得部120が取得したデジタル音声信号の極値である極大値と極小値とを特定するまで(S302のNO)、任意の極値から次の極値までのサンプル数がサンプル数閾値以上の場合(S308のNO)、または、極値間差分値が極値レベル閾値以下の場合(S310のNO)、テーブル選択部126は、所定期間が経過したか否かを判断する(S314)。所定期間が経過していなかった場合(S314のNO)、信号取得ステップ(S300)から繰り返す。所定期間が経過していた場合(S314のYES)、テーブル選択部126は、第1係数テーブル群166からデジタル信号のフォーマットに基づいて係数テーブルを選択する(S316)。こうして、所定期間内にサンプル数と極値間差分値とが所定の条件を満たさなければ、第1係数テーブル群166から係数テーブルが選択されることとなる。
When the
第2係数テーブル群選択ステップ(S312)、または第1係数選択ステップ(S316)でテーブル選択部126が係数テーブルの選択を終えると、図14に示す補正処理に移行する。
When the
図14に示すように、補正処理では、信号取得部120がデジタル音声信号を取得すると(S300のYES)、極値特定部122が、信号取得部120が取得したデジタル音声信号の極値である極大値と極小値とを特定するまで(S302のNO)、信号取得ステップ(S300)を繰り返す。信号取得部120が取得したデジタル音声信号の極値である極大値と極小値とを特定すると(S302のYES)、極値特定部122は、極値から極値までのサンプル数を計数する(S304)。なお、図14におけるデジタル音声信号と図13におけるデジタル音声信号は同様の信号である。
As shown in FIG. 14, in the correction process, when the
そして、補正値生成部130は、第2係数テーブル群選択ステップ(S312)、または第1係数選択ステップ(S316)で、テーブル選択部126が選択した係数テーブルを用いて、デジタル音声信号のサンプル数に対応した1の係数を選択する(S330)。
Then, the correction
補正値生成部130は、デジタル音声信号の極大値と、その極大値サンプルの1サンプル前のサンプルの値との差分である極大差分値にテーブル選択部126が選択した係数テーブルの係数を乗算することでその極大値のサンプルに加算する補正値を生成すると共に、デジタル音声信号の極小値と、その極小値サンプルの1サンプル前のサンプルの値との差分である極小差分値にテーブル選択部126が選択した係数テーブルの係数を乗算することでその極小値のサンプルから減算する補正値を生成し(S332)、極大差分値に基づいて生成した補正値が極大値に加算されるように極大値サンプルに対応付け、極小差分値に基づいて生成した補正値が極小値から減算されるように極小値サンプルに対応付ける(S334)。
The correction
続いて、補正値生成部130は、加算部134において、極大差分値から生成された補正値が、その補正値自体が対応付けられたデジタル音声信号の極大値に、極小差分値から生成された補正値が、その補正値が対応付けられたデジタル音声信号の極小値に、それぞれ同期するように補正値を配した補正信号を生成する(S336)。加算部134は、デジタル音声信号と補正信号とを加算し(S338)、信号出力部136は、補正信号が加算されたデジタル音声信号を出力し(S340)、信号取得ステップ(図14に示すS300)に戻る。
Subsequently, in the
以上説明した音声処理方法によっても、音質改善処理されたデジタル音声信号と通常のデジタル音声信号とを識別でき、それぞれに合わせた係数を用いて、補正処理を行うため、より原音に近いデジタル音声信号を生成可能となる。 Even with the audio processing method described above, a digital audio signal that has been subjected to sound quality improvement processing can be distinguished from a normal digital audio signal, and correction processing is performed using coefficients corresponding to each, so that the digital audio signal closer to the original sound is used. Can be generated.
以上、添付図面を参照しながら本発明の好適な実施形態について説明したが、本発明はかかる実施形態に限定されないことは言うまでもない。当業者であれば、特許請求の範囲に記載された範疇において、各種の変更例または修正例に想到し得ることは明らかであり、それらについても当然に本発明の技術的範囲に属するものと了解される。 As mentioned above, although preferred embodiment of this invention was described referring an accompanying drawing, it cannot be overemphasized that this invention is not limited to this embodiment. It will be apparent to those skilled in the art that various changes and modifications can be made within the scope of the claims, and these are naturally within the technical scope of the present invention. Is done.
なお、本明細書の音声処理方法における各工程は、必ずしもフローチャートとして記載された順序に沿って時系列に処理する必要はなく、並列的あるいはサブルーチンによる処理を含んでもよい。 Note that each step in the voice processing method of the present specification does not necessarily have to be processed in time series in the order described in the flowchart, and may include parallel or subroutine processing.
本発明は、デジタル音声信号を分析し、その分析結果に応じてデジタル音声信号を処理する音声処理装置、音声処理方法および音声処理プログラムに利用することができる。 The present invention can be used in an audio processing apparatus, an audio processing method, and an audio processing program that analyze a digital audio signal and process the digital audio signal according to the analysis result.
100 …音声処理装置
120 …信号取得部
124 …信号分析部
126 …テーブル選択部
128 …係数記憶部
130 …補正値生成部
134 …加算部
136 …第1変換部
138 …第2変換部
200 …コンピュータ
DESCRIPTION OF
Claims (11)
前記信号分析部が前記デジタル音声信号に前記高周波数成分が含まれていると判断したか否かに応じて異なる係数に基づき、前記デジタル音声信号の振幅を拡大するような補正値を生成する補正値生成部と、
前記デジタル音声信号に前記補正値を加算する加算部と、
を備えることを特徴とする音声処理装置。 A signal analysis unit for determining whether or not a high frequency component of a predetermined frequency or higher and a predetermined sound pressure or higher is included in the digital audio signal;
Correction that generates a correction value that expands the amplitude of the digital audio signal based on a different coefficient depending on whether or not the signal analysis unit determines that the high-frequency component is included in the digital audio signal A value generator,
An adder for adding the correction value to the digital audio signal;
An audio processing apparatus comprising:
前記加算部が前記補正値を加算した後のデジタル音声信号を、前記第1変換部によってアップサンプリングされる前のサンプリング周波数へとダウンサンプリングする第2変換部と、
をさらに備えることを特徴とする請求項1から6のいずれか1項に記載の音声処理装置。 A first converter for upsampling a digital audio signal acquired by the audio processing device;
A second conversion unit that downsamples the digital audio signal after the addition unit adds the correction value to a sampling frequency before being upsampled by the first conversion unit;
The speech processing apparatus according to claim 1, further comprising:
前記デジタル音声信号の極大値の1サンプル前のサンプルおよび1サンプル後のサンプルそれぞれの値と前記極大値との差分それぞれに前記係数を乗算すると共に、前記デジタル音声信号の極小値の1サンプル前のサンプルおよび1サンプル後のサンプルそれぞれの値と前記極小値との差分それぞれに前記係数を乗算することで前記補正値を生成し、
前記極大値の1サンプル前のサンプルの値と前記極大値との差分に基づいて生成した補正値が前記極大値の1サンプル前のサンプルの値に加算されるように前記極大値の1サンプル前のサンプルに対応付け、
前記極大値の1サンプル後のサンプルの値と前記極大値との差分に基づいて生成した補正値が前記極大値の1サンプル後のサンプルの値に加算されるように前記極大値の1サンプル後のサンプルに対応付け、
前記極小値の1サンプル前のサンプルの値と前記極小値との差分に基づいて生成した補正値が前記極小値の1サンプル前のサンプルの値から減算されるように前記極小値の1サンプル前のサンプルに対応付け、
前記極小値の1サンプル後のサンプルの値と前記極小値との差分に基づいて生成した補正値が前記極小値の1サンプル後のサンプルの値から減算されるように前記極小値の1サンプル後のサンプルに対応付けることを特徴とする請求項1から8のいずれか1項に記載の音声処理装置。 The correction value generation unit
The difference between the respective values of the sample one sample before and one sample after the maximum value of the digital audio signal and the maximum value is multiplied by the coefficient, and one sample before the minimum value of the digital audio signal. The correction value is generated by multiplying the difference between each value of the sample and the sample after one sample and the minimum value by the coefficient,
One sample before the maximum value so that a correction value generated based on the difference between the sample value one sample before the maximum value and the maximum value is added to the value of the sample one sample before the maximum value. Map to the sample
After one sample of the maximum value, a correction value generated based on the difference between the sample value after one sample of the maximum value and the maximum value is added to the value of the sample after one sample of the maximum value. Map to the sample
One sample before the minimum value so that a correction value generated based on the difference between the value of the sample one sample before the minimum value and the minimum value is subtracted from the value of the sample one sample before the minimum value. Map to the sample
After one sample of the minimum value, the correction value generated based on the difference between the sample value after one sample of the minimum value and the minimum value is subtracted from the value of the sample after one sample of the minimum value. The voice processing apparatus according to claim 1, wherein the voice processing apparatus is associated with the sample.
前記デジタル音声信号に前記高周波数成分が含まれているか否かに応じて異なる係数に基づき、前記デジタル音声信号の振幅を拡大するような補正値を生成し、
前記デジタル音声信号に前記補正値を加算することを特徴とする音声処理方法。 Determine whether the digital audio signal contains high frequency components above a specified frequency and above a specified sound pressure,
Based on different coefficients depending on whether the high frequency component is included in the digital audio signal, generating a correction value that expands the amplitude of the digital audio signal,
An audio processing method comprising adding the correction value to the digital audio signal.
所定周波数以上かつ所定音圧以上の高周波数成分がデジタル音声信号に含まれているか否かを判断するステップと、
前記デジタル音声信号に前記高周波数成分が含まれているか否かに応じて異なる係数に基づき、前記デジタル音声信号の振幅を拡大するような補正値を生成するステップと、
前記デジタル音声信号に前記補正値を加算するステップと、
を実行させることを特徴とする音声処理プログラム。 On the computer,
Determining whether the digital audio signal includes a high frequency component of a predetermined frequency or higher and a predetermined sound pressure or higher;
Generating a correction value for enlarging the amplitude of the digital audio signal based on different coefficients depending on whether the high frequency component is included in the digital audio signal;
Adding the correction value to the digital audio signal;
A voice processing program characterized by causing
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010051360A JP2011186187A (en) | 2010-03-09 | 2010-03-09 | Speech processor, speech processing method and speech processing program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010051360A JP2011186187A (en) | 2010-03-09 | 2010-03-09 | Speech processor, speech processing method and speech processing program |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2011186187A true JP2011186187A (en) | 2011-09-22 |
Family
ID=44792540
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010051360A Pending JP2011186187A (en) | 2010-03-09 | 2010-03-09 | Speech processor, speech processing method and speech processing program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2011186187A (en) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103392204A (en) * | 2010-12-03 | 2013-11-13 | 杜比实验室特许公司 | Adaptive processing with multiple media processing nodes |
JP2017507348A (en) * | 2014-01-07 | 2017-03-16 | ハーマン インターナショナル インダストリーズ インコーポレイテッド | Signal quality based enhancement and compensation of compressed audio signals |
JP2017156671A (en) * | 2016-03-04 | 2017-09-07 | ヤマハ株式会社 | system |
-
2010
- 2010-03-09 JP JP2010051360A patent/JP2011186187A/en active Pending
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103392204A (en) * | 2010-12-03 | 2013-11-13 | 杜比实验室特许公司 | Adaptive processing with multiple media processing nodes |
JP2014505898A (en) * | 2010-12-03 | 2014-03-06 | ドルビー ラボラトリーズ ライセンシング コーポレイション | Adaptive processing by multiple media processing nodes |
US9842596B2 (en) | 2010-12-03 | 2017-12-12 | Dolby Laboratories Licensing Corporation | Adaptive processing with multiple media processing nodes |
JP2017507348A (en) * | 2014-01-07 | 2017-03-16 | ハーマン インターナショナル インダストリーズ インコーポレイテッド | Signal quality based enhancement and compensation of compressed audio signals |
JP2017156671A (en) * | 2016-03-04 | 2017-09-07 | ヤマハ株式会社 | system |
WO2017150064A1 (en) * | 2016-03-04 | 2017-09-08 | ヤマハ株式会社 | System, control method, control terminal, and program |
CN108701451A (en) * | 2016-03-04 | 2018-10-23 | 雅马哈株式会社 | system, control method, control terminal and program |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6574046B2 (en) | Dynamic range control of encoded audio extension metadatabase | |
JP5917518B2 (en) | Speech signal dynamic correction for perceptual spectral imbalance improvement | |
JP5098569B2 (en) | Bandwidth expansion playback device | |
CN101170302B (en) | Audio processing method and audio processing apparatus | |
WO2012033099A1 (en) | Signal processing device and method, program, and data recording medium | |
JP5012995B2 (en) | Audio signal processing apparatus and audio signal processing method | |
KR20080068223A (en) | Apparatus and method for enhancing bass | |
JP2012037582A (en) | Signal processing apparatus and method, and program | |
JP2004170610A (en) | Encoding device, decoding device, encoding method, and decoding method | |
JP2011059714A (en) | Signal encoding device and method, signal decoding device and method, and program and recording medium | |
JP4760278B2 (en) | Interpolation device, audio playback device, interpolation method, and interpolation program | |
JPWO2015125191A1 (en) | Audio signal processing apparatus and audio signal processing method | |
KR100636144B1 (en) | Apparatus and method for encoding/decoding audio signal | |
JP2011186187A (en) | Speech processor, speech processing method and speech processing program | |
JP2010145426A (en) | Audio band extension device | |
JP2005507584A (en) | Sound algorithm selection method and apparatus | |
JPWO2005057550A1 (en) | Audio compression / decompression equipment | |
JP2013073230A (en) | Audio encoding device | |
US20190074805A1 (en) | Transient Detection for Speaker Distortion Reduction | |
JP2009063623A (en) | Encoding device, encoding method, decoding device, and decoding method | |
JP4311541B2 (en) | Audio signal compression device | |
JP2003280691A (en) | Voice processing method and voice processor | |
US8195317B2 (en) | Data reproduction apparatus and data reproduction method | |
JP5392057B2 (en) | Audio processing apparatus, audio processing method, and audio processing program | |
JP2020190606A (en) | Sound noise removal device and program |