JP2008096567A - Audio encoding device and audio encoding method, and program - Google Patents
Audio encoding device and audio encoding method, and program Download PDFInfo
- Publication number
- JP2008096567A JP2008096567A JP2006276218A JP2006276218A JP2008096567A JP 2008096567 A JP2008096567 A JP 2008096567A JP 2006276218 A JP2006276218 A JP 2006276218A JP 2006276218 A JP2006276218 A JP 2006276218A JP 2008096567 A JP2008096567 A JP 2008096567A
- Authority
- JP
- Japan
- Prior art keywords
- signal
- tone
- frequency
- low
- band
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Images
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
Description
本発明は、オーディオ信号を少ない情報量で効率的に符号化するオーディオ符号化装置および方法に関する。 The present invention relates to an audio encoding apparatus and method for efficiently encoding an audio signal with a small amount of information.
オーディオ信号を高能率に圧縮符号化し、低ビットレートにおいても高い品質を実現出来る方式として、SBR(Spectral Band Replication)方式が知られている。SBRは、オーディオ符号化方式の国際標準規格MPEG-4 Audio (ISO/IEC 14496-3:2001/AMD1:2003)(非特許文献1参照)において規定される符号化方式である。SBRは、従来の符号化方式、例えば、同じくMPEG-4 Audioで規定されるAAC (Advanced Audio Coding)等と組み合わせて使用されることに特徴があり、入力オーディオ信号を低域部と高域部の2つに分割し、低域部をAAC等の符号化方式、高域部をSBRによって符号化する。 An SBR (Spectral Band Replication) system is known as a system that can compress and encode audio signals with high efficiency and achieve high quality even at low bit rates. SBR is an encoding system defined in the international standard MPEG-4 Audio (ISO / IEC 14496-3: 2001 / AMD1: 2003) (see Non-Patent Document 1) of an audio encoding system. SBR is characterized by the fact that it is used in combination with a conventional encoding method, for example, AAC (Advanced Audio Coding), which is also defined by MPEG-4 Audio. The low frequency band is encoded by an encoding scheme such as AAC and the high frequency band is encoded by SBR.
このとき、符号化側においては、高域部について入力信号そのものを符号化せずに、そのエネルギエンベロープのみを符号化する。復号化側では、まず低域部の信号を復号したのち、SBR部において、復号された低域信号を高域部に複製し、復号されたエネルギエンベロープにしたがって信号を整形する。このように、SBRにおいては、高域部の信号について、そのエネルギエンベロープのみを符号化するため、入力信号そのものを符号化する従来方式と比較して、非常に少ない情報量で符号化が可能となる。このことにより、例えば48kbpsといった低いビットレートにおいて、0-16kHz帯域の広帯域のオーディオ信号を、高品質に符号化することが出来る。 At this time, on the encoding side, only the energy envelope is encoded without encoding the input signal itself for the high frequency part. On the decoding side, first, the low-frequency part signal is decoded, and then the SBR part replicates the decoded low-frequency signal to the high-frequency part and shapes the signal according to the decoded energy envelope. In this way, in SBR, only the energy envelope of the high frequency band signal is encoded, so that it is possible to encode with a very small amount of information compared to the conventional method of encoding the input signal itself. Become. As a result, a wideband audio signal in the 0-16 kHz band can be encoded with high quality at a low bit rate such as 48 kbps.
低域信号を複製して高域信号を復元することは、通常、入力信号の低域部と高域部の類似性、例えば、高調波構造の類似性などにより、人間の聴覚の特性上、大きな劣化としては知覚されない。しかしながら、入力信号の低域部と高域部の特性が大きく異なる場合、例えば、高域部のみに特徴的な信号が存在している場合は、低域部からの複製として生成された高域部の信号は、入力信号と大きく異なることになり、音質の劣化として知覚されることになる。高域部のみに存在する特徴的な信号としては、トーン性信号があり、電子楽器によって演奏される楽曲等においては、一般的に存在する。 Reconstructing the high frequency signal by duplicating the low frequency signal is usually based on the human auditory characteristics due to the similarity between the low frequency and high frequency of the input signal, for example, the similarity of the harmonic structure. It is not perceived as a major deterioration. However, when the characteristics of the low-frequency part and the high-frequency part of the input signal are significantly different, for example, when a characteristic signal exists only in the high-frequency part, the high-frequency band generated as a replica from the low-frequency part The signal of the part will be greatly different from the input signal, and will be perceived as sound quality degradation. A characteristic signal that exists only in the high frequency part is a tone signal, which is generally present in music played by an electronic musical instrument.
このような問題に対処するため、SBRでは、符号化において、入力信号の高域部分に含まれるトーン性の信号を検出して、その時間的および周波数的な存在位置を符号化し、復号化において、人工的に発生させたトーン信号を、低域部から複製した高域部の信号に付加する(トーン付加と呼ぶ)ことができるようになっている。具体的なトーン信号付加の方法としては、例えば、特許文献1に示される方法がある。以下、その処理について図面を参照しながら説明する。 In order to cope with such a problem, in SBR, in encoding, a tone-like signal included in a high frequency part of an input signal is detected, and its temporal and frequency existing positions are encoded, and in decoding, The tone signal generated artificially can be added to the high frequency band signal copied from the low frequency band (referred to as tone addition). As a specific method of adding a tone signal, for example, there is a method disclosed in Patent Document 1. Hereinafter, the process will be described with reference to the drawings.
図2は、従来のSBRにおけるトーン信号付加の構成を示す図である。入力信号206は、サブバンドフィルタ201に入力され、サブバンド信号に変換される。サブバンド信号は、高域部207と低域部208に分割され、それぞれ高域部トーン性分析手段202と低域部トーン性分析手段203に入力される。トーン性の度合(トーナリティ度合)としては、例えば、サブバンド信号に対する線形予測ゲインの大きさを用いる。算出された高域信号のトーン性度合209と、低域信号のトーン性度合210は、トーン信号付加可否決定手段204に入力される。トーン信号付加可否決定手段204は、高域信号のトーン性度合209と低域信号のトーン性度合210を比較し、トーン付加フラグ情報212を出力する。
FIG. 2 is a diagram showing a configuration of tone signal addition in the conventional SBR. The
ここで、比較すべきトーン性度合は、復号化において、低域部のどのサブバンドの信号を高域部のどのサブバンドに複製するかにより決定される。図3は符号化側と復号化側におけるサブバンド信号の関係を示す図であり、境界303により、高域部と低域部に分割される。復号化側のサブバンド信号302において、低域部のサブバンドmの信号307は、高域部のサブバンドnの信号306として複製されるので、符号化において比較すべき対象は、符号化側サブバンド信号301におけるサブバンドmの信号305と、サブバンドnの信号304となる。符号化側サブバンド信号において、サブバンドnの信号304のトーン性が高く、サブバンドmの信号305のトーン性が低い場合、入力のサブバンドnの信号304はトーン性が高いにも係らず、復号化において生成されるサブバンドnの信号306はトーン性が低いことになり、入力信号と復号信号の特性の違いにより音質が低下する。したがって、このような条件において、復号化で生成されるサブバンドnの信号306に対して、人工的なトーン信号を付加し、生成される信号のトーン性を高める必要があると判断できる。各サブバンドに対するトーン付加の有無は、オンオフのフラグ情報として符号化され、出力される。
Here, the degree of tone to be compared is determined by which subband signal in the low frequency band is copied to which subband in the high frequency band in decoding. FIG. 3 is a diagram showing the relationship between the subband signals on the encoding side and the decoding side, and is divided into a high frequency part and a low frequency part by a
なお、MPEG-4で規定されるSBRでは、隣接する複数のサブバンドをまとめた、スケールファクタバンドと呼ばれる単位で符号化が行われる。この場合、トーン付加の有無を表すフラグについても、スケールファクタバンド毎に設定されるため、トーン性の判定についてもスケールファクタバンド毎に行う必要がある。例えば、比較する対象となる高域部のスケールファクタバンドに含まれるサブバンド信号から、トーン性が最も高いサブバンドを選択し、そのトーン性度合を高域部のスケールファクタバンドの代表値とする。同様に、対応する低域部のスケールファクタバンドに含まれるサブバンド信号から、トーン性が最も高いサブバンドを選択し、そのトーン性度合を低域のスケールファクタバンドの代表値として、高域のスケールファクタバンドの代表値と比較することにより実現できる。
隣接する複数のサブバンドをまとめたスケールファクタバンドに対して、トーン付加フラグが設定される場合、スケールファクタバンドに含まれる複数のサブバンドの内、一つのサブバンド(通常、周波数位置として中央に存在するサブバンド)についてのみ、トーン信号を付加することになる。また、付加トーン信号の周波数位置はサブバンドの中心周波数となる。したがって、入力信号に含まれるトーン信号の周波数位置が、スケールファクタバンドの端にある場合には、付加トーン信号との周波数的なずれが大きくなる。 When the tone addition flag is set for a scale factor band that is a group of multiple adjacent subbands, one subband (usually centered as a frequency position) among the multiple subbands included in the scale factor band. A tone signal is added only to the existing subband. The frequency position of the additional tone signal is the center frequency of the subband. Therefore, when the frequency position of the tone signal included in the input signal is at the end of the scale factor band, the frequency shift from the additional tone signal becomes large.
SBRが取り扱う比較的高い周波数帯域の信号(例えば10kHz程度以上)においては、人間の聴覚特性の周波数分解能が低下するため、単独のトーン信号における若干の周波数位置のずれは、大きな音質劣化には至らない。しかしながら、高調波構造をなす複数のトーン信号の、周波数位置のずれは、音質に大きな影響を与える可能性がある。一般に、高調波構造もしくは、ハーモニクス構造と呼ばれる周波数スペクトル構造を持つ信号は、基音となる1次信号と、基音の整数倍の周波数を持つ2次からn次までの高調波の集合体である。 In a signal of a relatively high frequency band handled by SBR (for example, about 10 kHz or more), the frequency resolution of human auditory characteristics is reduced. Therefore, a slight frequency position shift in a single tone signal leads to a large deterioration in sound quality. Absent. However, the frequency position shift of a plurality of tone signals having a harmonic structure may greatly affect sound quality. In general, a signal having a frequency spectrum structure called a harmonic structure or a harmonic structure is a collection of a primary signal serving as a fundamental tone and harmonics from secondary to n-order having a frequency that is an integral multiple of the fundamental tone.
図4は、高調波構造を持つ信号における、低域部から複製した信号と、付加トーン信号の関係を示す図である。ここで、トーン付加はスケールファクタバンドkに対して行われるとし、401はトーン付加信号、402は低域部から複製された信号、403は401と402を合成した信号を表す。また、404はサブバンドの幅を、405はスケールファクタバンドの幅を表す。付加されたトーン信号406は、スケールファクタバンドkの中央のサブバンドの中心周波数の位置に配置される。また、低域部から複製された信号402は、高調波構造を持つため、407、408,409、410で表されるトーン性信号を含む。このとき、例えば、407と408の間隔415と、408と409の間隔416とは等しくなる。
FIG. 4 is a diagram illustrating a relationship between a signal duplicated from a low frequency region and an additional tone signal in a signal having a harmonic structure. Here, it is assumed that tone addition is performed on the scale factor band k, 401 is a tone addition signal, 402 is a signal copied from the low frequency part, and 403 is a signal obtained by combining 401 and 402.
このような高調波構造を持つ信号に対して、SBRによるトーン付加を行うと、付加されるトーン信号の周波数位置のずれにより、高調波間の間隔が乱れることになる。合成信号403は、低域部から複製した信号402に対して、トーン付加を行ったスケールファクタバンドkの信号を、トーン付加信号401に置き換えたものであり、含まれるトーン性の信号は、411、412、413、および414となる。411と412の間隔417は、低域部から複製された信号の高調波間隔415と等しいのに対して、412と413の間隔418は、低域部から複製された信号の高調波間隔416と異なることになる。
When tone addition by SBR is performed on a signal having such a harmonic structure, an interval between harmonics is disturbed due to a shift in frequency position of the added tone signal. The synthesized
高調波間隔の乱れは、隣接するトーン信号間の干渉の原因となり、結果として、歪感やうねり感など、音質を大きく損なう現象が発生することがある。このような場合には、トーン信号付加を行わずに、低域部からの複製によって高域部を生成する方が、少なくとも高域部の帯域内では高調波間の間隔が維持されるため、音質の低下が少ない。しかしながら、従来の構成では、サブバンドもしくはスケールファクタバンドの単位で、トーン信号付加の判定を行っていたため、入力信号が高調波構造を持っているかどうか把握することができず、高調波間隔を乱すような位置に、トーン信号を付加してしまうことがあった。 Disturbances in the harmonic spacing cause interference between adjacent tone signals, and as a result, a phenomenon that greatly impairs sound quality, such as a sense of distortion or a sense of undulation, may occur. In such a case, it is better to generate the high frequency band by duplicating from the low frequency band without adding the tone signal, because the spacing between the harmonics is maintained at least in the high frequency band. There is little decrease in However, in the conventional configuration, since the tone signal addition is determined in units of subbands or scale factor bands, it cannot be determined whether the input signal has a harmonic structure, and the harmonic interval is disturbed. A tone signal may be added at such a position.
本発明は、このような問題を解決することを目的とするもので、入力信号の高調波構造を分析する手段を新たに設けることにより、入力信号が高調波構造を持つか否かを判断し、高調波構造を持つ場合には、トーン付加を行わないようにすることによって、高調波間隔の乱れを防ぎ、音質を向上させるものである。 An object of the present invention is to solve such problems, and by newly providing means for analyzing the harmonic structure of an input signal, it is determined whether or not the input signal has a harmonic structure. In the case of having a harmonic structure, by avoiding the addition of a tone, disturbance of harmonic intervals is prevented and sound quality is improved.
本発明の構成により、入力信号の高調波間隔を乱さないように符号化を行うことができ、符号化されたオーディオ信号の品質を向上させることができる。 According to the configuration of the present invention, encoding can be performed without disturbing the harmonic interval of the input signal, and the quality of the encoded audio signal can be improved.
(実施の形態1)
図1は、本発明の実施の形態1における構成の一例を示す図である。図2に示される従来の構成に対して、入力信号の高調波構造を分析する手段105を設け、高調波構造の分析結果111を出力し、トーン信号付加手段に入力する様に構成した点が異なる。以下、その動作について詳しく説明する。
(Embodiment 1)
FIG. 1 is a diagram illustrating an example of a configuration according to Embodiment 1 of the present invention. Compared to the conventional configuration shown in FIG. 2, means 105 for analyzing the harmonic structure of the input signal is provided, and the analysis result 111 of the harmonic structure is output and input to the tone signal adding means. Different. Hereinafter, the operation will be described in detail.
入力信号106は、サブバンドフィルタ101によって高域部のサブバンド信号107と低域部のサブバンド信号108に分割され、それぞれ、高域部のトーン性分析手段102と低域部のトーン性分析手段103に入力される。それぞれのトーン性分析手段は、入力されたサブバンド信号について、サブバンド単位で、トーン性の度合109および110を算出する。トーン性の度合(トーナリティ度合)としては、例えば、サブバンド信号に対する線形予測ゲインの大きさを用いる。高調波構造分析手段105は、特にSBRによって符号化される、高域部のサブバンド信号を分析して、高調波構造が存在するか否かを判断する。
The
具体的な判断方法としては、例えば、高域部に含まれるサブバンドのトーン性度合109の平均値を算出し、あらかじめ定められた閾値と比較することによって、高域部が平均して高いトーン性を示すか否かを調べる。高調波構造を持つ信号は、多くのトーン性信号の集合体であるので、平均して高いトーン性を示すことから、算出されたトーン性度合の平均値が、高いトーン性を示せば、入力信号は高調波構造を持つ信号であると判断できる。
As a specific determination method, for example, an average value of
なお、トーン性度合の平均値算出においては、高域の各サブバンドのトーン性度合に加えて、低域の各サブバンドのトーン性度合を一部加える様に構成しても良い。高域部と低域部の境界は、6から10kHz程度に設定することが多いが、この付近の周波数帯域は、多くの楽曲において、高調波構造が強く見られる帯域であり、特に、境界周波数が高く設定されている場合(例えば10kHz)、低域部に分類される、境界よりも若干低い周波数(例えば8kHz)から高い部分の帯域について分析した方が、高調波構造の有無をより精度良く判断することができる。 In addition, in the calculation of the average value of the tone characteristics, a part of the tone characteristics of the low frequency subbands may be added in addition to the tone characteristics of the high frequency subbands. The boundary between the high and low frequencies is often set to about 6 to 10 kHz, but the frequency band near this is a band where harmonic structures are strongly observed in many music pieces. If the frequency is set high (for example, 10 kHz), it is better to analyze the presence or absence of the harmonic structure by analyzing the high band from a frequency slightly lower than the boundary (for example, 8 kHz), which is classified as a low frequency part. Judgment can be made.
高調波構造分析の結果111は、高調波構造を持つか否かの二値情報として出力される。トーン信号付加可否決定手段104は、高調波構造の有無にしたがって、トーン付加を行うか否かを切り替え、トーン付加フラグ情報112を出力する。切り替えの望ましい例としては、まず、低域のサブバンド信号のトーン性度合110と高域のサブバンド信号のトーン性度合109を比較することにより、トーン信号付加が必要なサブバンドを判定する。高調波構造を持たない場合は、この判定がそのまま最終判定となる。高調波構造を持つ場合には、続いて、先にトーン信号を付加すると判定された高域部のサブバンドの周辺サブバンド、例えば両隣のサブバンドにおいて、比較対象となる低域部のサブバンドのトーン性度合を調査する。低域部のサブバンドのトーン性度合が大きければ、低域部から複製されたサブバンド信号に含まれるトーン性信号と、付加トーン信号が干渉する可能性が高いので、トーン付加を行わないと判定する。
The result 111 of the harmonic structure analysis is output as binary information indicating whether or not it has a harmonic structure. The tone signal
また、二値情報に基づく切り替えでは、判定誤りによる音質劣化を発生させる可能性が高まるので、高調波構造分析の結果を、高調波構造の強度の度合として出力し、トーン信号付加手段においてより細かい判定を行うこともできる。高調波構造の強度の度合に基づく判定方法としては、例えば、高調波構造の強度の度合が大きくなるにしたがって、トーン付加判定の基準となる閾値を、トーン付加が行われなくなる方向に制御する様にすれば良い。 In addition, since switching based on binary information increases the possibility of sound quality degradation due to a determination error, the result of harmonic structure analysis is output as the degree of intensity of the harmonic structure, and the tone signal adding means is more detailed. A determination can also be made. As a determination method based on the intensity level of the harmonic structure, for example, as the intensity level of the harmonic structure increases, a threshold value used as a reference for tone addition determination is controlled in a direction in which tone addition is not performed. You can do it.
なお、上記の説明で用いた構成は、サブバンド単位でトーン付加判定を行うものであるが、スケールファクタバンド単位でトーン付加判定を行う構成についても、比較対象とするトーン性度合を、スケールファクタバンドを代表する値に置き換えることにより、同じ構成で実現できる。スケールファクタバンドを代表する値としては、当該スケールファクタバンドに含まれるサブバンド信号のトーン性度合の最大値や、平均値を用いることができる。 The configuration used in the above description performs tone addition determination in units of subbands. However, in the configuration in which tone addition determination is performed in units of scale factor bands, the tone characteristic degree to be compared is determined by the scale factor. By replacing the band with a representative value, the same configuration can be realized. As a value representative of the scale factor band, the maximum value or the average value of the tone characteristics of the subband signals included in the scale factor band can be used.
なお、上記の説明で用いた構成は、サブバンドフィルタにより生成されたサブバンド信号を用いて実現されているが、サブバンドフィルタに代えて、フーリエ変換、コサイン変換等のいかなる公知の時間周波数変換を用いても、同様の構成を実現できることは、当該技術の専門家にとって自明である。 The configuration used in the above description is realized using a subband signal generated by a subband filter. However, any known time-frequency conversion such as Fourier transform or cosine transform can be used instead of the subband filter. It is obvious to those skilled in the art that a similar configuration can be realized even when using.
なお、本発明を上記実施の形態に基づいて説明してきたが、本発明は、上記の実施の形態に限定されないのはもちろんである。以下のような場合も本発明に含まれる。 Although the present invention has been described based on the above embodiment, it is needless to say that the present invention is not limited to the above embodiment. The following cases are also included in the present invention.
(1)上記の各装置は、具体的には、マイクロプロセッサ、ROM、RAM、ハードディスクユニット、ディスプレイユニット、キーボード、マウスなどから構成されるコンピュータシステムである。前記RAMまたはハードディスクユニットには、コンピュータプログラムが記憶されている。前記マイクロプロセッサが、前記コンピュータプログラムにしたがって動作することにより、各装置は、その機能を達成する。ここでコンピュータプログラムは、所定の機能を達成するために、コンピュータに対する指令を示す命令コードが複数個組み合わされて構成されたものである。 (1) Each of the above devices is specifically a computer system including a microprocessor, a ROM, a RAM, a hard disk unit, a display unit, a keyboard, a mouse, and the like. A computer program is stored in the RAM or hard disk unit. Each device achieves its functions by the microprocessor operating according to the computer program. Here, the computer program is configured by combining a plurality of instruction codes indicating instructions for the computer in order to achieve a predetermined function.
(2)上記の各装置を構成する構成要素の一部または全部は、1個のシステムLSI(Large Scale Integration:大規模集積回路)から構成されているとしてもよい。システムLSIは、複数の構成部を1個のチップ上に集積して製造された超多機能LSIであり、具体的には、マイクロプロセッサ、ROM、RAMなどを含んで構成されるコンピュータシステムである。前記RAMには、コンピュータプログラムが記憶されている。前記マイクロプロセッサが、前記コンピュータプログラムにしたがって動作することにより、システムLSIは、その機能を達成する。 (2) A part or all of the components constituting each of the above devices may be configured by one system LSI (Large Scale Integration). The system LSI is a super multifunctional LSI manufactured by integrating a plurality of components on one chip, and specifically, a computer system including a microprocessor, a ROM, a RAM, and the like. . A computer program is stored in the RAM. The system LSI achieves its functions by the microprocessor operating according to the computer program.
(3)上記の各装置を構成する構成要素の一部または全部は、各装置に脱着可能なICカードまたは単体のモジュールから構成されているとしてもよい。前記ICカードまたは前記モジュールは、マイクロプロセッサ、ROM、RAMなどから構成されるコンピュータシステムである。前記ICカードまたは前記モジュールは、上記の超多機能LSIを含むとしてもよい。マイクロプロセッサが、コンピュータプログラムにしたがって動作することにより、前記ICカードまたは前記モジュールは、その機能を達成する。このICカードまたはこのモジュールは、耐タンパ性を有するとしてもよい。 (3) Part or all of the constituent elements constituting each of the above devices may be configured from an IC card that can be attached to and detached from each device or a single module. The IC card or the module is a computer system including a microprocessor, a ROM, a RAM, and the like. The IC card or the module may include the super multifunctional LSI described above. The IC card or the module achieves its function by the microprocessor operating according to the computer program. This IC card or this module may have tamper resistance.
(4)本発明は、上記に示す方法であるとしてもよい。また、これらの方法をコンピュータにより実現するコンピュータプログラムであるとしてもよいし、前記コンピュータプログラムからなるデジタル信号であるとしてもよい。 (4) The present invention may be the method described above. Further, the present invention may be a computer program that realizes these methods by a computer, or may be a digital signal composed of the computer program.
また、本発明は、前記コンピュータプログラムまたは前記デジタル信号をコンピュータ読み取り可能な記録媒体、例えば、フレキシブルディスク、ハードディスク、CD−ROM、MO、DVD、DVD−ROM、DVD−RAM、BD(Blu−ray Disc)、半導体メモリなどに記録したものとしてもよい。また、これらの記録媒体に記録されている前記デジタル信号であるとしてもよい。 The present invention also provides a computer-readable recording medium such as a flexible disk, a hard disk, a CD-ROM, an MO, a DVD, a DVD-ROM, a DVD-RAM, a BD (Blu-ray Disc). ), Recorded in a semiconductor memory or the like. The digital signal may be recorded on these recording media.
また、本発明は、前記コンピュータプログラムまたは前記デジタル信号を、電気通信回線、無線または有線通信回線、インターネットを代表とするネットワーク、データ放送等を経由して伝送するものとしてもよい。 In the present invention, the computer program or the digital signal may be transmitted via an electric communication line, a wireless or wired communication line, a network represented by the Internet, a data broadcast, or the like.
また、本発明は、マイクロプロセッサとメモリを備えたコンピュータシステムであって、前記メモリは、上記コンピュータプログラムを記憶しており、前記マイクロプロセッサは、前記コンピュータプログラムにしたがって動作するとしてもよい。 The present invention may be a computer system including a microprocessor and a memory, wherein the memory stores the computer program, and the microprocessor operates according to the computer program.
また、前記プログラムまたは前記デジタル信号を前記記録媒体に記録して移送することにより、または前記プログラムまたは前記デジタル信号を前記ネットワーク等を経由して移送することにより、独立した他のコンピュータシステムにより実施するとしてもよい。 In addition, the program or the digital signal is recorded on the recording medium and transferred, or the program or the digital signal is transferred via the network or the like, and executed by another independent computer system. It is good.
(5)上記実施の形態及び上記変形例をそれぞれ組み合わせるとしてもよい。 (5) The above embodiment and the above modifications may be combined.
音声もしくは、オーディオ信号を、少ない情報量で圧縮符号化して、記憶媒体に記憶し、記憶媒体から、直接もしくは伝送路を介して取り出し、元の音声もしくは、オーディオ信号を復号する装置、例えば携帯電話機や、音楽プレーヤ等の機器一般に適用することが可能である。具体的には、光学ディスク・磁気ディスク・半導体メモリ等を記憶媒体とする音声・音楽プレーヤ、音声・音楽・ビデオ等の放送、オンデマンド配信等に利用するのに適している。 A device that compresses and encodes a voice or audio signal with a small amount of information, stores it in a storage medium, extracts it from the storage medium directly or via a transmission line, and decodes the original voice or audio signal, for example, a mobile phone It can also be applied to general devices such as music players. Specifically, it is suitable for use in audio / music players using optical disks, magnetic disks, semiconductor memories, etc. as storage media, broadcasting of audio / music / video, on-demand distribution, and the like.
101、201 サブバンドフィルタ
102、202 高域トーン性分析手段
103、203 低域トーン性分析手段
104、204 トーン信号付加可否決定手段
105 高調波構造分析手段
106、206 入力信号
107、207 高域サブバンド信号
108、208 低域サブバンド信号
109、209 高域信号のトーン性度合
110、210 低域信号のトーン性度合
111 高調波構造の分析結果
112、212 トーン付加フラグ情報
301 符号化側サブバンド信号
302 復号化側サブバンド信号
303 低域部と高域部の境界
304 符号化側のサブバンドn
305 符号化側のサブバンドm
306 復号化側のサブバンドn
307 復号化側のサブバンドm
401 トーン付加信号
402 低域からの複製信号
403 合成信号
404 サブバンド
405 スケールファクタバンド
406 付加されたトーン信号
407、408、409、410 低域からの複製信号に含まれるトーン性信号
411、412、413、414 合成信号に含まれるトーン性信号
415、416 低域からの複製信号の高調波間隔
417,418 合成信号の高調波間隔
101, 201
305 Encoding side subband m
306 Decoding side subband n
307 Decoding side subband m
401 Tone added
Claims (8)
入力信号を低域部のサブバンド信号と高域部のサブバンド信号とに変換する手段と、前記低域部のサブバンド信号のトーン性度合を算出する第1のトーン性分析手段と、前記高域部のサブバンド信号のトーン性度合を算出する第2のトーン性分析手段と、前記入力信号の高調波構造を分析する高調波構造分析手段と、前記高域部のサブバンド信号に人工的なトーン信号を付加するか否かを決定するトーン信号付加可否決定手段とを備え、
前記トーン信号付加可否決定手段は、算出された前記低域部のサブバンド信号のトーン性度合と算出された前記高域部のサブバンド信号のトーン性度合とを比較した結果と、前記高調波構造分析手段による高調波構造分析の結果に基づいて、トーン信号を付加するか否かを決定することを特徴とするオーディオ符号化装置。 An input signal is divided into a low-frequency signal that is a low-frequency band signal and a high-frequency signal that is a high-frequency signal, and the high-frequency signal is divided from the low-frequency signal. An audio encoding device for restoring using a copy of
Means for converting an input signal into a sub-band signal in a low-frequency part and a sub-band signal in a high-frequency part; first tone characteristic analyzing means for calculating a tone characteristic of the sub-band signal in the low-frequency part; and A second tone characteristic analyzing means for calculating a tone characteristic degree of the sub-band signal in the high frequency part; a harmonic structure analyzing means for analyzing a harmonic structure of the input signal; and an artificial signal for the sub-band signal in the high frequency part. Tone signal addition availability determination means for determining whether or not to add a typical tone signal,
The tone signal addition availability determination means compares the calculated tone characteristics of the low-frequency subband signal with the calculated tone characteristics of the high-frequency subband signal, and the harmonics An audio encoding device that determines whether or not to add a tone signal based on a result of harmonic structure analysis by the structure analysis means.
入力信号を低域部のサブバンド信号と高域部のサブバンド信号とに変換するステップと、前記低域部のサブバンド信号のトーン性度合を算出する第1のトーン性分析ステップと、前記高域部のサブバンド信号のトーン性度合を算出する第2のトーン性分析ステップと、前記入力信号の高調波構造を分析する高調波構造分析ステップと、前記高域部のサブバンド信号に人工的なトーン信号を付加するか否かを決定するトーン信号付加可否決定ステップとにより構成され、
前記トーン信号付加可否決定ステップは、算出された前記低域部のサブバンド信号のトーン性度合と、算出された前記高域部のサブバンド信号のトーン性度合とを比較した結果と、前記高調波構造分析ステップにおける高調波構造分析の結果に基づいて、トーン信号を付加するか否かを決定することを特徴とするオーディオ符号化方法。 An input signal is divided into a low-frequency signal that is a low-frequency band signal and a high-frequency signal that is a high-frequency signal, and the high-frequency signal is divided from the low-frequency signal. An audio encoding method for reconstructing using a copy of
Converting an input signal into a low-frequency subband signal and a high-frequency subband signal; a first tone analysis step of calculating a tone characteristic of the low-frequency subband signal; and A second tone characteristic analyzing step for calculating a tone characteristic degree of the high-frequency subband signal; a harmonic structure analyzing step for analyzing a harmonic structure of the input signal; and an artificial signal for the high-frequency subband signal. A tone signal addition determination step for determining whether or not to add a typical tone signal,
The step of determining whether or not to add a tone signal includes comparing the calculated tone characteristic of the low-frequency subband signal and the calculated tone characteristic of the high-frequency subband signal with the harmonics. An audio encoding method comprising: determining whether to add a tone signal based on a result of harmonic structure analysis in the wave structure analysis step.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006276218A JP2008096567A (en) | 2006-10-10 | 2006-10-10 | Audio encoding device and audio encoding method, and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006276218A JP2008096567A (en) | 2006-10-10 | 2006-10-10 | Audio encoding device and audio encoding method, and program |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2008096567A true JP2008096567A (en) | 2008-04-24 |
Family
ID=39379497
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006276218A Withdrawn JP2008096567A (en) | 2006-10-10 | 2006-10-10 | Audio encoding device and audio encoding method, and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2008096567A (en) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013531281A (en) * | 2010-07-19 | 2013-08-01 | ホアウェイ・テクノロジーズ・カンパニー・リミテッド | Spectral flatness control for bandwidth extension |
JP2013538374A (en) * | 2010-09-15 | 2013-10-10 | サムスン エレクトロニクス カンパニー リミテッド | Encoding / decoding apparatus and method for extending high frequency bandwidth |
JP2014240974A (en) * | 2014-08-06 | 2014-12-25 | ソニー株式会社 | Encoding apparatus, encoding method, and program |
JP2015508186A (en) * | 2012-02-23 | 2015-03-16 | ドルビー・インターナショナル・アーベー | Method and system for efficient restoration of high frequency audio content |
JP2016515723A (en) * | 2013-04-05 | 2016-05-30 | ドルビー・インターナショナル・アーベー | Audio encoder and decoder for interleaved waveform coding |
JP2016541012A (en) * | 2013-10-31 | 2016-12-28 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | Audio bandwidth expansion by temporal pre-shaping noise insertion in frequency domain |
EP3343560A1 (en) | 2016-12-27 | 2018-07-04 | Fujitsu Limited | Audio coding device and audio coding method |
JP2019028419A (en) * | 2017-07-28 | 2019-02-21 | 富士通株式会社 | Audio encoding apparatus, audio encoding method, and audio encoding program |
WO2021143691A1 (en) * | 2020-01-13 | 2021-07-22 | 华为技术有限公司 | Audio encoding and decoding methods and audio encoding and decoding devices |
-
2006
- 2006-10-10 JP JP2006276218A patent/JP2008096567A/en not_active Withdrawn
Cited By (31)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10339938B2 (en) | 2010-07-19 | 2019-07-02 | Huawei Technologies Co., Ltd. | Spectrum flatness control for bandwidth extension |
JP2013531281A (en) * | 2010-07-19 | 2013-08-01 | ホアウェイ・テクノロジーズ・カンパニー・リミテッド | Spectral flatness control for bandwidth extension |
US9047875B2 (en) | 2010-07-19 | 2015-06-02 | Futurewei Technologies, Inc. | Spectrum flatness control for bandwidth extension |
US9837090B2 (en) | 2010-09-15 | 2017-12-05 | Samsung Electronics Co., Ltd. | Apparatus and method for encoding and decoding signal for high frequency bandwidth extension |
JP2013538374A (en) * | 2010-09-15 | 2013-10-10 | サムスン エレクトロニクス カンパニー リミテッド | Encoding / decoding apparatus and method for extending high frequency bandwidth |
US10418043B2 (en) | 2010-09-15 | 2019-09-17 | Samsung Electronics Co., Ltd. | Apparatus and method for encoding and decoding signal for high frequency bandwidth extension |
US9183847B2 (en) | 2010-09-15 | 2015-11-10 | Samsung Electronics Co., Ltd. | Apparatus and method for encoding and decoding signal for high frequency bandwidth extension |
CN107993673A (en) * | 2012-02-23 | 2018-05-04 | 杜比国际公司 | Determine method, system, encoder, decoder and the medium of noise hybrid cytokine |
CN104541327A (en) * | 2012-02-23 | 2015-04-22 | 杜比国际公司 | Methods and systems for efficient recovery of high frequency audio content |
CN107993673B (en) * | 2012-02-23 | 2022-09-27 | 杜比国际公司 | Method, system, encoder, decoder and medium for determining a noise mixing factor |
JP2015508186A (en) * | 2012-02-23 | 2015-03-16 | ドルビー・インターナショナル・アーベー | Method and system for efficient restoration of high frequency audio content |
US9666200B2 (en) | 2012-02-23 | 2017-05-30 | Dolby International Ab | Methods and systems for efficient recovery of high frequency audio content |
US9984695B2 (en) | 2012-02-23 | 2018-05-29 | Dolby International Ab | Methods and systems for efficient recovery of high frequency audio content |
US10121479B2 (en) | 2013-04-05 | 2018-11-06 | Dolby International Ab | Audio encoder and decoder for interleaved waveform coding |
US11145318B2 (en) | 2013-04-05 | 2021-10-12 | Dolby International Ab | Audio encoder and decoder for interleaved waveform coding |
US11875805B2 (en) | 2013-04-05 | 2024-01-16 | Dolby International Ab | Audio encoder and decoder for interleaved waveform coding |
JP7317882B2 (en) | 2013-04-05 | 2023-07-31 | ドルビー・インターナショナル・アーベー | Decoding method, decoder, medium and encoding method for interleaved waveform coding |
JP2016515723A (en) * | 2013-04-05 | 2016-05-30 | ドルビー・インターナショナル・アーベー | Audio encoder and decoder for interleaved waveform coding |
US9514761B2 (en) | 2013-04-05 | 2016-12-06 | Dolby International Ab | Audio encoder and decoder for interleaved waveform coding |
JP2021113975A (en) * | 2013-04-05 | 2021-08-05 | ドルビー・インターナショナル・アーベー | Decoding method, decoder, medium, and encoding method for interleaved waveform coding |
JP2019168712A (en) * | 2013-04-05 | 2019-10-03 | ドルビー・インターナショナル・アーベー | Decoding method, decoder, medium, and encoding method for interleaved waveform coding |
JP2017058686A (en) * | 2013-04-05 | 2017-03-23 | ドルビー・インターナショナル・アーベー | Audio encoder and decoder for interleaved waveform coding |
JP2016541012A (en) * | 2013-10-31 | 2016-12-28 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | Audio bandwidth expansion by temporal pre-shaping noise insertion in frequency domain |
US9805731B2 (en) | 2013-10-31 | 2017-10-31 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio bandwidth extension by insertion of temporal pre-shaped noise in frequency domain |
JP2014240974A (en) * | 2014-08-06 | 2014-12-25 | ソニー株式会社 | Encoding apparatus, encoding method, and program |
US10224048B2 (en) | 2016-12-27 | 2019-03-05 | Fujitsu Limited | Audio coding device and audio coding method |
JP2018106076A (en) * | 2016-12-27 | 2018-07-05 | 富士通株式会社 | Audio encoder and audio encoding method |
EP3343560A1 (en) | 2016-12-27 | 2018-07-04 | Fujitsu Limited | Audio coding device and audio coding method |
JP2019028419A (en) * | 2017-07-28 | 2019-02-21 | 富士通株式会社 | Audio encoding apparatus, audio encoding method, and audio encoding program |
WO2021143691A1 (en) * | 2020-01-13 | 2021-07-22 | 华为技术有限公司 | Audio encoding and decoding methods and audio encoding and decoding devices |
US11887610B2 (en) | 2020-01-13 | 2024-01-30 | Huawei Technologies Co., Ltd. | Audio encoding and decoding method and audio encoding and decoding device |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7050972B2 (en) | Enhancing the performance of coding systems that use high frequency reconstruction methods | |
KR101711312B1 (en) | Apparatus and Method for Reproducing an Audio Signal, Apparatus and Method for Generating a Coded Audio Signal, Computer Program and Coded Audio Signal | |
JP2008096567A (en) | Audio encoding device and audio encoding method, and program | |
JP3762579B2 (en) | Digital audio signal encoding apparatus, digital audio signal encoding method, and medium on which digital audio signal encoding program is recorded | |
JP6306702B2 (en) | Encoded audio signal decoding apparatus, method and computer program | |
JP4918841B2 (en) | Encoding system | |
JP3646939B1 (en) | Audio decoding apparatus and audio decoding method | |
CN103765509B (en) | Code device and method, decoding device and method | |
JP3739959B2 (en) | Digital audio signal encoding apparatus, digital audio signal encoding method, and medium on which digital audio signal encoding program is recorded | |
KR100310214B1 (en) | Signal encoding or decoding device and recording medium | |
JP6769299B2 (en) | Audio coding device and audio coding method | |
JP4272897B2 (en) | Encoding apparatus, decoding apparatus and method thereof | |
JP2006011456A (en) | Method and device for coding/decoding low-bit rate and computer-readable medium | |
BRPI0910285B1 (en) | Methods and apparatus for processing the audio signal. | |
TR201902394T4 (en) | Noise filling concept. | |
EP2122615A1 (en) | Apparatus and method for encoding an information signal | |
CN101896968A (en) | Audio coding apparatus and method thereof | |
CN103548080A (en) | Hybrid audio signal encoder, hybrid audio signal decoder, method for encoding audio signal, and method for decoding audio signal | |
JP4021124B2 (en) | Digital acoustic signal encoding apparatus, method and recording medium | |
US7466245B2 (en) | Digital signal processing apparatus, digital signal processing method, digital signal processing program, digital signal reproduction apparatus and digital signal reproduction method | |
JP2013084002A (en) | Device and method for enhancing quality of speech codec | |
JP2004199075A (en) | Stereo audio encoding/decoding method and device capable of bit rate adjustment | |
JP4022504B2 (en) | Audio decoding method and apparatus for restoring high frequency components with a small amount of calculation | |
US6995699B2 (en) | Encoding method, and encoding apparatus, and decoding method and decoding apparatus | |
JP5808092B2 (en) | Method for detecting an audio signal having a base layer and an enhancement layer |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20090929 |
|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20091014 |
|
A761 | Written withdrawal of application |
Free format text: JAPANESE INTERMEDIATE CODE: A761 Effective date: 20110425 |