JP2001148159A - Audio processing device and method, and computer- readable recording medium recorded with program to make computer execute audio processing method - Google Patents

Audio processing device and method, and computer- readable recording medium recorded with program to make computer execute audio processing method

Info

Publication number
JP2001148159A
JP2001148159A JP32994999A JP32994999A JP2001148159A JP 2001148159 A JP2001148159 A JP 2001148159A JP 32994999 A JP32994999 A JP 32994999A JP 32994999 A JP32994999 A JP 32994999A JP 2001148159 A JP2001148159 A JP 2001148159A
Authority
JP
Japan
Prior art keywords
audio data
audio
encoding
frame
gain
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP32994999A
Other languages
Japanese (ja)
Inventor
Hiroshi Segawa
浩 瀬川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP32994999A priority Critical patent/JP2001148159A/en
Publication of JP2001148159A publication Critical patent/JP2001148159A/en
Withdrawn legal-status Critical Current

Links

Abstract

PROBLEM TO BE SOLVED: To provide an audio encoding processor which can reproduce second without causing the sudden changes of sound levels nor generating noise due to the changes. SOLUTION: This audio processor 30 includes a dual port memory 31, which stores the audio data supplied from an audio input pin, a register 32 which holds a pause indication signal, a register 33 which holds an audio-encoding indication signal, a processor 35 which applies the audio encoding processing to the audio data stored in the memory 31, an audio frame pulse generator 36 which generates an audio frame pulse and generates an interrupt to the processor 35 to start the audio encoding processing, a FIFO(first in first out) memory 34 which stores the audio encoding data processed by the processor 35 and outputs these data in a FIFO system via an audio-processing data output pin and a memory 37 which holds various parameters.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、オーディオ処理装
置および方法、ならびにオーディオ処理方法をコンピュ
ータに実行させるためのプログラムを記録したコンピュ
ータ読取可能な記録媒体に関する。特に、音声再生時に
雑音が生じないオーディオ処理装置および方法、ならび
にオーディオ処理方法をコンピュータに実行させるため
のプログラムを記録したコンピュータ読取可能な記録媒
体に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to an audio processing apparatus and method, and a computer-readable recording medium on which a program for causing a computer to execute the audio processing method is recorded. In particular, the present invention relates to an audio processing apparatus and method that does not generate noise during audio reproduction, and a computer-readable recording medium that stores a program for causing a computer to execute the audio processing method.

【0002】[0002]

【従来の技術】従来、デジタルオーディオPCM(Puls
e Code Modulation)データの符号化処理装置を用いた
録音装置が存在する。オーディオ符号化処理としては、
MPEG(Moving Picture Experts Group)において国
際標準化が行なわれているMPEG1オーディオ圧縮処
理やDolby社が開発したAC−3圧縮処理などが用
いられている。
2. Description of the Related Art Conventionally, digital audio PCM (Puls
e Code Modulation) There is a recording device that uses a data encoding device. As audio encoding processing,
MPEG1 audio compression processing, which is internationally standardized by the Moving Picture Experts Group (MPEG), and AC-3 compression processing developed by Dolby are used.

【0003】録音装置には当然のことながら、録音動作
を一時停止させるポーズ機能がサポートされている。た
とえば、ユーザが、2つの異なるオーディオソースに録
音された楽曲を再生して、連続して録音するには、ある
オーディオソースからの録音が終了した段階で録音動作
を一時停止させ、オーディオソースを次のオーディオソ
ースに切換えた後、録音を再開させる。
[0003] The recording device naturally supports a pause function for temporarily stopping the recording operation. For example, in order for the user to play back music recorded on two different audio sources and record continuously, the recording operation is paused when recording from one audio source is completed, and the audio source is switched to the next. After switching to the audio source, recording is resumed.

【0004】図11を参照して、ポーズ機能を利用した
録音動作の一例について説明する。図中、処理対象とな
る各オーディオフレーム(以下「フレーム」という)に
は、A0〜A8までの番号を付している。オーディオ符
号化指示信号がL(Low)のとき、録音装置におい
て、オーディオ符号化処理がフレーム毎に行なわれ、ポ
ーズ指示信号がLのとき、オーディオ符号化指示信号の
値にかかわらず、オーディオ符号化処理が停止される。
図11に示す例では、フレームA2の処理が終了した段
階で、ポーズ指示信号がLとなり、ポーズが行なわれ
る。ポーズ指示信号がLである間に入力されるフレーム
A3およびA4はオーディオ符号化処理されない。フレ
ームA5が処理される時点で、ポーズ指示信号がH(H
igh)となるものとすると、フレームA5以降のフレ
ームに対してオーディオ符号化処理が再開される。
An example of a recording operation using a pause function will be described with reference to FIG. In the figure, audio frames to be processed (hereinafter referred to as “frames”) are numbered A0 to A8. When the audio encoding instruction signal is L (Low), the audio encoding process is performed for each frame in the recording device. When the pause instruction signal is L, audio encoding is performed regardless of the value of the audio encoding instruction signal. Processing is stopped.
In the example shown in FIG. 11, when the processing of the frame A2 is completed, the pause instruction signal becomes L, and the pause is performed. The frames A3 and A4 input while the pause instruction signal is at L are not subjected to audio encoding processing. At the time when the frame A5 is processed, the pause instruction signal becomes H (H
i), the audio encoding process is restarted for the frames after the frame A5.

【0005】このようなポーズ機能を利用することによ
り、オーディオ再生時には、フレームA0、A1、A
2、A5、A6…の順で再生が行なわれる。
By using such a pause function, frames A0, A1, A
Reproduction is performed in the order of 2, A5, A6,.

【0006】[0006]

【発明が解決しようとする課題】しかし、録音動作が一
時停止された前後には、再生音声レベル差が存在するこ
とがある。この再生音声レベル差、すなわち、図11に
示す例ではフレームA2とA5との間の再生音声レベル
差が大きい場合には、オーディオ再生時に雑音が生じ問
題であった。
However, before and after the recording operation is temporarily stopped, there may be a difference in the reproduced sound level. If the difference between the reproduced sound levels, that is, the difference between the reproduced sound levels between the frames A2 and A5 in the example shown in FIG. 11, is large, noise is generated at the time of reproducing the audio.

【0007】また、たとえば、テレビ番組では、CM
(Commercial Message)などへの切換えのタイミングで
ステレオ音声からモノラル音声への切換えが行なわれ
る。そしてこの音声切換えをトリガとして録画のポー
ズ、ポーズ解除を行なう装置がある。しかし、映像信号
と音声信号とが必ずしも正確に対応しているとは限らな
い。このため、音声切換えをトリガとしてポーズ動作を
行なうと通常のオーディオ符号化処理では、映像信号と
音声信号との間のずれにより、一時停止前の映像再生時
に、一時停止後の映像に対応した音声信号が再生されて
しまう場合、およびその逆の現象が生じる場合がある。
[0007] For example, in a television program, CM
(Commercial Message) or the like, switching from stereo sound to monaural sound is performed. There is a device that pauses and unpauses the recording by using the voice switching as a trigger. However, video signals and audio signals do not always correspond exactly. For this reason, if a pause operation is performed with audio switching as a trigger, in a normal audio encoding process, due to a shift between the video signal and the audio signal, the audio corresponding to the video after the pause is reproduced when the video is reproduced before the pause. In some cases, a signal is reproduced, and vice versa.

【0008】本発明は、上述の課題を解決するためにな
されたもので、その目的は、再生時に音声レベルの急激
な変化がなく、それに伴う雑音を生じさせることなく、
音声再生を行なうことができる、オーディオ符号化処理
装置および方法、ならびにオーディオ処理方法をコンピ
ュータに実行させるためのプログラムを記録したコンピ
ュータ読取可能な記録媒体を提供することである。
SUMMARY OF THE INVENTION The present invention has been made to solve the above-mentioned problem, and has as its object to prevent a sudden change in the sound level during reproduction and without causing noise accompanying the change.
An object of the present invention is to provide an audio encoding processing device and method capable of reproducing audio, and a computer-readable recording medium recording a program for causing a computer to execute the audio processing method.

【0009】本発明の他の目的は、複数の機器を使用す
る場合の再生タイミングの不整合を回避することができ
るオーディオ符号化処理装置および方法、ならびにオー
ディオ処理方法をコンピュータに実行させるためのプロ
グラムを記録したコンピュータ読取可能な記録媒体を提
供することである。
Another object of the present invention is to provide an audio encoding processing apparatus and method capable of avoiding a mismatch in reproduction timing when a plurality of devices are used, and a program for causing a computer to execute the audio processing method. Is to provide a computer-readable recording medium on which is recorded.

【0010】[0010]

【課題を解決するための手段】請求項1に記載の発明に
係るオーディオ処理装置は、第1および第2の値のうち
いずれかを選択的にとるオーディオデータの符号化処理
を指示するための第1の信号と、第3および第4の値の
うちいずれかを選択的にとるオーディオデータの符号化
処理の一時停止を指示するための第2の信号とに基づい
て、フレーム単位でオーディオデータを符号化する。オ
ーディオ処理装置は、フレーム単位のオーディオデータ
が入力される第1のポートおよびオーディオデータが出
力される第2のポートを有するメモリと、メモリに接続
され、メモリにオーディオデータが入力されると、メモ
リからオーディオデータを遅延させて読込み、第1およ
び第2の信号の履歴に基づいて、オーディオデータを符
号化する処理または符号化しない処理のいずれかを選択
的に実行するオーディオデータ符号化手段と、オーディ
オデータ符号化手段に結合され、記第2の信号の履歴に
基づいて、オーディオデータ符号化手段がオーディオデ
ータの符号化をしない期間の前後のフレームでオーディ
オデータの音声レベル差をなくすようオーディオデータ
符号化手段で符号化されるオーディオデータのゲインを
制御する音声レベル制御手段とを含む。
According to a first aspect of the present invention, there is provided an audio processing apparatus for instructing an audio data encoding process to selectively take one of a first value and a second value. Audio data in frame units based on a first signal and a second signal for instructing to temporarily stop encoding processing of audio data that selectively takes one of a third value and a fourth value; Is encoded. The audio processing device is connected to a memory having a first port to which audio data of a frame unit is input and a second port to which audio data is output, and when the audio data is input to the memory, the memory Audio data encoding means for reading audio data with a delay from the audio data, and selectively executing either audio data encoding processing or non-encoding processing based on the history of the first and second signals; Audio data encoding means coupled to the audio data encoding means for eliminating an audio level difference between the audio data in frames before and after a period in which the audio data encoding means does not encode the audio data based on the history of the second signal; A sound level controlling the gain of audio data encoded by the encoding means. And a le control unit.

【0011】オーディオデータの符号化処理が一時停止
される前後でオーディオフレームデータの音声レベル差
がなくなる。このため、再生時に音声レベルの急激な変
化がなく、それに伴う雑音が生じさせることなく、音声
再生を行なうことができる。
There is no difference in audio level between audio frame data before and after the audio data encoding process is temporarily stopped. For this reason, audio reproduction can be performed without a sudden change in the audio level at the time of reproduction, and without generating noise accompanying the change.

【0012】請求項2に記載の発明は、請求項1に記載
の発明の構成に加えて、音声レベル制御手段は、オーデ
ィオデータ符号化手段に結合され、第2の信号の履歴に
基づいて、オーディオデータ符号化手段が符号化を停止
するフレームよりも前の第1の所定フレーム期間でオー
ディオデータの音声レベルのゲインを基準値まで減少さ
せる第1のフェードアウト手段と、オーディオデータ符
号化手段に結合され、第2の信号の履歴に基づいて、オ
ーディオデータ符号化手段が符号化を再開するフレーム
以降の第2の所定フレーム期間でオーディオデータの音
声レベルのゲインを基準値から増加させるフェードイン
手段とを含む。
According to a second aspect of the present invention, in addition to the configuration of the first aspect, the audio level control means is coupled to the audio data encoding means, and based on the history of the second signal, First fade-out means for reducing the gain of the audio level of the audio data to a reference value during a first predetermined frame period before the frame at which the audio data encoding means stops encoding, and audio data encoding means; And fade-in means for increasing the gain of the audio level of the audio data from the reference value in a second predetermined frame period after the frame in which the audio data encoding means resumes encoding based on the history of the second signal. including.

【0013】オーディオデータの符号化処理が一時停止
される直前までにオーディオデータの音声レベルのゲイ
ンが基準値まで減少し、一時停止が解除されたフレーム
のオーディオデータの音声レベルのゲインが基準値から
増加する。このため、再生時に音声レベルの急激な変化
がなく、それに伴う雑音が生じさせることなく、音声再
生を行なうことができる。
[0013] The gain of the audio level of the audio data decreases to the reference value just before the audio data encoding process is paused, and the gain of the audio level of the audio data of the frame whose pause has been released is reduced from the reference value. To increase. For this reason, audio reproduction can be performed without a sudden change in the audio level at the time of reproduction, and without generating noise accompanying the change.

【0014】請求項3に記載の発明は、請求項2に記載
の発明の構成に加えて、第1のフェードアウト手段は、
オーディオデータ符号化手段に結合され、第2の信号の
履歴に基づいて、オーディオデータ符号化手段が符号化
を停止する直前の1フレームでオーディオデータの音声
レベルのゲインを基準値まで減少させる第2のフェード
アウト手段を含む。
According to a third aspect of the present invention, in addition to the configuration of the second aspect, the first fade-out means includes:
A second audio signal encoding unit configured to reduce the audio level gain of the audio data to a reference value in one frame immediately before the audio data encoding unit stops encoding, based on the history of the second signal; Including fade-out means.

【0015】請求項4に記載の発明は、請求項2に記載
の発明の構成に加えて、第1のフェードアウト手段は、
オーディオデータ符号化手段に結合され、第2の信号の
履歴に基づいて、オーディオデータ符号化手段が符号化
を停止するフレームよりも2フレーム以上前の予め定め
られたフレームに対して、オーディオデータの音声レベ
ルのゲインを予め定められた方法に従い基準値まで減少
させる第2のフェードアウト手段と、オーディオデータ
符号化手段に結合され、第2の信号の履歴に基づいて、
予め定められたフレームよりも後であり、かつオーディ
オデータ符号化手段が符号化を停止するよりも前のフレ
ームのオーディオデータの音声レベルのゲインを基準値
に維持させるミュート手段とを含む。
According to a fourth aspect of the present invention, in addition to the configuration of the second aspect, the first fade-out means includes:
The audio data encoding unit is coupled to the predetermined frame two or more frames before the frame at which the audio data encoding unit stops encoding based on the history of the second signal. A second fade-out means for reducing the gain of the audio level to a reference value according to a predetermined method, and an audio data encoding means, based on a history of the second signal,
And mute means for maintaining the gain of the audio level of the audio data of the frame after the predetermined frame and before the audio data encoding means stops encoding at the reference value.

【0016】たとえば、テレビ番組では、CMなどへの
切換えのタイミングでステレオ音声からモノラル音声へ
の切換えが行なわれる。そしてこの音声切換えをトリガ
として録画のポーズ、ポーズ解除を行なう装置がある。
しかし、映像信号と音声信号とが必ずしも正確に対応し
ているとは限らない。このため、音声切換えをトリガと
してポーズ動作を行なうと通常のオーディオ符号化処理
では、映像信号と音声信号との間のずれにより、一時停
止前の映像再生時に、一時停止後の映像に対応した音声
信号が再生されてしまう場合、およびその逆の現象が生
じる場合がある。しかし、一時停止が行なわれる前の数
フレームの間、音声レベルが基準値に定められる。この
ため、この基準値を低く定めておけば、一時停止後の映
像に対応した音声信号が一時停止前の映像再生時に生成
されることがなくなり、複数の機器を使用する場合の再
生タイミングの不整合を回避することができる。
For example, in a television program, switching from stereo sound to monaural sound is performed at the timing of switching to CM or the like. There is a device that pauses and unpauses the recording by using the voice switching as a trigger.
However, video signals and audio signals do not always correspond exactly. For this reason, if a pause operation is performed with audio switching as a trigger, in a normal audio encoding process, due to a shift between the video signal and the audio signal, the audio corresponding to the video after the pause is reproduced when the video is reproduced before the pause. In some cases, a signal is reproduced, and vice versa. However, for several frames before the pause is performed, the audio level is set to the reference value. For this reason, if this reference value is set low, an audio signal corresponding to the video after the pause will not be generated at the time of video reproduction before the pause, and the reproduction timing will not be correct when using multiple devices. Matching can be avoided.

【0017】請求項5に記載の発明に係るオーディオ処
理方法は、第1および第2の値のうちいずれかを選択的
にとるオーディオデータの符号化処理を指示するための
第1の信号と、第3および第4の値のうちいずれかを選
択的にとるオーディオデータの符号化処理の一時停止を
指示するための第2の信号とに基づいて、オーディオデ
ータをフレーム単位で符号化する。オーディオ処理方法
は、入力されたオーディオデータを遅延させるステップ
と、遅延させたオーディオデータおよび第2の信号の履
歴に基づいて、オーディオデータが符号化されない期間
の前後のフレームでオーディオデータの音声レベル差を
なくすよう符号化されるオーディオデータのゲインを制
御するステップと、遅延させたオーディオデータならび
に第1および第2の信号の履歴に基づいて、オーディオ
データを符号化する処理または符号化しない処理のいず
れかを選択的に実行するステップとを含む。
According to a fifth aspect of the present invention, there is provided an audio processing method, comprising: a first signal for instructing an audio data encoding process for selectively taking one of a first value and a second value; The audio data is encoded in frame units based on a second signal for instructing to temporarily stop encoding processing of the audio data that selectively takes one of the third and fourth values. The audio processing method includes the steps of: delaying input audio data; and determining, based on the history of the delayed audio data and the second signal, an audio level difference of the audio data between frames before and after a period in which the audio data is not encoded. Controlling the gain of the audio data to be encoded so as to eliminate the error, and encoding or not encoding the audio data based on the delayed audio data and the history of the first and second signals. Selectively performing the operation.

【0018】オーディオデータの符号化処理が一時停止
される前後でオーディオフレームデータの音声レベル差
がなくなる。このため、再生時に音声レベルの急激な変
化がなく、それに伴う雑音が生じさせることなく、音声
再生を行なうことができる。
There is no difference in audio level between audio frame data before and after the audio data encoding process is temporarily stopped. For this reason, audio reproduction can be performed without a sudden change in the audio level at the time of reproduction, and without generating noise accompanying the change.

【0019】請求項6に記載の発明は、請求項5に記載
の発明の構成に加えて、ゲインを制御するステップは、
遅延させたオーディオデータおよび第2の信号の履歴に
基づいて、オーディオデータの符号化が停止するフレー
ムよりも前の第1の所定フレーム期間でオーディオデー
タの音声レベルのゲインを基準値まで減少させるステッ
プと、遅延させたオーディオデータおよび第2の信号の
履歴に基づいて、オーディオデータの符号化が再開され
るフレーム以降の第2の所定フレーム期間でオーディオ
データの音声レベルのゲインを基準値から増加させるス
テップとを含む。
According to a sixth aspect of the present invention, in addition to the configuration of the fifth aspect of the present invention, the step of controlling the gain comprises:
Reducing the gain of the audio level of the audio data to a reference value in a first predetermined frame period before a frame in which encoding of the audio data is stopped based on the delayed audio data and the history of the second signal. And increasing the gain of the audio level of the audio data from the reference value in a second predetermined frame period after the frame in which the encoding of the audio data is restarted, based on the delayed audio data and the history of the second signal. Steps.

【0020】オーディオデータの符号化処理が一時停止
される直前までにオーディオデータの音声レベルのゲイ
ンが基準値まで減少し、一時停止が解除されたフレーム
のオーディオデータの音声レベルのゲインが基準値から
増加する。このため、再生時に音声レベルの急激な変化
がなく、それに伴う雑音が生じさせることなく、音声再
生を行なうことができる。
Just before the audio data encoding process is paused, the audio level gain of the audio data decreases to the reference value, and the audio level gain of the audio data of the frame whose pause has been released is reduced from the reference value. To increase. For this reason, audio reproduction can be performed without a sudden change in the audio level at the time of reproduction, and without generating noise accompanying the change.

【0021】請求項7に記載の発明は、請求項6に記載
の発明の構成に加えて、ゲインを基準値まで減少させる
ステップは、遅延させたオーディオデータおよび第2の
信号の履歴に基づいて、オーディオデータの符号化が停
止する直前の1フレームでオーディオデータの音声レベ
ルのゲインを基準値まで減少させるステップを含む。
According to a seventh aspect of the present invention, in addition to the configuration of the sixth aspect, the step of reducing the gain to the reference value is based on the delayed audio data and the history of the second signal. And reducing the gain of the audio level of the audio data to the reference value in one frame immediately before the stop of the encoding of the audio data.

【0022】請求項8に記載の発明は、請求項6に記載
の発明の構成に加えて、ゲインを基準値まで減少させる
ステップは、遅延させたオーディオデータおよび第2の
信号の履歴に基づいて、オーディオデータの符号化が停
止するフレームよりも2フレーム以上前の予め定められ
たフレームに対して、オーディオデータの音声レベルの
ゲインを予め定められた方法に従い基準値まで減少させ
るステップと、遅延させたオーディオデータおよび第2
の信号の履歴に基づいて、予め定められたフレームより
も後であり、かつオーディオデータの符号化が停止する
よりも前のフレームのオーディオデータの音声レベルの
ゲインを基準値に維持させるステップとを含む。
According to an eighth aspect of the present invention, in addition to the configuration of the sixth aspect, the step of reducing the gain to the reference value is based on the delayed audio data and the history of the second signal. Reducing the gain of the audio level of the audio data to a reference value according to a predetermined method for a predetermined frame two or more frames before the frame at which the encoding of the audio data is stopped; Audio data and second
Maintaining the gain of the audio level of the audio data of the frame after the predetermined frame and before the encoding of the audio data is stopped, based on the signal history of Including.

【0023】たとえば、テレビ番組では、CMなどへの
切換えのタイミングでステレオ音声からモノラル音声へ
の切換えが行なわれる。そしてこの音声切換えをトリガ
として録画のポーズ、ポーズ解除を行なう装置がある。
しかし、映像信号と音声信号とが必ずしも正確に対応し
ているとは限らない。このため、音声切換えをトリガと
してポーズ動作を行なうと通常のオーディオ符号化処理
では、映像信号と音声信号との間のずれにより、一時停
止前の映像再生時に、一時停止後の映像に対応した音声
信号が再生されてしまう場合、およびその逆の現象が生
じる場合がある。しかし、一時停止が行なわれる前の数
フレームの間、音声レベルが基準値に定められる。この
ため、この基準値を低く定めておけば、一時停止後の映
像に対応した音声信号が一時停止前の映像再生時に生成
されることがなくなり、複数の機器を使用する場合の再
生タイミングの不整合を回避することができる。
For example, in a television program, switching from stereo sound to monaural sound is performed at the timing of switching to CM or the like. There is a device that pauses and unpauses the recording by using the voice switching as a trigger.
However, video signals and audio signals do not always correspond exactly. For this reason, if a pause operation is performed with audio switching as a trigger, in a normal audio encoding process, due to a shift between the video signal and the audio signal, the audio corresponding to the video after the pause is reproduced when the video is reproduced before the pause. In some cases, a signal is reproduced, and vice versa. However, for several frames before the pause is performed, the audio level is set to the reference value. For this reason, if this reference value is set low, an audio signal corresponding to the video after the pause will not be generated at the time of video reproduction before the pause, and the reproduction timing will not be correct when using multiple devices. Matching can be avoided.

【0024】請求項9に記載の発明に係るコンピュータ
読取可能な記録媒体は、第1および第2の値のうちいず
れかを選択的にとるオーディオデータの符号化処理を指
示するための第1の信号と、第3および第4の値のうち
いずれかを選択的にとるオーディオデータの符号化処理
の一時停止を指示するための第2の信号とに基づいて、
オーディオデータをフレーム単位で符号化するオーディ
オ処理方法をコンピュータに実行させるためのプログラ
ムを記録している。オーディオ処理方法は、入力された
オーディオデータを遅延させるステップと、遅延させた
オーディオデータおよび第2の信号の履歴に基づいて、
オーディオデータが符号化されない期間の前後のフレー
ムでオーディオデータの音声レベル差をなくすよう符号
化されるオーディオデータのゲインを制御するステップ
と、遅延させたオーディオデータならびに第1および第
2の信号の履歴に基づいて、オーディオデータを符号化
する処理または符号化しない処理のいずれかを選択的に
実行するステップとを含む。
According to a ninth aspect of the present invention, there is provided a computer-readable recording medium according to the first aspect for instructing an audio data encoding process to selectively take one of a first value and a second value. On the basis of a signal and a second signal for instructing to temporarily stop encoding processing of audio data that selectively takes one of the third and fourth values.
A program for causing a computer to execute an audio processing method for encoding audio data in frame units is recorded. The audio processing method includes the steps of: delaying input audio data; and, based on the delayed audio data and the history of the second signal,
Controlling the gain of the audio data to be encoded so as to eliminate the audio level difference of the audio data in frames before and after the period in which the audio data is not encoded, and the history of the delayed audio data and the first and second signals And selectively performing either a process of encoding the audio data or a process of not encoding the audio data based on the audio data.

【0025】オーディオデータの符号化処理が一時停止
される前後でオーディオフレームデータの音声レベル差
がなくなる。このため、再生時に音声レベルの急激な変
化がなく、それに伴う雑音が生じさせることなく、音声
再生を行なうことができる。
There is no difference in audio level between audio frame data before and after the audio data encoding process is temporarily stopped. For this reason, audio reproduction can be performed without a sudden change in the audio level at the time of reproduction, and without generating noise accompanying the change.

【0026】請求項10に記載の発明は、請求項9に記
載の発明の構成に加えて、ゲインを制御するステップ
は、遅延させたオーディオデータおよび第2の信号の履
歴に基づいて、オーディオデータの符号化が停止するフ
レームよりも前の第1の所定フレーム期間でオーディオ
データの音声レベルのゲインを基準値まで減少させるス
テップと、遅延させたオーディオデータおよび第2の信
号の履歴に基づいて、オーディオデータの符号化が再開
されるフレーム以降の第2の所定フレーム期間でオーデ
ィオデータの音声レベルのゲインを基準値から増加させ
るステップとを含む。
According to a tenth aspect of the present invention, in addition to the configuration of the ninth aspect of the present invention, the step of controlling the gain includes the step of controlling the audio data based on the delayed audio data and the history of the second signal. Reducing the gain of the audio level of the audio data to a reference value in a first predetermined frame period before the frame in which encoding of the audio data stops, and based on the history of the delayed audio data and the second signal, Increasing the gain of the audio level of the audio data from the reference value in a second predetermined frame period after the frame in which the encoding of the audio data is restarted.

【0027】オーディオデータの符号化処理が一時停止
される直前までにオーディオデータの音声レベルのゲイ
ンが基準値まで減少し、一時停止が解除されたフレーム
のオーディオデータの音声レベルのゲインが基準値から
増加する。このため、再生時に音声レベルの急激な変化
がなく、それに伴う雑音が生じさせることなく、音声再
生を行なうことができる。
[0027] The gain of the audio level of the audio data decreases to the reference value just before the audio data encoding process is paused, and the gain of the audio level of the audio data of the frame whose pause has been released is reduced from the reference value. To increase. For this reason, audio reproduction can be performed without a sudden change in the audio level at the time of reproduction, and without generating noise accompanying the change.

【0028】請求項11に記載の発明は、請求項10に
記載の発明の構成に加えて、ゲインを基準値まで減少さ
せるステップは、遅延させたオーディオデータおよび第
2の信号の履歴に基づいて、オーディオデータの符号化
が停止する直前の1フレームでオーディオデータの音声
レベルのゲインを基準値まで減少させるステップを含
む。
According to an eleventh aspect of the present invention, in addition to the configuration of the tenth aspect, the step of reducing the gain to the reference value is based on the delayed audio data and the history of the second signal. And reducing the gain of the audio level of the audio data to the reference value in one frame immediately before the stop of the encoding of the audio data.

【0029】請求項12に記載の発明は、請求項10に
記載の発明の構成に加えて、ゲインを基準値まで減少さ
せるステップは、遅延させたオーディオデータおよび第
2の信号の履歴に基づいて、オーディオデータの符号化
が停止するフレームよりも2フレーム以上前の予め定め
られたフレームに対して、オーディオデータの音声レベ
ルのゲインを予め定められた方法に従い基準値まで減少
させるステップと、遅延させたオーディオデータおよび
第2の信号の履歴に基づいて、予め定められたフレーム
よりも後であり、かつオーディオデータの符号化が停止
するよりも前のフレームのオーディオデータの音声レベ
ルのゲインを基準値に維持させるステップとを含む。
According to a twelfth aspect of the present invention, in addition to the configuration of the tenth aspect, the step of reducing the gain to the reference value is based on the delayed audio data and the history of the second signal. Reducing the gain of the audio level of the audio data to a reference value according to a predetermined method for a predetermined frame two or more frames before the frame at which the encoding of the audio data is stopped; The gain of the audio level of the audio data of the frame after the predetermined frame and before the encoding of the audio data is stopped based on the history of the audio data and the history of the second signal. Maintaining.

【0030】たとえば、テレビ番組では、CMなどへの
切換えのタイミングでステレオ音声からモノラル音声へ
の切換えが行なわれる。そしてこの音声切換えをトリガ
として録画のポーズ、ポーズ解除を行なう装置がある。
しかし、映像信号と音声信号とが必ずしも正確に対応し
ているとは限らない。このため、音声切換えをトリガと
してポーズ動作を行なうと通常のオーディオ符号化処理
では、映像信号と音声信号との間のずれにより、一時停
止前の映像再生時に、一時停止後の映像に対応した音声
信号が再生されてしまう場合、およびその逆の現象が生
じる場合がある。しかし、一時停止が行なわれる前の数
フレームの間、音声レベルが基準値に定められる。この
ため、この基準値を低く定めておけば、一時停止後の映
像に対応した音声信号が一時停止前の映像再生時に生成
されることがなくなり、複数の機器を使用する場合の再
生タイミングの不整合を回避することができる。
For example, in a television program, switching from stereo sound to monaural sound is performed at the timing of switching to CM or the like. There is a device that pauses and unpauses the recording by using the voice switching as a trigger.
However, video signals and audio signals do not always correspond exactly. For this reason, if a pause operation is performed with audio switching as a trigger, in a normal audio encoding process, due to a shift between the video signal and the audio signal, the audio corresponding to the video after the pause is reproduced when the video is reproduced before the pause. In some cases, a signal is reproduced, and vice versa. However, for several frames before the pause is performed, the audio level is set to the reference value. For this reason, if this reference value is set low, an audio signal corresponding to the video after the pause will not be generated at the time of video reproduction before the pause, and the reproduction timing will not be correct when using multiple devices. Matching can be avoided.

【0031】[0031]

【発明の実施の形態】[実施の形態1]図1を参照し
て、本発明の実施の形態に係るオーディオ処理装置30
は、一方のポートがオーディオ入力ピンに接続され、他
方のポートが後述するバスに接続され、オーディオ入力
ピンより供給されるオーディオデータを記憶する2ポー
トメモリ31と、オーディオデータの符号化処理の一時
停止を指示するためのポーズ指示信号を保持するレジス
タ32と、オーディオデータの符号化を指示をするため
のオーディオ符号化指示信号を保持するレジスタ33
と、2ポートメモリ31に記憶されたオーディオデータ
にオーディオ符号化処理を施すプロセッサ35と、プロ
セッサ35に接続され、オーディオフレームパルスを発
生させ、オーディオフレームパルスに応答してプロセッ
サ35に割込みをかけ、オーディオ符号化処理を起動さ
せるオーディオフレームパルス発生器36と、プロセッ
サ35で処理されたオーディオ符号化データを記憶し、
先入れ先出し方式でオーディオ処理データ出力ピンより
出力するFIFO(First In First Out)メモリ34
と、各種パラメータを保持するメモリ37と、2ポート
メモリ31、レジスタ32、レジスタ33、FIFOメ
モリ34、プロセッサ35およびメモリ37を相互に接
続するバスとを含む。
[First Embodiment] Referring to FIG. 1, an audio processing apparatus 30 according to an embodiment of the present invention will be described.
Is a two-port memory 31 in which one port is connected to an audio input pin, the other port is connected to a bus described later, and stores audio data supplied from the audio input pin. A register 32 for holding a pause instruction signal for instructing stop, and a register 33 for holding an audio encoding instruction signal for instructing audio data encoding.
And a processor 35 for performing audio encoding processing on audio data stored in the two-port memory 31, connected to the processor 35, generating an audio frame pulse, interrupting the processor 35 in response to the audio frame pulse, An audio frame pulse generator 36 for activating an audio encoding process, and audio encoded data processed by the processor 35 are stored,
FIFO (First In First Out) memory 34 for outputting from the audio processing data output pin in a first-in first-out manner
And a memory 37 for holding various parameters, and a bus for interconnecting the two-port memory 31, the register 32, the register 33, the FIFO memory 34, the processor 35, and the memory 37.

【0032】レジスタ32は、ポーズ指示信号がHのと
き1を保持し、Lのとき0を保持する。レジスタ33
は、オーディオ符号化指示信号がHのとき1を保持し、
Lのとき0を保持する。
The register 32 holds 1 when the pause instruction signal is H, and holds 0 when the pause instruction signal is L. Register 33
Holds 1 when the audio encoding instruction signal is H,
When it is L, it holds 0.

【0033】図2および図3を参照して、オーディオ処
理装置30の各部は以下のように動作する。オーディオ
フレームパルス発生器36で発生するオーディオフレー
ムパルスにより、プロセッサ35に割込み処理がかけら
れると、プロセッサ35は、レジスタ33に記憶されて
いるオーディオ符号化指示信号がL(オーディオ符号化
指示がされている)か否かを判断する(S2)。オーデ
ィオ符号化指示がされていなければ(S2でNO)、処
理を終了する。オーディオ符号化指示がされていれば
(S2でYES)、プロセッサ35は、メモリ37に記
憶されているオーディオフレームカウンタを1つインク
リメントする(S4)。なお、初期状態ではオーディオ
フレームカウンタが−1にセットされているものとす
る。
Referring to FIGS. 2 and 3, each unit of audio processing device 30 operates as follows. When the processor 35 is interrupted by an audio frame pulse generated by the audio frame pulse generator 36, the processor 35 changes the audio encoding instruction signal stored in the register 33 to L (audio encoding instruction is issued. Is determined) (S2). If the audio encoding instruction has not been issued (NO in S2), the process ends. If an audio encoding instruction has been issued (YES in S2), the processor 35 increments the audio frame counter stored in the memory 37 by one (S4). It is assumed that the audio frame counter is set to -1 in the initial state.

【0034】プロセッサ35は、オーディオフレームカ
ウンタが2以上か否かを判断する(S6)。オーディオ
フレームカウンタが0または1であれば(S6でN
O)、オーディオ符号化処理はまだ行なわれないため、
処理を終了する。
The processor 35 determines whether the audio frame counter is 2 or more (S6). If the audio frame counter is 0 or 1 (N in S6)
O), since the audio encoding process has not been performed yet,
The process ends.

【0035】オーディオフレームカウンタが2以上にな
った時点で(S6でYES)、プロセッサ35は、2ポ
ートメモリ31より1フレーム分のオーディオデータを
読込む(S8)。オーディオフレームカウンタが0およ
び1の場合には、オーディオデータの読込み処理が行な
われておらず、その間のオーディオデータは、2ポート
メモリ31に保持されている。このため、S8の処理で
は、常に2フレーム前のオーディオデータが読込まれる
ことになり、以降のオーディオ符号化処理では、現在入
力されいれているオーディオデータよりも2フレーム前
のオーディオデータに対してオーディオ符号化処理が行
なわれる。
When the audio frame counter becomes 2 or more (YES in S6), the processor 35 reads one frame of audio data from the two-port memory 31 (S8). When the audio frame counter is 0 or 1, no audio data reading processing is performed, and the audio data during that time is held in the two-port memory 31. Therefore, in the process of S8, the audio data two frames before is always read, and in the subsequent audio encoding process, the audio data two frames before the currently input audio data is read. An audio encoding process is performed.

【0036】図4を参照して、プロセッサ35は、2フ
レーム前のポーズ指示信号の状態を表わすポーズ指示フ
ラグ2に1フレーム前のポーズ指示信号の状態を表わす
ポーズ指示フラグ1の値を代入する。また、ポーズ指示
フラグ1に現在のポーズ指示フラグの状態を表わすポー
ズ指示フラグ0の値を代入する。さらに、ポーズ指示フ
ラグ0にレジスタ32に記憶されているポーズ指示信号
の値を代入する(S10)。ポーズ指示フラグ0〜2
は、メモリ37に記憶されている。
Referring to FIG. 4, processor 35 substitutes the value of pause instruction flag 1 representing the state of the pause instruction signal one frame before into the pause instruction flag 2 representing the state of the pause instruction signal two frames before. . Further, the value of the pause instruction flag 0 representing the current state of the pause instruction flag is substituted for the pause instruction flag 1. Further, the value of the pause instruction signal stored in the register 32 is substituted for the pause instruction flag 0 (S10). Pause instruction flag 0-2
Are stored in the memory 37.

【0037】プロセッサ35は、S10の処理の際に、
ポーズ指示フラグ1が1から0に変化したか否かを判断
する(S12)。現在オーディオ符号化処理しようとし
ているフレームは、現在入力されているフレームよりも
2フレーム遅れたものである。このため、ポーズ指示フ
ラグ1が1から0に変化したということは、現在オーデ
ィオ符号化処理しようとしているフレームの後にポーズ
指示信号がLとなりオーディオ符号化処理が一時停止す
ることを示している。すなわち、図5を参照して、一例
として現在オーディオ符号化処理しようとしているフレ
ームがフレームA2である場合には、フレームA2の直
後のフレームA3でポーズ指示信号がLとなっている。
このため、ポーズ指示フラグ1が1から0に変化する。
The processor 35 performs the processing of S10
It is determined whether the pause instruction flag 1 has changed from 1 to 0 (S12). The frame to be subjected to the audio encoding process is delayed by two frames from the currently input frame. Therefore, the fact that the pause instruction flag 1 has changed from 1 to 0 indicates that the pause instruction signal becomes L after the frame currently being subjected to audio encoding processing, and the audio encoding processing is temporarily stopped. That is, referring to FIG. 5, when the frame currently undergoing audio encoding processing is frame A2, for example, the pause instruction signal is L in frame A3 immediately after frame A2.
Therefore, the pause instruction flag 1 changes from 1 to 0.

【0038】ポーズ指示フラグ1が1から0に変化した
場合には(S12でYES)、上述のように現在オーデ
ィオ符号化しようとしているフレームの直後に一時停止
されるため、現在符号化しようとしているフレームの音
声レベルのゲインを基準値(たとえば0)になるまで緩
やかに減少させる処理(以下「フェードアウト処理」と
いう)を行なう(S14)。
When the pause instruction flag 1 changes from 1 to 0 (YES in S12), the pause is performed immediately after the frame for which audio encoding is to be performed as described above. A process of gently decreasing the gain of the audio level of the frame until it reaches a reference value (for example, 0) (hereinafter, referred to as “fade-out process”) is performed (S14).

【0039】フェードアウト処理の後、またはポーズ指
示フラグ1が0から1に変化していない場合(S12で
NO)、プロセッサ35は、ポーズ指示フラグ2が0か
ら1に変化しているか否かを判断する(S16)。ポー
ズ指示フラグ2が0から1に変化したということは、現
在処理しようとしているフレームの直前のフレームに対
応するポーズ指示信号はHであり、オーディオ符号化処
理が一時停止状態であったが、現在処理しようとしてい
るフレームに対応するポーズ指示信号がLとなり、現在
のフレームからオーディオ符号化処理が再開されること
を示す。すなわち、図5を参照して、一例として、現在
オーディオ符号化処理しようとするフレームがA5で
は、フレームA5からポーズ指示信号がHとなり、一時
停止が解除されている。このため、ポーズ指示フラグ2
が0から1に変化する。
After the fade-out processing, or when the pause instruction flag 1 has not changed from 0 to 1 (NO in S12), the processor 35 determines whether or not the pause instruction flag 2 has changed from 0 to 1. (S16). The fact that the pause instruction flag 2 has changed from 0 to 1 means that the pause instruction signal corresponding to the frame immediately before the frame currently being processed is H, and the audio encoding process has been paused. The pause instruction signal corresponding to the frame to be processed becomes L, indicating that the audio encoding process is restarted from the current frame. That is, referring to FIG. 5, as an example, when the frame to be subjected to the audio encoding process is currently A5, the pause instruction signal becomes H from frame A5, and the pause is released. Therefore, the pause instruction flag 2
Changes from 0 to 1.

【0040】ポーズ指示フラグ2が0から1に変化した
場合には(S16でYES)、現在オーディオ符号化し
ようとしているフレームの音声レベルのゲインを基準値
(たとえば0)から緩やかに増加させる処理(以下「フ
ェードイン処理」という)を行なう(S18)。
When the pause instruction flag 2 changes from 0 to 1 (YES in S16), the process of gradually increasing the gain of the audio level of the frame to be audio-encoded from the reference value (for example, 0) ( Hereinafter, “fade-in processing”) is performed (S18).

【0041】フェードイン処理の後、またはポーズ指示
フラグ2が0から1に変化していない場合(S16でN
O)、プロセッサ35は、ポーズ指示フラグ2が1から
否かを判断する(S20)。
After the fade-in processing, or when the pause instruction flag 2 has not changed from 0 to 1 (N in S16)
O), the processor 35 determines whether or not the pause instruction flag 2 is 1 (S20).

【0042】ポーズ指示フラグ2が1の場合には(S2
0でNO)、現在処理しようとしているフレームに対す
るポーズ指示信号がHであり、オーディオ符号化処理の
一時停止が解除されているため、オーディオ符号化処理
を行なう(S22)。プロセッサ35は、オーディオ符
号化処理したデータをFIFOメモリ34に書込む(S
24)。このようにして、現在処理しようとしているフ
レームに対する処理が終了する。なお、オーディオ符号
化処理は、従来と同様MPEG1オーディオ圧縮処理な
どの処理である。
When the pause instruction flag 2 is 1 (S2
Since the pause instruction signal for the frame currently being processed is H and the pause of the audio encoding process has been released, the audio encoding process is performed (S22). The processor 35 writes the audio-encoded data into the FIFO memory 34 (S
24). Thus, the processing for the frame currently being processed is completed. Note that the audio encoding processing is processing such as MPEG1 audio compression processing as in the related art.

【0043】以下、オーディオフレームパルス発生器3
6よりオーディオフレームパルスが発生するごとに図2
および図3で示した処理が行なわれる。
Hereinafter, the audio frame pulse generator 3
Each time an audio frame pulse is generated from FIG.
And the processing shown in FIG. 3 is performed.

【0044】図5に示す具体的な例を参照して、オーデ
ィオ処理装置30で得られる符号化処理データの音声レ
ベルについて説明する。
With reference to a specific example shown in FIG. 5, the audio level of the encoded data obtained by the audio processing device 30 will be described.

【0045】図5の例では、フレームA3およびA4が
2ポートメモリ31に入力されるタイミングで、ポーズ
指示信号がLとなり、録音の一時停止が行なわれる。上
述の処理に従うと、フレームA0、A1、A6およびA
7の処理においては、ポーズ指示フラグ1および2とも
値が変化しておらず、ポーズ指示フラグ2の値が1であ
るため、通常の処理に従いオーディオ符号化処理が実行
される(S22)。
In the example of FIG. 5, at the timing when the frames A3 and A4 are input to the two-port memory 31, the pause instruction signal becomes L, and the recording is temporarily stopped. According to the above processing, frames A0, A1, A6 and A
In the process of 7, since the values of the pause instruction flags 1 and 2 have not changed and the value of the pause instruction flag 2 is 1, the audio encoding process is executed according to the normal process (S22).

【0046】フレームA2の処理においては、上述した
ように、ポーズ指示フラグ1が1から0に変化しており
(図3のS12でYES)、かつポーズ指示フラグ2が
1であるため(S20でYES)、フェードアウト処理
が行なわれた後、オーディオ符号化処理が行なわれる
(S14、S22)。
In the processing of the frame A2, as described above, the pause instruction flag 1 has changed from 1 to 0 (YES in S12 of FIG. 3) and the pause instruction flag 2 is 1 (S20). YES), after performing the fade-out processing, the audio encoding processing is performed (S14, S22).

【0047】フレームA5の処理においても、上述した
ようにポーズ指示フラグ2が0から1に変化しており
(図3のS16でYES)、かつポーズ指示フラグ2が
1であるため(S20でYES)、フェードイン処理が
行なわれた後、オーディオ符号化処理が行なわれる(S
18、S22)。
Also in the processing of frame A5, as described above, pause instruction flag 2 has changed from 0 to 1 (YES in S16 of FIG. 3), and pause instruction flag 2 is 1 (YES in S20). ), After the fade-in process is performed, the audio encoding process is performed (S
18, S22).

【0048】このため、各フレームにおける音声レベル
のゲインは、たとえば図5に示すようになり、ポーズ指
示される直前のフレームでフェードアウト処理がされ、
ポーズ指示が解除された時点のフレームでフェードイン
処理が行なわれ、オーディオ符号化処理が行なわれる。
このようにしてできあがったオーディオ符号化データ
は、フレームA0、A1、A2、A5、A6、A7の順
で記憶されており、音声再生時にはこの順序で再生され
る。再生時には、フレームA2でフェードアウトし、フ
レームA5でフェードインするため、録音時の一時停止
の前後で音声レベルの急激な変化が生じず、雑音を生じ
させることなく音声再生することが可能になる。
For this reason, the gain of the audio level in each frame is as shown in FIG. 5, for example, and the fade-out processing is performed in the frame immediately before the pause instruction is issued.
Fade-in processing is performed in the frame at the time when the pause instruction is released, and audio encoding processing is performed.
The audio encoded data thus completed is stored in the order of frames A0, A1, A2, A5, A6, and A7, and is reproduced in this order during audio reproduction. At the time of reproduction, the image fades out at the frame A2 and fades in at the frame A5. Therefore, the audio level does not change abruptly before and after the recording is temporarily stopped, and the audio can be reproduced without generating noise.

【0049】以上説明したオーディオ処理装置30は、
コンピュータにより実現することが可能である。図6を
参照して、オーディオ処理装置30は、コンピュータ4
1と、コンピュータ41に指示を与えるためのキーボー
ド45およびマウス46と、コンピュータ41により演
算された結果等を表示するためのディスプレイ42と、
コンピュータ41が実行するプログラムをそれぞれ読取
るための磁気テープ装置43、CD−ROM(Compact
Disc-Read Only Memory )装置47および通信モデム4
9とを含む。
The audio processing device 30 described above
It can be realized by a computer. With reference to FIG. 6, the audio processing device 30
1, a keyboard 45 and a mouse 46 for giving instructions to the computer 41, a display 42 for displaying the results calculated by the computer 41, etc.
A magnetic tape device 43 for reading programs executed by the computer 41, a CD-ROM (Compact
Disc-Read Only Memory) Device 47 and Communication Modem 4
9 is included.

【0050】図2および図3を参照して説明したオーデ
ィオ符号化処理のプログラムは、コンピュータ41で読
取可能な記録媒体である磁気テープ44またはCD−R
OM48に記録され、磁気テープ装置43およびCD−
ROM装置47でそれぞれ読取られる。または、通信回
線を介して通信モデム49で読取られる。
The program for the audio encoding process described with reference to FIGS. 2 and 3 includes a magnetic tape 44 or a CD-R, which is a recording medium readable by the computer 41.
Recorded on the OM 48, the magnetic tape device 43 and the CD-
Each is read by the ROM device 47. Alternatively, it is read by the communication modem 49 via the communication line.

【0051】図7を参照して、コンピュータ41は、磁
気テープ装置43、CD−ROM装置47または通信モ
デム49を介して読取られたプログラムを実行するため
のCPU(Central Processing Unit)50と、コンピ
ュータ41の動作に必要なその他のプログラムおよびデ
ータを記憶するためのROM(Read Only Memory)51
と、プログラム、プログラム実行時のパラメータ、演算
結果などを記憶するためのRAM(Random Access Memo
ry)52と、プログラムおよびデータなどを記憶するた
めの磁気ディスク53とを含む。
Referring to FIG. 7, computer 41 includes a CPU (Central Processing Unit) 50 for executing a program read via magnetic tape device 43, CD-ROM device 47 or communication modem 49, and a computer. ROM (Read Only Memory) 51 for storing other programs and data necessary for the operation of 41
And a RAM (Random Access Memo) for storing the program, parameters for executing the program, calculation results, and the like.
ry) 52 and a magnetic disk 53 for storing programs, data, and the like.

【0052】RAM52が、2ポートメモリ31、レジ
スタ32、レジスタ33、FIFOメモリ34およびメ
モリ37の役割を果たし、CPU50が、プロセッサ3
5およびオーディオフレームパルス発生器36の役割を
果たす。
The RAM 52 plays the role of a two-port memory 31, a register 32, a register 33, a FIFO memory 34, and a memory 37.
5 and an audio frame pulse generator 36.

【0053】磁気テープ装置43、CD−ROM装置4
7または通信モデム49により読取られたプログラム
は、CPU50で実行され、オーディオ符号化処理が行
なわれる。
Magnetic tape device 43, CD-ROM device 4
7 or the program read by the communication modem 49 is executed by the CPU 50 to perform audio encoding processing.

【0054】以上説明したように、本実施の形態に係る
オーディオ処理装置30によれば、録音時に一時停止を
行なった場合であっても、一時停止の前後でフェードア
ウト処理およびフェードイン処理を行ないオーディオ符
号化処理を行なうことができる。このため、再生時に音
声レベルの急激な変化に伴う雑音を生じさせることなく
音声再生することができる。
As described above, according to the audio processing apparatus 30 of the present embodiment, even when the recording is paused, the audio processing is performed by performing the fade-out process and the fade-in process before and after the pause. An encoding process can be performed. For this reason, audio reproduction can be performed without generating noise due to a rapid change in audio level during reproduction.

【0055】[実施の形態2]本実施の形態に係るオー
ディオ符号化装置は、図1を参照して説明した実施の形
態1に係るオーディオ処理装置30と同様のハードウェ
ア構成をとる。このため、その詳細な説明はここでは繰
返さない。本実施の形態のプロセッサ35では、フェー
ドアウト処理するタイミングを実施の形態1のプロセッ
サ35に比べ、早める。
[Second Embodiment] The audio encoding apparatus according to the present embodiment has the same hardware configuration as the audio processing apparatus 30 according to the first embodiment described with reference to FIG. Therefore, the detailed description will not be repeated here. In the processor 35 of the present embodiment, the timing of performing the fade-out process is advanced as compared with the processor 35 of the first embodiment.

【0056】図8および図9を参照して、本実施の形態
に係るオーディオ処理装置30の各部は以下のように動
作する。図8に示すS32〜S40までの処理は、図2
に示すS2〜S10までの処理と同様である。このた
め、その詳細な説明は、ここでは繰返さない。
Referring to FIGS. 8 and 9, each section of audio processing apparatus 30 according to the present embodiment operates as follows. The processing from S32 to S40 shown in FIG.
Are the same as the processing from S2 to S10. Therefore, detailed description thereof will not be repeated here.

【0057】図9を参照して、プロセッサ35は、S4
0の処理の際にポーズ指示フラグ0が1から0に変化し
たか否かを判断する(S42)。現在オーディオ処理し
ようとしているフレームは、現在入力されているフレー
ムよりも2フレーム遅れたものである。このため、ポー
ズ指示フラグ0が1から0に変化したということは、現
在オーディオ符号化しようとしているフレームの2フレ
ーム後にポーズ指示信号がLとなりオーディオ符号化処
理が一時停止することを示している。すなわち、図10
を参照して、現在オーディオ符号化処理しようとしてい
るフレームがA1である場合には、2フレーム後のフレ
ームA3で一時停止が行なわれるため、ポーズ指示フラ
グ0が1から0に変化する。
Referring to FIG. 9, the processor 35 executes the processing in S4
It is determined whether the pause instruction flag 0 has changed from 1 to 0 during the process of 0 (S42). The frame for which audio processing is to be performed is delayed by two frames from the currently input frame. Therefore, the fact that the pause instruction flag 0 has changed from 1 to 0 indicates that the pause instruction signal becomes L two frames after the frame currently being audio-encoded and the audio encoding process is temporarily stopped. That is, FIG.
, When the current frame to be subjected to the audio encoding process is A1, the pause is performed at frame A3 two frames later, and the pause instruction flag 0 changes from 1 to 0.

【0058】ポーズ指示フラグ0が1から0に変化した
場合には(S42でYES)、上述のように現在オーデ
ィオ符号化しようとしているフレームの2フレーム後に
一時停止が開始されるため、現在符号化しようとしてい
るフレームに対してフェードアウト処理を行なう(S4
4)。これにより、ポーズ指示信号がLになる2フレー
ム前のフレームに対してフェードアウト処理が施された
ことになる。
When the pause instruction flag 0 changes from 1 to 0 (YES in S42), the pause is started two frames after the frame currently being audio-encoded as described above. A fade-out process is performed on the frame to be tried (S4
4). This means that the fade-out processing has been performed on the frame two frames before the pause instruction signal becomes L.

【0059】フェードアウト処理の後、またはポーズ指
示フラグ0が1から0に変化していない場合(S42で
NO)、プロセッサ35は、ポーズ指示フラグ1が0か
否かを判断する(S46)。ポーズ指示フラグ1が0で
あるということは、現在処理しようとしているフレーム
の直後のフレームに対するポーズ指示信号がLであるこ
とを示す。すなわち、図10を参照して、現在オーディ
オ符号化処理しようとしているフレームがフレームA2
またはA3の場合には、それぞれのフレームの直後のフ
レームA3またはA4で一時停止処理が行なわれるた
め、ポーズ指示フラグ1が0となる。
After the fade-out process, or when the pause instruction flag 0 has not changed from 1 to 0 (NO in S42), the processor 35 determines whether or not the pause instruction flag 1 is 0 (S46). The fact that the pause instruction flag 1 is 0 indicates that the pause instruction signal for the frame immediately after the frame currently being processed is L. That is, referring to FIG. 10, the frame currently being subjected to audio encoding processing is frame A2.
Or in the case of A3, the pause instruction flag 1 becomes 0 because the pause processing is performed in the frame A3 or A4 immediately after each frame.

【0060】ポーズ指示フラグ1が0の場合には(S4
6でYES)、現在オーディオ符号化処理しようとして
いるフレームの音声レベルのゲインを基準値(たとえば
0)に維持する処理(以下「ミュート処理」という)が
行なわれる(S48)。
When the pause instruction flag 1 is 0 (S4
(YES in 6), a process of maintaining the gain of the audio level of the frame currently being subjected to the audio encoding process at a reference value (for example, 0) (hereinafter referred to as “mute process”) is performed (S48).

【0061】ミュート処理の後、またはポーズ指示フラ
グ1が1の場合には(S46でNO)、S50〜S58
に示す処理が行なわれる。S50〜S58の処理は、図
3を参照して説明したS16〜S24の処理と同様であ
る。このため、その詳細な説明はここでは繰返さない。
After the mute processing, or when the pause instruction flag 1 is 1 (NO in S46), S50 to S58
Are performed. The processing of S50 to S58 is the same as the processing of S16 to S24 described with reference to FIG. Therefore, the detailed description will not be repeated here.

【0062】以下、オーディオフレームパルス発生器3
6よりオーディオフレームパルスが発生するごとに図8
および図9で示した処理が行なわれる。
Hereinafter, the audio frame pulse generator 3
Each time an audio frame pulse is generated from FIG.
And the processing shown in FIG. 9 is performed.

【0063】図10に示す具体的な例を参照して、オー
ディオ処理装置30で得られる符号化処理データの音声
レベルについて説明する。
Referring to a specific example shown in FIG. 10, the audio level of the encoded data obtained by the audio processing device 30 will be described.

【0064】図10の例では、フレームA3およびA4
が2ポートメモリ31に入力されている時のタイミング
で、ポーズ指示信号がLとなり、録音の一時停止が行な
われる。上述の処理に従うと、フレームA0、A6およ
びA7の処理においては、ポーズ指示フラグ0および2
とも値が変化しておらず、ポーズ指示フラグ1の値が1
で、かつポーズ指示フラグ2の値が1であるため、通常
の処理に従いオーディオ符号化処理が実行される(S5
6)。
In the example of FIG. 10, frames A3 and A4
Is input to the two-port memory 31, the pause instruction signal becomes L, and the recording is temporarily stopped. According to the processing described above, in the processing of frames A0, A6 and A7, pause instruction flags 0 and 2 are set.
And the value of the pause instruction flag 1 is 1
And the value of the pause instruction flag 2 is 1, the audio encoding process is executed according to the normal process (S5).
6).

【0065】フレームA1の処理においては、上述した
ように、ポーズ指示フラグ0が1から0に変化しており
(図9のS42でYES)、かつポーズ指示フラグ2の
値が1であるため(S54でYES)、フェードアウト
処理が行なわれた後、オーディオ符号化処理が行なわれ
る(S44、S56)。
In the processing of the frame A1, as described above, the pause instruction flag 0 has changed from 1 to 0 (YES in S42 of FIG. 9), and the value of the pause instruction flag 2 is 1 ( After YES in S54, the fade-out process is performed, and then the audio encoding process is performed (S44, S56).

【0066】フレームA2およびA3の処理において
は、上述したように、ポーズ指示フラグ1の値が0であ
り(S446でYES)、かつポーズ指示フラグ2の値
が1であるため(S54でYES)、ミュート処理が行
なわれた後、オーディオ符号化処理が行なわれる(S4
8、S56)。
In the processing of frames A2 and A3, as described above, the value of pause instruction flag 1 is 0 (YES in S446), and the value of pause instruction flag 2 is 1 (YES in S54). After the mute processing is performed, the audio encoding processing is performed (S4).
8, S56).

【0067】フレームA5の処理においても、上述した
ようにポーズ指示フラグ2が0から1に変化しており
(図9のS50でYES)、かつポーズ指示フラグ2が
1であるため(S54でYES)、フェードイン処理が
行なわれた後、オーディオ符号化処理が行なわれる(S
52、S58)。
Also in the processing of frame A5, the pause instruction flag 2 has changed from 0 to 1 as described above (YES in S50 of FIG. 9), and the pause instruction flag 2 is 1 (YES in S54). ), After the fade-in process is performed, the audio encoding process is performed (S
52, S58).

【0068】このため、各フレームにおける音声レベル
のゲインは、たとえば図10に示すようになり、ポーズ
指示される2フレーム前のフレームでフェードアウト処
理が行なわれ、ポーズ指示が解除された時点のフレーム
でフェードイン処理が行なわれ、その間のフレームにお
いてミュート処理が行なわれる。その後、オーディオ符
号化処理が行なわれる。このようにしてできあがったオ
ーディオ符号化データは、フレームA0、A1、A2、
A5、A6、A7の順で記憶されており、音声再生時に
はこの順序で再生される。再生時には、フレームA1で
フェードアウトし、フレームA2で音声レベルが0にな
った後、フレームA5でフェードインする。このため、
録音時の一時停止の前後で音声レベルの急激な変化が生
じず、雑音を生じさせることなく音声再生することが可
能になる。
Therefore, the gain of the audio level in each frame is as shown in FIG. 10, for example. The fade-out process is performed in the frame two frames before the pause instruction is performed, and the frame at the time when the pause instruction is released is set. A fade-in process is performed, and a mute process is performed in a frame during the fade-in process. After that, an audio encoding process is performed. The audio encoded data thus completed includes frames A0, A1, A2,
A5, A6, and A7 are stored in this order, and are reproduced in this order during audio reproduction. At the time of reproduction, the image fades out at the frame A1, the audio level becomes 0 at the frame A2, and then fades at the frame A5. For this reason,
A sudden change in the sound level does not occur before and after the pause during recording, and the sound can be reproduced without generating noise.

【0069】特に、テレビ番組では、CM(Commercial
Message)などへの切換えのタイミングでステレオ音声
からモノラル音声への切換えが行なわれる。そしてこの
音声切換えをトリガとして録画のポーズ、ポーズ解除を
行なうことが可能である。しかし、映像信号と音声信号
とが必ずしも正確に対応しているとは限らない。このた
め、音声切換えをトリガとしてポーズ動作を行なうと通
常のオーディオ符号化処理では、映像信号と音声信号と
の間のずれにより、一時停止前の映像再生時に、一時停
止後の映像に対応した音声信号が再生されてしまう場
合、およびその逆の現象が生じる場合がある。本実施の
形態に係るオーディオ処理装置30では、ポーズ指示信
号がLとなるフレームの2フレーム前でフェードアウト
処理が行なわれ、1フレーム前でミュート処理が行なわ
れる。このため、一時停止後の映像に対応した音声信号
が一時停止前の映像再生時に生成されることがなくな
り、複数の機器を使用する場合の再生タイミングの不整
合を回避することができる。
In particular, in a television program, commercials (Commercial
Message) or the like, switching from stereo sound to monaural sound is performed. Then, it is possible to perform recording pause and pause release by using the voice switching as a trigger. However, video signals and audio signals do not always correspond exactly. For this reason, if a pause operation is performed with audio switching as a trigger, in a normal audio encoding process, due to a shift between the video signal and the audio signal, the audio corresponding to the video after the pause is reproduced when the video is reproduced before the pause. In some cases, a signal is reproduced, and vice versa. In audio processing apparatus 30 according to the present embodiment, fade-out processing is performed two frames before the frame in which the pause instruction signal is L, and mute processing is performed one frame before. Therefore, an audio signal corresponding to the video after the pause is not generated at the time of reproducing the video before the pause, and it is possible to avoid a mismatch in the reproduction timing when a plurality of devices are used.

【0070】以上説明したオーディオ処理装置30は、
コンピュータにより実現することができる。コンピュー
タによるオーディオ処理装置30の実現方法は、図6お
よび図7を参照して説明した、実施の形態1の実現方法
と同様である。このため、その詳細な説明はここでは繰
返さない。
The audio processing device 30 described above
It can be realized by a computer. The method of realizing the audio processing device 30 by the computer is the same as the method of realizing the first embodiment described with reference to FIGS. Therefore, the detailed description will not be repeated here.

【0071】オーディオ処理装置30では、ポーズ指示
信号がLとなるフレームの2フレーム前のフレームでフ
ェードアウト処理を行なうようにしたが、3フレーム以
上前のフレームでフェードアウト処理をし、続くフレー
ムでミュート処理を行なうようにしてもよい。
In the audio processing apparatus 30, the fade-out processing is performed in the frame two frames before the frame in which the pause instruction signal is L. However, the fade-out processing is performed in the frame three or more frames before, and the mute processing is performed in the subsequent frame. May be performed.

【0072】以上説明したように、本実施の形態に係る
オーディオ処理装置30によれば、音声信号再生時の音
声レベルの急激な変化に伴う雑音を生じさせることがな
く、音声再生することができる。また、複数の機器を同
期させてオーディオ符号化処理を行なう場合であって
も、複数の機器間での再生タイミングの不整合を回避す
ることができる。
As described above, according to the audio processing apparatus 30 according to the present embodiment, audio can be reproduced without generating noise due to a sudden change in the audio level when reproducing the audio signal. . Further, even when a plurality of devices are synchronized to perform the audio encoding process, it is possible to avoid a mismatch in reproduction timing between the plurality of devices.

【0073】今回開示された実施の形態はすべての点で
例示であって制限的なものではないと考えられるべきで
ある。本発明の範囲は上記した説明ではなくて特許請求
の範囲によって示され、特許請求の範囲と均等の意味お
よび範囲内でのすべての変更が含まれることが意図され
る。
The embodiments disclosed this time should be considered as illustrative in all points and not restrictive. The scope of the present invention is defined by the terms of the claims, rather than the description above, and is intended to include any modifications within the scope and meaning equivalent to the terms of the claims.

【0074】[0074]

【発明の効果】請求項1〜12に記載の発明によると、
再生時に音声レベルの急激な変化がなく、それに伴う雑
音を生じさせることなく、音声再生を行なうことができ
る。
According to the invention described in claims 1 to 12,
Audio reproduction can be performed without a sudden change in audio level at the time of reproduction and without accompanying noise.

【0075】請求項4、8および12に記載の発明によ
ると、複数の機器を使用する場合の再生タイミングの不
整合を回避することができる。
According to the fourth, eighth and twelfth aspects of the present invention, it is possible to avoid a mismatch in reproduction timing when a plurality of devices are used.

【図面の簡単な説明】[Brief description of the drawings]

【図1】 本発明の実施の形態1および2に係るオーデ
ィオ処理装置の構成を示すブロック図である。
FIG. 1 is a block diagram showing a configuration of an audio processing device according to Embodiments 1 and 2 of the present invention.

【図2】 実施の形態1に係るオーディオ符号化処理の
フローチャートである。
FIG. 2 is a flowchart of an audio encoding process according to Embodiment 1.

【図3】 実施の形態1に係るオーディオ符号化処理の
フローチャートである。
FIG. 3 is a flowchart of an audio encoding process according to Embodiment 1.

【図4】 ポーズ指示フラグの値の更新処理を説明する
ための図である。
FIG. 4 is a diagram for explaining a process of updating the value of a pause instruction flag.

【図5】 実施の形態1に係るオーディオ符号化処理後
の音声レベルについて説明するための図である。
FIG. 5 is a diagram for describing an audio level after audio encoding processing according to Embodiment 1.

【図6】 オーディオ処理装置を実現するコンピュータ
の外観図である。
FIG. 6 is an external view of a computer that realizes the audio processing device.

【図7】 オーディオ処理装置を実現するコンピュータ
の内部ブロック図である。
FIG. 7 is an internal block diagram of a computer that realizes the audio processing device.

【図8】 実施の形態2に係るオーディオ符号化処理の
フローチャートである。
FIG. 8 is a flowchart of an audio encoding process according to Embodiment 2.

【図9】 実施の形態2に係るオーディオ符号化処理の
フローチャートである。
FIG. 9 is a flowchart of an audio encoding process according to Embodiment 2.

【図10】 実施の形態2に係るオーディオ符号化処理
後の音声レベルについて説明するための図である。
FIG. 10 is a diagram for describing an audio level after audio encoding processing according to Embodiment 2.

【図11】 従来のオーディオ符号化処理について説明
するための図である。
FIG. 11 is a diagram illustrating a conventional audio encoding process.

【符号の説明】[Explanation of symbols]

30 オーディオ処理装置、31 2ポートメモリ、3
2,33 レジスタ、34 FIFOメモリ、35 プ
ロセッサ、36 オーディオフレームパルス発生器、3
7 メモリ。
30 audio processing unit, 31 two-port memory, 3
2, 33 registers, 34 FIFO memory, 35 processor, 36 audio frame pulse generator, 3
7 Memory.

Claims (12)

【特許請求の範囲】[Claims] 【請求項1】 第1および第2の値のうちいずれかを選
択的にとるオーディオデータの符号化処理を指示するた
めの第1の信号と、第3および第4の値のうちいずれか
を選択的にとるオーディオデータの符号化処理の一時停
止を指示するための第2の信号とに基づいて、フレーム
単位でオーディオデータを符号化するオーディオ処理装
置であって、 フレーム単位のオーディオデータが入力される第1のポ
ートおよびオーディオデータが出力される第2のポート
を有するメモリと、 前記メモリに接続され、前記メモリにオーディオデータ
が入力されると、前記メモリからオーディオデータを遅
延させて読込み、前記第1および第2の信号の履歴に基
づいて、オーディオデータを符号化する処理または符号
化しない処理のいずれかを選択的に実行するオーディオ
データ符号化手段と、 前記オーディオデータ符号化手段に結合され、記第2の
信号の履歴に基づいて、前記オーディオデータ符号化手
段がオーディオデータの符号化をしない期間の前後のフ
レームでオーディオデータの音声レベル差をなくすよう
前記オーディオデータ符号化手段で符号化されるオーデ
ィオデータのゲインを制御する音声レベル制御手段とを
含む、オーディオ処理装置。
1. A first signal for instructing an encoding process of audio data that selectively takes one of a first value and a second value, and one of a third value and a fourth value. An audio processing apparatus for encoding audio data on a frame basis based on a second signal for instructing a temporary stop of encoding processing of audio data to be selectively taken. A memory having a first port and a second port from which audio data is output; connected to the memory, and when audio data is input to the memory, the audio data is read from the memory with a delay, Based on the histories of the first and second signals, selectively execute either a process of encoding audio data or a process of not encoding audio data. Audio data encoding means, coupled to the audio data encoding means, and based on the history of the second signal, the audio data encoding means performs audio encoding in frames before and after a period during which the audio data encoding means does not encode audio data. An audio level control means for controlling a gain of audio data encoded by the audio data encoding means so as to eliminate an audio level difference of data.
【請求項2】 前記音声レベル制御手段は、 前記オーディオデータ符号化手段に結合され、前記第2
の信号の履歴に基づいて、前記オーディオデータ符号化
手段が符号化を停止するフレームよりも前の第1の所定
フレーム期間でオーディオデータの音声レベルのゲイン
を基準値まで減少させる第1のフェードアウト手段と、 前記オーディオデータ符号化手段に結合され、前記第2
の信号の履歴に基づいて、前記オーディオデータ符号化
手段が符号化を再開するフレーム以降の第2の所定フレ
ーム期間でオーディオデータの音声レベルのゲインを前
記基準値から増加させるフェードイン手段とを含む、請
求項1に記載のオーディオ処理装置。
2. The audio level control means is coupled to the audio data encoding means,
First fade-out means for reducing the gain of the audio level of the audio data to a reference value in a first predetermined frame period before the frame at which the audio data encoding means stops encoding, based on the signal history of The audio data encoding means, and the second
Fade-in means for increasing the gain of the audio level of the audio data from the reference value in a second predetermined frame period after the frame in which the audio data encoding means resumes encoding based on the signal history of The audio processing device according to claim 1.
【請求項3】 前記第1のフェードアウト手段は、前記
オーディオデータ符号化手段に結合され、前記第2の信
号の履歴に基づいて、前記オーディオデータ符号化手段
が符号化を停止する直前の1フレームでオーディオデー
タの音声レベルのゲインを基準値まで減少させる第2の
フェードアウト手段を含む、請求項2に記載のオーディ
オ処理装置。
3. The first fade-out means is coupled to the audio data encoding means, and one frame immediately before the audio data encoding means stops encoding based on a history of the second signal. 3. The audio processing apparatus according to claim 2, further comprising a second fade-out means for reducing the gain of the audio level of the audio data to a reference value.
【請求項4】 前記第1のフェードアウト手段は、 前記オーディオデータ符号化手段に結合され、前記第2
の信号の履歴に基づいて、前記オーディオデータ符号化
手段が符号化を停止するフレームよりも2フレーム以上
前の予め定められたフレームに対して、オーディオデー
タの音声レベルのゲインを予め定められた方法に従い前
記基準値まで減少させる第2のフェードアウト手段と、 前記オーディオデータ符号化手段に結合され、前記第2
の信号の履歴に基づいて、前記予め定められたフレーム
よりも後であり、かつ前記オーディオデータ符号化手段
が符号化を停止するよりも前のフレームのオーディオデ
ータの音声レベルのゲインを前記基準値に維持させるミ
ュート手段とを含む、請求項2に記載のオーディオ処理
装置。
4. The first fade-out means is coupled to the audio data encoding means, and the second fade-out means is
The gain of the audio level of the audio data is determined for a predetermined frame two or more frames before the frame at which the audio data encoding unit stops encoding based on the signal history of A second fade-out means for reducing to the reference value in accordance with
Based on the signal history, the gain of the audio level of the audio data of the frame after the predetermined frame and before the audio data encoding unit stops encoding is set to the reference value. 3. The audio processing device according to claim 2, further comprising: a mute means for maintaining the audio processing value.
【請求項5】 第1および第2の値のうちいずれかを選
択的にとるオーディオデータの符号化処理を指示するた
めの第1の信号と、第3および第4の値のうちいずれか
を選択的にとるオーディオデータの符号化処理の一時停
止を指示するための第2の信号とに基づいて、オーディ
オデータをフレーム単位で符号化するオーディオ処理方
法であって、 入力されたオーディオデータを遅延させるステップと、 遅延させたオーディオデータおよび前記第2の信号の履
歴に基づいて、オーディオデータが符号化されない期間
の前後のフレームでオーディオデータの音声レベル差を
なくすよう符号化されるオーディオデータのゲインを制
御するステップと、 遅延させたオーディオデータならびに前記第1および第
2の信号の履歴に基づいて、オーディオデータを符号化
する処理または符号化しない処理のいずれかを選択的に
実行するステップとを含む、オーディオ処理方法。
5. A first signal for instructing an encoding process of audio data that selectively takes one of a first value and a second value, and one of a third value and a fourth value. An audio processing method for encoding audio data on a frame basis based on a second signal for instructing a temporary stop of encoding processing of audio data to be selectively taken, wherein the input audio data is delayed. And a gain of the audio data that is encoded based on the delayed audio data and the history of the second signal so as to eliminate an audio level difference of the audio data in frames before and after a period in which the audio data is not encoded. Controlling the audio data based on the delayed audio data and the history of the first and second signals. Selectively performing either a process of encoding data or a process of not encoding data.
【請求項6】 ゲインを制御する前記ステップは、 遅延させたオーディオデータおよび前記第2の信号の履
歴に基づいて、オーディオデータの符号化が停止するフ
レームよりも前の第1の所定フレーム期間でオーディオ
データの音声レベルのゲインを基準値まで減少させるス
テップと、 遅延させたオーディオデータおよび前記第2の信号の履
歴に基づいて、オーディオデータの符号化が再開される
フレーム以降の第2の所定フレーム期間でオーディオデ
ータの音声レベルのゲインを前記基準値から増加させる
ステップとを含む、請求項5に記載のオーディオ処理方
法。
6. The method according to claim 6, wherein the step of controlling the gain includes, based on the delayed audio data and the history of the second signal, in a first predetermined frame period before a frame in which encoding of the audio data is stopped. Reducing the gain of the audio level of the audio data to a reference value; and a second predetermined frame after a frame in which encoding of the audio data is restarted based on the delayed audio data and the history of the second signal. The audio processing method according to claim 5, further comprising: increasing a gain of the audio level of the audio data from the reference value during a period.
【請求項7】 ゲインを基準値まで減少させる前記ステ
ップは、遅延させたオーディオデータおよび前記第2の
信号の履歴に基づいて、オーディオデータの符号化が停
止する直前の1フレームでオーディオデータの音声レベ
ルのゲインを基準値まで減少させるステップを含む、請
求項6に記載のオーディオ処理方法。
7. The step of reducing the gain to a reference value includes, based on the delayed audio data and the history of the second signal, the audio data of the audio data in one frame immediately before the stop of the encoding of the audio data. 7. The audio processing method according to claim 6, comprising reducing a level gain to a reference value.
【請求項8】 ゲインを基準値まで減少させる前記ステ
ップは、 遅延させたオーディオデータおよび前記第2の信号の履
歴に基づいて、オーディオデータの符号化が停止するフ
レームよりも2フレーム以上前の予め定められたフレー
ムに対して、オーディオデータの音声レベルのゲインを
予め定められた方法に従い前記基準値まで減少させるス
テップと、 遅延させたオーディオデータおよび前記第2の信号の履
歴に基づいて、前記予め定められたフレームよりも後で
あり、かつオーディオデータの符号化が停止するよりも
前のフレームのオーディオデータの音声レベルのゲイン
を前記基準値に維持させるステップとを含む、請求項6
に記載のオーディオ処理方法。
8. The step of reducing the gain to a reference value, comprising the step of: performing, on the basis of the delayed audio data and the history of the second signal, at least two frames before a frame at which encoding of the audio data is stopped. Reducing the gain of the audio level of the audio data to the reference value in accordance with a predetermined method for a predetermined frame; based on the delayed audio data and the history of the second signal, Maintaining the audio level gain of the audio data of the frame after the predetermined frame and before the encoding of the audio data is stopped at the reference value.
An audio processing method according to claim 1.
【請求項9】 第1および第2の値のうちいずれかを選
択的にとるオーディオデータの符号化処理を指示するた
めの第1の信号と、第3および第4の値のうちいずれか
を選択的にとるオーディオデータの符号化処理の一時停
止を指示するための第2の信号とに基づいて、オーディ
オデータをフレーム単位で符号化するオーディオ処理方
法をコンピュータに実行させるためのプログラムを記録
したコンピュータ読取可能な記録媒体であって、 前記オーディオ処理方法は、 入力されたオーディオデータを遅延させるステップと、 遅延させたオーディオデータおよび前記第2の信号の履
歴に基づいて、オーディオデータが符号化されない期間
の前後のフレームでオーディオデータの音声レベル差を
なくすよう符号化されるオーディオデータのゲインを制
御するステップと、 遅延させたオーディオデータならびに前記第1および第
2の信号の履歴に基づいて、オーディオデータを符号化
する処理または符号化しない処理のいずれかを選択的に
実行するステップとを含む、コンピュータ読取可能な記
録媒体。
9. A first signal for instructing audio data encoding processing to selectively take one of the first and second values, and one of the third and fourth values. A program for causing a computer to execute an audio processing method for encoding audio data on a frame basis based on a second signal for instructing a temporary stop of encoding processing of audio data to be selectively taken is recorded. A computer-readable recording medium, comprising: a step of delaying input audio data; and wherein audio data is not encoded based on the delayed audio data and the history of the second signal. Gain of audio data that is encoded to eliminate the difference in audio level of audio data in frames before and after the period And selectively performing either a process of encoding the audio data or a process of not encoding based on the delayed audio data and the history of the first and second signals. And a computer-readable recording medium.
【請求項10】 ゲインを制御する前記ステップは、 遅延させたオーディオデータおよび前記第2の信号の履
歴に基づいて、オーディオデータの符号化が停止するフ
レームよりも前の第1の所定フレーム期間でオーディオ
データの音声レベルのゲインを基準値まで減少させるス
テップと、 遅延させたオーディオデータおよび前記第2の信号の履
歴に基づいて、オーディオデータの符号化が再開される
フレーム以降の第2の所定フレーム期間でオーディオデ
ータの音声レベルのゲインを前記基準値から増加させる
ステップとを含む、請求項9に記載のコンピュータ読取
可能な記録媒体。
10. The step of controlling a gain, the step of: controlling a gain in a first predetermined frame period before a frame in which encoding of audio data is stopped based on a history of delayed audio data and a history of the second signal. Reducing the gain of the audio level of the audio data to a reference value; and a second predetermined frame after a frame in which encoding of the audio data is restarted based on the delayed audio data and the history of the second signal. Increasing the gain of the audio level of the audio data from the reference value during a period.
【請求項11】 ゲインを基準値まで減少させる前記ス
テップは、遅延させたオーディオデータおよび前記第2
の信号の履歴に基づいて、オーディオデータの符号化が
停止する直前の1フレームでオーディオデータの音声レ
ベルのゲインを基準値まで減少させるステップを含む、
請求項10に記載のコンピュータ読取可能な記録媒体。
11. The step of reducing a gain to a reference value comprises the steps of:
Reducing the gain of the audio level of the audio data to a reference value in one frame immediately before the encoding of the audio data is stopped based on the signal history of
A computer-readable recording medium according to claim 10.
【請求項12】 ゲインを基準値まで減少させる前記ス
テップは、 遅延させたオーディオデータおよび前記第2の信号の履
歴に基づいて、オーディオデータの符号化が停止するフ
レームよりも2フレーム以上前の予め定められたフレー
ムに対して、オーディオデータの音声レベルのゲインを
予め定められた方法に従い前記基準値まで減少させるス
テップと、 遅延させたオーディオデータおよび前記第2の信号の履
歴に基づいて、前記予め定められたフレームよりも後で
あり、かつオーディオデータの符号化が停止するよりも
前のフレームのオーディオデータの音声レベルのゲイン
を前記基準値に維持させるステップとを含む、請求項1
0に記載のコンピュータ読取可能な記録媒体。
12. The step of reducing the gain to a reference value includes the step of, based on the delayed audio data and the history of the second signal, setting a gain at least two frames before a frame at which encoding of audio data is stopped. Reducing the gain of the audio level of the audio data to the reference value in accordance with a predetermined method for a predetermined frame; based on the delayed audio data and the history of the second signal, Maintaining the gain of the audio level of the audio data of the frame after the predetermined frame and before the encoding of the audio data is stopped at the reference value.
0. The computer-readable recording medium according to 0.
JP32994999A 1999-11-19 1999-11-19 Audio processing device and method, and computer- readable recording medium recorded with program to make computer execute audio processing method Withdrawn JP2001148159A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP32994999A JP2001148159A (en) 1999-11-19 1999-11-19 Audio processing device and method, and computer- readable recording medium recorded with program to make computer execute audio processing method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP32994999A JP2001148159A (en) 1999-11-19 1999-11-19 Audio processing device and method, and computer- readable recording medium recorded with program to make computer execute audio processing method

Publications (1)

Publication Number Publication Date
JP2001148159A true JP2001148159A (en) 2001-05-29

Family

ID=18227072

Family Applications (1)

Application Number Title Priority Date Filing Date
JP32994999A Withdrawn JP2001148159A (en) 1999-11-19 1999-11-19 Audio processing device and method, and computer- readable recording medium recorded with program to make computer execute audio processing method

Country Status (1)

Country Link
JP (1) JP2001148159A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004054148A1 (en) * 2002-12-11 2004-06-24 Sony Corporation Encoding/transmission device and encoding/transmission method
KR100521937B1 (en) * 2000-02-11 2005-10-13 엘지전자 주식회사 Method for recording audio data on rewritable medium

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100521937B1 (en) * 2000-02-11 2005-10-13 엘지전자 주식회사 Method for recording audio data on rewritable medium
WO2004054148A1 (en) * 2002-12-11 2004-06-24 Sony Corporation Encoding/transmission device and encoding/transmission method
KR101013421B1 (en) * 2002-12-11 2011-02-14 소니 주식회사 Encoding/transmission device and encoding/transmission method
US8699527B2 (en) 2002-12-11 2014-04-15 Sony Corporation Encoding/transmitting apparatus and encoding/transmitting method
US9843798B2 (en) 2002-12-11 2017-12-12 Sony Corporation Encoding/transmitting apparatus and encoding/transmitting method
US10264251B2 (en) 2002-12-11 2019-04-16 Sony Corporation Encoding/transmitting apparatus and encoding/transmitting method
US10812789B2 (en) 2002-12-11 2020-10-20 Sony Corporation Encoding/transmitting apparatus and encoding/transmitting method

Similar Documents

Publication Publication Date Title
JP3106774B2 (en) Digital sound field creation device
KR100490403B1 (en) Method for controlling buffering of audio stream and apparatus thereof
JP2001148159A (en) Audio processing device and method, and computer- readable recording medium recorded with program to make computer execute audio processing method
US20070073931A1 (en) Audio player and method for playing audio data
JP2500579B2 (en) Video and audio synchronization system
JPH11353804A (en) Recording and reproducing apparatus and method therefor, and providing medium
JP4924575B2 (en) Karaoke equipment
US20110046967A1 (en) Data converting apparatus and data converting method
JP2005266571A (en) Method and device for variable-speed reproduction, and program
RU2529551C2 (en) Record playback device, record playback control method and editing system
JP4900301B2 (en) Karaoke equipment
JP3548021B2 (en) Signal processing device
JP2000269821A (en) Prediction encoding signal decoding device and noise removal method
JP3165661B2 (en) Audio synchronized playback device
JP2001043628A (en) Magnetic recording and reproducing device
JP2005157023A (en) Information processing apparatus and wireless phone
JP2004206771A (en) Simple reproducing method, simple reproducing device usable for the same, decoding method, and decoding device
KR100264328B1 (en) Fade out/in compensation device and method of a digital audio
JPH1195750A (en) Digital voice reproducer
JP2002229593A (en) Speech signal decoding processing method
JP2559441B2 (en) PCM signal correction circuit
JPH06314483A (en) Disk reproducing device
JPS6128182B2 (en)
KR20020096465A (en) Tempo controller for digital audio decoder chip
JPH0764730A (en) Transferring method for image/voice data

Legal Events

Date Code Title Description
A300 Withdrawal of application because of no request for examination

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20070206