JP2006211509A - Encoding apparatus, stc correction method used therein, encoding system, transmission system, and audio transmission/reception system - Google Patents

Encoding apparatus, stc correction method used therein, encoding system, transmission system, and audio transmission/reception system Download PDF

Info

Publication number
JP2006211509A
JP2006211509A JP2005023298A JP2005023298A JP2006211509A JP 2006211509 A JP2006211509 A JP 2006211509A JP 2005023298 A JP2005023298 A JP 2005023298A JP 2005023298 A JP2005023298 A JP 2005023298A JP 2006211509 A JP2006211509 A JP 2006211509A
Authority
JP
Japan
Prior art keywords
value
stc
stc value
current
pts
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2005023298A
Other languages
Japanese (ja)
Other versions
JP4624121B2 (en
Inventor
Naoki Kobayashi
尚樹 小林
Tsugumichi Nagana
継道 永名
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
NEC Engineering Ltd
Original Assignee
NEC Corp
NEC Engineering Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp, NEC Engineering Ltd filed Critical NEC Corp
Priority to JP2005023298A priority Critical patent/JP4624121B2/en
Publication of JP2006211509A publication Critical patent/JP2006211509A/en
Application granted granted Critical
Publication of JP4624121B2 publication Critical patent/JP4624121B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To correct an STC value that becomes a source of a PTS value, if the STC value is not correct. <P>SOLUTION: An audio encoding unit 10 of an encoding system comprises an encoding processing section 11, a PTS generating section 12 and an STC monitoring section 13. The STC monitoring section 13 computes a differential value between a present STC value a<SB>n</SB>given to an audio frame at a present time point and a previous STC value that became a source of a PTS value given to an audio frame at a time point preceding to the audio frame of the present time point for one frame and determines whether the differential value is settled within an allowable range of an STC value increase amount in the case where an STC value given for each of a plurality of audio frames increases time-sequentially by the same value all the time and if it is determined that the differential value is settled within the range, the present STC value a<SB>n</SB>is adopted as an STC value c<SB>n</SB>that becomes a source of a PTS value to be given to the audio frame at the present time point, but if not, an arithmetic value with the STC value increase amount added to the previous STC value is adopted as an STC value c<SB>n</SB>that becomes a source of the PTS value given to the audio frame at the present time point. <P>COPYRIGHT: (C)2006,JPO&NCIPI

Description

本発明は、符号化装置、これで用いるSTC補正方法、符号化システム、送出系、及び音声送受信システムに関し、特に符号化装置のSTC自動補正方法に関する。   The present invention relates to an encoding apparatus, an STC correction method used in the encoding apparatus, an encoding system, a transmission system, and a voice transmission / reception system, and more particularly to an STC automatic correction method for an encoding apparatus.

従来、映像と音声信号を独立して符号化する映像及び音声符号化部を有し、独立した映像と音声信号の符号化信号を1つの伝送路に多重伝送する送出系と、この送出系により多重伝送された信号から映像と音声の符号化信号を分離して独立に復号化する映像及び音声復号化部を有する受信系とで構成されるシステムが知られている(例えば、特許文献1参照)。   Conventionally, a transmission system having a video and audio encoding unit for encoding video and audio signals independently, and multiplexing and transmitting the encoded signals of independent video and audio signals to one transmission path, A system is known that includes a video and audio decoding unit that separates and independently decodes video and audio encoded signals from multiplexed signals (see, for example, Patent Document 1). ).

このシステムでは、受信系で映像と音声が正しい時刻に再生できるよう、送出系で映像と音声の符号化信号にその信号の時刻情報を付加する。例えば、送出系は、音声符号化において、送出系内で共通の「STC(System Time Clock)」と呼ばれる時刻情報を元に、音声フレーム単位に付加される「PTS(Presentation Time Stamp)」と呼ばれる再生時刻情報を作成し、作成されたPTSを「PCR(Program Clock Reference)」と呼ばれる時刻基準情報と共に受信系へ送出する。受信系では、受信された音声フレームのPCRから受信系内のSTCを生成し、PTSの時刻情報に基づいて音声フレームからなる音声信号を再生する。   In this system, the time information of the signal is added to the encoded video and audio signals in the transmission system so that the video and audio can be reproduced at the correct time in the reception system. For example, the transmission system is called “PTS (Presentation Time Stamp)” that is added in units of audio frames based on time information called “STC (System Time Clock)” that is common within the transmission system in audio coding. The reproduction time information is created, and the created PTS is sent to the reception system together with time reference information called “PCR (Program Clock Reference)”. In the reception system, an STC in the reception system is generated from the PCR of the received audio frame, and an audio signal composed of the audio frame is reproduced based on the time information of the PTS.

ここで、送出系内の音声符号化部へSTC値を渡す際に、例えばSTC値が破壊される、STC値の供給が停止される、音声符号化部とは独立してSTC値の基準が切り替わる等の事態が生じた場合、音声フレーム単位の時刻情報であるPTSが正しく付加されず、その結果、受信系で復号化される音声信号は、同期再生が滞る、もしくは正しい時刻に再生されないといった不都合が生じる可能性がある。   Here, when the STC value is passed to the speech encoding unit in the transmission system, for example, the STC value is destroyed, the supply of the STC value is stopped, and the STC value reference is independent of the speech encoding unit. When a situation such as switching occurs, the PTS, which is time information in units of audio frames, is not correctly added, and as a result, the audio signal decoded in the reception system is delayed in synchronization or not reproduced at the correct time. Inconvenience may occur.

これを回避するために、音声符号化部においてSTCを内部で自動算出し、音声フレームの時刻情報として採用する方法等が考えられる。しかし、この方法だけでは、システムの時刻情報のSTC値と内部で自動算出したSTC値のずれを検出することは不可能であり、一度両者にずれが生じた場合、その後全ての音声フレーム時刻はシステム時刻とずれ、その結果、受信系において所望の再生ができない可能性がある。
特開平10−51750号公報
In order to avoid this, a method of automatically calculating the STC internally in the speech encoding unit and adopting it as the time information of the speech frame can be considered. However, with this method alone, it is impossible to detect the deviation between the STC value of the system time information and the STC value that is automatically calculated internally. As a result, there is a possibility that a desired reproduction cannot be performed in the reception system.
JP-A-10-51750

上記のように、音声の再生時間を表すPTS値を付加する場合、PTS値を付加するときの基準になるSTC値が破壊、供給停止、もしくは音声符号化部とは独立してSTC値の基準が切り替わる等の事態が生じた場合、音声フレームの正しい時刻情報は失われ、受信系での所望の再生ができない可能性が生じ、最悪の場合、復号化映像信号と同期が取れない現象に至り、システム運用に重大な問題を及ぼす可能性がある。   As described above, when adding a PTS value representing the playback time of a voice, the STC value serving as a reference when adding the PTS value is destroyed, stopped, or the STC value reference is independent of the voice encoding unit. When a situation such as switching occurs, the correct time information of the audio frame is lost, and there is a possibility that the desired reproduction cannot be performed in the reception system, and in the worst case, it becomes a phenomenon in which synchronization with the decoded video signal cannot be achieved. May cause serious problems in system operation.

本発明は、このような従来の事情を考慮してなされたもので、音声符号化において音声フレームの時刻情報が常に同値で増加していく場合、PTS値の元となるSTC値が正しくないときにSTC値を自動的に補正することを目的とする。   The present invention has been made in consideration of such a conventional situation, and when the time information of a voice frame always increases with the same value in voice coding, when the STC value that is the basis of the PTS value is not correct. The purpose is to automatically correct the STC value.

上記目的を達成するため、本発明に係る符号化装置で用いるSTC補正方法は、音声信号を入力して符号化し、符号化された音声信号を成す複数の時系列に連続する音声フレーム毎に、時系列に与えられた時刻情報を表すSTC(System Time Clock)値を元に生成した再生時刻情報を表すPTS(Presentation Time Stamp)値を付与して出力する符号化装置で用いるSTC補正方法であって、前記複数の音声フレームのうち現時点の音声フレームに与えられた現STC値と、当該現時点の音声フレームよりも所定フレーム前の時点の音声フレームに付与されたPTS値の元になった前STC値との差分値を計算する演算ステップと、計算された前記差分値が、前記複数の音声フレーム毎に与えられるSTC値が時系列に常に同値で増加していく場合のSTC値増加量の許容範囲内にあるか否かを判定し、前記許容範囲内にあると判定された場合、前記現時点の音声フレームに付与されるPTS値の元になるSTC値として、前記現STC値を採用すると共に、前記許容範囲内にないと判定された場合、前記現時点の音声フレームに付与されるPTS値の元になるSTC値として、前記現STC値を補正した補正値を採用する処理ステップとを有することを特徴とする。   In order to achieve the above object, the STC correction method used in the encoding apparatus according to the present invention inputs and encodes a speech signal, and for each of a plurality of time-sequential speech frames constituting the encoded speech signal, This is an STC correction method used in an encoding apparatus that outputs a PTS (Presentation Time Stamp) value representing reproduction time information generated based on an STC (System Time Clock) value representing time information given in time series. The previous STC based on the current STC value given to the current voice frame among the plurality of voice frames and the PTS value given to the voice frame at a predetermined frame earlier than the current voice frame. A calculation step for calculating a difference value with respect to a value, and an ST in which the calculated difference value is always increased in time series with the same STC value given for each of the plurality of audio frames. It is determined whether or not it is within the allowable range of the C value increase amount, and if it is determined that it is within the allowable range, the STC value that is the basis of the PTS value assigned to the current audio frame is used as the STC value. When the STC value is adopted and when it is determined that it is not within the allowable range, the correction value obtained by correcting the current STC value is adopted as the STC value that is the basis of the PTS value given to the current audio frame. And a processing step.

本発明において、前記補正値は、前記前STC値に前記STC値増加量を加えた演算値であることが好ましい。   In the present invention, the correction value is preferably a calculated value obtained by adding the STC value increase amount to the previous STC value.

前記処理ステップは、前記差分値が前記STC値増加量の許容範囲内にないと判定される場合が所定回数連続して生じたとき、前記STC値増加量の基準となるSTC値を前記現STC値に切り替えるステップを有してもよい。   In the processing step, when it is determined that the difference value is not within the allowable range of the STC value increase amount continuously for a predetermined number of times, an STC value serving as a reference for the STC value increase amount is determined as the current STC value. You may have the step which switches to a value.

本発明に係る符号化装置は、音声信号を入力して符号化し、符号化された音声信号を成す複数の時系列に連続する音声フレーム毎に、時系列に与えられた時刻情報を表すSTC(System Time Clock)値を元に生成した再生時刻情報を表すPTS(Presentation Time Stamp)値を付与して出力する符号化装置であって、前記複数の音声フレームのうち現時点の音声フレームに与えられた現STC値と、当該現時点の音声フレームよりも所定フレーム前の時点の音声フレームに付与されたPTS値の元になった前STC値との差分値を計算する演算手段と、計算された前記差分値が、前記複数の音声フレーム毎に与えられるSTC値が時系列に常に同値で増加していく場合のSTC値増加量の許容範囲内にあるか否かを判定し、前記許容範囲内にあると判定された場合、前記現時点の音声フレームに付与されるPTS値の元になるSTC値として、前記現STC値を採用すると共に、前記許容範囲内にないと判定された場合、前記現時点の音声フレームに付与されるPTS値の元になるSTC値として、前記現STC値を補正した補正値を採用する処理手段とを有することを特徴とする。   The encoding apparatus according to the present invention inputs and encodes a speech signal, and for each speech frame that is continuous in a plurality of time sequences constituting the encoded speech signal, STC (time information given in time sequence) An encoding apparatus that outputs a PTS (Presentation Time Stamp) value representing reproduction time information generated based on a System Time Clock value, and is provided to a current audio frame among the plurality of audio frames An arithmetic means for calculating a difference value between the current STC value and the previous STC value that is a source of the PTS value given to the audio frame at a time point before the current audio frame, and the calculated difference It is determined whether or not the value is within the allowable range of the STC value increase amount when the STC value given for each of the plurality of audio frames always increases with the same value in time series, and is within the allowable range Judged If the current STC value is adopted as the STC value that is the basis of the PTS value given to the current audio frame, and it is determined that the current audio frame is not within the allowable range, And a processing unit that employs a correction value obtained by correcting the current STC value as an STC value that is a source of the assigned PTS value.

本発明において、前記補正値は、前記前STC値に前記STC値増加量を加えた演算値であることが好ましい。   In the present invention, the correction value is preferably a calculated value obtained by adding the STC value increase amount to the previous STC value.

前記処理手段は、前記差分値が前記STC値増加量の許容範囲内にないと判定される場合が所定回数連続して生じたとき、前記STC値増加量の基準となるSTC値を前記現STC値に切り替える手段を有してもよい。   The processing means determines an STC value as a reference for the STC value increase amount when the difference value is determined not to be within the allowable range of the STC value increase amount for a predetermined number of times. You may have a means to switch to a value.

本発明に係る符号化システムは、上記いずれかに記載の符号化装置を複数備え、前記複数の符号化装置は、前記STC値増加量の許容範囲が異なることを特徴とする。   An encoding system according to the present invention includes a plurality of the encoding apparatuses according to any one of the above, wherein the plurality of encoding apparatuses have different allowable ranges of the STC value increase amount.

本発明に係る送出系は、上記いずれかに記載の符号化装置を有し、当該符号化装置により符号化された音声信号を送出することを特徴とする。   A transmission system according to the present invention includes any one of the encoding devices described above, and transmits an audio signal encoded by the encoding device.

本発明に係る音声送受信システムは、上記いずれかに記載の符号化装置を有し且つ当該符号化装置により符号化された音声信号を送出する送出系と、前記送出系により送出された音声信号を受信する受信系とを有し、前記受信系は、前記符号化装置で符号化された音声信号を復号化する復号化装置を有することを特徴とする。   An audio transmission / reception system according to the present invention includes a transmission system that includes the encoding device according to any one of the above and that transmits an audio signal encoded by the encoding device, and an audio signal transmitted by the transmission system. A receiving system for receiving, wherein the receiving system has a decoding device for decoding the audio signal encoded by the encoding device.

本発明によれば、音声フレームの時刻情報となるSTC値が常に同値で増加していく場合に音声フレームに付与されるPTS値の元となるSTC値の増加量・減少量を現STC値と前STC値との差分値に基づき監視することで、STC値の変動、STC値の瞬間ずれ、STC値基準の切り替わりを検出でき、これによりSTC値が正しく与えられない場合にはSTC値を補正することができ、その結果、音声フレームに付与されるPTS値の正当性を確保することができる。   According to the present invention, when the STC value, which is the time information of the audio frame, always increases at the same value, the increase / decrease amount of the STC value that is the source of the PTS value given to the audio frame is the current STC value. By monitoring based on the difference value from the previous STC value, it is possible to detect STC value fluctuation, instantaneous deviation of STC value, and switching of STC value reference, thereby correcting the STC value when the STC value is not given correctly. As a result, it is possible to ensure the validity of the PTS value assigned to the audio frame.

以下、本発明の実施の形態について、図面を参照して説明する。   Embodiments of the present invention will be described below with reference to the drawings.

本実施形態の符号化システムは、例えば映像信号をMPEG−2(Moving Picture Coding Experts Group-phase 2)映像規格等の所定規格の映像符号化方式で符号化し、音声信号をMPEG−2 AAA(Advanced Audio Coding)方式等の所定規格の音声符号化方式で符号化し、符号化された映像及び音声データからMPEG−2システム規格等に基づくPES(Packetized Elementary Stream)等のパケット列からなるTS(Transport Stream)信号等を生成して送出する送出システム等に適用されるものである。   The encoding system according to the present embodiment encodes a video signal by a video encoding method of a predetermined standard such as MPEG-2 (Moving Picture Coding Experts Group-phase 2) video standard, and converts an audio signal to MPEG-2 AAA (Advanced TS (Transport Stream) consisting of a packet sequence such as PES (Packetized Elementary Stream) based on the MPEG-2 system standard, etc., from the encoded video and audio data, encoded by a predetermined audio encoding method such as Audio Coding It is applied to a transmission system that generates and transmits signals and the like.

図1は、本実施形態の符号化システムの主要部構成を示す。   FIG. 1 shows a main part configuration of the encoding system of this embodiment.

図1に示す符号化システムは、例えばMPEG−2 AAA方式等の音声符号化方式で音声信号を符号化する音声符号化部10と、音声符号化部10にシステム内の共通の時刻情報であるSTCを供給するSTC部20と、操作者により各種設定等の操作が可能な操作部30とを備えている。その他、図示しない映像信号を符号化する符号化装置や、符号化された音声及び映像信号を1本のTS信号に多重化して出力する多重化装置等も含まれる。以下の説明では、音声符号化部10以外の構成は、本発明に直接関係しないため、その説明を省略する。   The encoding system shown in FIG. 1 is a time information common to the speech encoding unit 10 and the speech encoding unit 10 that encodes a speech signal using a speech encoding method such as MPEG-2 AAA. An STC unit 20 that supplies an STC and an operation unit 30 that can be operated by the operator such as various settings are provided. In addition, an encoding device that encodes a video signal (not shown), a multiplexing device that multiplexes the encoded audio and video signals into one TS signal, and the like are included. In the following description, since the configuration other than the speech encoding unit 10 is not directly related to the present invention, the description thereof is omitted.

音声符号化部10は、入力された音声信号を符号化する符号化処理部11と、STC部20から与えられるSTC値を元に再生時間情報であるPTS値を生成して符号化処理部11に供給するPTS生成部12とを有する。これに加え、本発明のSTC補正方法を用いた処理部として、本実施の形態では、STC部20から与えられるSTC値aのずれ検出を現STC値aと前STC値との差分値Δdに基づいて行い、STC値aの瞬間ずれを検出した場合、現STC値aを正しいSTC値cに補正する等、STC値の増加量及び減少量を監視して必要に応じて補正するSTC監視部13が設けられている。 The speech encoding unit 10 generates an encoding processing unit 11 that encodes an input speech signal, and generates a PTS value that is reproduction time information based on the STC value given from the STC unit 20, thereby encoding the processing unit 11. And a PTS generator 12 to be supplied to. Additionally, as a processing unit with STC correcting method of the present invention, in the present embodiment, the difference value between the current STC value a n and the previous STC value the displacement detection of STC value a n given from the STC unit 20 performed based on [Delta] d, when detecting the instantaneous deviation of the STC values a n, etc. for correcting the current STC value a n at the correct STC value c n, as required by monitoring the increase and decrease in the STC value An STC monitoring unit 13 for correction is provided.

ここで、図2〜図5を参照して、本発明の符号化システムで用いるSTC補正方法の原理を説明する。   Here, the principle of the STC correction method used in the encoding system of the present invention will be described with reference to FIGS.

本STC補正方法は、音声符号化において音声フレームの時刻が常に同値で増加していく場合に採用するSTC値に問題があるとき、採用されるSTC値を自動的に補正するため、1)STC値の変動、2)STC値の瞬間ずれ、3)STC値基準の切り替わりをそれぞれ監視しながら、自動補正を行うものである。このため、本STC補正方法は、a)STC値のずれ検出を現STC値と前STC値の差分から行う手段と、b)STC値の瞬間ずれを検出した場合、現STC値を正しいSTC値に変更する手段と、c)STC値のずれを指定した時間内で連続して検出した場合、正しいSTC値の算出基準として現STC値を採用する手段とを有している。   This STC correction method automatically corrects the adopted STC value when there is a problem with the STC value adopted when the time of the voice frame always increases with the same value in speech coding. Automatic correction is performed while monitoring the fluctuation of the value, 2) the instantaneous deviation of the STC value, and 3) the switching of the STC value reference. For this reason, the present STC correction method includes a) means for detecting STC value deviation from the difference between the current STC value and the previous STC value, and b) when detecting an instantaneous deviation of STC value, the current STC value is set to the correct STC value. And c) means for adopting the current STC value as a reference for calculating a correct STC value when the deviation of the STC value is continuously detected within the specified time.

図2〜図5において、横軸は、実時間を表し、縦軸は、音声符号化部10が採用したSTC値を表す。AF1は、ある時刻に符号化する音声信号として音声符号化部10に入力される最初の音声フレーム、AF2は、最初の音声フレームAF1に続いて符号化する音声信号として音声符号化部10に入力される2番目の音声フレーム、AF3は、2番目の音声フレームAF2に続いて符号化する音声信号として音声符号化部10に入力される3番目の音声フレーム、AF4は、3番目の音声フレームAF3に続いて符号化する音声信号として音声符号化部10に入力される4番目の音声フレームである。   2 to 5, the horizontal axis represents real time, and the vertical axis represents the STC value adopted by the speech encoding unit 10. AF1 is the first audio frame input to the audio encoding unit 10 as an audio signal to be encoded at a certain time, and AF2 is input to the audio encoding unit 10 as an audio signal to be encoded following the first audio frame AF1. The second audio frame, AF3, is input to the audio encoding unit 10 as an audio signal to be encoded following the second audio frame AF2, and AF4 is the third audio frame AF3. Is the fourth audio frame that is input to the audio encoding unit 10 as an audio signal to be encoded.

また、t1は、音声符号化部10が最初の音声フレームAF1に対するSTC値a1を取得した瞬間の時刻、t2は、音声符号化部10が2番目の音声フレームAF2に対するSTC値a2を取得した瞬間の時刻、t3は、音声符号化部10が3番目の音声フレームAF3に対するSTC値a3を取得した瞬間の時刻、t4は、音声符号化部10が4番目の音声フレームAF4に対するSTC値a4を取得した瞬間の時刻を示す。   Also, t1 is the time when the speech encoding unit 10 acquires the STC value a1 for the first speech frame AF1, and t2 is the moment when the speech encoding unit 10 acquires the STC value a2 for the second speech frame AF2. , T3 is the time when the speech encoding unit 10 acquired the STC value a3 for the third speech frame AF3, and t4 is the time when the speech encoding unit 10 acquires the STC value a4 for the fourth speech frame AF4. Indicates the time of the moment.

また、a(nは正の整数で、図中の例ではn=1〜4、以下同様)は、現在の音声フレーム入力に対し、外部のSTC生成部20から供給され音声符号化部10で取得された現STC値、bは、前の音声フレームで採用された前STC値、cは、現音声フレームで採用されたSTC値、Δdは、前の音声フレームで採用されたSTC値と現在の音声フレーム入力に対し、外部から供給され音声符号化部10で取得されたSTC値との差分値であり、a−bを示す。Δeは、現音声フレームで取得されるべき理想的なSTC値の増分値であり、前の音声フレームで採用された前STC値から音声フレーム入力毎に単位時間分増加してゆく理想的なSTC値の増加量を示す。 Also, a n (n is a positive integer, n = 1 to 4 in the example in the figure, and so on) is supplied from the external STC generation unit 20 to the current speech frame input, and the speech encoding unit 10 STC in the obtained current STC value, b n is the previous STC value before adopted in the speech frame, c n is STC value adopted in the current speech frame, [Delta] d is adopted in the previous speech frame This is a difference value between the value and the STC value supplied from the outside and acquired by the speech encoding unit 10 for the current speech frame input, and indicates a n −b n . Δe is an increment value of an ideal STC value to be acquired in the current voice frame, and is an ideal STC that increases by unit time for each voice frame input from the previous STC value adopted in the previous voice frame. Indicates the amount of increase in value.

図2〜図5中のグラフ直線L1は、音声フレーム入力毎に単位時間分増加してゆく理想的な外部STC値の基準となるSTC値の時系列変化直線を示す。図5に示すグラフ直線L2は、音声フレーム入力毎に単位時間分増加してゆく理想的な外部STC値の基準となるSTC値を現STC値aに切り替えたときのSTC値の時系列変化直線を示す。 A graph straight line L1 in FIGS. 2 to 5 shows a time-series change line of STC values that serve as a reference for an ideal external STC value that increases by unit time for each voice frame input. Graph line L2 shown in FIG. 5, the time-series change in the STC value when switching the STC value as a reference of the ideal external STC value slide into increased unit time for each speech frame input to the current STC value a n A straight line is shown.

なお、図には記していないが、Δfは、現STC値aと前STC値bとの差分値Δdの許容差を示し、その値は指定される固定値とする。尺度M1は、時刻t1のタイミングでの差分値Δdの許容差Δfの範囲(上限値=r2−b1、下限値=r1−b1)、尺度M2は、時刻t2のタイミングでの差分値Δdの許容差Δfの範囲(上限値=r3−b2、下限値=r2−b2)、尺度M3は、時刻t3のタイミングでの差分値Δdの許容差Δfの範囲(上限値=r4−b3、下限値=r3−b3)、尺度M4は、時刻t4のタイミングでの差分値Δdの許容差Δfの範囲(上限値=r5−b4、下限値=r4−b4)を示す。 Although not noted in the figure, Delta] f represents the tolerance of the difference value Δd between the current STC value a n and the previous STC value b n, the value is a fixed value that is specified. Scale M1 is a range of tolerance Δf of difference value Δd at the timing of time t1 (upper limit = r2-b1, lower limit = r1-b1), and scale M2 is tolerance of difference value Δd at the timing of time t2. The range of the difference Δf (upper limit = r3-b2, lower limit = r2-b2), the scale M3 is the range of the tolerance Δf of the difference Δd at the timing of time t3 (upper limit = r4-b3, lower limit = r3-b3) and the scale M4 indicate the range of the tolerance Δf of the difference value Δd at the timing of time t4 (upper limit = r5-b4, lower limit = r4-b4).

以下、図2〜図5を参照して、4つのケースを説明する。
(ケース1)
図2の例は、音声フレーム入力時に外部から供給されたSTC値aが音声フレーム毎に単位時間分増加してゆく理想的な場合を示している。
Hereinafter, four cases will be described with reference to FIGS.
(Case 1)
The example of FIG. 2, STC value a n supplied from the outside indicates an ideal case in which slide into increased unit time for each speech frame when the speech frame input.

この場合、時刻t1のタイミングでSTC生成部20から与えられる現STC値a1と、前音声フレームで付与されたPTS値の元になった前STC値b1との差分値Δd(=a1−b1)は、尺度M1に示す許容差Δfの範囲(上限値=r2−b1、下限値=r1−b1)に入っており、この時、現音声フレームに付与すべきPTS値の元になるSTC値c1として、a1が採用される。即ち、STC値c1は、a1=c1の関係となる。
(ケース2)
図3の例は、音声フレーム入力時に外部から供給されたSTC値aが音声フレーム毎に単位時間分増加しなかった場合の一例を示し、STC値の変動とその補正方法を表すものである。
In this case, a difference value Δd (= a1-b1) between the current STC value a1 given from the STC generation unit 20 at the timing of time t1 and the previous STC value b1 that is the basis of the PTS value given in the previous voice frame. Is within the range of the tolerance Δf shown in the scale M1 (upper limit = r2-b1, lower limit = r1-b1), and at this time, the STC value c1 that is the source of the PTS value to be assigned to the current speech frame A1 is adopted. That is, the STC value c1 has a relationship of a1 = c1.
(Case 2)
Example of FIG. 3 shows an example in which STC value a n supplied from the outside during the speech frame input is not increased unit time for each speech frame, is representative of the change and its method of correcting STC value .

この場合、時刻t2のタイミングでSTC生成部20から与えられる現STC値a2と、前音声フレームで付与されたPTS値の元になった前STC値b2との差分値Δd(=a2−b2)は、尺度M2に示す許容差Δfの範囲(上限値=r3−b2、下限値=r2−b2)に入っており、この時、現音声フレームに付与すべきPTS値の元になるSTC値c2として、a2が採用される。即ち、STC値c2は、a2=c2の関係となる。   In this case, a difference value Δd (= a2−b2) between the current STC value a2 given from the STC generation unit 20 at time t2 and the previous STC value b2 that is the basis of the PTS value given in the previous voice frame. Is within the range of the tolerance Δf indicated by the scale M2 (upper limit = r3-b2, lower limit = r2-b2). At this time, the STC value c2 that is the basis of the PTS value to be assigned to the current speech frame As, a2 is adopted. That is, the STC value c2 has a relationship of a2 = c2.

図3の例では、外部のSTC値が理想的な増分Δeより大きくなった場合を示しているが、理想的な増分より小さくなった場合も許容範囲Δfの範囲であれば、外部のSTC値aを採用する。 The example of FIG. 3 shows the case where the external STC value is larger than the ideal increment Δe, but the external STC value is within the allowable range Δf even when the external STC value is smaller than the ideal increment. An is adopted.

また、真のSTCではなく補正したSTC値を用いてPTS値を作成したことを受信系(図示しない)へ通知するために、符号化処理部11にて生成されるPESパケット内のPESヘッダー部のユーザデータにフラグを重畳する。こうすることで、受信系(図示しない)側は、補正したSTC値との正当性を検査することができる。また、音声符号化部10にて補正を行った経緯に応じた警報を出力することが望ましい。こうすることで、上位システム(図示しない)で適切な対処を行えることになる。
(ケース3)
図4の例は、音声フレーム入力時に外部のSTC値aが音声フレーム毎に単位時間分増加しなかった場合の一例を示し、STC値の瞬間ずれとその補正方法を表す。
Further, in order to notify a receiving system (not shown) that a PTS value has been created using a corrected STC value instead of a true STC, a PES header part in a PES packet generated by the encoding processing unit 11 A flag is superimposed on the user data. By doing so, the receiving system (not shown) can inspect the correctness with the corrected STC value. Further, it is desirable to output an alarm corresponding to the circumstances in which the speech encoding unit 10 performed the correction. By doing so, appropriate measures can be taken in the host system (not shown).
(Case 3)
The example of FIG. 4, STC value a n of the outside when the speech frame input shows an example in which no increase unit time for each speech frame represents the instantaneous deviation and the correction method of the STC value.

この場合、時刻t3のタイミングでSTC生成部20から与えられる現STC値a3と、前音声フレームで付与されたPTS値の元になった前STC値b3の差分値Δd(=a3−b3)は、尺度M3に示す許容差Δfの範囲に入っておらず、この時、現音声フレームに付与すべきPTS値の元になるSTC値c3として、b3+Δeの値が採用される。即ち、STC値c3は、c3=b3+Δeの関係となり、理想的にSTC値を増加させた値となる。   In this case, a difference value Δd (= a3−b3) between the current STC value a3 given from the STC generation unit 20 at the timing of time t3 and the previous STC value b3 that is the basis of the PTS value given in the previous voice frame is In this case, the value of b3 + Δe is adopted as the STC value c3 that is the basis of the PTS value to be given to the current voice frame. That is, the STC value c3 has a relationship of c3 = b3 + Δe, and is an ideally increased value of the STC value.

図4の例では、外部のSTC値が理想的な増分Δeより大きくなった場合を示しているが、Δより小さくなった場合も、許容範囲Δfの範囲に入っていなければ、STC値として、bn+Δeの値が採用される。   In the example of FIG. 4, a case where the external STC value is larger than the ideal increment Δe is shown, but even when the external STC value is smaller than Δ, if it is not within the allowable range Δf, the STC value is A value of bn + Δe is adopted.

また、真のSTCではなく補正したSTC値を用いてPTS値を作成したことを受信系へ通知するために符号化処理部11にて生成されるPESパケット内のPESヘッダー部のユーザデータにフラグを重畳する。こうすることで、受信系(図示しない)側は、補正したSTC値との正当性を検査することができる。また、音声符号化部10にて補正を行った経緯に応じた警報を出力することが望ましい。こうすることで、上位システム(図示しない)で適切な対処を行えることになる。
(ケース4)
図5は、外部のSTC値が切り替わった状況を示しているSTC値基準の切り替わりとその補正方法を表す。図5中の直線L2は、切り替わった外部STCの増加を表す直線である。
In addition, a flag is set in the user data in the PES header portion in the PES packet generated by the encoding processing unit 11 in order to notify the reception system that the PTS value has been created using the corrected STC value instead of the true STC. Is superimposed. By doing so, the receiving system (not shown) can inspect the correctness with the corrected STC value. Further, it is desirable to output an alarm corresponding to the circumstances in which the speech encoding unit 10 performed the correction. By doing so, appropriate measures can be taken in the host system (not shown).
(Case 4)
FIG. 5 shows the STC value reference switching and the correction method showing the situation where the external STC value is switched. A straight line L2 in FIG. 5 is a straight line representing an increase in the switched external STC.

この場合、時刻t2、t3のタイミングで、STC生成部20から与えられる現STC値a2、a3と、前音声フレームで付与されたPTS値の元になった前STC値b2、b3のそれぞれの差分値Δd(=a2−b2)及びΔd(=a3−b3)は、尺度M2、M3に示す許容差Δfの範囲に入っておらず、この時、現音声フレームに付与すべきPTS値の元になるSTC値c2、c3として、それぞれb2+Δe、b3+Δeが採用される。即ち、STC値c2、c3は、c2=b2+Δe、c3=b3+Δeの関係となり、理想的にSTC値を増加させた値となる。   In this case, the difference between the current STC values a2 and a3 given from the STC generation unit 20 and the previous STC values b2 and b3 based on the PTS value given in the previous audio frame at the timings t2 and t3. The values Δd (= a2−b2) and Δd (= a3−b3) are not within the tolerance Δf indicated by the scales M2 and M3. At this time, the values Δd (= a2−b2) are based on the PTS values to be added to the current speech frame. As the STC values c2 and c3, b2 + Δe and b3 + Δe are adopted, respectively. That is, the STC values c2 and c3 are in a relationship of c2 = b2 + Δe and c3 = b3 + Δe, and are ideally increased STC values.

しかし、時刻t2、t3のタイミングで理想的に増加させたSTC値(b2+Δe、b3+Δe)を採用し、かつ、次の時刻t4のタイミングでも理想的に増加させたSTC値(b4+Δe)を採用した場合には、3回連続して理想的なSTC値(b+Δe)が採用されることになる。 However, when the STC values (b2 + Δe, b3 + Δe) that are ideally increased at the timings of times t2 and t3 are employed, and the STC values (b4 + Δe) that are ideally increased at the timings of the next time t4 are also employed. For this, an ideal STC value (b n + Δe) is adopted three times in succession.

このように連続して理想的なSTC値が採用される場合は、理想的な外部STC値の増加の基準となるSTC値の変化直線が直線L1から直線L2に変化したとみなし、時刻t4のタイミングでは、現音声フレームに付与すべきPTS値の元になるSTC値c4として、理想的に増加させたSTC値(b4+Δe)が破棄され、STC生成部20から与えられた現STC値a4が採用される。なお、”連続的に3回”の回数は、あくまで一例であり、任意な値に設定可能である。   When the ideal STC value is continuously adopted as described above, it is considered that the STC value changing straight line that serves as a reference for the increase in the ideal external STC value is changed from the straight line L1 to the straight line L2, and at time t4. At the timing, the STC value (b4 + Δe) that is ideally increased is discarded as the STC value c4 that is the basis of the PTS value to be assigned to the current speech frame, and the current STC value a4 given from the STC generation unit 20 is adopted. Is done. The number of times of “3 times continuously” is merely an example and can be set to an arbitrary value.

なお、STCの切り替わりが図5の例とは反対にSTC値の減少方向にあったとしても、その差分と許容範囲の範囲の判断の概念は共通であり、STC値の増加・減少の状況により、適切な補正処理を行うことも作用に含む。   Note that even if the switching of STC is in the direction of decreasing STC value as opposed to the example of FIG. 5, the concept of the determination of the difference and the range of allowable range is common, and it depends on the situation of increase / decrease of STC value. The operation also includes performing an appropriate correction process.

また、真のSTCではなく補正したSTC値を用いてPTS値を作成したこと、およびSTCの基準の切り替わりを判断したことを受信系(図示しない)に通知するために符号化処理部11にて生成されるPESパケット内のPESヘッダー部のユーザデータにフラグを重畳する。こうすることで、受信系(図示しない)側は、補正したSTC値との正当性を検査することができる。また、音声符号化部10から補正を行った経緯に応じた警報を出力することが望ましい。こうすることで、上位システムで適切な対処を行えることになる。   Further, the encoding processing unit 11 notifies the receiving system (not shown) that the PTS value has been created using the corrected STC value instead of the true STC and that the STC reference has been switched. A flag is superimposed on the user data in the PES header part in the generated PES packet. By doing so, the receiving system (not shown) can inspect the correctness with the corrected STC value. Further, it is desirable to output an alarm according to the background of the correction from the speech encoding unit 10. By doing so, appropriate measures can be taken in the host system.

図6は、上記STC補正方法の原理に基づくSTC監視部13の内部構成例を示す。   FIG. 6 shows an internal configuration example of the STC monitoring unit 13 based on the principle of the STC correction method.

STC監視部13は、機能上、制御中枢を担う制御部131と、この制御部131による制御の元で動作する各部、即ち現STC値バッファ132、前STC値バッファ133、減算器134、連続補正回数設定テーブル135、STC値算出基準テーブル136、及び判定部137とを有している。   The STC monitoring unit 13 is functionally a control unit 131 responsible for the control center, and each unit operating under the control of the control unit 131, that is, a current STC value buffer 132, a previous STC value buffer 133, a subtractor 134, a continuous correction A number setting table 135, an STC value calculation reference table 136, and a determination unit 137.

この内、現STC値バッファ132には、STC生成部20から入力されるSTC値aが現STC値aとして一時格納される。 Among them, the current STC value buffer 132, STC values a n input from the STC generation unit 20 is temporarily stored as a current STC value a n.

前STC値バッファ133には、STC監視部13からPTS生成部12へ出力されるSTC値cが前STC値bとして一時格納される。 The front STC value buffer 133, STC value c n output from the STC monitoring unit 13 to the PTS generating portion 12 is temporarily stored as a previous STC value b n.

減算器134は、両バッファ132、133からの現STC値a及び前STC値bの差分値Δd(=a−b)を計算する。 Subtractor 134 calculates the difference value Δd in the current STC value a n and the previous STC value b n from both buffers 132,133 (= a n -b n) .

連続補正回数設定テーブル135には、操作部30等を介して指定された連続補正回数xが設定される。   In the continuous correction number setting table 135, the continuous correction number x designated through the operation unit 30 or the like is set.

STC値算出基準設定テーブル136には、音声フレーム入力毎に単位時間分増加してゆく理想的なSTC値の基準値(例えば、図2〜図5中の直線L1に沿ったSTC値)及びその増加量の許容範囲を示す許容差Δfが設定される。   The STC value calculation reference setting table 136 includes an ideal STC value reference value (for example, an STC value along the straight line L1 in FIGS. 2 to 5) that increases by unit time for each voice frame input, and its A tolerance Δf indicating the allowable range of the increase amount is set.

判定部137は、減算器134から出力される差分値Δdと、両テーブル135、136の設定値とに基づき、現STC値aと前STC値bのずれを検出し、これに応じて採用すべきSTC値cを判定する。 Judging unit 137, the difference value Δd output from the subtractor 134, on the basis of the set value of both tables 135 and 136, to detect the deviation of the current STC value a n and the previous STC value b n, accordingly It determines STC value c n to be adopted.

図7は、STC監視部13の動作を説明するフローチャートを示す。   FIG. 7 is a flowchart for explaining the operation of the STC monitoring unit 13.

まず、連続補正回数設定テーブル135の連続補正回数xを初期設定し(ステップSt1)、STC値算出基準テーブル136のSTC値の算出基準となるSTC値及び許容差Δfを初期設定する(ステップSt2)。   First, the continuous correction number x in the continuous correction number setting table 135 is initially set (step St1), and the STC value and the tolerance Δf as the STC value calculation reference in the STC value calculation reference table 136 are initially set (step St2). .

次いで、STC生成部20から与えられるSTC値aを入力して、現STC値aとして現STC値バッファ132に一時格納し(ステップSt3)、現STC値バッファ132の現STC値aと、前STC値バッファ133に一時格納されている前STC値bとの差分値Δd(=a−b)を計算する(ステップSt4)。 Then, enter the STC value a n given from the STC generation unit 20, and temporarily stored in the current STC value buffer 132 as the current STC value a n (step St3), and the current STC value a n of the current STC value buffer 132 Then, a difference value Δd (= a n −b n ) from the previous STC value b n temporarily stored in the previous STC value buffer 133 is calculated (step St4).

次いで、現STC値aと前STC値bとの差分値Δd=0か否かを判断し(ステップSt5)、YES(Δd=0である)の場合は、現音声フレームに付与されるPTS値の元になるSTC値cとして、現STC値aを採用する(c=a)(ステップSt6)。この場合は、前述したケース1に対応する。 Next, it is determined whether or not the difference value Δd = 0 between the current STC value a n and the previous STC value b n (step St5). If YES (Δd = 0), the difference is given to the current voice frame. as STC value c n underlying the PTS value, employing the current STC value a n (c n = a n ) ( step St6). This case corresponds to Case 1 described above.

上記ステップSt5の判断でNO(Δd=0でない)の場合は、差分値Δdが許容差Δfの範囲内、即ちΔfの上限値≧Δd≧Δfの下限値の条件を満たすか否かを判断する(ステップSt7)。   If the determination in step St5 is NO (Δd = 0 is not true), it is determined whether or not the difference value Δd satisfies the condition of the tolerance Δf, that is, the upper limit value of Δf ≧ the lower limit value of Δd ≧ Δf. (Step St7).

この判断で、YES(Δf上限値≧Δd≧Δf下限値の条件を満たしている)の場合は、現音声フレームに付与されるPTS値の元になるSTC値cとして、現STC値aを採用し(c=a)(ステップSt8)、これに関する制御信号SをPTS生成部12に出力する(ステップSt9)。PTS生成部12は、制御信号Sにより、STC値cとして採用された現STC値aが許容差Δfの範囲内にあるものの理想的なSTC値よりも外れていることを認識し、これに関する警報を出力する等、必要な処理を行う。この場合は、前述したケース2に対応する。 In this decision, YES if the (meet the conditions of Delta] f upper limit ≧ [Delta] d ≧ Delta] f lower limit), the STC value c n underlying the PTS value applied to the current speech frame, the current STC value a n It was adopted (c n = a n) (step St8), and outputs a control signal S n to the PTS generating portion 12 in this regard (step St9). PTS generating unit 12, the control signals S n, recognizes that deviates than ideal STC value of the current STC value a n adopted as STC value c n is intended to be within the scope of the tolerance Delta] f, Necessary processing, such as outputting an alarm related to this, is performed. This case corresponds to the case 2 described above.

上記ステップSt7の判断でNO(Δf上限値≧Δd≧Δf下限値の条件を満たしていない)の場合は、現音声フレームに付与されるPTS値の元になるSTC値cとして、理想的なSTC値である「b+Δe」の値を採用し(c=b+Δe)(ステップSt10)、連続補正回数xをインクリメントし(ステップSt11)、x≧設定値(例えば3回)の条件を満たしているか否かを判断する(ステップSt12)。 For NO (Delta] f does not satisfy the condition of upper limit ≧ [Delta] d ≧ Delta] f lower limit) is determined in the step St 7, as STC value c n underlying the PTS value applied to the current speech frame, ideal The STC value “b n + Δe” is adopted (c n = b n + Δe) (step St10), the continuous correction number x is incremented (step St11), and the condition of x ≧ setting value (for example, 3 times) Is determined (step St12).

この判断でYES(x≧設定値の条件を満たしている)の場合は、PTS生成部12へ出力すべきSTC値cとして、「b+Δe」の値を破棄して、現STC値aを採用し(c=a)(ステップSt13)、理想的なSTC値の基準値となるSTC値として現STC値aを採用して、STC値算出基準の切り替えを行い(ステップSt14)、これに関する制御信号SをPTS生成部12に出力する(ステップSt15)。また、連続補正回数xの初期化(x→0)を行い(ステップSt16)、再度STC値算出基準の切り替え検出に備える。PTS生成部12は、制御信号Sにより、現STC値aが許容差Δfの範囲外にあるものの、現音声フレームに付与されるPTS値の元になるSTC値cとして現STC値aが採用され、かつ、理想的なSTC値の基準値となるSTC値が現STC値aに切り替えられたことを認識し、これに関する警報を出力する等、必要な処理を行う。この場合は、前述したケース4に対応する。 In case of YES (satisfies the condition of x ≧ set value) in this determination, as STC value c n to be outputted to the PTS generating portion 12 discards the value of "b n + .DELTA.e" current STC value a adopted n (c n = a n) (step St 13), employs a current STC value a n as STC value as a reference value of an ideal STC value, switches the STC value calculation criteria (step St14 ), and outputs the control signal S n in this regard to the PTS generating portion 12 (step St15). In addition, the number of continuous corrections x is initialized (x → 0) (step St16) to prepare for detection of switching of the STC value calculation reference again. PTS generating portion 12, a control signal by the S n, although the current STC value a n is outside the range of tolerance Delta] f, the current STC value a as STC values c n underlying the PTS value applied to the current speech frame n it is employed, and recognizes that the STC value as a reference value of an ideal STC value is switched to the current STC value a n, etc. for outputting an alarm on this, performs the necessary processing. This case corresponds to Case 4 described above.

上記判断でNO(x≧設定値の条件を満たしいていない)の場合は、これに関する制御信号SをPTS生成部12に出力する(ステップSt17)。PTS生成部12は、制御信号Sにより現STC値aが許容差Δfの範囲外にあるために理想的なSTC値(b+Δe)が採用されていることを認識し、これに関する警報を出力する等、必要な処理を行う。この場合は、前述したケース3に対応する。 For the NO (not yet satisfy the conditions of x ≧ set value) in the determination, and outputs a control signal S n in this regard to the PTS generating portion 12 (Step St17). PTS generator 12 recognizes that the ideal STC value to outside the range of the current STC value a n is tolerance Δf (b n + Δe) is employed by the control signals S n, warning about this To perform necessary processing. This case corresponds to the case 3 described above.

上記ステップSt6、St9、St15の処理が終了すると、前述の各ケース1〜4に応じて採用されたSTC値cをPTS生成部12及び前STC値バッファ133に出力する(ステップSt18)。 When the process of step St6, St9, St15 is completed, outputs the STC value c n adopted in accordance with each case 1 to 4 above the PTS generating portion 12 and the front STC value buffer 133 (step St18).

上記ステップSt3〜St18の処理は、ステップSt19にて処理終了と判断されるまで繰り返し実行される。   The processes in steps St3 to St18 are repeatedly executed until it is determined in step St19 that the process is finished.

従って、本実施の形態によれば、音声符号化部において音声フレームの時刻情報となるSTC値が時系列に常に同値で増加していく場合に音声フレームに付与されるPTS値の元となるSTC値の増加量・減少量を監視することで、STC値の変動、STC値の瞬間ずれ、STC値基準の切り替わりを検出するため、PTS値の元となるSTC値が正しくない場合は採用するSTC値を自動的に補正することができる。これにより、符号化された音声フレーム毎に付与されるPTS値の正当性を確保することができる。   Therefore, according to the present embodiment, when the STC value, which is the time information of the voice frame in the voice coding unit, always increases in time series with the same value, the STC that is the source of the PTS value given to the voice frame By monitoring the amount of increase / decrease in the value, the STC value variation, the STC value instantaneous deviation, and the STC value reference switching are detected. If the STC value that is the basis of the PTS value is incorrect, the STC to be adopted The value can be automatically corrected. Accordingly, it is possible to ensure the validity of the PTS value given to each encoded audio frame.

よって、符号化された音声信号を復号化する復号化装置を有する受信系では、復号化信号を所望の時刻情報に基づき出力することができる。また、STCの切り替わりを検出し、その際は基準のSTCも切り替えることで、PTS値の正当性を確保し、受信系での出力環境も、復号化装置を備えた送出系側と整合性のとれた正しいものとなり得る。さらに、音声符号化信号へ不正な時刻情報を付加することを防止し、時刻情報を用いた運用システムでの不都合を未然に防ぐことも可能である。また、システムとしての時刻情報を切り替えても、様々な設定、制御を施すことなく、自動的に追従できる点は、運用面から見て好都合である。   Therefore, a reception system having a decoding device that decodes an encoded audio signal can output a decoded signal based on desired time information. In addition, by detecting the switching of the STC and switching the reference STC at that time, the validity of the PTS value is ensured, and the output environment in the reception system is also consistent with the transmission system side equipped with the decoding device. It can be the right thing. In addition, it is possible to prevent unauthorized time information from being added to a speech encoded signal, and to prevent inconvenience in an operation system using the time information. In addition, it is convenient from an operational point of view that even when the time information as the system is switched, it can be automatically followed without performing various settings and controls.

なお、前述した音声符号化部10内におけるSTC監視部13の内部構成及び動作(図7、図8参照)はあくまで一例であり、本発明はこれに限定されるものではなく、本STC補正方法の原理(図2〜図5参照)に従うものであれば、いずれの内部構成及び動作でも適用可能である。   Note that the above-described internal configuration and operation (see FIGS. 7 and 8) of the STC monitoring unit 13 in the speech encoding unit 10 are merely examples, and the present invention is not limited to this, and this STC correction method. Any internal configuration and operation are applicable as long as they follow the principle (see FIGS. 2 to 5).

また、本発明の他の実施の形態として、音声符号化部でSTC値のずれを検出した結果を外部に通知する構成を採用してもよい。これによれば、映像符号化部でのPTS付加処理を行う部分や、映像符号化信号と音声符号化信号を多重化する部分等で、本音声符号化部で実施する形態を各部でも容易に実施することが可能である。   As another embodiment of the present invention, a configuration may be adopted in which the result of detecting the STC value deviation by the speech encoding unit is notified to the outside. According to this, it is possible to easily implement the embodiment implemented by the audio encoding unit in the part that performs the PTS addition processing in the video encoding unit, the part that multiplexes the video encoded signal and the audio encoded signal, etc. It is possible to implement.

また、本STC補正方法の有効/無効を切り替え設定可能なスイッチ手段を設けることで、次のような応用システムも考えられる。   In addition, the following application system is also conceivable by providing switch means capable of switching between valid / invalid of the STC correction method.

例えば、音声信号だけを用いるシステム的な一例として、音声多チャンネルでのバーチャル効果が可能となる。4チャンネルの音声符号化に際し、2チャンネルの音声符号化部を2つ設け、各々、前述したPTS値増加量の許容差Δfを別に用意しておく。例えば、2つの音声符号化部の一方には、スイッチ手段により本STC補正方法の無効にすることでPTS値増加量の許容差Δfを用意し、2つの音声符号化部の他方には、スイッチ手段により本STC補正方法の無効にすることでPTS値増加量の許容差Δfを設けず、外部から供給される、ずれたSTC値をそのまま付加するものとする。このようにして、好意的にずれたSTCを供給することで、効果音などの時に、輪唱的な音を実現できる。このバーチャル効果時間は、任意に設定できるPTS値増加量の許容差Δfにより変化させることが可能である。これは、音声符号化と相反する音声復号化でも実現可能である。   For example, as an example of a system using only an audio signal, a virtual effect with multiple audio channels is possible. In the case of 4-channel audio encoding, two 2-channel audio encoding units are provided, and the aforementioned PTS value increase amount tolerance Δf is prepared separately. For example, one of the two speech encoding units is provided with a tolerance Δf of the PTS value increase amount by disabling the present STC correction method by the switch means, and the other speech encoding unit has a switch By disabling the present STC correction method by means, the PST value increase amount tolerance Δf is not provided, but the shifted STC value supplied from the outside is added as it is. In this way, by supplying an STC that is favorably shifted, a ringing sound can be realized at the time of a sound effect or the like. This virtual effect time can be changed by a PTS value increase amount tolerance Δf that can be arbitrarily set. This can also be realized by speech decoding which is contrary to speech encoding.

本発明の実施の形態に係る符号化システムの主要部構成を示す概略ブロック図である。It is a schematic block diagram which shows the principal part structure of the encoding system which concerns on embodiment of this invention. 音声フレーム入力時に外部から供給されたSTC値が音声フレーム毎に単位時間分増加してゆく理想的な場合を説明するグラフである。It is a graph explaining the ideal case where the STC value supplied from the outside at the time of audio | voice frame input increases by unit time for every audio | voice frame. 音声フレーム入力時に外部から供給されたSTC値が音声フレーム毎に単位時間分増加しなかった場合(許容範囲内)を説明するグラフである。It is a graph explaining the case where the STC value supplied from the outside at the time of voice frame input does not increase by unit time for each voice frame (within an allowable range). 音声フレーム入力時に外部から供給されたSTC値が音声フレーム毎に単位時間分増加しなかった場合(許容範囲外)を説明するグラフである。It is a graph explaining the case where the STC value supplied from the outside at the time of voice frame input does not increase by unit time for each voice frame (outside the allowable range). 音声フレーム入力時に外部から供給されたSTC値の基準が切り替わった場合を説明するグラフである。It is a graph explaining the case where the reference | standard of the STC value supplied from the outside at the time of audio | voice frame input switches. STC監視部の内部構成を示す概略ブロック図である。It is a schematic block diagram which shows the internal structure of a STC monitoring part. STC監視部の動作を説明する概略フローチャートである。It is a schematic flowchart explaining operation | movement of an STC monitoring part.

符号の説明Explanation of symbols

10 音声符号化部
11 符号化処理部
12 PTS生成部
13 STC監視部
20 STC生成部
30 操作部
131 制御部
132 現STC値バッファ
133 前STC値バッファ
134 減算器
135 STC値算出基準テーブル
136 連続補正回数テーブル
137 判定部
DESCRIPTION OF SYMBOLS 10 Speech encoding part 11 Encoding process part 12 PTS generation part 13 STC monitoring part 20 STC generation part 30 Operation part 131 Control part 132 Current STC value buffer 133 Previous STC value buffer 134 Subtractor 135 STC value calculation reference table 136 Continuous correction Number table 137 determination unit

Claims (9)

音声信号を入力して符号化し、符号化された音声信号を成す複数の時系列に連続する音声フレーム毎に、時系列に与えられた時刻情報を表すSTC(System Time Clock)値を元に生成した再生時刻情報を表すPTS(Presentation Time Stamp)値を付与して出力する符号化装置で用いるSTC補正方法であって、
前記複数の音声フレームのうち現時点の音声フレームに与えられた現STC値と、当該現時点の音声フレームよりも所定フレーム前の時点の音声フレームに付与されたPTS値の元になった前STC値との差分値を計算する演算ステップと、
計算された前記差分値が、前記複数の音声フレーム毎に与えられるSTC値が時系列に常に同値で増加していく場合のSTC値増加量の許容範囲内にあるか否かを判定し、前記許容範囲内にあると判定された場合、前記現時点の音声フレームに付与されるPTS値の元になるSTC値として、前記現STC値を採用すると共に、前記許容範囲内にないと判定された場合、前記現時点の音声フレームに付与されるPTS値の元になるSTC値として、前記現STC値を補正した補正値を採用する処理ステップとを有することを特徴とする符号化装置で用いるSTC補正方法。
Generates an audio signal based on STC (System Time Clock) value representing time information given in time series for each audio frame that is continuous in a plurality of time series. An STC correction method used in an encoding device that outputs a PTS (Presentation Time Stamp) value representing reproduced time information,
A current STC value given to a current voice frame among the plurality of voice frames, and a previous STC value based on a PTS value given to a voice frame at a predetermined frame before the current voice frame; A calculation step for calculating a difference value of
The calculated difference value determines whether or not the STC value given for each of the plurality of audio frames is within an allowable range of an STC value increase amount when the STC value always increases in the same time series, and When it is determined that the current STC value is within the allowable range, the current STC value is adopted as the STC value that is the basis of the PTS value assigned to the current audio frame, and the current STC value is determined not to be within the allowable range And an STC correction method for use in an encoding apparatus, comprising a processing step of using a correction value obtained by correcting the current STC value as an STC value that is a source of a PTS value assigned to the current speech frame. .
前記補正値は、前記前STC値に前記STC値増加量を加えた演算値であることを特徴とする請求項1に記載の符号化装置で用いるSTC補正方法。   The STC correction method used in the encoding apparatus according to claim 1, wherein the correction value is a calculated value obtained by adding the STC value increase amount to the previous STC value. 前記演算ステップは、前記差分値が前記STC値増加量の許容範囲内にないと判定される場合が所定回数連続して生じたとき、前記STC値増加量の基準となるSTC値を前記現STC値に切り替えるステップを有することを特徴とする請求項1又は2に記載の符号化装置で用いるSTC補正方法。   In the calculation step, when it is determined that the difference value is not within the allowable range of the STC value increase amount continuously for a predetermined number of times, an STC value serving as a reference for the STC value increase amount is determined as the current STC value. The STC correction method used in the encoding apparatus according to claim 1, further comprising a step of switching to a value. 音声信号を入力して符号化し、符号化された音声信号を成す複数の時系列に連続する音声フレーム毎に、時系列に与えられた時刻情報を表すSTC(System Time Clock)値を元に生成した再生時刻情報を表すPTS(Presentation Time Stamp)値を付与して出力する符号化装置であって、
前記複数の音声フレームのうち現時点の音声フレームに与えられた現STC値と、当該現時点の音声フレームよりも所定フレーム前の時点の音声フレームに付与されたPTS値の元になった前STC値との差分値を計算する演算手段と、
計算された前記差分値が、前記複数の音声フレーム毎に与えられるSTC値が時系列に常に同値で増加していく場合のSTC値増加量の許容範囲内にあるか否かを判定し、前記許容範囲内にあると判定された場合、前記現時点の音声フレームに付与されるPTS値の元になるSTC値として、前記現STC値を採用すると共に、前記許容範囲内にないと判定された場合、前記現時点の音声フレームに付与されるPTS値の元になるSTC値として、前記現STC値を補正した補正値を採用する処理手段とを有することを特徴とする符号化装置。
Generates an audio signal based on STC (System Time Clock) value representing time information given in time series for each audio frame that is continuous in a plurality of time series. An encoding device that outputs a PTS (Presentation Time Stamp) value representing the playback time information,
A current STC value given to a current voice frame among the plurality of voice frames, and a previous STC value based on a PTS value given to a voice frame at a predetermined frame before the current voice frame; Computing means for calculating the difference value of
The calculated difference value determines whether or not the STC value given for each of the plurality of audio frames is within an allowable range of an STC value increase amount when the STC value always increases with the same value in time series, When it is determined that the current STC value is within the allowable range, the current STC value is adopted as the STC value that is the basis of the PTS value assigned to the current audio frame, and the current STC value is determined not to be within the allowable range And a processing unit that employs a correction value obtained by correcting the current STC value as an STC value that is a source of the PTS value assigned to the current speech frame.
前記補正値は、前記前STC値に前記STC値増加量を加えた演算値であることを特徴とする請求項4に記載の符号化装置。   5. The encoding apparatus according to claim 4, wherein the correction value is a calculated value obtained by adding the STC value increment to the previous STC value. 前記処理手段は、前記差分値が前記STC値増加量の許容範囲内にないと判定される場合が所定回数連続して生じたとき、前記STC値増加量の基準となるSTC値を前記現STC値に切り替える手段を有することを特徴とする請求項4又は5に記載の符号化装置。   The processing means determines an STC value as a reference for the STC value increase amount when the difference value is determined not to be within the allowable range of the STC value increase amount for a predetermined number of times. 6. The encoding apparatus according to claim 4, further comprising means for switching to a value. 請求項4から6のいずれか1項に記載の符号化装置を複数備え、
前記複数の符号化装置は、前記STC値増加量の許容範囲が異なることを特徴とする符号化システム。
A plurality of the encoding devices according to any one of claims 4 to 6,
The encoding system, wherein the plurality of encoding devices have different allowable ranges of the STC value increase amount.
請求項4から6のいずれか1項に記載の符号化装置を有し、当該符号化装置により符号化された音声信号を送出することを特徴とする送出系。   A transmission system comprising the encoding device according to any one of claims 4 to 6 and transmitting an audio signal encoded by the encoding device. 請求項4から6のいずれか1項に記載の符号化装置を有し、当該符号化装置により符号化された音声信号を送出する送出系と、
前記送出系により送出された音声信号を受信する受信系とを有し、
前記受信系は、前記符号化装置で符号化された音声信号を復号化する復号化装置を有することを特徴とする音声送受信システム。
A transmission system comprising the encoding device according to any one of claims 4 to 6 and transmitting an audio signal encoded by the encoding device;
A receiving system for receiving an audio signal sent by the sending system;
The speech transmission / reception system, wherein the reception system includes a decoding device that decodes the speech signal encoded by the encoding device.
JP2005023298A 2005-01-31 2005-01-31 Encoding apparatus, STC correction method used in the same, encoding system, transmission system, and voice transmission / reception system Active JP4624121B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005023298A JP4624121B2 (en) 2005-01-31 2005-01-31 Encoding apparatus, STC correction method used in the same, encoding system, transmission system, and voice transmission / reception system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005023298A JP4624121B2 (en) 2005-01-31 2005-01-31 Encoding apparatus, STC correction method used in the same, encoding system, transmission system, and voice transmission / reception system

Publications (2)

Publication Number Publication Date
JP2006211509A true JP2006211509A (en) 2006-08-10
JP4624121B2 JP4624121B2 (en) 2011-02-02

Family

ID=36967837

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005023298A Active JP4624121B2 (en) 2005-01-31 2005-01-31 Encoding apparatus, STC correction method used in the same, encoding system, transmission system, and voice transmission / reception system

Country Status (1)

Country Link
JP (1) JP4624121B2 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006254298A (en) * 2005-03-14 2006-09-21 Matsushita Electric Ind Co Ltd Device and method for moving picture reproduction

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07177479A (en) * 1993-09-30 1995-07-14 Thomson Consumer Electron Inc Synchronizer of audio signal and video signal
JPH11234308A (en) * 1997-11-25 1999-08-27 Nec Corp Method for reducing program clock reference jitter of mpeg over atm, reducing device and mpeg decoding device
JP2001053701A (en) * 1999-08-09 2001-02-23 Victor Co Of Japan Ltd Stream multiplexer
JP2001078195A (en) * 1999-09-06 2001-03-23 Matsushita Electric Ind Co Ltd System encoder
JP2004015111A (en) * 2002-06-03 2004-01-15 Sony Corp Data distribution system

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07177479A (en) * 1993-09-30 1995-07-14 Thomson Consumer Electron Inc Synchronizer of audio signal and video signal
JPH11234308A (en) * 1997-11-25 1999-08-27 Nec Corp Method for reducing program clock reference jitter of mpeg over atm, reducing device and mpeg decoding device
JP2001053701A (en) * 1999-08-09 2001-02-23 Victor Co Of Japan Ltd Stream multiplexer
JP2001078195A (en) * 1999-09-06 2001-03-23 Matsushita Electric Ind Co Ltd System encoder
JP2004015111A (en) * 2002-06-03 2004-01-15 Sony Corp Data distribution system

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006254298A (en) * 2005-03-14 2006-09-21 Matsushita Electric Ind Co Ltd Device and method for moving picture reproduction

Also Published As

Publication number Publication date
JP4624121B2 (en) 2011-02-02

Similar Documents

Publication Publication Date Title
EP2306736B1 (en) Method and apparatus for processing video and audio data received in decoding system
US8509301B2 (en) Audio and video synchronizing method in transcoding system
US20050019020A1 (en) Video/audio synchronizing apparatus
JP2006115104A (en) Method and device for packetizing time-series information encoded with high efficiency, and performing real-time streaming transmission, and for reception and reproduction
JP4565011B2 (en) Digital broadcast multiplexer
US8862256B2 (en) Electronic apparatus
KR20060065436A (en) Apparatus and method for synchronization of audio and video in dmb apparatus
JP4624121B2 (en) Encoding apparatus, STC correction method used in the same, encoding system, transmission system, and voice transmission / reception system
JP5383520B2 (en) Relay device, program, system, and method for correcting loss of synchronization between video frame and audio frame
US20070003253A1 (en) Information playback apparatus and information playback method
KR100864009B1 (en) Lip-synchronize method
JP3958531B2 (en) Synchronous control device
JP2006191463A (en) Coder, decoder, and coding transmission system
JP5168105B2 (en) Audio reproduction device and audio reproduction method
JP6684433B2 (en) Transmission device, transmission method, and program
JP2011061624A (en) Server apparatus, program sending system and program sending method
JP2010141498A (en) Video receiver and video transmitter
JP2002077670A (en) Method and system for switching coding equipment
JP4542924B2 (en) DIGITAL BROADCAST SIGNAL TRANSMITTING APPARATUS AND METHOD FOR CONTROLLING THE DIGITAL BROADCAST SIGNAL TRANSMITTING APPARATUS
JP4718499B2 (en) Audio transmission apparatus and audio transmission method
JP2008035216A (en) Moving picture decoder
JP2009100066A (en) Synchronous reproducer and synchronous processor
JP2005244367A (en) Pcr restamping device
JP2009088654A (en) Frame synchronizer, frame synchronizing method, and program
JP2001053701A (en) Stream multiplexer

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20071212

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20080515

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100721

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100723

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100917

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20101001

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20101001

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20101018

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20101102

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 4624121

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131112

Year of fee payment: 3

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313115

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350