JP2000151531A - Device and method for correcting audio data - Google Patents

Device and method for correcting audio data

Info

Publication number
JP2000151531A
JP2000151531A JP10315886A JP31588698A JP2000151531A JP 2000151531 A JP2000151531 A JP 2000151531A JP 10315886 A JP10315886 A JP 10315886A JP 31588698 A JP31588698 A JP 31588698A JP 2000151531 A JP2000151531 A JP 2000151531A
Authority
JP
Japan
Prior art keywords
data
data amount
audio data
amount
correction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP10315886A
Other languages
Japanese (ja)
Inventor
Koichi Horiuchi
浩一 堀内
Takao Matsumoto
孝夫 松本
Aki Yoneda
亜旗 米田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP10315886A priority Critical patent/JP2000151531A/en
Publication of JP2000151531A publication Critical patent/JP2000151531A/en
Pending legal-status Critical Current

Links

Landscapes

  • Time-Division Multiplex Systems (AREA)
  • Television Systems (AREA)

Abstract

PROBLEM TO BE SOLVED: To provide a device and a method for correcting audio data that corrects missing audio data in order to encode and multiplex audio data and video data synchronously with the video data. SOLUTION: A data quantity measurement means 11 measures a data quantity 1i per unit tie of received audio data. A data quantity comparison means 12 compares a data quantity 1t per preset unit time with the data quantity 1i. A correction data insert means 13 outputs the received audio data when the comparison result is equal, distributes uniformly correction data by a difference between the data quantity 1t and the data quantity 1i to the input audio data after the judgement of the smaller data quantity it and provides an output of the result when the comparison result indicates that the data quantity 1i is less than the data quantity 1t.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、欠損のある音声デ
ータを補正する音声データ補正装置及び方法に関し、特
に映像データとの同期をとって音声データと映像データ
を符号化し多重化するために欠損のある音声データを補
正する音声データ補正装置及び方法に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to an audio data correcting apparatus and method for correcting audio data having a loss, and more particularly, to a method for encoding and multiplexing audio data and video data in synchronization with video data. TECHNICAL FIELD The present invention relates to an audio data correction apparatus and method for correcting audio data with noise.

【0002】[0002]

【従来の技術】近年、マルチメディア対応パソコンと呼
ばれるパソコンが低価格で市場に出てきており、 音声
や映像の再生がパソコン上で簡単に出来るようになっ
た。また、インターネットでの音声や映像の配信なども
行われるようになってきた。音声や映像のデータ量は非
常に大きいため、これらのデータを原データのまま用い
るのではなく、データ量を減らすため符号化したデータ
を用いるのが一般的である。また、音声データと映像デ
ータの両方を含むデータは、音声データと映像データが
同期をとって再生(復号化)できるように多重化して用
いられている。このような符号化多重化の例としては、
MPEGがよく知られている。また、再生(復号化)に
必要な処理量は比較的小さいため、現在ではソフトウエ
アを用いて行なうのが主流になってきた。
2. Description of the Related Art In recent years, personal computers called multimedia-compatible personal computers have appeared on the market at low prices, and it has become possible to easily reproduce audio and video on the personal computer. In addition, distribution of audio and video over the Internet has also been performed. Since the amount of audio and video data is very large, it is common to use coded data to reduce the amount of data, rather than using these data as the original data. Data including both audio data and video data is multiplexed and used so that the audio data and the video data can be synchronously reproduced (decoded). Examples of such coded multiplexing include:
MPEG is well known. Further, since the amount of processing required for reproduction (decoding) is relatively small, the use of software has become the mainstream at present.

【0003】従来この分野では、音声データと映像デー
タを符号化し多重化する際に、符号化に必要な処理量が
膨大なため、音声データと映像データを取込みながら専
用LSIを搭載したハードウエア(拡張ボード、または
パソコン外付けの周辺装置)を用いて実時間で行なう
か、または予め取込んでおいた音声データと映像データ
をソフトウエアを用いて実時間の数倍の時間をかけて行
なうのが一般的であった。専用LSIを搭載したハード
ウエアを用いる場合には、音声データの取込みは専用L
SIにより行なわれるため、音声データに欠損はなかっ
た。また、ソフトウエアを用いる場合には、音声データ
は予め用意しておけばよいため、音声データに欠損はな
かった。従って、欠損のある音声データを用いることは
ないため、欠損のある音声データを補正する音声データ
補正装置及び方法は必要なかった。
Conventionally, in this field, when encoding and multiplexing audio data and video data, the amount of processing required for encoding is enormous. Using an expansion board or a peripheral device external to a personal computer) in real time, or using the software to take audio and video data in several times the real time. Was common. When using hardware equipped with a dedicated LSI, the acquisition of audio data
There was no loss in the audio data because it was performed by SI. Further, when software is used, the audio data may be prepared in advance, and there is no loss in the audio data. Therefore, there is no need to use the audio data with the loss, so that there is no need for an audio data correction apparatus and method for correcting the audio data with the loss.

【0004】[0004]

【発明が解決しようとする課題】このような状況の中
で、CPU性能の向上により、音声データと映像データ
をソフトウエアで実時間で符号化多重化することが可能
になりつつある。実時間ソフトウエアは、高性能CPU
を搭載するパソコンの世界では、再生(復号化)の主流
がソフトウエアで行われるようになったと同様に、今後
主流になっていくと考えられる。この場合の実時間ソフ
トウエアとは、符号化多重化の処理の一部をハードウエ
アに分担させて処理を行なうソフトウエアも含む。
In such a situation, it is becoming possible to encode and multiplex audio data and video data by software in real time by improving the performance of the CPU. Real-time software is a high-performance CPU
In the world of PCs equipped with, it is expected that the mainstream of playback (decryption) will become mainstream in the future, just as software has become the mainstream. The real-time software in this case also includes software for performing processing by sharing a part of the encoding and multiplexing processing with hardware.

【0005】ソフトウエアで実時間で符号化多重化する
場合、音声データはアナログの音声信号をデジタルの音
声データに変換するキャプチャボードと呼ばれる拡張ボ
ードを用いてパソコンに取込まれる。通常このボード
は、デジタルの音声データをアナログの音声信号に変換
してスピーカへの出力を行なう機能を合わせもち、音声
データの入出力を行なう音声ボードとしてパソコンに実
装されている。従来の専用LSIを搭載したハードウエ
アと異なり、符号化多重化のための音声データの取込み
以外にも用いられ、またデジタルに変換された音声デー
タはソフトウエアがパソコン内部のメモリまたは処理を
分担して行なうハードウエアへと転送するという取込み
処理を行なう。
When encoding and multiplexing in real time by software, audio data is taken into a personal computer using an expansion board called a capture board that converts an analog audio signal into digital audio data. Usually, this board has a function of converting digital audio data into an analog audio signal and outputting the signal to a speaker, and is mounted on a personal computer as an audio board for inputting and outputting audio data. Unlike hardware with conventional dedicated LSI, it is used for other than the acquisition of audio data for encoding and multiplexing. Digitally converted audio data is used by software to share memory or processing inside the PC. Then, the data is transferred to hardware.

【0006】このようにして音声データを取り込む場
合、ソフトウエアによる取込み処理が実時間に間に合わ
ない場合が発生し、音声データを取り損ねることがあ
る。例えば、A(1)、A(2)、A(3)、…、A
(N−1)、A(N)という音声データを取り込もうと
して、A(2)の音声データを取り損ねると、A
(1)、A(3)、…、A(N−1)、A(N)という
A(2)が欠損した音声データが取り込まれる。
When the audio data is fetched in this way, there is a case where the fetching process by the software cannot be performed in real time, and the audio data may be missed. For example, A (1), A (2), A (3),.
If the user tries to capture the audio data of (N-1) and A (N) and fails to capture the audio data of A (2), A
A (2), which is (1), A (3),..., A (N-1), and A (N), is lost.

【0007】音声データには、個々の音声データがどの
時間に取り込まれたかという時間情報は付いていないの
で、A(1)、A(3)、…、A(N−1)、A(N)
という音声データを受取っても、欠損があるかないか分
からない。また、どの音声データが欠損しているか分か
らない。この音声データと用いて映像データと多重化を
行なうと、音声データが欠損した時間以降では音声と映
像の同期にずれが発生する。この同期のずれは欠損が微
少の場合は人間には知覚されにくいが、欠損が累積する
と明らかに知覚できるようになる。また、映像の終了直
前では音声がない状態になる。
[0007] Since the audio data does not have time information indicating at what time the individual audio data was captured, A (1), A (3), ..., A (N-1), A (N )
Does not know if there is any loss or not. Further, it is not known which audio data is missing. When multiplexing is performed with video data using the audio data, a synchronization error occurs between the audio and the video after the time when the audio data is lost. This synchronization deviation is hardly perceived by a human when the loss is minute, but can be clearly perceived when the loss is accumulated. Immediately before the end of the video, there is no sound.

【0008】本発明は、上記従来の課題に鑑み、映像デ
ータとの同期をとって音声データと映像データを符号化
し多重化するために欠損のある音声データを補正する音
声データ補正装置及び方法を提供することを目的とす
る。
In view of the above-mentioned conventional problems, the present invention provides an audio data correction apparatus and method for correcting defective audio data in order to encode and multiplex audio data and video data in synchronization with video data. The purpose is to provide.

【0009】[0009]

【課題を解決するための手段】本発明の音声データ補正
装置は、入力音声データの単位時間当たりの第1のデー
タ量を計測する手段と、予め設定された単位時間当たり
の第2のデータ量と第1のデータ量とを比較する手段
と、第1のデータ量が第2のデータ量と等しい場合、入
力音声データを出力し、第1のデータ量が第2のデータ
量より少ない場合、第2のデータ量と第1のデータ量の
差だけ補正データを均等に分散させてデータ量が少ない
と判断された時点以降の入力音声データに挿入し出力す
る手段とを備える。
According to the present invention, there is provided an audio data correction apparatus comprising: means for measuring a first data amount per unit time of input audio data; and a second data amount per unit time set in advance. Means for comparing the first data amount with the first data amount; outputting the input audio data when the first data amount is equal to the second data amount; and outputting the input audio data when the first data amount is smaller than the second data amount. Means for uniformly dispersing the correction data by the difference between the second data amount and the first data amount and inserting the corrected data into the input audio data after the point in time when it is determined that the data amount is small, and outputting the data.

【0010】また、本発明の音声データ補正装置は、入
力音声データの単位時間当たりの第1のデータ量を計測
する手段と、予め設定された単位時間当たりの第2のデ
ータ量と第1のデータ量とを比較する手段と、入力音声
データを一時的に格納する手段と、第1のデータ量が第
2のデータ量と等しい場合、格納する手段に格納された
入力音声データを出力し、第1のデータ量が第2のデー
タ量より少ない場合、第2のデータ量と第1のデータ量
の差だけ補正データを格納する手段に格納された入力音
声データに均等に分散させて挿入し出力する手段とを備
える。
The audio data correction apparatus of the present invention further comprises means for measuring a first data amount per unit time of the input audio data, and a second data amount per unit time which is set in advance. Means for comparing the amount of data with the data, means for temporarily storing the input voice data, and when the first data amount is equal to the second data amount, outputting the input voice data stored in the storing means; When the first data amount is smaller than the second data amount, the first data amount is evenly distributed and inserted into the input audio data stored in the correction data storing means by the difference between the second data amount and the first data amount. Output means.

【0011】また、本発明の音声データ補正装置は、補
正データを挿入する代わりに、入力音声データをアップ
サンプルして補間し直し、第2のデータ量と第1のデー
タ量の差だけデータ量を増加させる手段を備える。
Further, instead of inserting the correction data, the audio data correction apparatus of the present invention upsamples the input audio data and re-interpolates the input audio data to obtain a data amount corresponding to the difference between the second data amount and the first data amount. Is provided.

【0012】[0012]

【発明の実施の形態】以下、本発明の実施の形態につい
て、図面を参照しながら説明する。
Embodiments of the present invention will be described below with reference to the drawings.

【0013】(実施の形態1)図1は本発明の実施の形
態1における音声データ補正装置の構成の例を示すブロ
ック図である。図1において、データ量計測手段11
は、入力音声データの単位時間当たりのデータ量(以降
データ量1iとする)を計測する、データ量比較手段1
2は、予め設定された単位時間当たりのデータ量(以降
データ量1tとする)とデータ量計測手段11が計測し
たデータ量1iとを比較する、補正データ挿入手段13
は、データ量比較手段12の比較結果が等しい場合、入
力音声データを出力し、データ量比較手段12の比較結
果がデータ量1iが少ない場合、データ量1tとデータ
量1iの差だけ補正データを均等に分散させてデータ量
1iが少ないと判断された時点以降の入力音声データに
挿入し出力する、音声データ符号化装置14はこの補正
された音声データを符号化する、映像データ符号化手段
15は入力映像データを符号化する、多重化手段16は
符号化された音声データと符号化された映像データを同
期をとって多重化し音声映像符号化データを出力する。
(Embodiment 1) FIG. 1 is a block diagram showing an example of the configuration of an audio data correction apparatus according to Embodiment 1 of the present invention. In FIG. 1, data amount measuring means 11
Is a data amount comparing means 1 for measuring a data amount of input voice data per unit time (hereinafter referred to as a data amount 1i).
Reference numeral 2 denotes a correction data insertion unit 13 that compares a preset data amount per unit time (hereinafter referred to as a data amount 1t) with a data amount 1i measured by the data amount measurement unit 11.
Outputs the input voice data when the comparison result of the data amount comparing means 12 is equal, and outputs the correction data by the difference between the data amount 1t and the data amount 1i when the comparison result of the data amount comparing means 12 is small. The audio data encoding device 14 that uniformly scatters and inserts and outputs the input audio data after the point in time when it is determined that the data amount 1i is small, encodes the corrected audio data. Encodes the input video data. The multiplexing means 16 multiplexes the coded audio data and the coded video data in synchronization with each other and outputs coded audio / video data.

【0014】音声データ補正装置の動作を図3の例を用
いてさらに詳しく説明する。図3において、31は原音
声データ、32は欠損の発生したデータ、33は音声デ
ータ補正装置に入力される入力音声データ、34は音声
データ補正装置が出力する補正された音声データであ
る。またこの図は、連続して入力される音声データの一
部分を示している。
The operation of the audio data correction device will be described in more detail with reference to the example shown in FIG. In FIG. 3, reference numeral 31 denotes original voice data, reference numeral 32 denotes defective data, reference numeral 33 denotes input voice data input to the voice data correction device, and reference numeral 34 denotes corrected voice data output from the voice data correction device. This figure shows a part of the audio data that is continuously input.

【0015】音声データは欠損がなければ一定速度のデ
ータ量で入力され、このデータ量は予め分かっている。
データ量計測手段11が計測する単位時間あたりのデー
タ量は、音声データに欠損がなければ常に一定である。
このデータ量をmとすると、データ量比較手段12はデ
ータ量計測手段11が計測したデータ量とmとを比較す
る。等しい場合は、欠損がないため、入力音声データを
そのまま出力する。
If there is no loss, audio data is input at a constant speed data amount, and this data amount is known in advance.
The data amount per unit time measured by the data amount measuring means 11 is always constant unless there is any loss in the audio data.
Assuming that this data amount is m, the data amount comparison unit 12 compares the data amount measured by the data amount measurement unit 11 with m. If they are equal, there is no loss, so the input voice data is output as it is.

【0016】データ量計測手段11が計測したデータ量
の方が少ない場合は、欠損があると判断できる。この時
計測したデータ量をm’とすると、m−m’だけのデー
タが欠損したことになり、m−m’だけデータを増加さ
せる必要がある。どのデータが欠損したかは判断できな
いため、データが欠損したと判断された計測単位の次の
入力音声データに、m−m’だけの補正データを均等に
分散させて挿入して出力する。均等に分散させて挿入す
るのは、入力音声データに対する変更を数箇所に分散さ
せ、1ヶ所当たりの変更は最小限に押さえることで、人
間が補正データが挿入されていることを知覚しにくくな
るためである。
If the data amount measured by the data amount measuring means 11 is smaller, it can be determined that there is a loss. Assuming that the data amount measured at this time is m ', data for mm' has been lost, and it is necessary to increase the data by mm '. Since it is not possible to determine which data has been lost, correction data of mm ′ is inserted in the input audio data next to the unit of measurement in which the data has been determined to be lost, evenly distributed and output. Inserting evenly distributed means that changes to the input audio data are distributed to several places and changes per place are kept to a minimum, making it difficult for a human to perceive that the correction data is inserted. That's why.

【0017】このようにして、欠損のある入力音声デー
タを補正することで、映像データと音声データが同期し
た符号化データを作成することができる。また、入力音
声データ自体を遅延させる処理が不要なので、入力音声
データの補正による遅延時間を少なくすることができ
る。遅延時間が少ないことは、例えばTV電話や監視カ
メラの場合のように、可能な限り遅延時間が少ないこと
が望まれる用途に有効である。
In this way, by correcting input audio data having a loss, encoded data in which video data and audio data are synchronized can be created. Further, since it is not necessary to perform a process of delaying the input voice data itself, it is possible to reduce a delay time due to the correction of the input voice data. The small delay time is effective for applications where it is desired to minimize the delay time, such as in the case of a TV phone or a surveillance camera.

【0018】なお、本実施の形態1では、補正データを
データが欠損したと判断された計測単位の次の入力音声
データに挿入したが、欠損したと判断された計測単位以
降の入力音声データであれば、どこでもよいし複数の計
測単位に渡ってもよい。また、補正データを挿入する位
置を均等に分散させたが、厳密に均等でなくても極端に
偏っていなければよい。
In the first embodiment, the correction data is inserted into the input audio data next to the measurement unit in which the data is determined to be lost. If it exists, it may be anywhere and may extend to a plurality of measurement units. Further, the positions at which the correction data are inserted are uniformly distributed. However, the positions at which the correction data are inserted are not strictly uniform, but need not be extremely biased.

【0019】(実施の形態2)図2は本発明の実施の形
態2における音声データ補正装置の構成の例を示すブロ
ック図である。図2において、データ量計測手段21
は、入力音声データの単位時間当たりのデータ量(以降
データ量2iとする)を計測する、データ量比較手段2
2は、予め設定された単位時間当たりのデータ量(以降
データ量2tとする)とデータ量計測手段21が計測し
たデータ量2iとを比較する、バッファ27は、入力音
声データを一時的に格納する、補正データ挿入手段23
は、データ量比較手段22の比較結果が等しい場合、バ
ッファ27に格納された入力音声データを出力し、デー
タ量比較手段22の比較結果がデータ量2iが少ない場
合、データ量2tとデータ量2iの差だけ補正データを
バッファ27に格納された入力音声データに均等に分散
させて挿入し出力する、音声データ符号化装置24はこ
の補正された音声データを符号化する、映像データ符号
化手段25は入力映像データを符号化する、多重化手段
26は符号化された音声データと符号化された映像デー
タを同期をとって多重化し音声映像符号化データを出力
する。
(Embodiment 2) FIG. 2 is a block diagram showing an example of the configuration of an audio data correction apparatus according to Embodiment 2 of the present invention. In FIG. 2, the data amount measuring means 21
Is a data amount comparing means 2 for measuring a data amount of input voice data per unit time (hereinafter referred to as a data amount 2i).
2 compares the preset data amount per unit time (hereinafter referred to as data amount 2t) with the data amount 2i measured by the data amount measuring means 21. The buffer 27 temporarily stores the input audio data. Correction data insertion means 23
Outputs the input audio data stored in the buffer 27 when the comparison result of the data amount comparing unit 22 is equal, and outputs the data amount 2t and the data amount 2i when the comparison result of the data amount comparing unit 22 is small. The audio data encoding device 24 encodes this corrected audio data by inserting and outputting the corrected data evenly dispersed in the input audio data stored in the buffer 27 and outputting the corrected data. Encodes the input video data. The multiplexing means 26 multiplexes the coded audio data and the coded video data in synchronization with each other and outputs coded audio / video data.

【0020】音声データ補正装置の動作を図4の例を用
いてさらに詳しく説明する。図4において、41は原音
声データ、42は欠損の発生したデータ、43は音声デ
ータ補正装置に入力される入力音声データ、44は音声
データ補正装置が出力する補正された音声データであ
る。またこの図は、連続して入力される音声データの一
部分を示している。
The operation of the audio data correction device will be described in more detail with reference to the example of FIG. In FIG. 4, reference numeral 41 denotes original voice data, reference numeral 42 denotes missing data, reference numeral 43 denotes input voice data input to the voice data correction device, and reference numeral 44 denotes corrected voice data output from the voice data correction device. This figure shows a part of the audio data that is continuously input.

【0021】音声データは欠損がなければ一定速度のデ
ータ量で入力され、このデータ量は予め分かっている。
データ量計測手段21が計測する単位時間あたりのデー
タ量は、音声データに欠損がなければ常に一定である。
このデータ量をmとすると、データ量比較手段22はデ
ータ量計測手段21が計測したデータ量とmとを比較す
る。等しい場合は、欠損がないため、バッファ27に格
納された入力音声データをそのまま出力する。
The voice data is input at a constant speed data amount if there is no loss, and this data amount is known in advance.
The data amount per unit time measured by the data amount measuring means 21 is always constant unless there is any loss in the audio data.
Assuming that this data amount is m, the data amount comparison unit 22 compares the data amount measured by the data amount measurement unit 21 with m. If they are equal, there is no loss, so the input audio data stored in the buffer 27 is output as it is.

【0022】データ量計測手段21が計測したデータ量
の方が少ない場合は、欠損があると判断できる。この時
計測したデータ量をm’とすると、m−m’だけのデー
タが欠損したことになり、m−m’だけデータを増加さ
せる必要がある。どのデータが欠損したかは判断できな
いため、データが欠損したと判断された計測単位を含む
バッファ27に格納された入力音声データに、m−m’
だけの補正データを均等に分散させて挿入して出力す
る。均等に分散させて挿入するのは、入力音声データに
対する変更を数箇所に分散させ、1ヶ所当たりの変更は
最小限に押さえることで、人間が補正データが挿入され
ていることを知覚しにくくなるためである。
If the data amount measured by the data amount measuring means 21 is smaller, it can be determined that there is a loss. Assuming that the data amount measured at this time is m ', data for mm' has been lost, and it is necessary to increase the data by mm '. Since it is not possible to determine which data has been lost, the input audio data stored in the buffer 27 including the unit of measurement determined to have lost the data includes MM ′
The correction data is inserted evenly dispersed and output. Inserting evenly distributed means that changes to the input audio data are distributed to several places and changes per place are kept to a minimum, making it difficult for a human to perceive that the correction data is inserted. That's why.

【0023】このようにして、欠損のある入力音声デー
タを補正することで、映像データと音声データが同期し
た符号化データを作成することができる。また、補正デ
ータが広い範囲に分散されるため、補正データが挿入さ
れていることをより知覚しにくくすることができる。ま
た、バッファの格納単位をデータ量の計測単位と同じに
すれば、補正データは欠損が発生した計測単位のみに挿
入されるため、補正データの影響を最小限の範囲に押さ
える事ができ、これ以外の計測単位の入力音声データは
完全に同期をとった上で、全体として同期した符号化デ
ータを作成することができる。
As described above, by correcting input audio data having a loss, encoded data in which video data and audio data are synchronized can be created. Further, since the correction data is dispersed over a wide range, it is possible to make it more difficult to perceive that the correction data has been inserted. In addition, if the buffer storage unit is set to be the same as the data amount measurement unit, the correction data is inserted only in the measurement unit in which the loss has occurred, so that the influence of the correction data can be suppressed to a minimum range. The input audio data of the measurement units other than the above can be completely synchronized, and then encoded data synchronized as a whole can be created.

【0024】なお、本実施の形態2では、補正データを
データが欠損したと判断された計測単位を含むバッファ
27に格納された入力音声データ全体に渡り挿入した
が、その一部分の計測単位だけでもよい。また、補正デ
ータを挿入する位置を均等に分散させたが、厳密に均等
でなくても極端に偏っていなければよい。
In the second embodiment, the correction data is inserted over the entire input audio data stored in the buffer 27 including the measurement unit whose data is determined to be lost. Good. Further, the positions at which the correction data are inserted are uniformly distributed. However, the positions at which the correction data are inserted are not strictly uniform, but need not be extremely biased.

【0025】(実施の形態3)本発明の実施の形態3
は、実施の形態1において説明した図1の補正データ挿
入手段13および実施の形態2において説明した図2の
補正データ挿入手段23が挿入する補正データが、無音
データ、または直前の音声データ、または直後の音声デ
ータ、または直前の音声データと直後の音声データの補
間データ、のいずれかであるものである。
(Embodiment 3) Embodiment 3 of the present invention
The correction data inserted by the correction data insertion means 13 of FIG. 1 described in the first embodiment and the correction data insertion means 23 of FIG. 2 described in the second embodiment is the sound data, the immediately preceding audio data, or It is either the immediately following audio data or interpolation data of the immediately preceding audio data and the immediately following audio data.

【0026】欠損した入力音声データが何であったかは
分からないため、それに代わる何等かのデータを補正デ
ータとして挿入する必要がある。この補正データは、元
々不正なデータなので雑音または異音として知覚される
可能性があり、人間が知覚しにくいものが望ましい。無
音データは、音声の瞬間的な途切れであるので、知覚し
にくい。直前または直後のデータは、同じ音声の瞬間的
な連続であるので、さらに知覚しにくい。直前の音声デ
ータと直後の音声データの補間データは、前後の音声の
から推測される音声であるので、さらに知覚しにくい。
Since it is not known what the lost input voice data was, it is necessary to insert some data instead of it as correction data. Since the correction data is originally incorrect data, there is a possibility that the correction data is perceived as noise or abnormal noise. Silent data is hard to perceive because it is a momentary break in speech. Since the data immediately before or immediately after is the instantaneous continuation of the same sound, it is more difficult to perceive. The interpolation data of the immediately preceding audio data and the immediately succeeding audio data is the audio estimated from the preceding and following audio data, and is therefore more difficult to perceive.

【0027】(実施の形態4)本発明の実施の形態4
は、実施の形態1において説明した図1の補正データ挿
入手段13および実施の形態2において説明した図2の
補正データ挿入手段23が、補正データを挿入する代わ
りに、入力音声データをアップサンプルすることで、欠
損したm−m’だけデータ量を増加させ、音声データを
補正するものである。
(Embodiment 4) Embodiment 4 of the present invention
Is that the correction data insertion means 13 of FIG. 1 described in the first embodiment and the correction data insertion means 23 of FIG. 2 described in the second embodiment up-sample input audio data instead of inserting correction data. In this way, the data amount is increased by the lost MM ′ to correct the audio data.

【0028】入力音声データをアップサンプルするの
で、補正された音声データは入力音声データを欠損した
データ量だけ時間的に引き伸ばしたものになり、補正さ
れたことが知覚しにくい。
Since the input voice data is up-sampled, the corrected voice data is obtained by expanding the input voice data temporally by the amount of the missing data, and it is difficult to perceive the correction.

【0029】(実施の形態5)図5は本発明の実施の形
態5における音声データ補正方法の構成の例を示すフロ
ーチャートである。図5において、データ量計測ステッ
プ52で、入力音声データの単位時間当たりのデータ量
(以降データ量5iとする)を計測する、データ量比較
ステップ53で、予め設定された単位時間当たりのデー
タ量(以降データ量5tとする)とデータ量計測ステッ
プ52で計測したデータ量5iとを比較する、データ量
比較ステップ53の比較結果が等しい(5i=5t)場
合、データ出力ステップ56で、入力音声データを出力
する、データ量比較ステップ53の比較結果がデータ量
5iが少ない(5i<5t)場合、補正データ挿入ステ
ップ55で、データ量5tとデータ量5iの差だけ補正
データを均等に分散させてデータ量5iが少ないと判断
された時点以降の入力音声データに挿入し、データ出力
ステップ56で、そのデータを出力する。以上のステッ
プを入力音声データが終了するまで繰り返す。
(Embodiment 5) FIG. 5 is a flowchart showing an example of the configuration of the audio data correction method according to Embodiment 5 of the present invention. In FIG. 5, a data amount measuring step 52 measures a data amount of input audio data per unit time (hereinafter referred to as a data amount 5i). A data amount comparing step 53 sets a preset data amount per unit time. (Hereinafter referred to as data amount 5t) and data amount 5i measured in data amount measurement step 52. If the comparison result in data amount comparison step 53 is equal (5i = 5t), input voice is output in data output step 56. If the comparison result of the data amount comparison step 53 that outputs data is that the data amount 5i is small (5i <5t), in the correction data insertion step 55, the correction data is evenly distributed by the difference between the data amount 5t and the data amount 5i. Is inserted into the input audio data after the time when it is determined that the data amount 5i is small, and the data is output in a data output step 56. . The above steps are repeated until the input voice data ends.

【0030】音声データ補正方法の動作を図3の例を用
いてさらに詳しく説明する。音声データは欠損がなけれ
ば一定速度のデータ量で入力され、このデータ量は予め
分かっている。データ量計測ステップ52で計測する単
位時間あたりのデータ量は、音声データに欠損がなけれ
ば常に一定である。このデータ量をmとすると、データ
量比較ステップ53でデータ量計測ステップ52で計測
したデータ量とmとを比較する。等しい場合は、欠損が
ないため、入力音声データをそのまま出力する。
The operation of the audio data correction method will be described in more detail with reference to the example of FIG. If there is no loss, the voice data is input at a constant speed data amount, and this data amount is known in advance. The data amount per unit time measured in the data amount measurement step 52 is always constant unless there is any loss in the audio data. Assuming that this data amount is m, a data amount comparison step 53 compares the data amount measured in the data amount measurement step 52 with m. If they are equal, there is no loss, so the input voice data is output as it is.

【0031】データ量計測ステップ52で計測したデー
タ量の方が少ない場合は、欠損があると判断できる。こ
の時計測したデータ量をm’とすると、m−m’だけの
データが欠損したことになり、m−m’だけデータを増
加させる必要がある。どのデータが欠損したかは判断で
きないため、データが欠損したと判断された計測単位の
次の入力音声データに、m−m’だけの補正データを均
等に分散させて挿入して出力する。均等に分散させて挿
入するのは、入力音声データに対する変更を数箇所に分
散させ、1ヶ所当たりの変更は最小限に押さえること
で、人間が補正データが挿入されていることを知覚しに
くくなるためである。
If the data amount measured in the data amount measuring step 52 is smaller, it can be determined that there is a loss. Assuming that the data amount measured at this time is m ', data for mm' has been lost, and it is necessary to increase the data by mm '. Since it is not possible to determine which data has been lost, correction data of mm ′ is inserted in the input audio data next to the unit of measurement in which the data has been determined to be lost, evenly distributed and output. Inserting evenly distributed means that changes to the input audio data are distributed to several places and changes per place are kept to a minimum, making it difficult for a human to perceive that the correction data is inserted. That's why.

【0032】このようにして、欠損のある入力音声デー
タを補正することで、映像データと音声データが同期し
た符号化データを作成することができる。また、入力音
声データ自体を遅延させる処理が不要なので、入力音声
データの補正による遅延時間を少なくすることができ
る。遅延時間が少ないことは、例えばTV電話や監視カ
メラの場合のように、可能な限り遅延時間が少ないこと
が望まれる用途に有効である。
In this way, by correcting the input audio data having a loss, encoded data in which the video data and the audio data are synchronized can be created. Further, since it is not necessary to perform a process of delaying the input voice data itself, it is possible to reduce a delay time due to the correction of the input voice data. The small delay time is effective for applications where it is desired to minimize the delay time, such as in the case of a TV phone or a surveillance camera.

【0033】なお、本実施の形態5では、補正データを
データが欠損したと判断された計測単位の次の入力音声
データに挿入したが、欠損したと判断された計測単位以
降の入力音声データであれば、どこでもよいし複数の計
測単位に渡ってもよい。また、補正データを挿入する位
置を均等に分散させたが、厳密に均等でなくても極端に
偏っていなければよい。
In the fifth embodiment, the correction data is inserted into the input audio data next to the measurement unit in which the data is determined to be lost. If it exists, it may be anywhere and may extend to a plurality of measurement units. Further, the positions at which the correction data are inserted are uniformly distributed. However, the positions at which the correction data are inserted are not strictly uniform, but need not be extremely biased.

【0034】(実施の形態6)図6は本発明の実施の形
態6における音声データ補正方法の構成の例を示すフロ
ーチャートである。図6において、データ一時格納ステ
ップ67で、入力音声データを一時的にバッファに格納
する、データ量計測ステップ62で、入力音声データの
単位時間当たりのデータ量(以降データ量6iとする)
を計測する、データ量比較ステップ63で、予め設定さ
れた単位時間当たりのデータ量(以降データ量6tとす
る)とデータ量計測ステップ62で計測したデータ量6
iとを比較する、データ量比較ステップ63の比較結果
が等しい(6i=6t)場合、データ出力ステップ66
で、入力音声データを出力する、データ量比較ステップ
63の比較結果がデータ量6iが少ない(6i<6t)
場合、補正データ挿入ステップ65で、データ量6tと
データ量6iの差だけ補正データをデータ一時格納ステ
ップ67で格納された入力音声データに均等に分散させ
て挿入し、データ出力ステップ66で、そのデータを出
力する。以上のステップを入力音声データが終了するま
で繰り返す。
(Embodiment 6) FIG. 6 is a flowchart showing an example of the configuration of the audio data correction method according to Embodiment 6 of the present invention. In FIG. 6, in a data temporary storage step 67, the input audio data is temporarily stored in a buffer. In a data amount measurement step 62, a data amount of the input audio data per unit time (hereinafter referred to as a data amount 6i).
In the data amount comparison step 63, the data amount per unit time set in advance (hereinafter referred to as data amount 6t) and the data amount 6 measured in the data amount measurement step 62
When the comparison result of the data amount comparison step 63 for comparing i is equal (6i = 6t), the data output step 66
Then, the comparison result of the data amount comparison step 63 for outputting the input audio data indicates that the data amount 6i is small (6i <6t).
In this case, in the correction data insertion step 65, the correction data is evenly dispersed and inserted into the input audio data stored in the data temporary storage step 67 by the difference between the data amount 6t and the data amount 6i, and in the data output step 66, Output data. The above steps are repeated until the input voice data ends.

【0035】音声データ補正方法の動作を図4の例を用
いてさらに詳しく説明する。音声データは欠損がなけれ
ば一定速度のデータ量で入力され、このデータ量は予め
分かっている。データ量計測ステップ62で計測する単
位時間あたりのデータ量は、音声データに欠損がなけれ
ば常に一定である。このデータ量をmとすると、データ
量比較ステップ63でデータ量計測ステップ62で計測
したデータ量とmとを比較する。等しい場合は、欠損が
ないため、データ一時格納ステップ67で格納された入
力音声データをそのまま出力する。
The operation of the audio data correction method will be described in more detail with reference to the example of FIG. If there is no loss, the voice data is input at a constant speed data amount, and this data amount is known in advance. The data amount per unit time measured in the data amount measurement step 62 is always constant unless there is any loss in the audio data. Assuming that this data amount is m, the data amount measured in the data amount measurement step 62 is compared with m in the data amount comparison step 63. If they are equal, there is no loss, and the input voice data stored in the data temporary storage step 67 is output as it is.

【0036】データ量計測ステップ62で計測したデー
タ量の方が少ない場合は、欠損があると判断できる。こ
の時計測したデータ量をm’とすると、m−m’だけの
データが欠損したことになり、m−m’だけデータを増
加させる必要がある。どのデータが欠損したかは判断で
きないため、データが欠損したと判断された計測単位を
含むデータ一時格納ステップ67で格納された入力音声
データに、m−m’だけの補正データを均等に分散させ
て挿入して出力する。均等に分散させて挿入するのは、
入力音声データに対する変更を数箇所に分散させ、1ヶ
所当たりの変更は最小限に押さえることで、人間が補正
データが挿入されていることを知覚しにくくなるためで
ある。
If the data amount measured in the data amount measuring step 62 is smaller, it can be determined that there is a loss. Assuming that the data amount measured at this time is m ', data for mm' has been lost, and it is necessary to increase the data by mm '. Since it is not possible to determine which data has been lost, the correction data of only m−m ′ is evenly distributed in the input voice data stored in the data temporary storage step 67 including the unit of measurement determined to be lost. Insert and output. Inserting evenly distributed is
This is because it is difficult for a human to perceive that the correction data is inserted by dispersing the change to the input voice data in several places and minimizing the change per place.

【0037】このようにして、欠損のある入力音声デー
タを補正することで、映像データと音声データが同期し
た符号化データを作成することができる。また、補正デ
ータが広い範囲に分散されるため、補正データが挿入さ
れていることをより知覚しにくくすることができる。ま
た、バッファの格納単位をデータ量の計測単位と同じに
すれば、補正データは欠損が発生した計測単位のみに挿
入されるため、補正データの影響を最小限の範囲に押さ
える事ができ、これ以外の計測単位の入力音声データは
完全に同期をとった上で、全体として同期した符号化デ
ータを作成することができる。
As described above, by correcting input audio data having a loss, encoded data in which video data and audio data are synchronized can be created. Further, since the correction data is dispersed over a wide range, it is possible to make it more difficult to perceive that the correction data has been inserted. In addition, if the buffer storage unit is set to be the same as the data amount measurement unit, the correction data is inserted only in the measurement unit in which the loss has occurred, so that the influence of the correction data can be suppressed to a minimum range. The input audio data of the measurement units other than the above can be completely synchronized, and then encoded data synchronized as a whole can be created.

【0038】なお、本実施の形態6では、補正データを
データが欠損したと判断された計測単位を含むデータ一
時格納ステップ67で格納された入力音声データ全体に
渡り挿入したが、その一部分の計測単位だけでもよい。
また、補正データを挿入する位置を均等に分散させた
が、厳密に均等でなくても極端に偏っていなければよ
い。
In the sixth embodiment, the correction data is inserted over the entire input voice data stored in the data temporary storing step 67 including the unit of measurement determined to have lost data. Only the unit may be used.
Further, the positions at which the correction data are inserted are uniformly distributed. However, the positions at which the correction data are inserted are not strictly uniform, but need not be extremely biased.

【0039】(実施の形態7)本発明の実施の形態7
は、実施の形態5において説明した図5の補正データ挿
入ステップ55および実施の形態6において説明した図
6の補正データ挿入ステップ65で挿入する補正データ
が、無音データ、または直前の音声データ、または直後
の音声データ、または直前の音声データと直後の音声デ
ータの補間データ、のいずれかであるものである。
(Embodiment 7) Embodiment 7 of the present invention
The correction data inserted in the correction data insertion step 55 shown in FIG. 5 described in the fifth embodiment and the correction data insertion step 65 shown in FIG. It is either the immediately following audio data or interpolation data of the immediately preceding audio data and the immediately following audio data.

【0040】欠損した入力音声データが何であったかは
分からないため、それに代わる何等かのデータを補正デ
ータとして挿入する必要がある。この補正データは、元
々不正なデータなので雑音または異音として知覚される
可能性があり、人間が知覚しにくいものが望ましい。無
音データは、音声の瞬間的な途切れであるので、知覚し
にくい。直前または直後のデータは、同じ音声の瞬間的
な連続であるので、さらに知覚しにくい。直前の音声デ
ータと直後の音声データの補間データは、前後の音声の
から推測される音声であるので、さらに知覚しにくい。
Since it is not known what the lost input voice data was, it is necessary to insert some data instead of it as correction data. Since the correction data is originally incorrect data, there is a possibility that the correction data is perceived as noise or abnormal noise. Silent data is hard to perceive because it is a momentary break in speech. Since the data immediately before or immediately after is the instantaneous continuation of the same sound, it is more difficult to perceive. The interpolation data of the immediately preceding audio data and the immediately succeeding audio data is the audio estimated from the preceding and following audio data, and is therefore more difficult to perceive.

【0041】(実施の形態8)本発明の実施の形態8
は、実施の形態5において説明した図5の補正データ挿
入ステップ55および実施の形態6において説明した図
6の補正データ挿入ステップ65で、補正データを挿入
する代わりに、入力音声データをアップサンプルするこ
とで、欠損したm−m’だけデータ量を増加させ、音声
データを補正するものである。
Embodiment 8 Embodiment 8 of the present invention
In the correction data insertion step 55 of FIG. 5 described in the fifth embodiment and the correction data insertion step 65 of FIG. 6 described in the sixth embodiment, input audio data is up-sampled instead of inserting correction data. In this way, the data amount is increased by the lost MM ′ to correct the audio data.

【0042】入力音声データをアップサンプルするの
で、補正された音声データは入力音声データを欠損した
データ量だけ時間的に引き伸ばしたものになり、補正さ
れたことが知覚しにくい。
Since the input voice data is up-sampled, the corrected voice data is obtained by expanding the input voice data temporally by the amount of the missing data, and it is difficult to perceive the correction.

【0043】なお、以上の実施の形態1から実施の形態
8の全てにおいて、計測したデータ量が等しい場合と少
ない場合のみ述べたが、データ量を計測するタイミング
のずれによっては計測したデータ量が多い場合もありう
る。この場合は、余分な分だけデータ量を均等に分散さ
せて削除するか、または、余分な分だけデータ量が減少
するようにダウンサンプリングすればよい。
In all of the above-described first to eighth embodiments, only the case where the measured data amount is equal and the case where the measured data amount is small have been described. There may be many cases. In this case, the extra data amount may be evenly distributed and deleted, or down-sampling may be performed so that the extra data amount is reduced.

【0044】[0044]

【発明の効果】以上のように本発明は、入力音声データ
の単位時間当たりの第1のデータ量を計測する手段と、
予め設定された単位時間当たりの第2のデータ量と第1
のデータ量とを比較する手段と、入力音声データに補正
データを挿入し出力する手段とが、第1のデータ量が第
2のデータ量と等しい場合、入力音声データを出力し、
第1のデータ量が第2のデータ量より少ない場合、第2
のデータ量と第1のデータ量の差だけ補正データを均等
に分散させてデータ量が少ないと判断された時点以降の
入力音声データに挿入し出力することで、欠損のある入
力音声データを補正して、映像データと音声データが同
期した符号化データを作成することが可能になる。
As described above, according to the present invention, there is provided means for measuring a first data amount of input voice data per unit time,
The second data amount per unit time set in advance and the first
Means for comparing with the data amount of the input audio data and means for inserting and outputting the correction data into the input audio data, when the first data amount is equal to the second data amount, output the input audio data;
If the first data amount is smaller than the second data amount, the second
Correction of the input audio data with loss by dispersing the correction data evenly by the difference between the data amount of the first audio data and the first data amount and inserting and outputting the input audio data after the time point when the data amount is determined to be small. Thus, encoded data in which the video data and the audio data are synchronized can be created.

【0045】また、本発明は、入力音声データの単位時
間当たりの第1のデータ量を計測する手段と、予め設定
された単位時間当たりの第2のデータ量と第1のデータ
量とを比較する手段と、入力音声データを一時的に格納
する手段と、入力音声データに補正データを挿入し出力
する手段とが、第1のデータ量が第2のデータ量と等し
い場合、格納する手段に格納された入力音声データを出
力し、第1のデータ量が第2のデータ量より少ない場
合、第2のデータ量と第1のデータ量の差だけ補正デー
タを格納する手段に格納された入力音声データに均等に
分散させて挿入し出力することで、欠損のある入力音声
データを補正して、映像データと音声データが同期した
符号化データを作成することが可能になる。
The present invention also relates to a means for measuring a first data amount per unit time of input audio data, and comparing the second data amount and the first data amount per unit time set in advance. Means for temporarily storing input audio data, and means for inserting correction data into the input audio data and outputting the same when the first data amount is equal to the second data amount. Outputting the stored input voice data, and when the first data amount is smaller than the second data amount, the input stored in the means for storing the correction data by the difference between the second data amount and the first data amount By inserting and outputting the audio data evenly dispersed in the audio data, it is possible to correct the deficient input audio data and create encoded data in which the video data and the audio data are synchronized.

【0046】また、本発明は、入力音声データに補正デ
ータを挿入し出力する手段が、補正データを挿入する代
わりに、入力音声データをアップサンプルして補間し直
し、第2のデータ量と第1のデータ量の差だけデータ量
を増加させることで、欠損のある入力音声データを補正
して、映像データと音声データが同期した符号化データ
を作成することが可能になる。
Also, according to the present invention, the means for inserting and outputting correction data into the input audio data is such that instead of inserting the correction data, the input audio data is up-sampled and re-interpolated, and the second data amount and the second By increasing the data amount by the difference of the data amount of 1, it becomes possible to correct the deficient input audio data and create encoded data in which the video data and the audio data are synchronized.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の実施の形態1の構成の一例を示すブロ
ック図
FIG. 1 is a block diagram illustrating an example of a configuration according to a first embodiment of the present invention.

【図2】本発明の実施の形態2の構成の一例を示すブロ
ック図
FIG. 2 is a block diagram illustrating an example of a configuration according to a second embodiment of the present invention;

【図3】本発明の実施の形態1の動作の一例を説明する
説明図
FIG. 3 is an explanatory diagram illustrating an example of an operation according to the first embodiment of the present invention;

【図4】本発明の実施の形態2の動作の一例を説明する
説明図
FIG. 4 is an explanatory diagram illustrating an example of an operation according to the second embodiment of the present invention.

【図5】本発明の実施の形態5の構成の一例を示すフロ
ーチャート
FIG. 5 is a flowchart illustrating an example of a configuration according to a fifth embodiment of the present invention;

【図6】本発明の実施の形態6の構成の一例を示すフロ
ーチャート
FIG. 6 is a flowchart illustrating an example of a configuration according to the sixth embodiment of the present invention;

【符号の説明】[Explanation of symbols]

11,21 データ量計測手段 12,22 データ量比較手段 13,23 補正データ挿入手段 27 バッファ 52,62 データ量計測ステップ 53,63 データ量比較ステップ 55,65 補正データ挿入ステップ 56,66 データ出力ステップ 67 データ一時格納ステップ 11, 21 Data amount measurement means 12, 22 Data amount comparison means 13, 23 Correction data insertion means 27 Buffer 52, 62 Data amount measurement step 53, 63 Data amount comparison step 55, 65 Correction data insertion step 56, 66 Data output step 67 Temporary Data Storage Step

───────────────────────────────────────────────────── フロントページの続き (72)発明者 米田 亜旗 大阪府門真市大字門真1006番地 松下電器 産業株式会社内 Fターム(参考) 5C063 AB05 AC05 BA08 CA14 CA20 CA40 5K028 EE03 EE08 KK32 SS03 SS24 ──────────────────────────────────────────────────続 き Continuing from the front page (72) Inventor Aki Yoneda 1006 Kazuma Kadoma, Kadoma, Osaka Prefecture F-term in Matsushita Electric Industrial Co., Ltd. 5C063 AB05 AC05 BA08 CA14 CA20 CA40 5K028 EE03 EE08 KK32 SS03 SS24

Claims (8)

【特許請求の範囲】[Claims] 【請求項1】入力音声データの単位時間当たりの第1の
データ量を計測する手段と、予め設定された単位時間当
たりの第2のデータ量と前記第1のデータ量とを比較す
る手段と、前記第1のデータ量が前記第2のデータ量と
等しい場合、前記入力音声データを出力し、前記第1の
データ量が前記第2のデータ量より少ない場合、前記第
2のデータ量と前記第1のデータ量の差だけ補正データ
を均等に分散させてデータ量が少ないと判断された時点
以降の前記入力音声データに挿入し出力する手段、を具
備する事を特徴とする音声データ補正装置。
A means for measuring a first data amount per unit time of input audio data; and a means for comparing the first data amount with a second data amount per unit time set in advance. Outputting the input audio data when the first data amount is equal to the second data amount; and outputting the input audio data when the first data amount is smaller than the second data amount. Means for dispersing the correction data evenly by the difference in the first data amount and inserting and outputting the corrected data in the input audio data after the point in time when it is determined that the data amount is small. apparatus.
【請求項2】入力音声データの単位時間当たりの第1の
データ量を計測する手段と、予め設定された単位時間当
たりの第2のデータ量と前記第1のデータ量とを比較す
る手段と、前記入力音声データを一時的に格納する手段
と、前記第1のデータ量が前記第2のデータ量と等しい
場合、前記格納する手段に格納された前記入力音声デー
タを出力し、前記第1のデータ量が前記第2のデータ量
より少ない場合、前記第2のデータ量と前記第1のデー
タ量の差だけ補正データを前記格納する手段に格納され
た前記入力音声データに均等に分散させて挿入し出力す
る手段、を具備することを特徴とする音声データ補正装
置。
2. A means for measuring a first data amount per unit time of input voice data, and a means for comparing a second data amount per unit time and the first data amount set in advance. Means for temporarily storing the input sound data, and, when the first data amount is equal to the second data amount, outputting the input sound data stored in the storing means; If the data amount is smaller than the second data amount, the correction data is evenly distributed to the input audio data stored in the storage unit by the difference between the second data amount and the first data amount. And a means for inserting and outputting the data.
【請求項3】前記補正データが、無音データ、または直
前の音声データ、または直後の音声データ、または直前
の音声データと直後の音声データの補間データ、のいず
れかであることを特徴とする請求項1または請求項2記
載の音声データ補正装置。
3. The method according to claim 1, wherein the correction data is any of silent data, immediately preceding audio data, immediately following audio data, or interpolation data of immediately preceding and succeeding audio data. The audio data correction device according to claim 1 or 2.
【請求項4】前記補正データを挿入する代わりに、前記
入力音声データをアップサンプルして補間し直し、前記
第2のデータ量と前記第1のデータ量の差だけデータ量
を増加させることを特徴とする請求項1または請求項2
記載の音声データ補正装置。
4. The method according to claim 1, wherein instead of inserting said correction data, said input audio data is upsampled and re-interpolated to increase the data amount by the difference between said second data amount and said first data amount. Claim 1 or Claim 2
An audio data correction device according to claim 1.
【請求項5】入力音声データの単位時間当たりの第1の
データ量を計測するステップと、予め設定された単位時
間当たりの第2のデータ量と前記第1のデータ量とを比
較するステップと、前記第1のデータ量が前記第2のデ
ータ量と等しい場合、前記入力音声データを出力し、前
記第1のデータ量が前記第2のデータ量より少ない場
合、前記第2のデータ量と前記第1のデータ量の差だけ
補正データを均等に分散させてデータ量が少ないと判断
された時点以降の前記入力音声データに挿入し出力する
ステップ、を具備する事を特徴とする音声データ補正方
法。
5. A step of measuring a first data amount per unit time of input audio data, and a step of comparing the second data amount per unit time and the first data amount set in advance. Outputting the input audio data when the first data amount is equal to the second data amount; and outputting the input audio data when the first data amount is smaller than the second data amount. A step of dispersing the correction data evenly by the difference in the first data amount and inserting the correction data into the input audio data after the point in time when the data amount is determined to be small, and outputting the input data. Method.
【請求項6】入力音声データの単位時間当たりの第1の
データ量を計測するステップと、予め設定された単位時
間当たりの第2のデータ量と前記第1のデータ量とを比
較するステップと、前記入力音声データを一時的に格納
するステップと、前記第1のデータ量が前記第2のデー
タ量と等しい場合、前記格納するステップで格納された
前記入力音声データを出力し、前記第1のデータ量が前
記第2のデータ量より少ない場合、前記第2のデータ量
と前記第1のデータ量の差だけ補正データを前記格納す
るステップで格納された前記入力音声データに均等に分
散させて挿入し出力するステップ、を具備することを特
徴とする音声データ補正方法。
6. A step of measuring a first data amount of input audio data per unit time, and a step of comparing the first data amount with a preset second data amount per unit time. Temporarily storing the input audio data; and, if the first data amount is equal to the second data amount, outputting the input audio data stored in the storing step; Is smaller than the second data amount, the correction data is evenly distributed to the input audio data stored in the step of storing the correction data by the difference between the second data amount and the first data amount. And inserting and outputting the audio data.
【請求項7】前記補正データが、無音データ、または直
前の音声データ、または直後の音声データ、または直前
の音声データと直後の音声データの補間データ、のいず
れかであることを特徴とする請求項5または請求項6記
載の音声データ補正方法。
7. The method according to claim 1, wherein the correction data is any of silent data, immediately preceding audio data, immediately following audio data, or interpolation data of immediately preceding and succeeding audio data. The audio data correction method according to claim 5 or 6.
【請求項8】前記補正データを挿入する代わりに、前記
入力音声データをアップサンプルして補間し直し、前記
第2のデータ量と前記第1のデータ量の差だけデータ量
を増加させることを特徴とする請求項5または請求項6
記載の音声データ補正方法。
8. Instead of inserting the correction data, up-sampling and re-interpolating the input audio data to increase the data amount by the difference between the second data amount and the first data amount. Claim 5 or Claim 6
The described audio data correction method.
JP10315886A 1998-11-06 1998-11-06 Device and method for correcting audio data Pending JP2000151531A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10315886A JP2000151531A (en) 1998-11-06 1998-11-06 Device and method for correcting audio data

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10315886A JP2000151531A (en) 1998-11-06 1998-11-06 Device and method for correcting audio data

Publications (1)

Publication Number Publication Date
JP2000151531A true JP2000151531A (en) 2000-05-30

Family

ID=18070796

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10315886A Pending JP2000151531A (en) 1998-11-06 1998-11-06 Device and method for correcting audio data

Country Status (1)

Country Link
JP (1) JP2000151531A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100745683B1 (en) * 2005-11-28 2007-08-02 한국전자통신연구원 Method for packet error concealment using speech characteristic

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100745683B1 (en) * 2005-11-28 2007-08-02 한국전자통신연구원 Method for packet error concealment using speech characteristic

Similar Documents

Publication Publication Date Title
DE69522697T2 (en) METHOD AND DEVICE FOR PROGRAMMABLE SOUND / VIDEO SYNCHRONIZATION FOR MULTIMEDIA SYSTEMS
US6078725A (en) Apparatus for a synchronized playback of audio-video signals
US7130316B2 (en) System for frame based audio synchronization and method thereof
US8233765B2 (en) Audio/video synchronization with no cleanpoints
USRE42792E1 (en) Method and apparatus for compensating reproduced audio signals of an optical disc
US20020154691A1 (en) System and process for compression, multiplexing, and real-time low-latency playback of networked audio/video bit streams
JP2008506282A (en) Maintaining synchronization between streaming audio and streaming video used for Internet protocols
JP2003114845A (en) Media conversion method and media conversion device
JP3823044B2 (en) Time stamp value controller
KR20040105869A (en) Apparatus and method for synchronization of audio and video streams
US20080012985A1 (en) System and method for synchronizing video frames and audio frames
US20020128822A1 (en) Method and apparatus for skipping and repeating audio frames
JP2001346205A (en) Method for concealing signal error
US20060140591A1 (en) Systems and methods for load balancing audio/video streams
KR980010748A (en) Multiplexed data generating device, encoded data reproducing device, clock converting device, encoded data recording medium, encoded data transmission medium, multiplexed data generating method, encoded data reproducing method and clock converting method
US6744473B2 (en) Editing and switching of video and associated audio signals
US20060209076A1 (en) Variable play back speed in video mail
US20200020342A1 (en) Error concealment for audio data using reference pools
JP3224371B2 (en) Method of synchronizing coded AV signal
JP2000151531A (en) Device and method for correcting audio data
KR100864009B1 (en) Lip-synchronize method
TW200843364A (en) An audio decoder and method thereof
JPH1188878A (en) Processor for discontinuous transport stream packet
JP2002229593A (en) Speech signal decoding processing method
KR19990053837A (en) Method and apparatus for error concealment of audio signal

Legal Events

Date Code Title Description
R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term