JP2006100882A - Voice packet reproducing system - Google Patents
Voice packet reproducing system Download PDFInfo
- Publication number
- JP2006100882A JP2006100882A JP2004280972A JP2004280972A JP2006100882A JP 2006100882 A JP2006100882 A JP 2006100882A JP 2004280972 A JP2004280972 A JP 2004280972A JP 2004280972 A JP2004280972 A JP 2004280972A JP 2006100882 A JP2006100882 A JP 2006100882A
- Authority
- JP
- Japan
- Prior art keywords
- reproduction
- voice
- packet
- audio
- voice packet
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
Description
本発明は、ネットワーク上のパケットを介して音声通信を行うシステムにおける音声パケット再生方式に関する。 The present invention relates to a voice packet reproduction method in a system that performs voice communication via a packet on a network.
この種の従来の音声パケット再生方式では、ネットワークから受信した音声パケットは、到着時間のばらつきを吸収し音声サンプルクロックをもとに等間隔で音声再生をするための音声バッファに格納される。音声バッファでは、一定数のパケットが蓄積されると音声再生が開始される。音声パケットの受信間隔が長くなるかパケットの欠落が発生し、バッファ内のパケットが枯渇すると、代替パケットが挿入される。また、音声パケットの受信間隔が短くなりバッファが溢れると、パケットが廃棄される(特許文献1参照)。
このような従来の音声パケット再生方式では、音声パケットの受信タイミングと再生タイミング間でのクロック周波数差により、パケットの欠落がない良好な通信状態であっても、時間経過とともに音声バッファ内のパケットの蓄積あるいは枯渇が進み、周期的に音声バッファのオーバフローあるいはアンダフローが生じ、その都度音声パケット単位で音声データの廃棄あるいは挿入を行うため、再生される音声の違和感が大きいという問題点があった。 In such a conventional voice packet reproduction method, even in a good communication state in which there is no packet loss due to the clock frequency difference between the reception timing and the reproduction timing of the voice packet, the packet in the voice buffer is Accumulation or depletion has progressed, and voice buffer overflows or underflows occur periodically. Since voice data is discarded or inserted in units of voice packets each time, there is a problem that the sense of discomfort of the reproduced voice is large.
本発明の目的は、受信された音声パケットから再生される音声に与える影響である違和感を軽減して音声再生を行うことができる音声パケット再生方式を提供することにある。 An object of the present invention is to provide an audio packet reproduction method capable of performing audio reproduction while reducing a sense of incongruity that is an influence on audio reproduced from a received audio packet.
この課題を解決するために、本発明による音声パケット再生方式は、受信した音声パケットから音声を再生するための基準となる音声再生タイミング信号を出力するタイミング発生部と、
受信した音声パケットの受信タイミングと前記音声再生タイミング信号とのクロック周波数差を検出して該クロック周波数差に対応する補正量情報を出力する周波数差検出部と、
検出された該周波数差に対応する前記補正量情報に従って前記音声再生タイミング信号の分周比を制御して、前記受信した音声パケットから音声信号を再生する再生要求信号を生成する補正制御部と、
前記受信された前記音声パケットを一時的に記録し、その記録された音声パケットの読み出し再生間隔が前記再生要求信号により制御されて、前記音声パケットの再生タイミングを再生クロック単位で変化させることができる音声バッファと、
該音声パケットのフレームデータを前記再生要求信号による制御の下で音声サンプルデータに変換する音声復号部と、
前記再生要求信号に基づき該音声サンプルデータを前記再生クロック単位でそのまま再生または廃棄もしくは挿入して再生データを生成する音声再生部と、
を備えた備えた構成を有している。
In order to solve this problem, an audio packet reproduction method according to the present invention includes a timing generation unit that outputs an audio reproduction timing signal serving as a reference for reproducing audio from a received audio packet;
A frequency difference detection unit that detects a clock frequency difference between the reception timing of the received audio packet and the audio reproduction timing signal and outputs correction amount information corresponding to the clock frequency difference;
A correction control unit that controls a frequency division ratio of the audio reproduction timing signal according to the correction amount information corresponding to the detected frequency difference and generates a reproduction request signal for reproducing an audio signal from the received audio packet;
The received voice packet is temporarily recorded, and the read / playback interval of the recorded voice packet is controlled by the playback request signal, so that the playback timing of the voice packet can be changed in units of playback clock. An audio buffer;
A voice decoding unit that converts the frame data of the voice packet into voice sample data under the control of the reproduction request signal;
An audio reproduction unit for generating reproduction data by reproducing, discarding, or inserting the audio sample data in units of the reproduction clock based on the reproduction request signal;
It has the composition provided with.
本発明によれば、音声データの再生が再生クロック単位で廃棄および挿入が可能となるため、再生される音声品質の向上を期待することができる。 According to the present invention, since the reproduction of audio data can be discarded and inserted in units of reproduction clocks, it is possible to expect an improvement in the quality of reproduced audio.
図1は、本発明の実施例1を示すブロック図である。図2は、本発明方式の動作を説明するためのタイムチャートである。
〔LANインタフェース1〕
LANインタフェース1では、IPネットワークから受信したパケットデータをパケット受信制御部2に転送する。
〔パケット受信制御部2〕
パケット受信制御部2は、図3に示すように、パケットデータ受信部2−1,受信バッファ制御部2−2および受信タイミング情報生成部2−3により構成される。
パケットデータ受信部2−1では、LANインタフェース1から受信した音声パケットからその受信タイミングを抽出するとともに、また、そのシーケンス番号,タイムスタンプ,符号化音声フレームデータaを出力する。
受信バッファ制御部2−2では、符号化音声フレームデータaを音声バッファ3に転送する。
受信タイミング情報生成部2−3では、周波数差検出部5に対して、音声バッファ3への転送を完了したことを示す転送完了タイミング信号を出力するとともに、当該音声パケットに記録されたシーケンス番号およびタイムスタンプを出力する。
〔音声バッファ3〕
音声バッファ3は、パケット受信制御部2から転送された符号化音声フレームデータaを蓄積する。
蓄積された符号化音声フレームデータbは、ジッタ吸収に必要な一定量蓄積された後、補正制御部6からの再生要求信号eにより制御されて、音声復号部7に転送される。
FIG. 1 is a block
[LAN interface 1]
The
[Packet reception control unit 2]
As shown in FIG. 3, the packet
The packet data receiving unit 2-1 extracts the reception timing from the voice packet received from the
The reception buffer control unit 2-2 transfers the encoded audio frame data a to the
The reception timing information generation unit 2-3 outputs a transfer completion timing signal indicating that the transfer to the
[Audio buffer 3]
The
The accumulated encoded audio frame data b is accumulated in a certain amount necessary for jitter absorption, and is then controlled by a reproduction request signal e from the
〔タイミング発生部4〕
タイミング発生部4は、図示しない音声再生側基準クロック源からの基準クロックを分周し、音声再生タイミング信号fを生成する。
〔周波数差検出部5〕
周波数差検出部5は、受信した音声パケットの転送完了タイミング信号と基準再生タイミング信号f間のクロック周波数差を検出し、この周波数差に対応する補正量情報を出力する。即ち、この周波数差検出部5では、送受信点間で共通の音声符号化方式に基づいて構成された音声パケットに付与された時刻の推移を監視し、一定時間あたりの受信パケットと再生パケットとの時刻の変化量を計算することにより、送受信間でのクロック周波数差を算出し、これに対応する補正量情報を作成する
〔補正制御部6〕
補正制御部6は、タイミング発生部4からの音声再生タイミング信号fを分周して、音声復号化および音声再生の基準とする再生周期を生成する。また、図5に示すように、分周比制御回路6ー1と分周カウンタ6ー2を用いて、周波数差検出部5からの補正量情報をもとに、基準となる再生周期に対して、1再生クロック分のデータのタイミング補正制御を行うために、分周比を変化させた再生要求信号eを出力する。また、補正制御部6はクロック周波数差に対応する補正量情報をもとに受信から再生までのパケット転送間隔すなわち音声再生間隔を制御する再生要求信号eを生成する。
[Timing generator 4]
The
[Frequency difference detector 5]
The frequency difference detector 5 detects the clock frequency difference between the transfer completion timing signal of the received voice packet and the reference reproduction timing signal f, and outputs correction amount information corresponding to this frequency difference. That is, the frequency difference detection unit 5 monitors the transition of the time given to the voice packet configured based on the voice coding method common between the transmission and reception points, and determines the received packet and the playback packet per certain time. By calculating the amount of change in time, the clock frequency difference between transmission and reception is calculated, and correction amount information corresponding to this is generated [correction control unit 6]
The
〔音声復号部7〕
音声復号部7は、再生要求信号eに同期して、音声バッファ3から転送される符号化音声フレームデータbをもとに、実際に使用されるサンプリングレートにおける時間系列に対応した復号化音声データcに変換して出力する。
〔音声再生部8〕
音声再生部8は、復号化された音声データcを再生要求信号eの周期の変化に対応して、そのまま再生するか、1再生クロック分のデータを廃棄または挿入して再生音声データdを出力する。即ち、音声再生部8では、音声バッファ3からパケットを取り出す周期に連動して、補正量情報をもとに、音声サンプルデータ列に対して、そのまま再生するか1再生クロック分のデータの廃棄または挿入を行って再生音声データd1,d2,d3を取り出す。
[Audio decoding unit 7]
The audio decoding unit 7 decodes the decoded audio data corresponding to the time series at the sampling rate actually used based on the encoded audio frame data b transferred from the
[Audio playback unit 8]
The audio reproduction unit 8 reproduces the decoded audio data c as it is corresponding to the change in the period of the reproduction request signal e, or discards or inserts the data for one reproduction clock and outputs the reproduction audio data d To do. That is, the audio reproduction unit 8 reproduces the audio sample data string as it is based on the correction amount information in conjunction with the cycle for extracting the packet from the
本発明方式の動作の概要を説明する。
本発明の実施例を示す図1において、周波数差検出部5では、送受信点間で共通の音声符号化方式に基づいて構成された音声パケットに付与された時刻の推移を監視し、一定時間あたりの受信パケットと再生パケットとの時刻の変化量を計算することにより、送受信間でのクロック周波数差を算出し、これに対応する補正量情報を作成する。また、補正制御部6はクロック周波数差に対応する補正量情報をもとに受信から再生までのパケット転送間隔すなわち音声再生間隔を制御する再生要求信号eを生成する。
An outline of the operation of the method of the present invention will be described.
In FIG. 1 showing an embodiment of the present invention, the frequency difference detection unit 5 monitors the transition of time given to a voice packet configured based on a voice coding method common between transmission and reception points, By calculating the amount of change in the time between the received packet and the reproduced packet, the clock frequency difference between transmission and reception is calculated, and correction amount information corresponding to this is created. Further, the
音声バッファ3では、補正量情報をもとにその音声バッファ3からパケットを取り出す周期を音声サンプルクロック単位で一時的に変化させる。
The
音声復号部7では、取り出されたパケットから音声パケット符号化方式に基づいて音声サンプルデータ列に変換する。 The voice decoding unit 7 converts the extracted packet into a voice sample data string based on the voice packet encoding method.
音声再生部8では、音声バッファ3からパケットを取り出す周期に連動して、補正量情報をもとに、音声サンプルデータ列に対して、1サンプル分のデータを廃棄あるいは挿入を行って再生音声データdを取り出す。
The audio playback unit 8 discards or inserts one sample of data into the audio sample data string based on the correction amount information in conjunction with the cycle of extracting the packet from the
図4は、本発明に用いる周波数差検出部5の構成例を示すブロック図である。
計数カウンタ回路501は、音声再生タイミング信号fにより連続計数動作し、転送完了タイミング信号211が入力された時点での計数値515をメモリ502に書き込む。
メモリ502は、受信パケットのシーケンス番号212およびタイムスタンプ213とともに、計数値515を順次記憶する。
差分回路503は、メモリ502から読み出した2個のパケットに対する計数値520,521から差分を求め、パケット受信間隔522を算出する。
メモリ504は、差分回路503で得られた受信間隔522を順次記憶する。
演算回路505は、メモリ504に記憶された個々のパケット受信間隔523を読み出し、一定数について平均化処理を行い、平均受信間隔524を算出する。
受信間隔レジスタ509は、一定数の受信パケットから算出された平均受信間隔524を一時的に記憶し、時間経過とともに順次更新され、パケット平均受信間隔525として出力する。
差分回路506は、メモリ502から読み出した2個のパケットに対するタイムスタンプ516,517から差分を求め、パケット送信間隔508を算出する。
送信間隔レジスタ507は、差分回路506により算出されたパケット送信間隔518を記憶する。
演算回路508は、パケット平均受信間隔525とパケット送信間隔518から周波数差を算出し、補正量情報526を出力する。
FIG. 4 is a block diagram showing a configuration example of the frequency difference detection unit 5 used in the present invention.
The
The
The
The
The
The
The
The
The
この周波数差検出部5では、音声再生タイミングクロックで計数カウンタ回路501を動作させ、パケット受信制御部2から出力される受信完了タイミング信号が発生した時点での計数カウンタ回路501の値を記録するとともに、対応するパケットのシーケンス番号およびタイムスタンプを記録する。
ここで、図6に示すように、一定の差分nを示す2個のシーケンス番号(k,k+n)を持つ2個のパケットのタイムスタンプの差分値により、送信側における2個のパケット送信間隔TIを求める。
一方、その2個のパケットに対応する計数カウンタの値(Tk,Tk+n)の差分値により、実際に受信された時間間隔RIkを求める。同様に、連続する2n個のパケットに対して、シーケンス番号の差分nを示す2個のパケットに対応する計数カウンタの値の差分値をn個求め、平均時間間隔RIを求める。
TIとRIの差異の推移を順次監視し、1サンプル分の音声データを廃棄または挿入すべき補正時間間隔を算出し、補正制御部へ補正量情報として通知する。
The frequency difference detection unit 5 operates the
Here, as shown in FIG. 6, two packet transmission intervals TI on the transmission side are determined by the difference value of the time stamps of two packets having two sequence numbers (k, k + n) indicating a constant difference n. Ask for.
On the other hand, the actually received time interval RIk is obtained from the difference value of the count counter values (Tk, Tk + n) corresponding to the two packets. Similarly, for 2n consecutive packets, n difference values of count counter values corresponding to two packets indicating sequence number difference n are obtained, and an average time interval RI is obtained.
The transition of the difference between TI and RI is sequentially monitored, a correction time interval at which one sample of audio data is to be discarded or inserted is calculated, and the correction control unit is notified as correction amount information.
本発明は、ネットワーク上でパケットを介して音声通信を行うシステムにおいて、音声パケットを再生する際に広く適用することができる。 The present invention can be widely applied when reproducing voice packets in a system that performs voice communication via packets on a network.
1 LANインタフェース
2 パケット受信制御部
2−1 パケットデータ受信部
2−2 受信バッファ制御部
2−3 受信タイミング情報生成部
3 音声バッファ
4 タイミング発生部
5 周波数差検出部
6 補正制御部
7 音声復号部
8 音声再生部
9 バッファ監視部
211 転送完了タイミング信号
212 シーケンス番号
213 タイムスタンプ
501 計数カウンタ回路
502 メモリ
503 差分回路
504 メモリ
505 演算回路
506 差分回路
507 送信間隔レジスタ
508 演算回路
509 受信間隔レジスタ
515 計数値
516 タイムスタンプ
517 タイムスタンプ
518 パケット送信間隔
519 パケット送信間隔
520,521 計数値
522 パケット受信間隔
523 パケット受信間隔
524 平均受信間隔
525 パケット平均受信間隔
a 符号化音声フレームデータ
b 符号化音声フレームデータ
c 符号化音声データ
d 再生音声データ
e 再生要求信号
f 音声再生タイミング信号
DESCRIPTION OF
Claims (1)
受信した音声パケットの受信タイミングと前記音声再生タイミング信号とのクロック周波数差を検出して該クロック周波数差に対応する補正量情報を出力する周波数差検出部と、
検出された該周波数差に対応する前記補正量情報に従って前記音声再生タイミング信号の分周比を制御して、前記受信した音声パケットから音声信号を再生する再生要求信号を生成する補正制御部と、
前記受信された前記音声パケットを一時的に記録し、その記録された音声パケットの読み出し再生間隔が前記再生要求信号により制御されて、前記音声パケットの再生タイミングを再生クロック単位で変化させることができる音声バッファと、
該音声パケットのフレームデータを前記再生要求信号による制御の下で音声サンプルデータに変換する音声復号部と、
前記再生要求信号に基づき該音声サンプルデータを前記再生クロック単位でそのまま再生または廃棄もしくは挿入して再生データを生成する音声再生部と、
を備えた音声パケット再生方式。 A timing generation unit that outputs a sound reproduction timing signal serving as a reference for reproducing sound from the received sound packet;
A frequency difference detection unit that detects a clock frequency difference between the reception timing of the received audio packet and the audio reproduction timing signal and outputs correction amount information corresponding to the clock frequency difference;
A correction control unit that controls a frequency division ratio of the audio reproduction timing signal according to the correction amount information corresponding to the detected frequency difference and generates a reproduction request signal for reproducing an audio signal from the received audio packet;
The received voice packet is temporarily recorded, and the read / playback interval of the recorded voice packet is controlled by the playback request signal, so that the playback timing of the voice packet can be changed in units of playback clock. An audio buffer;
A voice decoding unit that converts the frame data of the voice packet into voice sample data under the control of the reproduction request signal;
An audio reproduction unit for generating reproduction data by reproducing, discarding, or inserting the audio sample data in units of the reproduction clock based on the reproduction request signal;
Voice packet playback system with
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004280972A JP2006100882A (en) | 2004-09-28 | 2004-09-28 | Voice packet reproducing system |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004280972A JP2006100882A (en) | 2004-09-28 | 2004-09-28 | Voice packet reproducing system |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2006100882A true JP2006100882A (en) | 2006-04-13 |
Family
ID=36240326
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004280972A Pending JP2006100882A (en) | 2004-09-28 | 2004-09-28 | Voice packet reproducing system |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2006100882A (en) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008153941A (en) * | 2006-12-18 | 2008-07-03 | Kddi Corp | Sound packet reproducing device having clock correction function, communication terminal and program |
JP2009141743A (en) * | 2007-12-07 | 2009-06-25 | Hitachi Ulsi Systems Co Ltd | Communication system |
-
2004
- 2004-09-28 JP JP2004280972A patent/JP2006100882A/en active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008153941A (en) * | 2006-12-18 | 2008-07-03 | Kddi Corp | Sound packet reproducing device having clock correction function, communication terminal and program |
JP4679502B2 (en) * | 2006-12-18 | 2011-04-27 | Kddi株式会社 | Voice packet reproducing apparatus, communication terminal and program having clock correction function |
JP2009141743A (en) * | 2007-12-07 | 2009-06-25 | Hitachi Ulsi Systems Co Ltd | Communication system |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP1229690A1 (en) | Data stream processing device and method, and program storage medium | |
JP2007221326A (en) | Device and method for adjusting transmission rate | |
JP5380862B2 (en) | IP stream transmission / reception system, IP stream reception apparatus, and reception processing timing synchronization method used therefor | |
JP3052824B2 (en) | Audio playback time adjustment circuit | |
JP2008053872A (en) | Ip stream transmission and reception system, ip stream receiving device, and reception processing timing synchronizing method used therefor | |
JP2012075069A (en) | Moving image transmission apparatus | |
JP2010531087A (en) | System and method for transmission of constant bit rate streams | |
TWI431986B (en) | Information processing apparatus and method, and program | |
US6931371B2 (en) | Digital interface device | |
JP2006100882A (en) | Voice packet reproducing system | |
JPH09247670A (en) | Information multiplexer | |
JP5186094B2 (en) | Communication terminal, multimedia playback control method, and program | |
JP3617655B2 (en) | Encoding system and encoding method, decoding system and decoding method, encoded data recording apparatus and encoded data recording method, encoded data transmission apparatus and encoded data transmission method, and recording medium | |
US7274863B2 (en) | Data stream processing device and method and program storage medium | |
US20050135368A1 (en) | Stream data receiving apparatus | |
WO2012094974A1 (en) | Method, device and system for synchronizing media streams | |
JP3177825B2 (en) | Media coding device | |
JP5741064B2 (en) | Video / audio processing apparatus and video / audio processing method | |
JP2001339688A (en) | Playback equipment of transport stream | |
JPH1118071A (en) | Slow reproduction system | |
JP2008035198A (en) | Video processor and packet processing method | |
JP2002374220A (en) | Stream transmission reception system, and stream transmitter and receiver | |
JP2009212877A (en) | Ts receiving device and timing regenerating method for use therein | |
JP2006332966A (en) | Data transmission device | |
JP2008022432A (en) | Signal transmitting/receiving apparatus and communication synchronism control method |