JP5235309B2 - Audio playback apparatus and audio playback method - Google Patents
Audio playback apparatus and audio playback method Download PDFInfo
- Publication number
- JP5235309B2 JP5235309B2 JP2007015338A JP2007015338A JP5235309B2 JP 5235309 B2 JP5235309 B2 JP 5235309B2 JP 2007015338 A JP2007015338 A JP 2007015338A JP 2007015338 A JP2007015338 A JP 2007015338A JP 5235309 B2 JP5235309 B2 JP 5235309B2
- Authority
- JP
- Japan
- Prior art keywords
- audio data
- error
- unit
- data
- audio
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
- Detection And Prevention Of Errors In Transmission (AREA)
Description
本発明は、音声コーデックを用いて符号化された符号化音声データを再生する音声再生装置および音声再生方法に関する。 The present invention relates to an audio reproducing apparatus and an audio reproducing method for reproducing encoded audio data encoded using an audio codec.
PHS(Personal Handy phone System)等の無線端末装置では、ユーザの音声によるアナログ信号を一旦デジタル信号に変換して他のユーザの無線端末装置に送信し、そこで再びアナログ信号に変換されて音声が再生される。しかし、アナログ信号を単純にデジタル信号に変換するだけではその情報量が大きくなり、伝送可能な情報量が制限されている通信路において全ての音声データを伝達できないことになる。そこで、この通信路で伝送できるように、音声データの情報量を圧縮する音声コーデックが必要となる。 In a wireless terminal device such as PHS (Personal Handy phone System), an analog signal based on a user's voice is once converted into a digital signal and transmitted to another user's wireless terminal device, where it is converted back to an analog signal and reproduced. Is done. However, simply converting an analog signal into a digital signal increases the amount of information, and all audio data cannot be transmitted over a communication path in which the amount of information that can be transmitted is limited. Therefore, an audio codec that compresses the information amount of the audio data is necessary so that it can be transmitted through this communication path.
音声コーデックは、音声デジタルデータの符号化(エンコード)と復号(デコード)からなり、音声符号化装置で符号化された音声データが、音声再生装置でデコードおよび、再生される。上述したPHS等の無線端末装置で用いられる音声コーデックとしては、例えば、ADPCM(適応差分PCM)符号化技術が挙げられる。かかるADPCMは、音声等のアナログデータが連続的に変化する性質を利用し、音声データの差分を符号化する技術である。 The audio codec is composed of encoding (decoding) and decoding (decoding) of audio digital data, and audio data encoded by the audio encoding device is decoded and reproduced by the audio reproducing device. Examples of the voice codec used in the above-described wireless terminal device such as PHS include ADPCM (adaptive differential PCM) coding technology. Such ADPCM is a technique that encodes a difference of audio data by utilizing the property that analog data such as audio continuously changes.
ADPCMによる動作を説明すると、図9に示すように、音声符号化装置10では、送信すべき音声データynと前回の音声データy'n-1との差分dnを量子化幅Δnで量子化して符号を割り当て、符号化された符号化音声データcnを音声再生装置12に送信する。そして、音声再生装置12では、この符号化音声データcnを、量子化幅Δnを用いて復号し、復号された差分d'nを前回値y'n-1に加算して音声データy'nを得る。ADPCMでは、振幅が小さいアナログデータでも再現できるように、振幅変化幅に応じて量子化の分解能を変化させ得る特性を有し、図9に示すように符号化音声データcnに応じて、アナログデータの振幅範囲が大きいところでは量子化幅Δnを大きくし、小さいところでは量子化幅Δnを小さくする。このようなADPCMを用いることで、圧縮された少ない情報量から音声符号装置10の音声データynをほぼ復元することができる。
The operation by ADPCM will be described. As shown in FIG. 9, in the
無線端末装置では、例えば、QPSKの変調方式において32kbpsのADPCM(ITU−T勧告G.726)が採用され、ここでは、聴覚上違和感のない再生を行うため、窓関数を用いて窓掛けを行い、時間軸上に並んだ現在のフレームデータと前回のフレームデータとの連続性を維持した音声データを生成することができる。かかる32kbpsADPCMの音声通信においては、エラーが発生すると、復号する前の符号化音声データをゼロデータ(0x0または0xF)に置き換えて音声を強制的に無音にし、かつ、ノイズが生じている間のみ音圧を下げることで、ノイズを抑制することができる(例えば、特許文献1)。
無線端末装置では、無線回線の有効利用の観点から上述したQPSK変調方式における32kbpsADPCMに加えてBPSK変調方式における16kbpsADPCMの並行利用が検討されている。16kbpsADPCMは32kbpsADPCMに比べ単位時間に伝送する情報量は少ないものの、電波強度が弱いときでも比較的安定して通信することができる利点を有する。 In the wireless terminal apparatus, from the viewpoint of effective use of the radio channel, parallel use of 16 kbps ADPCM in the BPSK modulation system is being studied in addition to the above-described 32 kbps ADPCM in the QPSK modulation system. Although 16 kbps ADPCM transmits less information per unit time than 32 kbps ADPCM, it has an advantage that communication can be performed relatively stably even when the radio wave intensity is weak.
しかし、このような16kbpsADPCMでエラーが発生した場合、16kbpsADPCMには規格上ゼロデータが存在しないので、32kbpsADPCMのように符号化音声データをゼロデータに置き換えて無音状態を生成することができない。また、16kbpsADPCMでは、音声コーデックの特性上、エラーが回復した後も音声データに異常なノイズが生じてしまう。従って、32kbpsADPCMの音声再生技術を単に16kbpsADPCMに適応することができなかった。 However, when an error occurs in such 16 kbps ADPCM, there is no zero data in the standard in 16 kbps ADPCM, and therefore, it is not possible to generate a silence state by replacing the encoded voice data with zero data as in 32 kbps ADPCM. Further, in 16 kbps ADPCM, abnormal noise occurs in the audio data even after the error is recovered due to the characteristics of the audio codec. Therefore, the voice reproduction technology of 32 kbps ADPCM cannot be simply applied to 16 kbps ADPCM.
本発明は、16kbpsADPCMにおける音声データ再生時の上記問題点に鑑みてなされたものであり、本発明の目的は、16kbpsADPCMを利用する場合であっても、エラー時における耳障り(不快)な音声の再生を確実に防止することが可能な、新規かつ改良された音声再生装置および音声再生方法を提供することである。 The present invention has been made in view of the above problems at the time of audio data reproduction in 16 kbps ADPCM, and the object of the present invention is to reproduce unpleasant (uncomfortable) audio at the time of error even when 16 kbps ADPCM is used. It is an object of the present invention to provide a new and improved audio reproduction device and audio reproduction method that can surely prevent the above.
上記課題を解決するために、本発明のある観点によれば、音声コーデックを用いて符号化された符号化音声データを受信するデータ受信部と、受信された符号化音声データのエラーを検出するエラー検出部と、エラー検出部がエラーを検出しなかった場合に符号化音声データを再生バッファに格納するデータ格納部と、再生バッファに格納された符号化音声データを復号する復号部と、復号部によって復号された音声データを減衰することが可能な減衰部と、音声データを再生する音声再生部とを備える音声再生装置であって、データ格納部は、エラー検出部がエラーを検出した場合、再生バッファに格納された符号化音声データの前回値を維持し、減衰部は、エラー検出部によってエラーが検出され、再生バッファに符号化音声データの前回値が維持されている時に、復号部によって復号された、前回値に基づく音声データを、固定された最大の減衰率にて減衰させることを特徴とする、音声再生装置が提供される。音声コーデックは、16kbpsのADPCM(適応差分PCM)であってもよい。 In order to solve the above problems, according to an aspect of the present invention, a data receiving unit that receives encoded audio data encoded using an audio codec, and an error in the received encoded audio data are detected. An error detection unit; a data storage unit that stores encoded audio data in a reproduction buffer when the error detection unit does not detect an error; a decoding unit that decodes encoded audio data stored in the reproduction buffer; Audio reproduction device comprising an attenuation unit capable of attenuating audio data decoded by the unit and an audio reproduction unit for reproducing audio data, wherein the data storage unit detects an error by the error detection unit The previous value of the encoded audio data stored in the reproduction buffer is maintained, and the attenuation unit detects an error by the error detection unit and When the value is maintained, it decoded by the decoding unit, the audio data based on the previous value, and wherein the attenuating at a fixed maximum attenuation rate, the sound reproducing apparatus is provided. The audio codec may be 16 kbps ADPCM (Adaptive Differential PCM).
当該ADPCMは、現在の音声データと前回の音声データとの差分を符号化する技術である。従って、エラーが検出され、その符号化音声データを利用できない場合は、音声データが連続的に変化していると推定して符号化音声データの書き換えを行わずに前回値を維持する。また、エラーが検出され、再生バッファに符号化音声データの前回値が維持されている時に、復号部によって復号された、前回値に基づく音声データを減衰させる。 The ADPCM is a technique for encoding a difference between current audio data and previous audio data. Therefore, when an error is detected and the encoded audio data cannot be used, it is estimated that the audio data is continuously changing, and the previous value is maintained without rewriting the encoded audio data. Further, when an error is detected and the previous value of the encoded audio data is maintained in the reproduction buffer, the audio data based on the previous value decoded by the decoding unit is attenuated.
減衰部は、音声再生部より前段に設けられ、エラーが回復してから所定時間、音声データを減衰してもよい。 Damping portion is provided in front from the sound reproducing unit, a predetermined time from the recovery error, but it may also be attenuated audio data.
当該音声コーデックでは、音声データの前回値との差分を符号化しているので、一旦音声データが不正な値になると、本来の正常なデータに回復するのに時間を要する。特に、16kbpsADPCMにおいては、32kbpsADPCMと比較して差分の情報量が少ないため、音声データの回復に長時間を要してしまう。かかる音声データを所定時間減衰する構成により、例え音声データの回復段階で異常なノイズが発生したとしても音声には影響せず、耳障りな音声の再生を防止することができる。 Since the audio codec encodes the difference from the previous value of the audio data, it takes time to recover the original normal data once the audio data becomes an incorrect value. In particular, in the 16 kbps ADPCM, since the difference information amount is small compared to the 32 kbps ADPCM, it takes a long time to recover the audio data. With such a configuration in which the audio data is attenuated for a predetermined time, even if abnormal noise occurs in the recovery stage of the audio data, the audio is not affected, and an unpleasant audio reproduction can be prevented.
また、上記所定時間は、エラーが回復してからカウントを開始し、そのカウント値はエラーの度にリセットされるので、複数のエラーが間隔をおいて連続的に発生したとしても、最後のエラーが回復してから所定時間が確保され、音声コーデックの特性上のノイズを減衰部で確実に抑制することが可能となる。 In addition, the count starts after the error is recovered for the predetermined time, and the count value is reset at each error, so even if multiple errors occur consecutively at intervals, the last error A predetermined time is secured after the recovery of the noise, and the noise on the characteristics of the voice codec can be surely suppressed by the attenuation unit.
減衰部は、エラーが回復してから所定時間後に減衰率がゼロになるように減衰率を漸減してもよい。 The attenuation unit may gradually decrease the attenuation rate so that the attenuation rate becomes zero a predetermined time after the error is recovered.
ここでは、エラーが回復してから上記所定時間より手前まで最大減衰率を維持し、それ以降、減衰率を漸減して音声データの音圧(音量)を徐々に大きくし、所定時間には減衰率が0(ゼロ)となるように減衰率を強制的に推移させる。16kbpsのADPCMにおいては、32kbpsADPCMの窓関数のようにゲインを妥当な傾斜をもって回復させる効果がないので、このように意図的に減衰率を調整する。上記減衰率を漸減する構成により、違和感なく円滑に再生状態を回復させることができる。 Here, after the error is recovered, the maximum attenuation rate is maintained before the predetermined time, and thereafter, the attenuation rate is gradually decreased to gradually increase the sound pressure (volume) of the audio data, and then attenuated at the predetermined time. The attenuation rate is forcibly shifted so that the rate becomes 0 (zero). In the 16 kbps ADPCM, there is no effect of recovering the gain with an appropriate slope unlike the window function of 32 kbps ADPCM, and thus the attenuation rate is intentionally adjusted in this way. With the configuration in which the attenuation rate is gradually reduced, the reproduction state can be smoothly recovered without a sense of incongruity.
上記課題を解決するために、本発明の他の観点によれば、音声コーデックを用いて符号化された符号化音声データを受信するデータ受信ステップと、受信された符号化音声データのエラーを検出するエラー検出ステップと、エラーを検出しなかった場合に符号化音声データを再生バッファに格納するデータ格納ステップと、再生バッファの符号化音声データを復号する復号ステップと、復号ステップによって復号された音声データを減衰することが可能な減衰ステップと、音声データを再生する音声再生ステップと、を含む音声再生方法であって、データ格納ステップでは、エラー検出ステップにおいてエラーを検出した場合、再生バッファに格納された符号化音声データの前回値を維持し、減衰ステップでは、エラー検出ステップによってエラーが検出され、再生バッファに符号化音声データの前回値が維持されている時に、復号ステップによって復号された、前回値に基づく音声データを、固定された最大の減衰率にて減衰させることを特徴とする、音声再生方法が提供される。
In order to solve the above problems, according to another aspect of the present invention, a data receiving step for receiving encoded audio data encoded using an audio codec, and detecting an error in the received encoded audio data An error detecting step, a data storing step for storing the encoded audio data in the reproduction buffer when no error is detected, a decoding step for decoding the encoded audio data in the reproduction buffer, and the audio decoded by the decoding step An audio reproduction method including an attenuation step capable of attenuating data and an audio reproduction step for reproducing audio data. In the data storage step, when an error is detected in the error detection step, the data is stored in a reproduction buffer. The previous value of the encoded audio data is maintained, and in the attenuation step, the error detection step Error is detected, when the previous value of the encoded voice data is maintained in the reproduction buffer, decoded by the decoding step, the audio data based on the previous value, that attenuates at a fixed maximum attenuation rate A featured audio playback method is provided.
上述した音声再生装置における技術的思想に対応する構成要素やその説明は、当該音声再生方法にも適用可能である。 The components corresponding to the technical idea of the above-described sound reproduction device and the description thereof can be applied to the sound reproduction method.
以上説明したように本発明によれば、エラー時、特にエラーが長期間に渡る場合においても耳障りな音声の再生を確実に防止することが可能となる。 As described above, according to the present invention, it is possible to reliably prevent annoying sound reproduction when an error occurs, particularly when the error is for a long period of time.
以下に添付図面を参照しながら、本発明の好適な実施の形態について詳細に説明する。なお、本明細書及び図面において、実質的に同一の機能構成を有する構成要素については、同一の符号を付することにより重複説明を省略する。 Exemplary embodiments of the present invention will be described below in detail with reference to the accompanying drawings. In addition, in this specification and drawing, about the component which has the substantially same function structure, duplication description is abbreviate | omitted by attaching | subjecting the same code | symbol.
PHS端末や携帯電話等の無線端末装置と基地局との通信におけるデジタルデータの音声コーデックには、例えば、32kbpsのADPCMが利用されている。そして、無線回線の有効利用の観点からこの32kbpsADPCMに加えて16kbpsADPCMの並行利用が検討されている。かかるADPCMはその特性上、エラーの発生時に異常なノイズが生じ、不快な音声が聞こえることがある。 For example, 32 kbps ADPCM is used as a voice codec for digital data in communication between a wireless terminal device such as a PHS terminal or a mobile phone and a base station. In addition to the 32 kbps ADPCM, a parallel use of 16 kbps ADPCM is being studied from the viewpoint of effective use of the wireless line. Due to the characteristics of such ADPCM, abnormal noise may occur when an error occurs, and unpleasant sound may be heard.
(無線通信システム100)
本実施形態では、このような16kbpsADPCMにおいても、エラー時における耳障り(不快)な音声の再生を確実に防止することが可能な音声再生装置を提供する。尚、本実施形態においては、無線端末装置110を音声再生装置として用いている。以下、本実施形態の無線端末装置(音声再生装置)110によって無線通信を遂行する無線通信システム100の概略を説明し、その後、各構成要素に関して詳述する。
(Wireless communication system 100)
In the present embodiment, there is provided an audio reproduction device capable of reliably preventing reproduction of unpleasant (unpleasant) audio at the time of an error even in such a 16 kbps ADPCM. In the present embodiment, the
図1は、無線通信システム100の概略的な構成を示したブロック図である。かかる無線通信システム100は、無線端末装置110と、基地局120と、インターネットや専用回線等の通信網130と、中継サーバ140と、他の無線端末装置150とを含んで構成される。
FIG. 1 is a block diagram illustrating a schematic configuration of a
上記無線通信システム100では、無線端末装置110を利用して他の無線端末装置150に電話しようと試みた場合、ユーザは、自己の無線端末装置110を操作して、無線通信可能領域にある基地局120と無線通信を確立し、通信網130、中継サーバ(基地局制御装置や交換機を含む)140、および、他の無線端末装置150の無線通信可能領域にある基地局120を介して、通信相手の有する他の無線端末装置150と音声通話を遂行する。
In the
(無線端末装置110)
図2は、無線端末装置110のハードウェア構成を示した機能ブロック図である。無線端末装置110は、上述した携帯電話やPHSの他に、ノート型パーソナルコンピュータ、PDA(Personal Digital Assistant)等の様々な電子機器で構成され、構成要素として、端末制御部210と、端末メモリ212と、表示部214と、操作部216と、音声入出力部218と、端末無線部220とを含んでいる。
(Wireless terminal apparatus 110)
FIG. 2 is a functional block diagram illustrating a hardware configuration of the
上記端末制御部210は、中央処理装置(CPU)を含む半導体集積回路により無線端末装置110全体を管理および制御する。端末制御部210は、端末メモリ212のプログラムを用いて、無線端末装置110を利用した通話機能やメール配信機能も当然にして遂行するが、図3を用いて後述する、エラー検出部254、データ格納部256、復号部260としても機能する。
The
上記端末メモリ212は、ROM、RAM、E2PROM、不揮発性RAM、フラッシュメモリ、HDD(Hard Disk Drive)等で構成され、端末制御部210で処理されるプログラムや音声データ等を記憶する。また、後述する受信バッファ252や再生バッファ258としても機能させることができる。
The
上記表示部214は、カラーまたはモノクロのディスプレイで構成され、端末メモリ212に記憶された、または通信網130を介してアプリケーション中継サーバ(図示せず)から提供される、WebブラウザやアプリケーションのGUI(Graphical User Interface)を表示することができる。
The
上記操作部216は、キーボード、十字キー、ジョイスティック等のスイッチから構成され、ユーザの操作入力を受け付ける。
The
上記音声入出力部218は、マイクやスピーカから構成され、通話時に入力されたユーザの音声を音声データに変換し、また、通話相手の音声データを音声に変えて出力する。また、着信音や操作部216による操作音、アラーム音等も出力できる。また、後述する音声再生部264としても機能する。
The voice input /
上記端末無線部220は、携帯電話網における基地局120と無線通信を行う。また、後述するデータ受信部250としても機能する。
The
以上、図2を用いて無線端末装置110のハードウェアの説明をしたが、以下にそのようなハードウェア上で遂行される機能および動作を詳述する。
The hardware of the
図3は、無線端末装置110の概略的な機能を示した機能ブロック図である。無線端末装置110は、データ受信部250と、受信バッファ252と、エラー検出部254と、データ格納部256と、再生バッファ258と、復号部260と、減衰部262と、音声再生部264とを含んで構成される。
FIG. 3 is a functional block diagram showing a schematic function of the
上記データ受信部250は、音声コーデック、ここでは特に16kbpsADPCMを用いて符号化された符号化音声データを受信し、受信バッファに格納する。 The data receiving unit 250 receives encoded audio data encoded using an audio codec, specifically, 16 kbps ADPCM, and stores it in a reception buffer.
上記受信バッファ252は、データ受信部250が受信した符号化音声データを一時的に保持する。 The reception buffer 252 temporarily holds the encoded audio data received by the data receiving unit 250.
上記エラー検出部254は、データ受信部250で受信された符号化音声データのエラーを検出する。符号化音声データは所定長のパケットを5msec毎に合わせた所謂フレームで管理される。本実施形態において検出するエラーとしては、フレームの種類を示すCI情報が音声データ(TCH)を示しているか否かの確認、CRC(Cyclic Redundancy Check)、同期符号(UW:Unique Word)の有無等を用いる。また、ここに挙げたエラー以外にも、当該フレームの正当性を判断可能な様々なエラー検出方法を適用することが可能である。
The
上記データ格納部256は、エラー検出部254がエラーを検出しなかった場合に、受信バッファ252の符号化音声データを再生バッファ258に格納する。このとき、符号化音声データに音質向上処理を施して再生バッファ258に格納することもできる。
The
また、データ格納部256は、エラー検出部254がエラーを検出した場合、再生バッファ258に格納された符号化音声データの前回値を維持するとしてもよい。
The
当該ADPCMは、現在の音声データと前回の音声データとの差分を符号化する技術である。従って、エラーが検出され、その符号化音声データを利用できない場合は、音声データが連続的に変化していると推定して符号化音声データの書き換えを行わずに前回値を維持する。かかる構成の下、所定回数に達する前にエラーが回復すると、音声データも迅速かつ円滑に回復させることができる。 The ADPCM is a technique for encoding a difference between current audio data and previous audio data. Therefore, when an error is detected and the encoded audio data cannot be used, it is estimated that the audio data is continuously changing, and the previous value is maintained without rewriting the encoded audio data. Under such a configuration, if the error is recovered before the predetermined number of times is reached, the audio data can be recovered quickly and smoothly.
さらに、データ格納部256は、エラー検出部254が所定回数以上連続してエラーを検出した場合、復号すると無音または任意の音声となる符号化音声データを再生バッファ258に格納してもよい。復号すると無音となる符号化音声データとしては、例えば、既に復号した音声データから無音の音声データへ推移するための差分データを逆算(符号化)して求めることができる。
Further, the
上述したように、データ格納部256は、エラー検出部254がエラーを検出した場合、再生バッファ258に格納された符号化音声データの前回値を維持して、音声データの迅速かつ円滑な回復に備える。しかし、エラーが連続すると、実際の音声データと推定した音声データとが離隔している可能性が高くなるので、前回値を維持することで音声データが一方方向に膨張し、却って弊害となる場合もある。そこで、エラーを所定回数以上連続して検出した場合、音声データが無音または任意の音声となるような符号化音声データを再生バッファ258に格納することで、耳障りな音声の再生を確実に防止することができる。
As described above, when the
上記再生バッファ258は、データ格納部256によって格納された符号化音声データを一時的に保持する。
The
上記復号部260は、再生バッファ258に格納されている符号化音声データをアナログ化可能な音声データに復号する。
The
上記減衰部262は、復号部260で復号された音声データを減衰することができる。本実施形態では、特に、エラー中およびエラーが回復してから所定時間、音声データを減衰する。かかる減衰部262は、端末制御部210内においてソフトウェアで構成することもでき、ハードウェアとして構成することもできる。
The
当該音声コーデックでは、音声データの前回値との差分を符号化しているので、一旦音声データが不正な値になると、本来の正常なデータに回復するのに時間を要する。特に、16kbpsADPCMにおいては、32kbpsADPCMと比較して差分の情報量が少ないため、音声データの回復に長時間を要してしまう。かかる音声データを所定時間減衰する構成により、例え音声データの回復段階で異常なノイズが発生したとしても音声には影響せず、耳障りな音声の再生を防止することができる。 Since the audio codec encodes the difference from the previous value of the audio data, it takes time to recover the original normal data once the audio data becomes an incorrect value. In particular, in the 16 kbps ADPCM, since the difference information amount is small compared to the 32 kbps ADPCM, it takes a long time to recover the audio data. With such a configuration in which the audio data is attenuated for a predetermined time, even if abnormal noise occurs in the recovery stage of the audio data, the audio is not affected, and an unpleasant audio reproduction can be prevented.
また、上記所定時間は、エラーが回復してからカウントを開始し、そのカウント値はエラーの度にリセットされるので、複数のエラーが間隔をおいて連続的に発生したとしても、最後のエラーが回復してから所定時間が確保され、音声コーデックの特性上のノイズを減衰部で確実に抑制することが可能となる。 In addition, the count starts after the error is recovered for the predetermined time, and the count value is reset at each error, so even if multiple errors occur consecutively at intervals, the last error A predetermined time is secured after the recovery of the noise, and the noise on the characteristics of the voice codec can be surely suppressed by the attenuation unit.
減衰部262は、エラーが回復してから所定時間後に減衰率が0(ゼロ)になるように減衰率を漸減してもよい。
The
ここでは、エラーが回復してから上記所定時間より手前まで最大減衰率を維持させ、それ以降、減衰率を漸減して音声データの音圧を徐々に大きくして、所定時間には減衰率が0(ゼロ)となるように減衰率を推移させる。16kbpsのADPCMにおいては、32kbpsADPCMの窓関数のようにゲインを妥当な傾斜をもって回復させる効果がないので、このように意図的に減衰率を調整する。上記減衰率を漸減する構成により、違和感なく円滑に再生状態を回復させることができる。 Here, after the error is recovered, the maximum attenuation rate is maintained before the predetermined time, and thereafter, the attenuation rate is gradually decreased to gradually increase the sound pressure of the audio data. The attenuation rate is changed so as to be 0 (zero). In the 16 kbps ADPCM, there is no effect of recovering the gain with an appropriate slope unlike the window function of 32 kbps ADPCM, and thus the attenuation rate is intentionally adjusted in this way. With the configuration in which the attenuation rate is gradually reduced, the reproduction state can be smoothly recovered without a sense of incongruity.
上記音声再生部264は、減衰部262を経由した音声データを再生する。
The
上述したような構成により、無線端末装置110は、音声コーデックを用いて符号化された符号化音声データを、エラー時における耳障りな音声を回避しつつ、再生することが可能となる。
With the configuration as described above, the
(音声再生方法)
次に、上述した音声再生装置としての無線端末装置110を用いて符号化音声データを再生する音声再生方法について説明する。
(Audio playback method)
Next, an audio reproduction method for reproducing encoded audio data using the
図4は、音声再生方法の全体的な流れを示したフローチャートである。無線端末装置110では、以後の処理のため正常カウンタ値と異常カウンタ値とを0に初期化し、音声データの待ち受け状態を維持する。そして、無線通信による受信割り込みに応じて、符号化音声データを受信し(データ受信ステップ:S300)、受信した符号化音声データを受信バッファ252に格納する(S302)。
FIG. 4 is a flowchart showing the overall flow of the audio reproducing method. The
そして、エラー検出部254が、受信バッファ252に格納された符号化音声データの正当性を判断する。ここでは、受信した符号化音声データパケットをフレーム単位に連結した上で、フレーム毎にエラーを検出する(エラー検出ステップ)。具体的には、フレームの種類を示すCI情報が音声データ(TCH)を示しているか否かを判断し(S304)、そのフレームが音声データであれば、CRCによりビットエラーの有無を判断する(S306)。ここで、フレームのフォーマット、サンプリング周波数、送信速度等が妥当な数値を示しているかどうか判断することもできる。かかるCRCでもビットエラーが検出されなかった場合、最後に特定のビット列で表され、符号化音声データの位置を示す同期符号UWの有無を判断する(S308)。
Then, the
このようなエラー検出ステップによりエラーが検出されなかった場合、受信した符号化音声データは正常であるとみなし、正常受信処理(S310)を行う。また、エラー検出ステップのいずれかのステップにおいてエラーが検出された場合、その符号化音声データは不正なデータであるとみなされ、異常受信処理(S312)が遂行される。そして、各受信処理によって再生バッファに格納された音声データを減衰部262で減衰し、音声再生部で再生する(S314)。以下、正常受信処理(S310)および異常受信処理(S312)について詳述する。
If no error is detected by such an error detection step, the received encoded audio data is regarded as normal and normal reception processing (S310) is performed. If an error is detected in any of the error detection steps, the encoded voice data is regarded as illegal data, and an abnormal reception process (S312) is performed. Then, the audio data stored in the reproduction buffer by each reception process is attenuated by the
(正常受信処理S310)
図5は、正常受信処理S310の具体的な流れを示したフローチャートである。正常受信処理S310では、まず、データ格納部256が正常なデータとみなされた符号化音声データを受信バッファ252から再生バッファ258に転送し(S330)、異常受信処理S312で利用する異常カウンタ値を0にリセットする(S332)。そして、復号部260が再生バッファ258に格納された符号化音声データを復号する(S334)。
(Normal reception processing S310)
FIG. 5 is a flowchart showing a specific flow of normal reception processing S310. In the normal reception process S310, first, the
また、減衰部262は、音声データの回復段階における異常なノイズを音声に変換させないため音声データの減衰率を調整する。この調整は、音声データが安定するまでの十分な時間(正常カウンタ値が無音閾値に達するまで)最大の減衰率(ここでは−15dB)を維持し、それ以降徐々に減衰率を下げて、エラーが回復してから所定時間後(正常カウンタ値が減衰閾値に達したとき)減衰率が0となるように減衰率を推移することで実行される。
In addition, the
従って、減衰部262は、正常カウンタ値と無音閾値(ここでは「6」)とを比較し(S336)、正常カウンタ値が無音閾値に達していなければ減衰率を最大の−15dBに設定し(S338)、正常カウンタ値をインクリメントする(S340)。無音閾値に達していれば、減衰閾値(ここでは、「10」)と比較し(S342)、減衰値に達していなければ、減衰値と正常カウンタ値の差分に−3dBを乗じた値を減衰率に設定し(S344)、正常カウンタ値をインクリメントする(S346)。こうすることで、−3dBずつ減衰率が回復する調整を行うことができる。そして、正常カウンタ値が減衰閾値に達すると、その後は、エラーが生じるまで0dBを減衰率に設定し(S348)、音声の抑制を行わない。
Therefore, the
このような正常受信処理S310を通じて、受信した符号化音声データを音声として再生すると共に、エラーが回復してもなお発生する異常なノイズを抑制することが可能である。 Through such normal reception processing S310, it is possible to reproduce the received encoded audio data as audio and to suppress abnormal noise that still occurs even when the error is recovered.
(異常受信処理S312)
図6は、異常受信処理S312の具体的な流れを示したフローチャートである。異常受信処理S312において、エラーが回復したときの音声データの迅速かつ円滑な回復のために、データ格納部256は、エラー検出部254がエラーを検出した場合、再生バッファ258に格納された符号化音声データの前回値を維持し、エラー検出部254が所定回数(保持閾値)以上連続してエラーを検出した場合、復号すると無音または任意の音声となる符号化音声データを再生バッファ258に格納する。
(Abnormal reception process S312)
FIG. 6 is a flowchart showing a specific flow of the abnormal reception process S312. In the abnormal reception process S312, in order to quickly and smoothly recover the audio data when the error is recovered, the
従って、異常受信処理S312では、まず、異常カウンタ値と保持閾値(ここでは「4」)とを比較し(S360)、異常カウンタ値が保持閾値に達していなければ再生バッファ258に残存している前回の符号化音声データをそのまま維持し(S362)、異常カウンタ値をインクリメントする(S364)。保持閾値に達していれば、復号すると無音となる無音データを生成して再生バッファ258に格納する(S366)。
Therefore, in the abnormal reception process S312, first, the abnormal counter value is compared with the holding threshold (here, “4”) (S360). If the abnormal counter value does not reach the holding threshold, it remains in the
ここでは、異常カウンタ値が保持閾値に達するまで、再生バッファ258の値を上書きしないことで符号化音声データを維持する構成を述べているが、かかる場合に限られず、前回値を他の記憶手段に保持しておいて、その都度参照する構成をとってもよい。
Here, the configuration is described in which the encoded audio data is maintained by not overwriting the value of the
再生バッファ258の符号化音声データが確定すると、復号部260が再生バッファ258に格納された符号化音声データを復号し(S368)、音声の再生を抑制するため減衰率を−15dBに固定する(S370)。そして、正常受信処理S310で利用する正常カウンタ値を0にリセットする(S372)。
When the encoded audio data in the
このような異常受信処理S312を通じて、エラー時の音声を抑制すると共に、エラーが回復したときの音声データの迅速かつ円滑な回復に備える。 Through such an abnormal reception process S312, the voice at the time of error is suppressed and the voice data is recovered quickly and smoothly when the error is recovered.
次に、上述した音声再生方法による再生バッファ258内のデータや減衰率の推移を説明する。ここでは、上述した音声再生方法の受信割り込みが5msec毎に行われるので、サンプリング時間は5msecとなる。
Next, transition of data and attenuation rate in the
図7は、エラー時の再生バッファ258内のデータの推移を示した説明図である。かかる図7の左側には、データ受信部250が受信し、受信バッファ252に格納された符号化音声データが示されている。そして、エラー検出部254のエラー判断(正常のときは「○」、異常のときは「×」)が示され、その判断に基づく再生バッファ258の内容が図7右側に示されている。
FIG. 7 is an explanatory diagram showing the transition of data in the
かかる図7を参照すると、エラーを検出したときには、前回サンプリングした符号化音声データを維持するので、例えば、サンプリング数3のとき、サンプリング数2で用いた「受信データ2」を維持する。また、サンプリング数5でもサンプリング数4で用いた「受信データ4」を維持し、エラーが連続している間、「受信データ4」が維持される。
Referring to FIG. 7, when an error is detected, the previously sampled encoded audio data is maintained. For example, when the sampling number is 3, “
そして、エラーが所定回数(4回)連続して検出されると、エラーの検出が無くなるまで、即ちエラーが回復するまで、再生バッファ258には復号すると無音データとなる16kbpsのADPCM用の無音データが強制的に書き込まれる。
When an error is continuously detected a predetermined number of times (four times), the
サンプリング数12では、エラーが回復しているので、正常時の処理である受信バッファ252から再生バッファ258への転送が行われる。
Since the error is recovered at the
図8は、エラー時の減衰率の推移を示した説明図である。かかる図8では、縦軸に減衰部262の減衰率が、横軸にサンプリング数(時間)が示されている。また、横軸上に示される「○」、「×」は、エラー判断の結果を示している(正常のときは「○」、異常のときは「×」)。例えば、3回目のサンプリングでエラーを検出すると、異常受信処理S312が開始され、減衰率は−15dBになり、音声データが絞られるので音声は遮断状態になる。
FIG. 8 is an explanatory diagram showing the transition of the attenuation rate at the time of error. In FIG. 8, the vertical axis represents the attenuation rate of the
4回目のサンプリングでエラーが回復し、正常カウンタ値が計数410されるものの、5回目のサンプリングで再びエラーが検出されているので、正常カウンタ値はリセットされる。そして、エラーが回復した12回目のサンプリングから再び計数412される。ここで、正常カウンタ値が無音閾値に達するまでは、減衰率も−15dBの値が維持される。 Although the error is recovered by the fourth sampling and the normal counter value is counted 410, the normal counter value is reset because the error is detected again by the fifth sampling. Then, counting is again performed 412 from the 12th sampling in which the error is recovered. Here, until the normal counter value reaches the silence threshold, the attenuation rate is maintained at -15 dB.
そして、再びエラーを検出することなく、18回目のサンプリング時に正常カウンタ値が無音閾値に達すると、サンプリング毎に減衰率を下げて、音圧を少しずつ上げ、最終的に実際の音声データが示す音圧で再生を行う。かかる無音閾値までの期間は、実施状況に応じて任意に設定できるが、音声データが整定する程度十分に長く、かつ、ユーザが違和感を感じない程度短い時間を選択するとよい。 Then, when the normal counter value reaches the silence threshold during the 18th sampling without detecting an error again, the attenuation rate is decreased for each sampling, the sound pressure is increased little by little, and finally the actual audio data indicates Playback with sound pressure. The period up to the silence threshold can be arbitrarily set according to the implementation status, but it is preferable to select a time that is long enough to stabilize the audio data and short enough for the user not to feel uncomfortable.
以上、添付図面を参照しながら本発明の好適な実施形態について説明したが、本発明は係る例に限定されないことは言うまでもない。当業者であれば、特許請求の範囲に記載された範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、それらについても当然に本発明の技術的範囲に属するものと了解される。 As mentioned above, although preferred embodiment of this invention was described referring an accompanying drawing, it cannot be overemphasized that this invention is not limited to the example which concerns. It will be apparent to those skilled in the art that various changes and modifications can be made within the scope of the claims, and these are naturally within the technical scope of the present invention. Understood.
なお、本明細書の伝送品質補償方法における各工程は、必ずしもフローチャートとして記載された順序に沿って時系列に処理する必要はなく、並列的あるいは個別に実行される処理(例えば、並列処理あるいはオブジェクトによる処理)も含むとしても良い。 Note that the steps in the transmission quality compensation method of the present specification do not necessarily have to be processed in time series in the order described in the flowchart, but are performed in parallel or individually (for example, parallel processing or object processing). May be included.
本発明は、音声コーデックを用いて符号化された符号化音声データを再生する音声再生装置および音声再生方法に利用可能である。 The present invention can be used for an audio reproducing apparatus and an audio reproducing method for reproducing encoded audio data encoded using an audio codec.
110 無線端末装置(音声再生装置)
220 端末無線部
250 データ受信部
254 エラー検出部
256 データ格納部
258 再生バッファ
260 復号部
262 減衰部
264 音声再生部
110 Wireless terminal device (voice playback device)
220 Terminal Radio Unit 250
Claims (4)
前記データ格納部は、前記エラー検出部がエラーを検出した場合、前記再生バッファに格納された符号化音声データの前回値を維持し、
前記減衰部は、前記エラー検出部によってエラーが検出され、前記再生バッファに符号化音声データの前回値が維持されている時に、前記復号部によって復号された、前記前回値に基づく音声データを、固定された最大の減衰率にて減衰させ、
前記減衰部は、エラーが回復してから所定時間後に減衰率がゼロになるように減衰率を漸減することを特徴とする、音声再生装置。 A data receiving unit that receives encoded audio data encoded using an audio codec, an error detection unit that detects an error in the received encoded audio data, and the error detection unit did not detect an error A data storage unit for storing the encoded audio data in the reproduction buffer, a decoding unit for decoding the encoded audio data stored in the reproduction buffer, and attenuating the audio data decoded by the decoding unit. An audio reproduction device comprising a possible attenuation unit and an audio reproduction unit for reproducing the audio data,
When the error detection unit detects an error, the data storage unit maintains the previous value of the encoded audio data stored in the reproduction buffer,
The attenuation unit detects audio data based on the previous value decoded by the decoding unit when an error is detected by the error detection unit and the previous value of the encoded audio data is maintained in the reproduction buffer. Attenuate at a fixed maximum attenuation rate ,
The sound reproducing apparatus according to claim 1, wherein the attenuation unit gradually reduces the attenuation rate so that the attenuation rate becomes zero after a predetermined time after the error is recovered .
前記受信された符号化音声データのエラーを検出するエラー検出ステップと、
前記エラーを検出しなかった場合に前記符号化音声データを再生バッファに格納するデータ格納ステップと、
前記再生バッファの符号化音声データを復号する復号ステップと、
前記復号ステップによって復号された音声データを減衰することが可能な減衰ステップと、
前記音声データを再生する音声再生ステップと、
を含む音声再生方法であって、
前記データ格納ステップでは、前記エラー検出ステップにおいてエラーを検出した場合、前記再生バッファに格納された符号化音声データの前回値を維持し、
前記減衰ステップでは、前記エラー検出ステップによってエラーが検出され、前記再生バッファに符号化音声データの前回値が維持されている時に、前記復号ステップによって復号された、前記前回値に基づく音声データを、固定された最大の減衰率にて減衰させ、
前記減衰ステップでは、エラーが回復してから所定時間後に減衰率がゼロになるように減衰率を漸減することを特徴とする、音声再生方法。 A data receiving step for receiving encoded audio data encoded using an audio codec;
An error detection step of detecting an error in the received encoded audio data;
A data storage step of storing the encoded audio data in a reproduction buffer when the error is not detected;
A decoding step of decoding the encoded audio data of the reproduction buffer;
An attenuation step capable of attenuating the audio data decoded by the decoding step;
An audio reproduction step of reproducing the audio data;
An audio playback method including:
In the data storage step, when an error is detected in the error detection step, the previous value of the encoded audio data stored in the reproduction buffer is maintained,
In the attenuation step, when an error is detected by the error detection step and the previous value of the encoded audio data is maintained in the reproduction buffer, the audio data based on the previous value decoded by the decoding step is Attenuate at a fixed maximum attenuation rate ,
In the attenuation step, the attenuation rate is gradually reduced so that the attenuation rate becomes zero a predetermined time after the error is recovered .
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007015338A JP5235309B2 (en) | 2007-01-25 | 2007-01-25 | Audio playback apparatus and audio playback method |
CN2008100089132A CN101231843B (en) | 2007-01-25 | 2008-01-25 | Sound reproducing device and method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007015338A JP5235309B2 (en) | 2007-01-25 | 2007-01-25 | Audio playback apparatus and audio playback method |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2008180996A JP2008180996A (en) | 2008-08-07 |
JP5235309B2 true JP5235309B2 (en) | 2013-07-10 |
Family
ID=39724932
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007015338A Expired - Fee Related JP5235309B2 (en) | 2007-01-25 | 2007-01-25 | Audio playback apparatus and audio playback method |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP5235309B2 (en) |
CN (1) | CN101231843B (en) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5053712B2 (en) * | 2007-05-29 | 2012-10-17 | 京セラ株式会社 | Radio terminal and audio playback method for radio terminal |
JP5489431B2 (en) * | 2008-08-11 | 2014-05-14 | 京セラ株式会社 | Wireless communication module, wireless terminal, and wireless communication method |
WO2010061460A1 (en) * | 2008-11-27 | 2010-06-03 | 株式会社島津製作所 | Communication device |
US10580416B2 (en) * | 2015-07-06 | 2020-03-03 | Nokia Technologies Oy | Bit error detector for an audio signal decoder |
JP7381237B2 (en) * | 2019-07-25 | 2023-11-15 | ラピスセミコンダクタ株式会社 | Audio playback device and audio playback system |
CN112947263A (en) * | 2021-04-20 | 2021-06-11 | 南京云玑信息科技有限公司 | Management control system based on data acquisition and coding |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2627579B2 (en) * | 1991-02-18 | 1997-07-09 | 日本電信電話株式会社 | Audio muting method |
JP3200887B2 (en) * | 1991-11-12 | 2001-08-20 | 日本電気株式会社 | Audio waveform decoding device |
JP3436940B2 (en) * | 1992-09-10 | 2003-08-18 | 旭化成株式会社 | Wireless communication device |
JP4572755B2 (en) * | 2005-06-27 | 2010-11-04 | ソニー株式会社 | Decoding device, decoding method, and digital audio communication system |
-
2007
- 2007-01-25 JP JP2007015338A patent/JP5235309B2/en not_active Expired - Fee Related
-
2008
- 2008-01-25 CN CN2008100089132A patent/CN101231843B/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2008180996A (en) | 2008-08-07 |
CN101231843A (en) | 2008-07-30 |
CN101231843B (en) | 2011-12-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4897173B2 (en) | Noise suppression | |
JP5235309B2 (en) | Audio playback apparatus and audio playback method | |
JP3596841B2 (en) | Receive data decompression device | |
KR101476138B1 (en) | Method of Setting Configuration of Codec and Codec using the same | |
ES2371455T3 (en) | PRE-PROCESSING OF DIGITAL AUDIO DATA FOR MOBILE AUDIO CODECS. | |
US8327211B2 (en) | Voice activity detection (VAD) dependent retransmission scheme for wireless communication systems | |
US20070129022A1 (en) | Method for adjusting mobile communication activity based on voicing quality | |
US20100324911A1 (en) | Cvsd decoder state update after packet loss | |
KR100332526B1 (en) | Systems and methods for communicating desired audio information over a communications medium | |
JPH10209950A (en) | Digital radio communication equipment | |
JP3436940B2 (en) | Wireless communication device | |
JP5053712B2 (en) | Radio terminal and audio playback method for radio terminal | |
JP3187953B2 (en) | Wireless communication device | |
JP3603469B2 (en) | Voice quality improvement device | |
US20140257800A1 (en) | Error concealment for speech decoder | |
JPH09307513A (en) | Voice quality improvement device | |
KR20180004075A (en) | Method of Setting Configuration of Codec and Codec using the same | |
JP3992581B2 (en) | Telephone | |
KR100244217B1 (en) | The equipment and the method of transmitting and receiving both voice and data at the same time | |
JP2640598B2 (en) | Voice decoding device | |
KR101814607B1 (en) | Method of Setting Configuration of Codec and Codec using the same | |
JP3302931B2 (en) | Audio restoration device, wireless telephone device using the same, and audio restoration method | |
JP3917101B2 (en) | Mobile phone terminal and voice level control program | |
KR101645294B1 (en) | Method of Setting Configuration of Codec and Codec using the same | |
JPH07336311A (en) | Voice decoder |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20091015 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110620 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110628 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110826 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20120228 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120525 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20120627 |
|
A912 | Re-examination (zenchi) completed and case transferred to appeal board |
Free format text: JAPANESE INTERMEDIATE CODE: A912 Effective date: 20120921 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130227 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130326 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 Ref document number: 5235309 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20160405 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |