JP2006113375A - 音声の再生及び停止を制御する音声再生装置及びプログラム - Google Patents

音声の再生及び停止を制御する音声再生装置及びプログラム Download PDF

Info

Publication number
JP2006113375A
JP2006113375A JP2004301611A JP2004301611A JP2006113375A JP 2006113375 A JP2006113375 A JP 2006113375A JP 2004301611 A JP2004301611 A JP 2004301611A JP 2004301611 A JP2004301611 A JP 2004301611A JP 2006113375 A JP2006113375 A JP 2006113375A
Authority
JP
Japan
Prior art keywords
signal
buffer
threshold value
timer
threshold
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2004301611A
Other languages
English (en)
Other versions
JP4561301B2 (ja
Inventor
Satoshi Miyaji
悟史 宮地
Yasuhiro Takishima
康弘 滝嶋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
KDDI Corp
Original Assignee
KDDI Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by KDDI Corp filed Critical KDDI Corp
Priority to JP2004301611A priority Critical patent/JP4561301B2/ja
Priority to US11/247,271 priority patent/US7650422B2/en
Publication of JP2006113375A publication Critical patent/JP2006113375A/ja
Application granted granted Critical
Publication of JP4561301B2 publication Critical patent/JP4561301B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/253Telephone sets using digital voice transmission
    • H04M1/2535Telephone sets using digital voice transmission adapted for voice communication over an Internet Protocol [IP] network
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04JMULTIPLEX COMMUNICATION
    • H04J3/00Time-division multiplex systems
    • H04J3/02Details
    • H04J3/06Synchronising arrangements
    • H04J3/062Synchronisation of signals having the same nominal but fluctuating bit rates, e.g. using buffers
    • H04J3/0632Synchronisation of packets and cells, e.g. transmission of voice via a packet network, circuit emulation service [CES]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/60Substation equipment, e.g. for use by subscribers including speech amplifiers
    • H04M1/6016Substation equipment, e.g. for use by subscribers including speech amplifiers in the receiver circuit

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Computer Hardware Design (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Telephone Function (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Communication Control (AREA)

Abstract

【課題】 リバッファリングによる音途切れ時間を短くすることができる音声再生装置及びプログラムを提供する。
【解決手段】 音声データを一時的に蓄積するバッファ部13と、バッファ部13から再生手段へ出力される音声データを、開放/閉止によって制御するスイッチ14と、バッファ手段のバッファ蓄積量を監視し、バッファ蓄積量が閾値以下であることを判定する閾値判定手段18と、トリガパルスを出力するタイマ19と、閾値判定部18が真と判定した際に、タイマ19の所定周期でスイッチ14の開放/閉止を制御する制御手段191とを有する。
【選択図】 図2

Description

本発明は、音声の再生及び停止を制御する音声再生装置及びプログラムに関する。特に、IP(Internet Protocol)電話及びIPテレビ電話のような会話を目的とした音声再生装置等に関する。
図1は、従来技術によるデジタル音声再生装置の機能構成図である。
図1のデジタル音声再生装置1は、圧縮音声データを含むパケットを受信しつつ再生する装置である。音声再生装置1は、音声パケット受信部11、音声デコーダ12、バッファ13、スイッチ14、D/A変換部15、増幅器16及び初期バッファリング判定部17を有する。音声パケット受信部11は、ネットワークから圧縮音声データを含むパケットを受信し、その圧縮音声データを音声デコーダ12へ出力する。音声デコーダ12は、圧縮音声データを復号し、非圧縮PCM(Pulse Code Modulation)データに変換し、そのPCMデータをバッファ13へ出力する。バッファ13は、PCMデータを一時的に蓄積し、スイッチ14を介してD/A変換部15へ出力する。初期バッファリング判定部17は、バッファ13のバッファ蓄積量を監視し、そのバッファ蓄積量に基づいて、スイッチ14の開放/閉止を制御する。D/A変換部15は、スイッチ14を介して入力されたPCMデータをアナログ音声信号に変換し、増幅器16に出力する。増幅器16から出力されたアナログ音声信号は、スピーカ2によって再生される。
初期バッファリング判定部17は、NORゲート171と、コンパレータ172と、RSフリップフロップ173と、閾値記憶部174とを有する。NORゲート171は、バッファ13のバッファ蓄積量が0となった際に、H信号をフリップフロップ173へ出力する。コンパレータ172は、バッファ13のバッファ蓄積量と、閾値記憶部174の初期バッファリング値とを比較し、バッファ蓄積量が初期バッファリング値以下になった際に、H信号をフリップフロップ173へ出力する。フリップフロップ173は、セット状態又はリセット状態によって、スイッチ14の開放/閉止を制御する。
以下では、初期バッファリング判定部17の動作について説明する。
初期状態について、バッファ13にはPCMデータが全く蓄積されていない。従って、NORゲート171には0が入力され、その出力はH信号となる。これにより、フリップフロップ173はセット状態となり、スイッチ114は開放される。従って、音声デコーダ12から出力されたPCMデータは、バッファ13に蓄積されていくこととなる。
その後、バッファ13に蓄積されたPCMデータのバッファ蓄積量が、初期バッファリング値以上になった際に、コンパレータ172はH信号を出力する。これにより、フリップフロップ173はリセット状態となり、スイッチ114は閉止される。従って、バッファ13に蓄積されたPCMデータは、D/A変換部15に入力され、増幅器16を介してスピーカ2から音声が再生される。
このように、音声データを含むパケットを受信しつつ再生する場合、ネットワークのレート(伝送速度)変動等によって、パケットの受信時刻に揺らぎが生じると、バッファ蓄積量の時間換算値より長い時間に渡ってパケット受信が滞ることとなる。このとき、バッファ内データが全て取り出され、アンダーフロー状態となる場合がある。
バッファ13に蓄積されたPCM(Pulse Code Modulation)データのバッファ蓄積量が0(アンダーフロー)になると、NOTゲート171の出力がH信号となり、フリップフロップ173はセット状態となり、スイッチ114は開放される。そうすると、音声デコーダ12から出力されるPCMデータは、バッファ13に蓄積されていくこととなる。その後、バッファ13に蓄積されたPCMデータのバッファ蓄積量が、初期バッファリング値以上になった際、スイッチ114は閉止される。
このような動作をリバッファリング動作と称し、スイッチ114が閉止されている間は、再生が停止されることによる音途切れが生じる。
音声パケットが遅延なく到着すれば、バッファ蓄積量は、初期バッファリングレベルのバッファ蓄積量の辺りで推移する。しかしながら、音声パケットの到着に遅延が生ずると、バッファ蓄積量が低下することとなる。そして、アンダーフロー状態となれば、リバッファリング動作による音途切れが生じる。一方、遅延が解消され、遅延データが一度に到着すると、バッファ蓄積量は急激に増加することとなる。
初期バッファリング及びリバッファリングは、再度、バッファアンダーフローを生じないようにある程度長い時間が必要とされる。IP電話又はIPテレビ電話のようなリアルタイム系のアプリケーションの場合は、遅延量とのトレードオフを考慮して、一般に100m秒〜数100m秒とする。また、映像ストリーミングのような非リアルタイム系のアプリケーションの場合は、安定性を重視して、一般に数秒程度とする。
尚、先行公知文献としては、デジタル音声送受信装置におけるバッファリングについて、無音区間を利用して、バッファの読み出し位置と書き込み位置との間隔を調整する技術、即ち遅延を調整する技術がある(例えば特許文献1参照)。
特表2003−503890号
しかしながら、IP電話又はIPテレビ電話のような会話を目的としたアプリケーションの場合、100m秒を越える音途切れは、聴感上十分認知され、声が聞き取れないといった支障をきたす。従って、音声データを含むパケットを受信しつつ再生する場合において音声品質を向上させるためには、リバッファリングによって生じる音途切れ時間を短くすることが必要となる。
従って、本発明は、リバッファリングによる音途切れ時間を短くすることができる音声再生装置及びプログラムを提供することを目的とする。
本発明の音声再生装置によれば、
音声データを一時的に蓄積するバッファ手段と、
バッファ手段から再生手段へ出力される音声データを、開放/閉止によって制御するスイッチと、
バッファ手段のバッファ蓄積量を監視し、バッファ蓄積量が閾値以下であることを判定する閾値判定手段と、
トリガパルスを出力するタイマと、
閾値判定手段が真と判定した際に、タイマの所定周期でスイッチの開放/閉止を制御する第1の制御手段とを有することを特徴とする。
本発明の音声再生装置における他の実施形態によれば、閾値判定手段は、閾値を記憶しており、所定時間以前の過去時間のバッファ蓄積量が閾値よりも大きく、且つ、現在時間のバッファ蓄積量が閾値よりも小さいことを判定する閾値別判定手段を含むことも好ましい。
また、本発明の音声再生装置における他の実施形態によれば、閾値判定手段は、複数の閾値別判定手段を含み、いずれか1つの該閾値別判定手段が真と判定した際に、閾値判定手段は真と判定するように構成されていることも好ましい。
更に、本発明の音声再生装置における他の実施形態によれば、少なくとも1つの閾値は、音声再生のために動作当初に必要となる初期バッファリング値であることも好ましい。
更に、本発明の音声再生装置における他の実施形態によれば、タイマは、音声符号化の1フレーム分に相当する時間周期であることも好ましい。
更に、本発明の音声再生装置における他の実施形態によれば、
閾値判定手段は、真と判定した際にH信号を出力し、偽と判定した際にL信号を出力し、
タイマは、所定周期でH信号及びL信号を出力するものであり、
第1の制御手段は、閾値判定手段の出力信号とタイマの出力信号とを入力とするANDゲートであって、その出力信号がスイッチの開放/閉止を制御することも好ましい。
更に、本発明の音声再生装置における他の実施形態によれば、
閾値判定手段は、真と判定した際にH信号を出力し、偽と判定した際にL信号を出力し、
タイマは、所定周期でH信号及びL信号を出力するものであり、
第1の制御手段は、閾値判定手段の出力信号とタイマの出力信号とを入力とするANDゲートであり、
バッファ手段のバッファ蓄積量を監視し、バッファ蓄積量が初期バッファリング値以下である場合にH信号を出力する初期バッファリング判定手段と、
第1の制御手段の出力信号と初期バッファリング判定手段の出力信号とを入力するORゲートであって、その出力信号がスイッチの開放/閉止を制御する第2の制御手段とを更に有することも好ましい。
本発明の音声再生プログラムによれば、
音声データを一時的に蓄積するバッファ手段と、
バッファ手段から再生手段へ出力される音声データを、開放/閉止によって制御するスイッチと、
バッファ手段のバッファ蓄積量を監視し、バッファ蓄積量が閾値以下であることを判定する閾値判定手段と、
トリガパルスを出力するタイマと、
閾値判定手段が真と判定した際に、タイマの所定周期でスイッチの開放/閉止を制御する第1の制御手段と
してコンピュータを機能させることを特徴とする。
本発明の音声再生プログラムにおける他の実施形態によれば、
閾値判定手段は、閾値を記憶しており、所定時間以前の過去時間のバッファ蓄積量が閾値よりも大きく、且つ、現在時間のバッファ蓄積量が閾値よりも小さいことを判定する閾値別判定手段を含むようにコンピュータを機能させることも好ましい。
また、本発明の音声再生プログラムにおける他の実施形態によれば、
閾値判定手段は、複数の閾値別判定手段を含み、いずれか1つの該閾値別判定手段が真と判定した際に、閾値判定手段は真と判定するようにコンピュータを機能させることも好ましい。
更に、本発明の音声再生プログラムにおける他の実施形態によれば、
少なくとも1つの閾値は、音声再生のために動作当初に必要となる初期バッファリング値であることも好ましい。
更に、本発明の音声再生プログラムにおける他の実施形態によれば、
タイマは、音声符号化の1フレーム分に相当する時間周期であることも好ましい。
更に、本発明の音声再生プログラムにおける他の実施形態によれば、
閾値判定手段は、真と判定した際にH信号を出力し、偽と判定した際にL信号を出力し、
タイマは、所定周期でH信号及びL信号を出力するものであり、
第1の制御手段は、閾値判定手段の出力信号とタイマの出力信号とを入力とするANDゲートであって、その出力信号がスイッチの開放/閉止を制御するようにコンピュータを機能させることも好ましい。
更に、本発明の音声再生プログラムにおける他の実施形態によれば、
閾値判定手段は、真と判定した際にH信号を出力し、偽と判定した際にL信号を出力し、
タイマは、所定周期でH信号及びL信号を出力するものであり、
第1の制御手段は、閾値判定手段の出力信号とタイマの出力信号とを入力とするANDゲートであり、
バッファ手段のバッファ蓄積量を監視し、バッファ蓄積量が初期バッファリング値以下である場合にH信号を出力する初期バッファリング判定手段と、
第1の制御手段の出力信号と初期バッファリング判定手段の出力信号とを入力するORゲートであって、その出力信号がスイッチの開放/閉止を制御する第2の制御手段として更にコンピュータを機能させることも好ましい。
本発明によれば、バッファアンダーフローを生じる前段階において、聴感上認知されにくい微小区間の音途切れを前もって挿入することにより、初期遅延レベルに近いバッファ蓄積量を維持し、アンダーフロー状態に達することを事前に回避することができる。
本発明によれば、一瞬だけ音声再生が停止するため音途切れを生じる。しかしながら、音声が断となっている時間が20m秒と非常に短く、聴感上は一瞬雑音が入ったように聞こえるだけであり、会話用途にも一切支障をきたすことはない。この再生を停止した時間は、バッファからPCMデータを抜き取らないため、バッファ蓄積量の回復が期待でき、大きな音途切れの原因となるバッファアンダーフロー時のリバッファリングの頻度を、大きく低減することができる。
以下では、図面を用いて、本発明を実施するための最良の形態について詳細に説明する。
図2は、本発明におけるデジタル音声再生装置の基本的な機能構成図である。以下では、音声再生装置の機能について説明するが、各機能はプログラムによって実装され、そのプログラムをコンピュータが実行することによって各機能が実現される。
図2の音声再生装置1は、図1と比較して、タイマ19と、タイマ用ANDゲート191とを更に有し、初期バッファリング判定部17に代えて閾値判定部18を有する。閾値判定部18は、閾値を記憶する閾値記憶部189と、バッファ13のバッファ蓄積量と当該閾値とを比較し、例えばバッファ蓄積量が閾値以下であれば、真となるH信号を出力し、そうでなければL信号を出力する。タイマ19は、一般的な音声符号化の1フレーム分に相当する20m秒のトリガパルス信号を出力する。タイマ用ANDゲート191は、閾値判定部18からの判定信号(H信号/L信号)と、タイマ19からのトリガパルス信号(H信号/L信号)とが入力される。
動作開始時は、バッファ13のバッファ蓄積量は0であるために、バッファ蓄積量は閾値以下となり、コンパレータ180は真と判定するH信号を出力する。タイマ用ANDゲート191は、タイマ19のトリガパルスのH信号及びL信号に依存して、H信号及びL信号を出力する。スイッチ14は、タイマ19のトリガパルスにおける20m秒の期間だけ、H信号によって開放状態になされ、L信号によって閉止状態になされる。スイッチ14が開放状態になされると、バッファ13のPCMデータはD/A変換部15に出力されず、バッファ13内に蓄積されていく。一方、スイッチ14が閉止状態になされると、バッファ13のPCMデータはD/A変換部15に出力され、その音声信号が再生される。
最初は、20m秒間隔で音途切れが生じるものの、次第にバッファ13のバッファ蓄積量が増大し、アンダーフロー状態が解消されていく。バッファ13のバッファ蓄積量が閾値以上になると、コンパレータ180は偽と判定するL信号を出力する。タイマ用ANDゲート191は、タイマ19のトリガパルスのH信号及びL信号に依存することなく、L信号を出力する。スイッチ14は、L信号によって閉止状態になされ、バッファ13のPCMデータはD/A変換部15に出力され、その音声信号は音途切れを生じることなく再生される。
その後、ネットワークから受信するパケットの到着が遅延し、バッファ13からPCMデータが抜き取られ、バッファ13に蓄積されているPCMデータが、閾値以下になったとする。このとき、コンパレータ180は真と判定するH信号を出力する。タイマ用ANDゲート191は、タイマ19のトリガパルスのH信号及びL信号に依存して、H信号及びL信号を出力する。スイッチ14は、タイマ19のトリガパルスにおける20m秒の期間だけ、H信号によって開放状態になされ、L信号によって閉止状態になされる。これにより、音途切れが発生するけれども、次第にバッファ13のバッファ蓄積量が増大していく。
そして、バッファ13のバッファ蓄積量が閾値以上になると、コンパレータ180は偽と判定するL信号を出力する。タイマ用ANDゲート191は、タイマ19のトリガパルスのH信号及びL信号に依存することなく、L信号を出力する。スイッチ14は、L信号によって閉止状態になされ、バッファ13のPCMデータはD/A変換部15に出力され、その音声信号は音途切れを生じることなく再生される。
図3は、本発明における第2のデジタル音声再生装置の機能構成図である。
図3の音声再生装置は、図2と比較して、初期バッファリング判定部17及びスイッチ用ORゲート190を更に有する。また、閾値判定部18は、複数のコンパレータによって構成されている。基本構成である図2の音声再生装置によれば、動作開始時(初期バッファリングレベルに至るまでの間)には、必ず音途切れが生じる。これに対し、図3の音声再生装置は、閾値の設定によって動作開始時における音途切れが発生しない。また、従来技術とおりアンダーフロー状態を判定するだけでなく、アンダーフロー状態に至るまでに段階的に閾値を設けることによって、音途切れを生じさせる回数をバッファ蓄積量に応じて制御することができる。
閾値判定部18は、複数のコンパレータ180〜183と、ANDゲート184及び185と、ORゲート186と、閾値記憶部187及び188と、遅延回路189とを有する。遅延回路189は、現在時間よりも所定時間以前の過去のバッファ蓄積量を出力することができる。20m秒の音途切れを生じさせるとするならば、その遅延時間は例えば30m秒程度に設定する。閾値記憶部187及び188はそれぞれ、バッファ蓄積量がアンダーフロー状態に至る前段階における閾値を記憶する。2つの閾値を設定する場合、例えば以下のように設定することができる。
第1の閾値 = 初期バッファリング値
第2の閾値 = 第1の閾値 / 2
片方向の音声データの配信のように、エンド−エンド間の通信の遅延が大きくても良い場合には、初期バッファ値を大きくして、ネットワークの遅延変動にも柔軟に対応できるようにすることができる。しかしながら、IP電話又はIPテレビ電話(VoIP)のような場合、会話が目的であるために、遅延が少ないことが要求される。従って、初期バッファ値を大きくすることができず、バッファに余裕のない状態で通信を行わなければならない。
図3の閾値判定部18は、2つのコンパレータ(180及び181、182及び183)の組を、2個備えている。尚、コンパレータの組は、閾値の個数分存在するものであって、閾値の個数に応じて任意に拡張することができる。
コンパレータ180は「過去時間のバッファ蓄積量 > 第1の閾値」を判定する。
コンパレータ181は「第1の閾値 > 現在時間のバッファ蓄積量」を判定する。
コンパレータ182は「過去時間のバッファ蓄積量 > 第2の閾値」を判定する。
コンパレータ183は「第2の閾値 > 現在時間のバッファ蓄積量」を判定する。
このような判定は、所定時間間隔(過去時間から現在時間までの時間間隔)で閾値を跨ぐようなバッファ蓄積量の低下を生じたか否かを判定する。
ANDゲート184は、コンパレータ180及び181が共に真になった場合に、H信号を出力する。ANDゲート185は、コンパレータ182及び183が共に真になった場合に、H信号を出力する。ORゲート186は、いずれかのコンパレータの組の判定が真となれば、H信号を出力する。このH信号を出力すると同時に、タイマ19のトリガパルスが出力されるようにすることもできる。
タイマ用ANDゲート191は、閾値判定部18(ORゲート186)の出力信号と、タイマ19の出力信号とを入力とする。閾値判定部18からの出力信号は、第1の閾値又は第2の閾値のいずれかを満たす場合、H信号となる。従って、タイマ用ANDゲート191の出力信号は、タイマ19のH信号に対して、H信号を出力する。
スイッチ用ORゲート190は、タイマ用ANDゲート191の出力信号と、初期バッファリング判定部17の出力信号とを入力とする。タイマ用ANDゲート191からの出力信号は、第1の閾値又は第2の閾値のいずれかを満たし且つタイマ19のH信号であるか、又は、初期バッファリング判定部17がアンダーフロー状態であるとするH信号である場合、H信号を出力する。このH信号によって、スイッチ14は開放され、バッファ13からD/A変換部15への音声データの出力が停止される。
本発明を、具体的に数値によって説明する。例えば、音声デコーダの出力データが、標本化周波数8000Hz、量子化ビット数16bit、チャンネル:モノラルとする。このとき、初期遅延量を100m秒(0.1秒)とすると、再生を開始する初期バッファリング値は1600byteとなる。
8000Hz × 16bit / 8bit × 0.1秒 = 1600byte
バッファへの入力レートと出力レートとが同じであれば、バッファ蓄積量は、初期遅延レベル(1600byte)近辺で推移する。しかしながら、音声データの到着に遅延が生ずると、バッファ蓄積量が低下することとなる。一方、遅延が解消され、遅延データが一度に到着すると、バッファ蓄積量は急激に増加することとなる。
ここで、初期バッファリング値が1600byteとすれば、例えば、以下のような3つの閾値、第1の閾値=1200byte、第2の閾値=800byte、第3の閾値=400byteと設定することができる。
Bin(t)は、時刻tまでにバッファに入力されたデータの合計値とする。
Bout(t)は、時間tの間、バッファから抜き取られたデータの合計値とする。
音声データの場合、Bout(t) = 8000Hz × 16bit / 8bit × t
t0は、初期バッファリングを行った時間(再生が停止していた時間)とする。
そうすると、通常時、バッファ蓄積量B(t)は、以下のようになる。
B(t) = Bin(t) − Bout(t - t0)
通信開始時、1600byte付近で動作していたバッファ蓄積量が、パケット受信の遅延によって第1の閾値1200byte以下になったとする。その瞬間に、20m秒の音途切れを生じさせる。これにより、20m秒だけバッファから音声データが抜き取られず、バッファ蓄積量が増加することとなる。即ち、バッファ蓄積量が下がるのを抑止することができる。このとき、バッファ蓄積量B(t)は、以下のようになる。
B(t) = Bin(t) − Bout(t−0.1秒−0.02秒)
それでも更にパケットの受信が滞り、Binの増大につながらない場合、第2の閾値800byte以下になったとする。その瞬間に、再度、20m秒の音途切れを生じさせる。これにより、20m秒だけバッファから音声データが抜き取られず、バッファ蓄積量が増加することとなる。このとき、バッファ蓄積量B(t)は、以下のようになる。
B(t) = Bin(t) − Bout(t−0.1秒−0.02秒−0.02秒)
前述した実施形態によれば、スイッチの開放/閉止によって音声の再生及び停止を制御しているけれども、例えばD/A変換部の動作を止めるなど、バッファからのデータ抜き取りを行わないようにする任意の手段が適用できる。
前述した本発明における送信方法、送信プログラム及び送信装置の種々の実施形態によれば、本発明の技術思想及び見地の範囲の種々の変更、修正及び省略を、当業者は容易に行うことができる。前述の説明はあくまで例であって、何ら制約しようとするものではない。本発明は、特許請求の範囲及びその均等物として限定するものにのみ制約される。
従来技術によるデジタル音声再生装置の機能構成図である。 本発明における第1のデジタル音声再生装置の機能構成図である。 本発明における第2のデジタル音声再生装置の機能構成図である。
符号の説明
1 音声再生装置
11 音声パケット受信部
12 音声デコーダ
13 バッファ
14 スイッチ
15 D/A変換部
16 増幅器
17 初期バッファリング判定部
171 NORゲート
172 コンパレータ
173 RSフリップフロップ
174 閾値記憶部
18 閾値判定部
180〜183 コンパレータ
184、185 ANDゲート
186 ORゲート
187 第1の閾値記憶部
188 第2の閾値記憶部
189 遅延回路
19 タイマ
190 スイッチ用ORゲート
191 タイマ用ANDゲート
2 スピーカ

Claims (14)

  1. 音声データを一時的に蓄積するバッファ手段と、
    前記バッファ手段から再生手段へ出力される前記音声データを、開放/閉止によって制御するスイッチと、
    前記バッファ手段のバッファ蓄積量を監視し、前記バッファ蓄積量が閾値以下であることを判定する閾値判定手段と、
    トリガパルスを出力するタイマと、
    前記閾値判定手段が真と判定した際に、前記タイマの所定周期で前記スイッチの開放/閉止を制御する第1の制御手段と
    を有することを特徴とする音声再生装置。
  2. 前記閾値判定手段は、前記閾値を記憶しており、所定時間以前の過去時間のバッファ蓄積量が前記閾値よりも大きく、且つ、現在時間のバッファ蓄積量が前記閾値よりも小さいことを判定する閾値別判定手段を含むことを特徴とする請求項1に記載の音声再生装置。
  3. 前記閾値判定手段は、複数の前記閾値別判定手段を含み、いずれか1つの該閾値別判定手段が真と判定した際に、前記閾値判定手段は真と判定するように構成されていることを特徴とする請求項1又は2に記載の音声再生装置。
  4. 少なくとも1つの前記閾値は、音声再生のために動作当初に必要となる初期バッファリング値であることを特徴とする請求項1から3のいずれか1項に記載の音声再生装置。
  5. 前記タイマは、音声符号化の1フレーム分に相当する時間周期であることを特徴とする請求項1から4のいずれか1項に記載の音声再生装置。
  6. 前記閾値判定手段は、真と判定した際にH信号を出力し、偽と判定した際にL信号を出力し、
    前記タイマは、前記所定周期でH信号及びL信号を出力するものであり、
    前記第1の制御手段は、前記閾値判定手段の出力信号と前記タイマの出力信号とを入力とするANDゲートであって、その出力信号が前記スイッチの開放/閉止を制御することを特徴とする請求項1から5のいずれか1項に記載の音声再生装置。
  7. 前記閾値判定手段は、真と判定した際にH信号を出力し、偽と判定した際にL信号を出力し、
    前記タイマは、前記所定周期でH信号及びL信号を出力するものであり、
    前記第1の制御手段は、前記閾値判定手段の出力信号と前記タイマの出力信号とを入力とするANDゲートであり、
    前記バッファ手段のバッファ蓄積量を監視し、前記バッファ蓄積量が初期バッファリング値以下である場合にH信号を出力する初期バッファリング判定手段と、
    前記第1の制御手段の出力信号と前記初期バッファリング判定手段の出力信号とを入力するORゲートであって、その出力信号が前記スイッチの開放/閉止を制御する第2の制御手段とを更に有することを特徴とする請求項1から5のいずれか1項に記載の音声再生装置。
  8. 音声データを一時的に蓄積するバッファ手段と、
    前記バッファ手段から再生手段へ出力される前記音声データを、開放/閉止によって制御するスイッチと、
    前記バッファ手段のバッファ蓄積量を監視し、前記バッファ蓄積量が閾値以下であることを判定する閾値判定手段と、
    トリガパルスを出力するタイマと、
    前記閾値判定手段が真と判定した際に、前記タイマの所定周期で前記スイッチの開放/閉止を制御する第1の制御手段と
    してコンピュータを機能させることを特徴とする音声再生プログラム。
  9. 前記閾値判定手段は、前記閾値を記憶しており、所定時間以前の過去時間のバッファ蓄積量が前記閾値よりも大きく、且つ、現在時間のバッファ蓄積量が前記閾値よりも小さいことを判定する閾値別判定手段を含むようにコンピュータを機能させることを特徴とする請求項8に記載の音声再生プログラム。
  10. 前記閾値判定手段は、複数の前記閾値別判定手段を含み、いずれか1つの該閾値別判定手段が真と判定した際に、前記閾値判定手段は真と判定するようにコンピュータを機能させることを特徴とする請求項8又は9に記載の音声再生プログラム。
  11. 少なくとも1つの前記閾値は、音声再生のために動作当初に必要となる初期バッファリング値であることを特徴とする請求項8から10のいずれか1項に記載の音声再生プログラム。
  12. 前記タイマは、音声符号化の1フレーム分に相当する時間周期であることを特徴とする請求項8から11のいずれか1項に記載の音声再生プログラム。
  13. 前記閾値判定手段は、真と判定した際にH信号を出力し、偽と判定した際にL信号を出力し、
    前記タイマは、前記所定周期でH信号及びL信号を出力するものであり、
    前記第1の制御手段は、前記閾値判定手段の出力信号と前記タイマの出力信号とを入力とするANDゲートであって、その出力信号が前記スイッチの開放/閉止を制御するようにコンピュータを機能させることを特徴とする請求項8から12のいずれか1項に記載の音声再生プログラム。
  14. 前記閾値判定手段は、真と判定した際にH信号を出力し、偽と判定した際にL信号を出力し、
    前記タイマは、前記所定周期でH信号及びL信号を出力するものであり、
    前記第1の制御手段は、前記閾値判定手段の出力信号と前記タイマの出力信号とを入力とするANDゲートであり、
    前記バッファ手段のバッファ蓄積量を監視し、前記バッファ蓄積量が初期バッファリング値以下である場合にH信号を出力する初期バッファリング判定手段と、
    前記第1の制御手段の出力信号と前記初期バッファリング判定手段の出力信号とを入力するORゲートであって、その出力信号が前記スイッチの開放/閉止を制御する第2の制御手段として更にコンピュータを機能させることを特徴とする請求項8から12のいずれか1項に記載の音声再生プログラム。
JP2004301611A 2004-10-15 2004-10-15 音声の再生及び停止を制御する音声再生装置及びプログラム Expired - Fee Related JP4561301B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2004301611A JP4561301B2 (ja) 2004-10-15 2004-10-15 音声の再生及び停止を制御する音声再生装置及びプログラム
US11/247,271 US7650422B2 (en) 2004-10-15 2005-10-12 Audio playback apparatus for controlling pause and resume of audio

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004301611A JP4561301B2 (ja) 2004-10-15 2004-10-15 音声の再生及び停止を制御する音声再生装置及びプログラム

Publications (2)

Publication Number Publication Date
JP2006113375A true JP2006113375A (ja) 2006-04-27
JP4561301B2 JP4561301B2 (ja) 2010-10-13

Family

ID=36381938

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004301611A Expired - Fee Related JP4561301B2 (ja) 2004-10-15 2004-10-15 音声の再生及び停止を制御する音声再生装置及びプログラム

Country Status (2)

Country Link
US (1) US7650422B2 (ja)
JP (1) JP4561301B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010035082A (ja) * 2008-07-31 2010-02-12 Seiko Epson Corp 伝送装置、伝送システム、プログラムおよび情報記憶媒体

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8223975B2 (en) * 2008-06-19 2012-07-17 Xm Satellite Radio Inc. Method and apparatus for multiplexing audio program channels from one or more received broadcast streams to provide a playlist style listening experience to users
US9008812B2 (en) 2008-06-19 2015-04-14 Sirius Xm Radio Inc. Method and apparatus for using selected content tracks from two or more program channels to automatically generate a blended mix channel for playback to a user upon selection of a corresponding preset button on a user interface
KR100724899B1 (ko) * 2005-11-22 2007-06-04 삼성전자주식회사 호환성있는(compatible) 프로그레시브 다운로드방법 및 그 시스템
US7715404B2 (en) * 2007-11-15 2010-05-11 Lockheed Martin Corporation Method and apparatus for controlling a voice over internet protocol (VoIP) decoder with an adaptive jitter buffer
WO2009070343A1 (en) 2007-11-27 2009-06-04 Xm Satellite Radio Inc Method for multiplexing audio program channels to provide a playlist
WO2009092450A1 (en) * 2008-01-25 2009-07-30 Global Infinipool Gmbh Method for coordinating processing in a distributed system

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002330181A (ja) * 2001-04-27 2002-11-15 Toa Corp 受信装置及び受信再生方法
JP2003046490A (ja) * 2001-07-30 2003-02-14 Mitsubishi Electric Corp 音声伝送装置
JP2004264497A (ja) * 2003-02-28 2004-09-24 Mitsubishi Electric Corp 音声復号装置

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6092128A (en) * 1997-08-28 2000-07-18 Cypress Semiconductor Corp. Ethernet repeater that couples an input data stream to multiple output data streams of differing rates and provides access to a shared bus by a number of inputs and outputs
US6715126B1 (en) * 1998-09-16 2004-03-30 International Business Machines Corporation Efficient streaming of synchronized web content from multiple sources
US6665751B1 (en) * 1999-04-17 2003-12-16 International Business Machines Corporation Streaming media player varying a play speed from an original to a maximum allowable slowdown proportionally in accordance with a buffer state
US6671292B1 (en) 1999-06-25 2003-12-30 Telefonaktiebolaget Lm Ericsson (Publ) Method and system for adaptive voice buffering
US6996624B1 (en) * 2001-09-27 2006-02-07 Apple Computer, Inc. Reliable real-time transport protocol
GB0226520D0 (en) * 2002-11-14 2002-12-18 Ibm Method and apparatus for an interactive voice response system

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002330181A (ja) * 2001-04-27 2002-11-15 Toa Corp 受信装置及び受信再生方法
JP2003046490A (ja) * 2001-07-30 2003-02-14 Mitsubishi Electric Corp 音声伝送装置
JP2004264497A (ja) * 2003-02-28 2004-09-24 Mitsubishi Electric Corp 音声復号装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010035082A (ja) * 2008-07-31 2010-02-12 Seiko Epson Corp 伝送装置、伝送システム、プログラムおよび情報記憶媒体

Also Published As

Publication number Publication date
US20060104314A1 (en) 2006-05-18
US7650422B2 (en) 2010-01-19
JP4561301B2 (ja) 2010-10-13

Similar Documents

Publication Publication Date Title
US8937963B1 (en) Integrated adaptive jitter buffer
KR100964437B1 (ko) V o I P 용 적응성 디-지터 버퍼
EP2140635B1 (en) Method and apparatus for modifying playback timing of talkspurts within a sentence without affecting intelligibility
US9437216B2 (en) Method of transmitting data in a communication system
US7650422B2 (en) Audio playback apparatus for controlling pause and resume of audio
KR20140108119A (ko) 음성 복호 장치
JP4454255B2 (ja) 音声/fax通信システム、音声/fax受信装置および揺らぎ吸収バッファ量制御方法
JP4050961B2 (ja) パケット型音声通信端末
EP0676868B1 (en) Audio signal transmission apparatus
JP4338083B2 (ja) ディジタル音声再生装置
JP2006253843A (ja) 音声データ補間装置と音声データ補間方法
JP4534582B2 (ja) 音声ストリーム再生装置及び音声ストリーム再生方法
JPS63257367A (ja) 音声パケツト通信方法
JP3648231B2 (ja) 電話通信装置と音声データの処理方法及びその処理プログラム
JPH01241240A (ja) 音声信号処理装置
JP2012205066A (ja) 音声データ処理装置
JP2006100933A (ja) 音声通信装置
AU2012200349A1 (en) Method of transmitting data in a communication system
JP2004205638A (ja) 無音圧縮装置
JP2007184949A (ja) 音声通信方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070905

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100409

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100420

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100608

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100706

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100719

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130806

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4561301

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees