WO2011033780A1

WO2011033780A1 - 端末装置、音声出力方法および情報処理システム

Info

Publication number: WO2011033780A1
Application number: PCT/JP2010/005670
Authority: WO
Inventors: 渋谷清人; 中村仁; 柴田勝彦; 柳瀬和大; 山口明俊; 森田章義; 風間幸一
Original assignee: 株式会社ソニー・コンピュータエンタテインメント
Priority date: 2009-09-18
Filing date: 2010-09-16
Publication date: 2011-03-24
Also published as: US20120245929A1; JP2011066842A; CN102648606A; EP2472804B1; JP5443918B2; US8949115B2; CN102648606B; EP2472804A4; EP2472804A1

Abstract

　音声出力端末装置１００において、バッファ制御部１２２は、指示受付部１２０において設定指示された音声出力モードに応じて、ジッタバッファ１２８のバッファサイズを調節する。指示受付部１２０が、音声出力の低遅延を要求する音声出力モードの設定指示を受け付けると、バッファ制御部１２２が、ジッタバッファ１２８のバッファサイズを縮小する。またバッファ制御部１２２は、設定指示された音声出力モードに応じて、メディアバッファがジッタバッファ１２８に音声パケットを送出するタイミングを制御する。

Description

端末装置、音声出力方法および情報処理システム

　本発明は、端末装置に関し、特に音声パケットを受信して音声出力する端末装置、および音声出力端末装置を備えたシステムに関する。

　Ｂｌｕｅｔｏｏｔｈ（登録商標）プロトコルを利用した近距離ワイヤレス通信システムが開発され、実用化されている。このような近距離ワイヤレス通信システムでは、パーソナルコンピュータやプリンタ、デジタルカメラなどの電子機器間をケーブルを使用せずに接続できる。近年では、Ｂｌｕｅｔｏｏｔｈプロトコルを利用したヘッドセットも開発されている。ワイヤレスヘッドセットは、音源との間をつなぐケーブルを不要とするため、たとえばユーザが音楽を聴くような場合に、ケーブルが絡まるなどの煩わしさから解放される利点がある。

特開２００３－３０９５４１号公報

　携帯型のゲーム装置が普及し、ユーザは、電車内や屋外など、様々な環境下でゲームを楽しむことができるようになっている。ゲーム音声を聴くためにワイヤレスヘッドセットを用いる場合、ヘッドセットを経由して出力されるゲーム音声は、ゲーム装置のディスプレイに表示されるゲーム画像に対して必然的に遅れを生じる。アクション系ゲームやリズム系ゲームなどのゲームは、進行が早く、ゲーム画像に対してゲーム音声が大きく遅れることは好ましくない。一方で、ＲＰＧ系ゲームなどは、ゲームの進行が比較的緩やかであり、ゲーム画像に対するゲーム音声の遅れに対する要求は、それほどシビアではない。また、音楽再生のアプリケーションのように、音声と画像との同期が求められない場合には、画像に対する音声の遅れは許容されることが多い。

　そこで本発明は、無線送信された音声パケットが送信されてから音声出力されるまでの時間を、必要に応じて調整する技術を提供することを目的とする。

　上記課題を解決するために、本発明のある態様の端末装置は、音声パケットを受信する受信部と、受信した音声パケットを一時的に蓄積するジッタバッファと、ジッタバッファのバッファサイズを調節するバッファ制御部と、ジッタバッファから出力される音声パケットを復号する音声復号部と、音声出力モードの設定指示を受け付ける指示受付部と、を備える。バッファ制御部は、指示受付部において設定指示された音声出力モードに応じて、ジッタバッファのバッファサイズを調節する。

　本発明の別の態様は、音声出力方法である。この音声出力方法は、音声出力モードの設定指示を受け付けるステップと、設定指示された音声出力モードに応じて、音声パケットを一時的に蓄積するジッタバッファのバッファサイズを調節するステップと、音声パケットを受信するステップと、受信した音声パケットを、バッファサイズを調節されたジッタバッファに供給するステップと、ジッタバッファから出力される音声パケットを復号するステップとを備える。

　本発明の別の態様は、情報処理システムである。この情報処理システムは、ディスプレイに画像を出力する情報処理装置と、情報処理装置から無線送信される音声パケットを受信して音声を出力する音声出力端末装置とを備える。情報処理装置は、画像信号および音声信号を生成するアプリケーション処理部と、生成された画像信号を処理して、ディスプレイから画像を出力させる画像信号処理部と、生成された音声信号を処理して、音声パケットを生成する音声信号処理部と、音声パケットを送信する送信部とを備える。音声出力端末装置は、音声パケットを受信する受信部と、受信した音声パケットを一時的に蓄積するジッタバッファと、ジッタバッファのバッファサイズを調節するバッファ制御部と、ジッタバッファから出力される音声パケットを復号する音声復号部と、音声出力モードの設定指示を受け付ける指示受付部と、を備える。バッファ制御部は、指示受付部において設定指示された音声出力モードに応じて、ジッタバッファのバッファサイズを調節する。

　なお、以上の構成要素の任意の組合せ、本発明の表現を方法、装置、システム、記録媒体、コンピュータプログラムなどの間で変換したものもまた、本発明の態様として有効である。

本発明の実施例にかかる情報処理システムを示す図である。Ｂｌｕｅｔｏｏｔｈの状態遷移図である。本実施例に係る情報処理装置の外観構成を示す図である。情報処理装置の機能ブロックを示す図である。本実施例に係る音声出力端末装置の外観構成を示す図である。音声出力端末装置の機能ブロックを示す図である。バッファ制御部により調節されるジッタバッファのバッファサイズを示す図である。

　図１は、本発明の実施例にかかる情報処理システム１を示す。情報処理システム１は、アプリケーションを実行する情報処理装置１０と、情報処理装置１０から無線送信される音声パケットを受信して音声を出力する音声出力端末装置１００とを備える。

　情報処理装置１０は、アプリケーションを実行して、画像信号および音声信号を生成する。たとえば情報処理装置１０は、ゲームアプリケーションを実行し、ゲーム画像信号とゲーム音声信号を生成してもよい。情報処理装置１０はディスプレイを有し、画像信号を処理してディスプレイから画像出力させる。一方、情報処理装置１０は、音声信号を音声パケットに変換して、音声出力端末装置１００に無線送信する。音声出力端末装置１００は、たとえばワイヤレスヘッドセットであってよく、受信した音声パケットを復号して、音声出力する。情報処理装置１０と音声出力端末装置１００とは、たとえばＢｌｕｅｔｏｏｔｈプロトコルを用いて無線接続される。

　図２は、Ｂｌｕｅｔｏｏｔｈの状態遷移図を示す。図示のように、Ｂｌｕｅｔｏｏｔｈ端末の状態は、待ち受けフェーズ、同期確立フェーズ、通信接続フェーズに分けることができる。

　情報処理装置１０および音声出力端末装置１００の電源投入直後や通信リンクを切断した場合、情報処理装置１０および音声出力端末装置１００は「待ち受け」状態に入る。「待ち受け」状態では、データの送受信は行われない。同期確立フェーズにおいては、情報処理装置１０が、周辺の音声出力端末装置１００を含む端末機器に対して接続照会すなわち「問い合わせ」を行う状態と、情報処理装置１０および音声出力端末装置１００がそれぞれ互いを認識して「呼び出し」を行う状態とがある。「問い合わせ」状態では、情報処理装置１０が、近くにいる端末機器に対してＩＱ（問い合わせ）パケットをブロードキャストする。ＩＱパケットを受信した音声出力端末装置１００は、Bluetoothアドレスとクロック情報を含むＦＨＳ（Frequency Hop Synchronization）パケットを情報処理装置１０に返信する。

　たとえば情報処理装置１０が音声出力端末装置１００を呼び出す場合、情報処理装置１０は音声出力端末装置１００からＦＨＳパケットを受け取り、どのような音声出力端末装置１００が存在するかを把握した後、特定の音声出力端末装置１００に対してＩＤパケットを送信する。特定の音声出力端末装置１００からＩＤパケットに対する応答が返ると、情報処理装置１０はＦＨＳパケットを音声出力端末装置１００に送信し、自分のアドレスとクロックを音声出力端末装置１００に知らせる。これにより、情報処理装置１０と音声出力端末装置１００は、同一のホッピングパターンを共有できるようになる。なお、音声出力端末装置１００が情報処理装置１０を呼び出す場合は、以上の処理における動作主体が入れ替わる。

　「呼び出し」を行うと、音声出力端末装置１００と情報処理装置１０との間にピコネットが形成され、「接続」状態に入る。ピコネットとは、Ｂｌｕｅｔｏｏｔｈ端末同士を近づけたときに、端末の間で一時的に形成されるネットワークを意味し、最大で８台のＢｌｕｅｔｏｏｔｈ端末が１つのピコネットに参加することができる。１つのピコネットにおいて、呼び出しを行った装置は親機（マスタ）として機能し、最大７台の子機（スレーブ）と接続することが可能である。「接続」状態になると、通信リンク設定のための制御パケットが送受信され、これにより「データ転送」が可能となる。なお情報処理システム１において、音声出力端末装置１００が呼び出しを行ってマスタとなる場合、音声出力端末装置１００と情報処理装置１０との間でマスタとスレーブの役割をスイッチする。このスイッチにより、情報処理装置１０がマスタとなり、音声出力端末装置１００がスレーブとなる。

　図３は、本実施例に係る情報処理装置１０の外観構成を示す。情報処理装置１０は、スライド可能に連結された上側筐体２０および下側筐体３０を備える。図３には、下側筐体３０を上側筐体２０に対してスライドして、下側筐体３０の前面に設けられた操作キーが外部に露出する開状態となった情報処理装置１０が示される。

　上側筐体２０の前面にはディスプレイ２３が設けられる。下側筐体３０の前面には、方向キー３１ａ、３１ｂ、３１ｃ、３１ｄ（以下、総称する場合には「方向キー３１」と呼ぶ）、アナログパッド３２、マイク３３、スタートボタン３４、セレクトボタン３５、操作ボタン３６ａ、３６ｂ、３６ｃ、３６ｄ（以下、総称する場合には「操作ボタン３６」と呼ぶ）が設けられる。

　情報処理装置１０は携帯型ゲーム機であってよい。ユーザは、情報処理装置１０を開状態にして、ゲームアプリケーションを実行する。ユーザは、情報処理装置１０を把持しながら方向キー３１や操作ボタン３６などを操作して、ゲームを楽しむことができる。ディスプレイ２３にはゲーム画像が表示され、ゲーム音声は、Ｂｌｕｅｔｏｏｔｈプロトコルで接続された音声出力端末装置１００に送信される。

　図４は、情報処理装置１０の機能ブロックを示す。情報処理装置１０は、操作入力受付部４０、アプリケーション処理部４２、画像信号処理部４４、音声信号処理部４６および通信部４８を備える。操作入力受付部４０は、ユーザによる方向キー３１や操作ボタン３６の操作入力を受け付ける。アプリケーション処理部４２は、ゲームアプリケーションを実行し、ユーザからの操作入力を反映して、ゲームを進行させて、ゲームの画像信号および音声信号を生成する。この画像信号および音声信号は、本来は同期して、それぞれゲーム画像、ゲーム音声として出力されるべきものである。

　画像信号は画像信号処理部４４に供給され、画像信号処理部４４は、画像信号を処理して、ディスプレイ２３から画像を出力させる。音声信号は音声信号処理部４６に供給され、音声信号処理部４６は、音声信号を処理して、音声パケットを生成する。音声信号処理部４６は、ＭＴＵ（Maximum Transmission Unit）にしたがって、音声パケットのサイズを定める。ここでＭＴＵは、通信部４８が１回のデータ転送で送信できるパケットデータの最大値を示す値である。情報処理装置１０と音声出力端末装置１００との間に形成されるピコネットにおいて、音声出力端末装置１００のＭＴＵが、情報処理装置１０のＭＴＵよりも小さければ、音声信号処理部４６は、音声出力端末装置１００のＭＴＵに合わせて音声パケットのサイズを決定する。通信部４８は、音声信号処理部４６により生成された音声パケットを、音声出力端末装置１００に送信する。

　図５は、本実施例に係る音声出力端末装置１００の外観構成を示す。図５（ａ）は、音声出力端末装置１００の正面図であり、図５（ｂ）は、音声出力端末装置１００の右側面図であり、図５（ｃ）は、音声出力端末装置１００の上面図である。音声出力端末装置１００は、操作スイッチ１０２、電源ボタン１０４、モード切替スイッチ１０６、ＵＳＢ（Universal Serial Bus）ジャック１０８およびヘッドホン端子１１０を備える。操作スイッチ１０２は、ユーザにより操作されて、ゲーム音声の音量を調整するために利用される。モード切替スイッチ１０６は、ユーザにより操作されて、音声出力モードの設定を指示するために利用される。ＵＳＢジャック１０８は、音声出力端末装置１００を充電するために設けられ、ＰＣに接続するＵＳＢケーブルのコネクタを差し込まれることで、音声出力端末装置１００が充電される。ヘッドホン端子１１０には、ヘッドホンのコネクタが差し込まれる。

　本実施例においてユーザは、モード切替スイッチ１０６を操作して、ノーマルモードと低遅延モードのいずれかを設定する。ノーマルモードは、通常の音声出力モードであり、低遅延モードは、ノーマルモードに比して、音声出力の低遅延を要求する音声出力モードである。低遅延モードには、音声出力の低遅延が実現され、出力画像に対する出力音声の遅延が低減される利点があり、一方、ノーマルモードには、低遅延モードに比して、音切れの可能性が低減される、または省電力効果が高いなどの利点がある。ユーザは、実行するアプリケーションに応じて、音声出力モードを設定する。

　図６は、音声出力端末装置１００の機能ブロックを示す。音声出力端末装置１００は、指示受付部１２０、バッファ制御部１２２、通信部１２４、メディアバッファ１２６、ジッタバッファ１２８、音声復号部１３０およびスピーカ１３２を備える。音声出力端末装置１００の機能は、ＣＰＵ、メモリ、メモリにロードされたプログラムなどによって実現され、ここではそれらの連携によって実現される機能ブロックを描いている。したがってこれらの機能ブロックがハードウエアのみ、ソフトウエアのみ、またはそれらの組合せによっていろいろな形で実現できることは、当業者に理解されるところである。

　パケット通信システムにおいては、パケット転送にかかる遅延時間が変動するため、リアルタイム通信では、転送遅延の揺らぎ（ジッタ）が、通信品質に大きな影響をおよぼす。ジッタへの対策として、音声パケットの受信端末には、ジッタを吸収するためのバッファ（ジッタバッファ）が設けられる。受信端末では、ジッタバッファに予め定めたバッファサイズ分の音声パケットが蓄積されると、ジッタバッファから、所定時間分の音声パケットが音声復号部に読み出されて、音声再生が行われる。本実施例の音声出力端末装置１００も、情報処理装置１０から音声パケットをリアルタイム送信されるため、ジッタを吸収するためのジッタバッファ１２８を備えて構成されている。ジッタバッファ１２８は、ＦＩＦＯ形式のメモリである。

　通信部１２４は、情報処理装置１０から送信される音声パケットを受信する。ジッタバッファ１２８は、音声パケットを一時的に蓄積する。通信部１２４とジッタバッファ１２８の間には、通信部１２４で受信した音声パケットを一時的に蓄積して、ジッタバッファ１２８に送出するメディアバッファ１２６が設けられる。バッファ制御部１２２は、メディアバッファ１２６およびジッタバッファ１２８を管理し、それぞれの動作を制御する。音声復号部１３０は、ジッタバッファ１２８から出力される所定時間分の音声パケットを復号し、スピーカ１３２が音声を出力する。

　メディアバッファ１２６は、通信部１２４で受信した音声パケットを、定められた周期でジッタバッファ１２８に送出する。これによりジッタバッファ１２８におけるバッファリング処理を容易にし、バッファサイズを音声パケットの出力閾値とする制御を可能としている。メディアバッファ１２６は、ジッタバッファ１２８に音声パケットを周期的に送出する目的で設けられるため、多くの音声パケットを一時蓄積する必要はない。そのため、メディアバッファ１２６のサイズは、ジッタバッファ１２８のサイズよりも小さい。バッファ制御部１２２は、メディアバッファ１２６がジッタバッファ１２８に音声パケットを送出するタイミングを制御し、具体的にはメディアバッファ１２６がジッタバッファ１２８に音声パケットを送出する周期を設定する。

　本実施例の音声出力端末装置１００では、メディアバッファ１２６から送出された音声パケットの蓄積量が、ジッタバッファ１２８のバッファサイズに到達すると、ジッタバッファ１２８から音声復号部１３０に所定時間分の音声パケットが出力される。このようにジッタバッファ１２８のバッファサイズは、音声パケットを復号するタイミングに影響を与える。したがって、バッファサイズを小さくすることで、音声再生にかかる遅延を低減できることになる。そこでバッファ制御部１２２は、ユーザより指示された音声出力モードに応じて、ジッタバッファ１２８のバッファサイズを調節する。

　ユーザがモード切替スイッチ１０６を動かすと、指示受付部１２０が、モード切替スイッチ１０６の動きを、音声出力モードの設定指示として受け付ける。モード切替スイッチ１０６は、第１位置と第２位置との間で動かされる。モード切替スイッチ１０６が第１位置から第２位置に動かされると、指示受付部１２０が、低遅延モードの設定指示を受け付け、第２位置から第１位置に動かされると、ノーマルモードの設定指示を受け付ける。

　指示受付部１２０がノーマルモードの設定指示を受け付けると、バッファ制御部１２２は、ジッタバッファ１２８のバッファサイズをＭ（ワード）とする。一方、指示受付部１２０が低遅延モードの設定指示を受け付けると、バッファ制御部１２２は、ジッタバッファ１２８のバッファサイズをＮ（ワード）（Ｎ＜Ｍ）とする。低遅延モードにおいて、バッファ制御部１２２は、ノーマルモードのときと比べて、ジッタバッファ１２８のバッファサイズを縮小する。

　図７は、バッファ制御部１２２により調節されるジッタバッファ１２８のバッファサイズを示す。ノーマルモードにおいては、バッファサイズがＭワードに設定され、低遅延モードにおいては、バッファサイズがＮワードに設定される。本実施例の音声出力端末装置１００では、音声パケットの蓄積量がバッファサイズで特定されるデータ量に到達すると、所定時間分の音声パケット（図示の例ではＬワード分の音声パケット）が、音声復号部１３０に出力される（Ｌ≦Ｎ）。したがって、低遅延モードにおいて、ジッタバッファ１２８のバッファサイズを縮小することで、ノーマルモードと比較すると、（Ｍ－Ｎ）ワード分の音声パケットがジッタバッファ１２８に蓄積するのに要する時間を省略でき、低遅延で音声を出力することが可能となる。Ｎ／Ｍの値を、たとえば１／４以下に設定することで、ノーマルモードに比して、効果的に低遅延の音声出力を実現できる。

　バッファ制御部１２２は、指示受付部１２０において設定指示された音声出力モードに応じて、メディアバッファ１２６がジッタバッファ１２８に音声パケットを送出するタイミングを調節してもよい。指示受付部１２０がノーマルモードの設定指示を受け付けると、バッファ制御部１２２は、メディアバッファ１２６がジッタバッファ１２８に音声パケットを送出する周期をＴ１に設定する。一方、指示受付部１２０が低遅延モードの設定指示を受け付けると、バッファ制御部１２２は、メディアバッファ１２６がジッタバッファ１２８に音声パケットを送出する周期をＴ２（Ｔ２＜Ｔ１）に設定する。低遅延モードにおいて、バッファ制御部１２２は、ノーマルモードのときと比べて、メディアバッファ１２６による音声パケットの送出周期を短く設定する。

　低遅延モードにおいてメディアバッファ１２６による音声パケットの送出周期を短くすると、ジッタバッファ１２８に音声パケットが蓄積される速度があがる。したがって、ノーマルモードのときと比べて、ジッタバッファ１２８において、音声パケットの蓄積量がバッファサイズに到達するタイミングが早まり、したがってジッタバッファ１２８から音声パケットを音声復号部１３０に出力するタイミングも早めることができ、低遅延で音声を出力することが可能となる。

　またバッファ制御部１２２は、指示受付部１２０において設定指示された音声出力モードに応じて、ＭＴＵを調整してもよい。指示受付部１２０がノーマルモードの設定指示を受け付けると、バッファ制御部１２２は、ＭＴＵをＸ（バイト）に設定する。一方、指示受付部１２０が低遅延モードの設定指示を受け付けると、バッファ制御部１２２は、ＭＴＵをＹ（バイト）（Ｙ＜Ｘ）に設定する。低遅延モードにおいて、バッファ制御部１２２は、ノーマルモードのときと比べて、ＭＴＵを小さく設定する。

　低遅延モードにおいてＭＴＵを小さく設定すると、情報処理装置１０から音声出力端末装置１００に送信した音声パケットの到達タイミングが早くなる。したがって、ノーマルモードのときと比べて、ジッタバッファ１２８に音声パケットを蓄積するタイミングが早まり、したがってジッタバッファ１２８から音声パケットを音声復号部１３０に出力するタイミングも早めることができ、低遅延で音声を出力することが可能となる。

　なお、ＭＴＵを変更すると、情報処理装置１０と音声出力端末装置１００との間の通信リンクを再設定する必要がある。そこで、ＭＴＵを変更した場合には、一旦通信リンクを切断し、新たなＭＴＵを用いて、情報処理装置１０と音声出力端末装置１００との間の通信リンクを設定しなおす。ＭＴＵの情報は、情報処理装置１０と音声出力端末装置１００との間で、呼び出し時に送受信される。

　以上、低遅延モードにおいて、バッファ制御部１２２が、ジッタバッファ１２８のバッファサイズの設定、メディアバッファ１２６の音声パケット送出周期の設定、ＭＴＵの設定、を実行することを説明した。低遅延の音声出力を実現するために、これら３つの設定の全てが実行されることが好ましいが、いずれか１つ、またはいずれか２つのみが実行されてもよい。なお、３つの全てが実行されない場合であっても、ジッタバッファ１２８のバッファサイズの設定は実行されることが好ましい。また、ジッタバッファ１２８のバッファサイズを小さくしたときには、メディアバッファ１２６の音声パケット送出周期を短くすることで、低遅延の音声出力を、より効果的に実現できる。ジッタバッファ１２８のバッファサイズの設定、メディアバッファ１２６の音声パケット送出周期の設定については、通信リンクの再設定をすることなく、同時に実行できるため、これらは合わせて実行されるようにしてもよい。

　以上、本発明を実施例をもとに説明した。この実施例は例示であり、それらの各構成要素や各処理プロセスの組合せにいろいろな変形例が可能なこと、またそうした変形例も本発明の範囲にあることは当業者に理解されるところである。

　実施例では情報処理装置１０が、ゲームアプリケーションを実行した。その他、画像と音声とが連動するアプリケーション、たとえば映画などの映像コンテンツを再生するアプリケーションなど、画像と音声とを同期して出力する要請が高いものについては、本実施例の情報処理装置１０を効果的に適用できる。

　また実施例では、低遅延モードにおいて、ジッタバッファ１２８のバッファサイズをＮワードに設定したが、バッファ制御部１２２は、通信環境に応じて、Ｎワードを基準として、バッファサイズを変動させてもよい。特に、通信環境が悪い場合には、バッファサイズをＮワード～２Ｎワードの範囲内に設定することで、ジッタを吸収しつつ、ノーマルモードに比して音声出力の低遅延を実現することが可能となる。

１・・・情報処理システム、１０・・・情報処理装置、４０・・・操作入力受付部、４２・・・アプリケーション処理部、４４・・・画像信号処理部、４６・・・音声信号処理部、４８・・・通信部、１００・・・音声出力端末装置、１０２・・・操作スイッチ、１０４・・・電源ボタン、１０６・・・モード切替スイッチ、１０８・・・ＵＳＢジャック、１１０・・・ヘッドホン端子、１２０・・・指示受付部、１２２・・・バッファ制御部、１２４・・・通信部、１２６・・・メディアバッファ、１２８・・・ジッタバッファ、１３０・・・音声復号部、１３２・・・スピーカ。

　本発明は、音声出力技術に利用できる。

Claims

　音声パケットを受信する受信部と、
　受信した音声パケットを一時的に蓄積するジッタバッファと、
　前記ジッタバッファのバッファサイズを調節するバッファ制御部と、
　ジッタバッファから出力される音声パケットを復号する音声復号部と、
　音声出力モードの設定指示を受け付ける指示受付部と、を備え、
　前記バッファ制御部は、前記指示受付部において設定指示された音声出力モードに応じて、前記ジッタバッファのバッファサイズを調節することを特徴とする端末装置。
　前記指示受付部が、音声出力の低遅延を要求する音声出力モードの設定指示を受け付けると、前記バッファ制御部が、前記ジッタバッファのバッファサイズを縮小することを特徴とする請求項１に記載の端末装置。
　前記受信部と前記ジッタバッファの間において、前記受信部で受信した音声パケットを一時的に蓄積して、前記ジッタバッファに送出するメディアバッファをさらに備え、
　前記バッファ制御部は、前記指示受付部において設定指示された音声出力モードに応じて、前記メディアバッファが前記ジッタバッファに音声パケットを送出するタイミングを制御することを特徴とする請求項１または２に記載の端末装置。
　前記指示受付部が、音声出力の低遅延を要求する音声出力モードの設定指示を受け付けると、前記バッファ制御部が、前記メディアバッファが前記ジッタバッファに音声パケットを送出する周期を短くすることを特徴とする請求項３に記載の端末装置。
　前記指示受付部が、音声出力の低遅延を要求する音声出力モードの設定指示を受け付けると、１回のデータ転送で送信できるパケットデータの最大値（ＭＴＵ）を小さくすることを特徴とする請求項１から４のいずれかに記載の端末装置。
　音声出力モードの設定指示を受け付けるステップと、
　設定指示された音声出力モードに応じて、音声パケットを一時的に蓄積するジッタバッファのバッファサイズを調節するステップと、
　音声パケットを受信するステップと、
　受信した音声パケットを、バッファサイズを調節されたジッタバッファに供給するステップと、
　ジッタバッファから出力される音声パケットを復号するステップと、
　を備えることを特徴とする音声出力方法。
　コンピュータに、
　音声出力モードの設定指示を受け付ける機能と、
　設定指示された音声出力モードに応じて、音声パケットを一時的に蓄積するジッタバッファのバッファサイズを調節する機能と、
　音声パケットを受信する機能と、
　受信した音声パケットを、バッファサイズを調節されたジッタバッファに供給する機能と、
　ジッタバッファから出力される音声パケットを復号する機能と、
　を実現させるためのプログラム。
　請求項７に記載のプログラムを記録したコンピュータ読み取り可能な記録媒体。
　ディスプレイに画像を出力する情報処理装置と、情報処理装置から無線送信される音声パケットを受信して音声を出力する音声出力端末装置とを備えた情報処理システムであって、
　前記情報処理装置は、
　画像信号および音声信号を生成するアプリケーション処理部と、
　生成された画像信号を処理して、ディスプレイから画像を出力させる画像信号処理部と、
　生成された音声信号を処理して、音声パケットを生成する音声信号処理部と、
　音声パケットを送信する送信部と、を備え、
　前記音声出力端末装置は、
　音声パケットを受信する受信部と、
　受信した音声パケットを一時的に蓄積するジッタバッファと、
　前記ジッタバッファのバッファサイズを調節するバッファ制御部と、
　ジッタバッファから出力される音声パケットを復号する音声復号部と、
　音声出力モードの設定指示を受け付ける指示受付部と、を備え、
　前記バッファ制御部は、前記指示受付部において設定指示された音声出力モードに応じて、前記ジッタバッファのバッファサイズを調節する
　ことを特徴とする情報処理システム。