JP7284266B2

JP7284266B2 - オーディオストリーム切り替え方法および装置

Info

Publication number: JP7284266B2
Application number: JP2021533722A
Authority: JP
Inventors: リウ，チャオ; シオーン，ジエ; ジャーン，ジンホゥイ; フオン，リーホーン
Original assignee: Huawei Technologies Co Ltd
Current assignee: Huawei Technologies Co Ltd
Priority date: 2018-12-13
Filing date: 2019-12-06
Publication date: 2023-05-30
Anticipated expiration: 2039-12-06
Also published as: EP3879836A1; JP2022513833A; EP3879836A4; CN111327923A; KR102519514B1; US11995375B2; CN111327923B; KR20210091319A; EP3879836B1; WO2020119605A1; US20210303259A1

Description

この出願は、マルチメディア通信技術の分野に関し、特に、オーディオストリーム切り替え方法および装置に関する。

マルチメディア通信技術の分野、例えば、テレビ（ｔｅｌｅｖｉｓｉｏｎ、ＴＶ）制作および放送の分野では、異なるオーディオデバイスが送信するオーディオストリームが互いに切り替わるというシナリオがある。

現在のオーディオストリーム切り替えソリューションでは、例えば、スイッチアウトストリームがスイッチインストリームにスイッチアウトされるときに、以下の動作が実行される必要がある。すなわち、データがスイッチインストリームのパケットからパースアウトされ、データがスイッチアウトストリームのパケットからパースアウトされた後、スイッチインストリームのパースアウトされたデータおよびスイッチアウトストリームのパースアウトされたデータは両方とも、オーディオ切り替えマトリクスに適用可能なフォーマットに変換され、次いで、切り替えのためにオーディオ切り替えマトリクスに入力される。その結果、切り替え効率は比較的低く、システムの複雑性は比較的高い。

この出願の実施形態は、従来技術における低効率および高複雑性の問題を解決するために、オーディオストリーム切り替え方法および装置を提供する。

第１の態様によれば、この出願の実施形態は、オーディオストリーム切り替え方法であって、この方法は、
切り替えデバイスが、切り替え命令を受信することであって、切り替え命令は、送信された第１のオーディオストリームから第２のオーディオストリームに切り替えるように指示する、受信することと、切り替えデバイスが、第１のオーディオストリームの第１のパケットのタイムスタンプと第２のオーディオストリームの第２のパケットのタイムスタンプとに基づいて、第１のオーディオストリームと第２のオーディオストリームとの間の同期関係を決定することであって、第１のパケットの受信時間は、第２のパケットの受信時間と同じである、決定することと、切り替えデバイスが、同期関係と第１のパケットのタイムスタンプとに基づいて、第１のオーディオストリームの切り替えポイントのパラメータ値を決定し、同期関係と第２のパケットのタイムスタンプとに基づいて、第２のオーディオストリームの切り替えポイントのパラメータ値を決定することであって、切り替えポイントのパラメータ値が、切り替えポイントのタイムスタンプまたは切り替えポイントのシーケンス番号である、決定することと、切り替えデバイスが、第１のオーディオストリーム内にあり、かつパラメータ値が第１のオーディオストリームの切り替えポイントのパラメータ値より大きいパケットを、第２のオーディオストリーム内にあり、かつパラメータ値が第２のオーディオストリームの切り替えポイントのパラメータ値より大きいパケットに切り替えることと、を含む。

例えば、オーディオストリームに含まれるパケットは、リアルタイム・トランスポート・プロトコル（ｒｅａｌ－ｔｉｍｅｔｒａｎｓｐｏｒｔｐｒｏｔｏｃｏｌ、ＲＴＰ）パケットであってもよい。

前述の解決策では、スイッチアウトストリームがスイッチインストリームに切り替えられるときに、スイッチインストリームからのデータを解析し、スイッチアウトストリームからのデータを解析し、スイッチインストリームの解析されたデータとスイッチアウトストリームの解析されたデータとの両方をオーディオ切り替えマトリクスに適用可能なフォーマットに変換した後に切り替えを実行する代わりに、同期関係が、スイッチアウトストリーム内のパケットのタイムスタンプとスイッチインストリーム内のパケットのタイムスタンプとに基づいて決定され、切り替えポイントが、同期関係に基づいて決定されて切り替えを実行することによって、切り替え効率が改善され、システムの複雑性が特定の程度に低減される。

可能な設計では、切り替えデバイスが、第１のオーディオストリームの第１のパケットのタイムスタンプと第２のオーディオストリームの第２のパケットのタイムスタンプとに基づいて、第１のオーディオストリームと第２のオーディオストリームとの間の同期関係を決定することは、
第１のオーディオストリームのサンプリング周波数が、第２のオーディオストリームのサンプリング周波数と異なるときに、切り替えデバイスが、第１のオーディオストリームのサンプリング周波数と第２のオーディオストリームのサンプリング周波数とに基づいて、かつ基準サンプリング周波数に基づいて、第１のパケットのタイムスタンプと第２のパケットのタイムスタンプとを統一することと、切り替えデバイスが、第１のパケットの統一タイムスタンプと第２のパケットの統一タイムスタンプとに基づいて、第１のオーディオストリームと第２のオーディオストリームとの間の同期関係を決定することとを含む。

第１のオーディオストリームのサンプリング周波数は、第１のオーディオストリーム内のＮ個の受信パケットのタイムスタンプに基づいて決定され、第２のオーディオストリームのサンプリング周波数は、第２のオーディオストリーム内のＭ個の受信パケットのタイムスタンプに基づいて決定され、ＭとＮの両方は、正の整数である。基準サンプリング周波数は、第１のオーディオストリームのサンプリング周波数、第２のオーディオストリームのサンプリング周波数、またはプリセットサンプリング周波数である。

前述の設計において、スイッチインストリームのサンプリング周波数がスイッチアウトストリームのサンプリング周波数と異なるときに、スイッチインストリーム内のパケットのタイムスタンプとスイッチアウトストリーム内のパケットのタイムスタンプとが基準サンプリング周波数を使用して統一された後に、２つのオーディオストリーム間の同期関係が決定されて、同期関係を決定する精度が特定の程度まで改善され得る。

可能な設計では、第１のオーディオストリームのサンプリング周波数および第２のオーディオストリームのサンプリング周波数は、以下の方式で決定される。

切り替えデバイスは、第１のオーディオストリームの第１のタイムスタンプ増分グループと、第２のオーディオストリームの第２のタイムスタンプ増分グループとを得る。第１のタイムスタンプ増分グループは、Ｎ個のパケットのタイムスタンプに基づいて決定されるＮ－１個の第１のタイムスタンプ増分を含み、第２のタイムスタンプ増分グループは、Ｍ個のパケットのタイムスタンプに基づいて決定されるＭ－１個の第２のタイムスタンプ増分を含む。第１のタイムスタンプ増分は、第１のオーディオストリーム内の２つの連続的に受信されたパケット間のタイムスタンプ差であり、第２のタイムスタンプ増分は、第２のオーディオストリーム内の２つの連続的に受信されたパケット間のタイムスタンプ差であるか、または、第１のタイムスタンプ増分は、第１のオーディオストリーム内の受信された隣接パケット間のタイムスタンプ差であり、第２のタイムスタンプ増分は、第２のオーディオストリーム内の受信された隣接パケット間のタイムスタンプ差である。切り替えデバイスは、第１のタイムスタンプ増分グループに基づいて、第１のオーディオストリームのサンプリング周波数を決定し、第２のタイムスタンプ増分グループに基づいて、第２のオーディオストリームのサンプリング周波数を決定する。

前述の設計では、サンプリング周波数はパケットタイムスタンプ増分を使用して決定され、これは、実施が容易であり、低複雑性を有する。

可能な設計では、Ｎ個のパケットは、切り替え命令が受信された後に受信される第１のオーディオストリーム内の最初のＮ個のパケットであり、Ｍ個のパケットは、切り替え命令が受信された後に受信される第２のオーディオストリーム内の最初のＭ個のパケットであり、ＮはＭに等しい。

前述の設計では、サンプリング周波数は、切り替え命令が受信された後に決定されて、サンプリング周波数を決定する必要があるいくつかのオーディオストリームを決定することができ、それによって、リソースの利用率が特定の程度まで改善されるようにする。

可能な設計では、第１のパケットは、第１のオーディオストリーム内にあり、かつ第１のオーディオストリームのサンプリング周波数が決定されたときに受信されるパケットであり、第２のパケットは、第２のオーディオストリーム内にあり、かつ第２のオーディオストリームのオーディオ情報が決定されたときに受信されるパケットである。

前述の設計によれば、サンプリング周波数が決定されたときに受信されるパケットは、切り替えポイントを決定するために選択されて、切り替え待ち時間が特定の程度まで低減され得るようにする。

可能な設計では、切り替えデバイスが、同期関係と第１のパケットのタイムスタンプとに基づいて、第１のオーディオストリームの切り替えポイントのパラメータ値を決定し、同期関係と第２のパケットのタイムスタンプとに基づいて、第２のオーディオストリームの切り替えポイントのパラメータ値を決定することは、切り替えデバイスが、同期関係、第１のパケットのタイムスタンプ、および第１のオーディオストリームのパケット時間に基づいて、第１のオーディオストリームの切り替えポイントのパラメータ値を決定し、同期関係、第２のパケットのタイムスタンプ、第２のオーディオストリームのパケット時間に基づいて、第２のオーディオストリームの切り替えポイントのパラメータ値を決定することを含み、第１のオーディオストリームのパケット時間は、Ｎ個のパケットのタイムスタンプに基づいて決定され、第２のオーディオストリームのパケット時間は、Ｍ個のパケットのタイムスタンプに基づいて決定される。

前述の設計は、切り替えポイントを決定するための別の実施しやすい方式を提供する。

可能な設計では、第１のオーディオストリームの切り替えポイントのパケットタイムスタンプと、第２のオーディオストリームの切り替えポイントのパケットタイムスタンプとが以下の条件を満たす。
第１のパケットの統一タイムスタンプと第２のパケットの統一タイムスタンプとに基づいて、第１のオーディオストリームと第２のオーディオストリームとが同期されていると決定された場合、

および

であるという条件、
第１のパケットの統一タイムスタンプが、第２のパケットの統一タイムスタンプよりも遅い場合、

および

であるという条件、または
第１のパケットの統一タイムスタンプが、第２のパケットの統一タイムスタンプよりも早い場合、

および

であるという条件である。

であり、ＴＳ_ｏ ^０は、第１のパケットの統一タイムスタンプを表し、ＴＳ_ｉ ^０は、第２のパケットの統一タイムスタンプを表し、ｆ_ｉｏは、基準サンプリング周波数を表し、ＴＳ_ｉ＿ＳＷは、第２のオーディオストリームの切り替えポイントのタイムスタンプを表し、ＴＳ_ｉは、第２のパケットの非統一タイムスタンプを表し、ｔｉ＿ｐｋｔは、第２のオーディオストリームのパケット時間を表し、ｄｔｓ_ｉは、隣接するパケット間のタイムスタンプ差のものであって、第２のオーディオストリームのサンプリング周波数に対応する理論値を表し、ＴＳ_ｏ＿ＳＷは、第１のオーディオストリームの切り替えポイントのタイムスタンプを表し、ＴＳ_ｏは、第１のオーディオストリームの非統一タイムスタンプを表し、ｔｏ＿ｐｋｔは、第１のオーディオストリームのパケット時間を表し、ｄｔｓ_ｏは、隣接するパケット間のタイムスタンプ差のものであって、第１のオーディオストリームのサンプリング周波数に対応する理論値を表し、Ｋ１は、第１のプリセット持続時間を表し、Ｋ２は、第２のプリセット持続時間を表す。

前述の設計では、切り替えポイントが決定されたときに、特定の持続時間が加えられ、切り替えポイントのタイムスタンプとして使用され、これは、混乱を回避し、切り替えポイントの待ち時間が予め記憶される既存の方法と比較してリソースを節約することができる。

可能な設計では、決定されるオーディオストリームのパケット時間が、以下の条件を満たし、決定されるオーディオストリームが第１のオーディオストリームまたは第２のオーディオストリームである。すなわち、

である場合、決定されるオーディオストリームのパケット時間が第１の値であるという条件、または

である場合、決定されるオーディオストリームのパケット時間が第２の値であるという条件である。

であり、

は、決定されるオーディオストリームのタイムスタンプ増分グループに基づいて決定されたタイムスタンプ増分平均を表し、ｄＴＳ_{ｔｈｒｅｓ}は、隣接するパケット間のタイムスタンプ差のものであり、異なるパケット時間に対応する理論値に関し、ｄＴＳ_ｉは、決定されるオーディオストリームのタイムスタンプ増分グループのｉ番目のタイムスタンプ増分を表し、ｄＳＥＱ_ｉは、ｉ番目のタイムスタンプ増分に対応する２つのパケット間のシーケンス番号差を表し、ｗは、決定されるオーディオストリームのタイムスタンプ増分グループのタイムスタンプ増分の数を表す。

可能な設計では、切り替えデバイスが、第１のタイムスタンプ増分グループに基づいて、第１のオーディオストリームのサンプリング周波数を決定することは、
複数の第１のフィッティング誤差を得るために、Ｎ－１個の第１のタイムスタンプ増分、各第１のタイムスタンプ増分に対応する２つのパケット間のシーケンス番号の差、および隣接するパケット間のタイムスタンプ差のものであって、切り替えデバイスによってサポートされる複数の理論サンプリング周波数にそれぞれ対応する理論値に基づいて、線形フィッティングを実行することと、隣接するパケット間のタイムスタンプ差のものであって、複数の第１のフィッティング誤差における最小の第１のフィッティング誤差に対応する理論値を決定することと、隣接するパケット間のタイムスタンプ差のものであって、最小の第１のフィッティング誤差に対応する理論値に対応する理論サンプリング周波数を、第１のオーディオストリームのサンプリング周波数として使用することと、を含むか、
切り替えデバイスが、第２のタイムスタンプ増分グループに基づいて、第２のオーディオストリームのサンプリング周波数を決定することは、複数の第２のフィッティング誤差を得るために、Ｍ－１個の第２のタイムスタンプ増分、各第２のタイムスタンプ増分に対応する２つのパケット間のタイムスタンプ差、および隣接するパケット間のタイムスタンプ差のものであって、切り替えデバイスによってサポートされる複数の理論サンプリング周波数にそれぞれ対応する理論値に基づいて、線形フィッティングを実行することと、隣接するパケット間のタイムスタンプ差のものであって、複数の第２のフィッティング誤差における最小の第１のフィッティング誤差に対応する理論値を決定することと、隣接するパケット間のタイムスタンプ差のものであって、最小の第２のフィッティング誤差に対応する理論値に対応する理論サンプリング周波数を、第２のオーディオストリームのサンプリング周波数として使用することと、を含む。

前述の設計では、サンプリング周波数は、実施が容易であり、比較的複雑性が低いフィッティング方式で決定される。

第２の態様によれば、この出願の実施形態は、オーディオストリーム切り替え装置を提供する。
この装置は、切り替えデバイスに適用されてもよい。有益な効果については、第１の態様の説明を参照のこと。詳細は、ここでは再度説明しない。装置は、第１の態様の方法の実施形態における挙動を実施する機能を有する。この機能は、ハードウェアを使用して実施されてもよいし、対応するソフトウェアを実行するハードウェアを使用して実施されてもよい。ハードウェアまたはソフトウェアは、機能に対応する１つ以上のモジュールを含む。

例えば、装置は、受信ユニット、処理ユニット、および送信ユニットを含む。

受信ユニットは、切り替え命令を受信することであって、切り替え命令は、送信された第１のオーディオストリームから第２のオーディオストリームに切り替えるように指示する、受信することを行うように構成されている。

処理ユニットは、第１のオーディオストリームの第１のパケットのタイムスタンプと第２のオーディオストリームの第２のパケットのタイムスタンプとに基づいて、第１のオーディオストリームと第２のオーディオストリームとの間の同期関係を決定することであって、第１のパケットの受信時間は、第２のパケットの受信時間と同じである、決定することと、同期関係と第１のパケットのタイムスタンプとに基づいて、第１のオーディオストリームの切り替えポイントのパラメータ値を決定し、同期関係と第２のパケットのタイムスタンプとに基づいて、第２のオーディオストリームの切り替えポイントのパラメータ値を決定することであって、切り替えポイントのパラメータ値が、切り替えポイントのタイムスタンプまたは切り替えポイントのシーケンス番号である、決定することと、を行うように構成されている。

送信ユニットは、第１のオーディオストリーム内にあり、かつパラメータ値が第１のオーディオストリームの切り替えポイントのパラメータ値より大きいパケットを、第２のオーディオストリーム内にあり、かつパラメータ値が第２のオーディオストリームの切り替えポイントのパラメータ値より大きいパケットに切り替えることを行うように構成されている。

可能な設計では、第１のオーディオストリームの第１のパケットのタイムスタンプと第２のオーディオストリームの第２のパケットのタイムスタンプとに基づいて、第１のオーディオストリームと第２のオーディオストリームとの間の同期関係を決定するときに、処理ユニットは、具体的には、
第１のオーディオストリームのサンプリング周波数が、第２のオーディオストリームのサンプリング周波数と異なるときに、第１のオーディオストリームのサンプリング周波数と第２のオーディオストリームのサンプリング周波数とに基づいて、かつ基準サンプリング周波数に基づいて、第１のパケットのタイムスタンプと第２のパケットのタイムスタンプとを統一することと、第１のパケットの統一タイムスタンプと第２のパケットの統一タイムスタンプとに基づいて、第１のオーディオストリームと第２のオーディオストリームとの間の同期関係を決定することとを行うように構成されている。

第１のオーディオストリームのサンプリング周波数は、第１のオーディオストリーム内のＮ個の受信パケットのタイムスタンプに基づいて決定され、第２のオーディオストリームのサンプリング周波数は、第２のオーディオストリーム内のＭ個の受信パケットのタイムスタンプに基づいて決定され、ＭとＮの両方は、正の整数である。
基準サンプリング周波数は、第１のオーディオストリームのサンプリング周波数、第２のオーディオストリームのサンプリング周波数、またはプリセットサンプリング周波数である。

可能な設計では、処理ユニットは、第１のオーディオストリームのサンプリング周波数および第２のオーディオストリームのサンプリング周波数を以下の方式で得るようにさらに構成されている。
第１のオーディオストリームの第１のタイムスタンプ増分グループと、第２のオーディオストリームの第２のタイムスタンプ増分グループとを得ることであって、
第１のタイムスタンプ増分グループは、Ｎ個のパケットのタイムスタンプに基づいて決定されるＮ－１個の第１のタイムスタンプ増分を含み、第２のタイムスタンプ増分グループは、Ｍ個のパケットのタイムスタンプに基づいて決定されるＭ－１個の第２のタイムスタンプ増分を含み、
第１のタイムスタンプ増分は、第１のオーディオストリーム内の２つの連続的に受信されたパケット間のタイムスタンプ差であり、第２のタイムスタンプ増分は、第２のオーディオストリーム内の２つの連続的に受信されたパケット間のタイムスタンプ差であるか、または、第１のタイムスタンプ増分は、第１のオーディオストリーム内の受信された隣接パケット間のタイムスタンプ差であり、第２のタイムスタンプ増分は、第２のオーディオストリーム内の受信された隣接パケット間のタイムスタンプ差である、ことと、
第１のタイムスタンプ増分グループに基づいて、第１のオーディオストリームのサンプリング周波数を決定し、第２のタイムスタンプ増分グループに基づいて、第２のオーディオストリームのサンプリング周波数を決定することである。

可能な設計では、第１のパケットは、第１のオーディオストリーム内にあり、第１のオーディオストリームのサンプリング周波数が決定されたときに受信されるパケットであり、第２のパケットは、第２のオーディオストリーム内にあり、第２のオーディオストリームのオーディオ情報が決定されたときに受信されるパケットである。

可能な設計では、同期関係と第１のパケットのタイムスタンプとに基づいて、第１のオーディオストリームの切り替えポイントのパラメータ値を決定し、同期関係と第２のパケットのタイムスタンプとに基づいて、第２のオーディオストリームの切り替えポイントのパラメータ値を決定するときに、処理ユニットは、具体的には、
同期関係、第１のパケットのタイムスタンプ、および第１のオーディオストリームのパケット時間に基づいて、第１のオーディオストリームの切り替えポイントのパラメータ値を決定し、同期関係、第２のパケットのタイムスタンプ、第２のオーディオストリームのパケット時間に基づいて、第２のオーディオストリームの切り替えポイントのパラメータ値を決定するように構成されている。

第１のオーディオストリームのパケット時間は、Ｎ個のパケットのタイムスタンプに基づいて決定され、第２のオーディオストリームのパケット時間は、Ｍ個のパケットのタイムスタンプに基づいて決定される。

および

であるという条件である。

可能な設計では、決定されるオーディオストリームのパケット時間が、以下の条件を満たし、決定されるオーディオストリームは第１のオーディオストリームまたは第２のオーディオストリームである。

であり、

可能な設計では、第１のタイムスタンプ増分グループに基づいて、第１のオーディオストリームのサンプリング周波数を決定するときに、処理ユニットは、具体的には、
複数の第１のフィッティング誤差を得るために、Ｎ－１個の第１のタイムスタンプ増分、各第１のタイムスタンプ増分に対応する２つのパケット間のシーケンス番号の差、および隣接するパケット間のタイムスタンプ差のものであって、切り替えデバイスによってサポートされる複数の理論サンプリング周波数にそれぞれ対応する理論値に基づいて、線形フィッティングを実行することと、
隣接するパケット間のタイムスタンプ差のものであって、複数の第１のフィッティング誤差における最小の第１のフィッティング誤差に対応する理論値を決定することと、
隣接するパケット間のタイムスタンプ差のものであって、最小の第１のフィッティング誤差に対応する理論値に対応する理論サンプリング周波数を、第１のオーディオストリームのサンプリング周波数として使用することと、を行うように構成されており、または
第２のタイムスタンプ増分グループに基づいて第２のオーディオストリームのサンプリング周波数を決定するときに、処理ユニットは、具体的には、
複数の第２のフィッティング誤差を得るために、Ｍ－１個の第２のタイムスタンプ増分、各第２のタイムスタンプ増分に対応する２つのパケット間のタイムスタンプ差、および隣接するパケット間のタイムスタンプ差のものであって、切り替えデバイスによってサポートされる複数の理論サンプリング周波数にそれぞれ対応する理論値に基づいて、線形フィッティングを実行することと、
隣接するパケット間のタイムスタンプ差のものであって、複数の第２のフィッティング誤差における最小の第１のフィッティング誤差に対応する理論値を決定することと、
隣接するパケット間のタイムスタンプ差のものであって、最小の第２のフィッティング誤差に対応する理論値に対応する理論サンプリング周波数を、第２のオーディオストリームのサンプリング周波数として使用することと、を行うように構成されている。

第３の態様によれば、この出願の一実施形態は、装置をさらに提供する。本装置は、切り替えデバイスに適用される。有益な効果については、第１の態様の記載を参照のこと。詳細は、ここでは再度説明しない。通信装置の構造は、プロセッサおよびトランシーバを含み、メモリをさらに含んでもよい。プロセッサは、第１の態様の方法において対応する機能を実行する際に、端末デバイスをサポートするように構成されている。メモリは、プロセッサに結合され、通信装置に必要なプログラム命令およびデータを記憶する。トランシーバは、他のデバイスと通信するように構成されている。

第４の態様によれば、この出願は、コンピュータ可読記憶媒体をさらに提供する。コンピュータ可読記憶媒体は命令を記憶する。命令がコンピュータ上で動作するときに、コンピュータが、第１の態様に従って方法を実行することを可能にする。

第５の態様によれば、この出願は、さらに、命令を含むコンピュータプログラム製品を提供する。コンピュータプログラム製品がコンピュータ上で動作するときに、コンピュータが、第１の態様に従って方法を実行することを可能にする。

第６の態様によれば、この出願は、コンピュータチップをさらに提供する。チップは、メモリに接続される。チップは、メモリに記憶されたソフトウェアプログラムを読み出して実行し、第１の態様に従って方法を実行するように構成されている。

この出願の一実施形態によるオーディオストリーム切り替えシステムの概略構造図である。この出願の一実施形態によるオーディオストリーム切り替え方法の概略フローチャートである。この出願の一実施形態による、切り替えポイントのタイムスタンプを決定するプロセスの概略図である。この出願の一実施形態による、第１のオーディオストリーム内のパケットを送信するための方法の概略図である。この出願の一実施形態による、第２のオーディオストリーム内のパケットを送信する方法の概略図である。この出願の一実施形態によるオーディオストリームの切り替えの概略図である。この出願の一実施形態による切り替えフローテーブルの概略図である。この出願の一実施形態による別のオーディオストリーム切り替え方法の概略フローチャートである。この出願の一実施形態によるオーディオストリームのシーケンス番号の順序がずれている概略図である。この出願の一実施形態によるシーケンス番号更新の概略図である。この出願の一実施形態による複数のオーディオストリーム間の切り替えの概略図である。この出願の一実施形態による装置１１００の概略構造図である。この出願の一実施形態による装置１２００の概略構造図である。

この出願の実施形態は、マスター制御システム、テレビスタジオ、または放送およびテレビ制作および放送ネットワークの放送領域など、ＩＰネットワーク上で搬送されるオーディオストリームを切り替える必要があるシナリオに適用されてもよい。

図１は、オーディオストリーム切り替えシステムの一例の概略構造図である。システムは、Ｘ個のオーディオデバイス、切り替えデバイス、およびオーディオ受信装置を含み、Ｘは１より大きい整数である。オーディオデバイスは、切り替えデバイスにオーディオストリームを出力するように構成されている。切り替えデバイスは、Ｘ個のオーディオデバイスが出力するＸ個のオーディオストリームのうちの１つをダウンストリームデバイスに送信することを担当し、ダウンストリームデバイスを使用してオーディオストリームをオーディオ受信デバイスに送信する。

この出願のこの実施形態における切り替えデバイスは、ルータ、スイッチ、または仮想スイッチのような、制作および放送ＩＰネットワークにおいて使用されるＩＰネットワーク切り替えデバイスであってもよいし、１つ以上のサーバ、仮想化プラットフォーム、クラウドコンピューティングサービスセンターなどであってもよい。

例えば、オーディオストリーム切り替えシステムは、切り替えデバイスに切り替え命令を送信するように構成されている管理デバイスをさらに含んでもよい。管理デバイスは、有線ネットワークまたは無線ネットワークを使用して切り替えデバイスに接続されてもよい。

任意選択で、無線ネットワークまたは有線ネットワークは、標準的な通信技術および／またはプロトコルを使用する。ネットワークは、典型的にはインターネットであるが、代替的には、ローカルエリアネットワーク（ｌｏｃａｌａｒｅａｎｅｔｗｏｒｋ、ＬＡＮ）、メトロポリタンエリアネットワーク（ｍｅｔｒｏｐｏｌｉｔａｎａｒｅａｎｅｔｗｏｒｋ、ＭＡＮ）、ワイドエリアネットワーク（ｗｉｄｅａｒｅａｎｅｔｗｏｒｋ、ＷＡＮ）、モバイルネットワーク、有線ネットワーク、無線ネットワーク、プライベートネットワーク、または仮想プライベートネットワークの任意の組み合わせを含むが、これらに限定されない任意のネットワークであってもよい。

パルス符号変調（ｐｕｌｓｅｃｏｄｅｍｏｄｕｌａｔｉｏｎ、ＰＣＭ）オーディオ要素、伝送制限、チャネル要求、整合性制御等は、放送信号およびテレビ信号のインターネットプロトコル（ｉｎｔｅｒｎｅｔｐｒｏｔｏｃｏｌ、ＩＰ）ネットワーク伝送規格に規範的に説明されている。
例えば、映画テレビ技術者協会（ｔｈｅｓｏｃｉｅｔｙｏｆｍｏｔｉｏｎｐｉｃｔｕｒｅａｎｄｔｅｌｅｖｉｓｉｏｎｅｎｇｉｎｅｅｒｓ、ＳＭＰＴＥ）２１１０は、オーディオの送信端および受信端は、４４．１ｋＨｚ、４８ｋＨｚ、および９６ｋＨｚのサンプリング周波数、１２５μｓ、および１ｍｓのオーディオ持続時間などをサポートすることを規定している。

オーディオデータＩＰプロセスでは、オーディオサンプリング、アナログ－デジタル変換、ＰＣＭ符号化、およびＩＰカプセル化を連続的に実行した後、オーディオストリームを形成し、切り替え選択のための切り替えデバイスに送信する。全プロセスにおいて、正確な時間同期は、高精度時間プロトコル（ｐｒｅｃｉｓｉｏｎｔｉｍｅｐｒｏｔｏｃｏｌ、ＰＴＰ）クロックソースを使用することによって保証され得る。現在のオーディオストリーム切り替えソリューションでは、スイッチインされるオーディオストリームを、再生中のオーディオストリームと同じオーディオフォーマットに変換し、切り替えを実行する必要がある。その結果、切り替え効率が比較的低く、システムの複雑性が比較的高い。

これに基づいて、この出願の実施形態は、従来技術における低効率および高複雑性の問題を解決するために、オーディオストリーム切り替え方法および装置を提供する。方法および装置は、同一の発明概念に基づいている。方法および装置は、同様の問題解決の原理を有するため、装置の実施態様と方法の実施態様とを相互に参照してもよく、繰り返される説明を提供しない。

異なるオーディオデバイス製造業者により、異なるオーディオサンプリング周波数、チャネル数、パケット時間などが存在する。例えば、ＳＭＰＴＥ２１１０－３０規格は、３つのオーディオサンプリング周波数と２つのタイプのパケット時間を規定している。異なるサンプリング周波数およびパケット時間は、異なるオーディオストリームタイムスタンプおよびパケット間隔に対応する。複数のチャネルのデータは、同じデータストリームにカプセル化されるため、チャネル数は、オーディオストリームの切り替えに直接影響しない。この出願の実施態様において、オーディオストリームのパケットのタイムスタンプは、サンプリング周波数およびパケット時間を決定するために得られ、オーディオストリーム間の時間関係は、切り替えポイントを決定するために得られ、それによって、正しいオーディオストリームの切り替えを保証する。

追加的に、この出願の実施形態では、切り替え前に送信されたストリームをスイッチアウトストリームと称し、切り替え後に送信されたストリームをスイッチインストリームと称することがある。この出願の実施形態の後続の説明では、例えば、第１のオーディオストリームはスイッチアウトストリームであり、第２のオーディオストリームはスイッチインストリームである。

図２は、この出願の一実施形態によるオーディオストリーム切り替え方法の概略フローチャートである。

Ｓ２０１．切り替えデバイスは、切り替え命令を受信し、切り替え命令は、送信された第１のオーディオストリームから第２のオーディオストリームに切り替えるように指示する。

Ｓ２０２．切り替えデバイスは、第１のオーディオストリームの第１のパケットのタイムスタンプと第２のオーディオストリームの第２のパケットのタイムスタンプに基づいて、第１のオーディオストリームと第２のオーディオストリームとの間の同期関係を決定し、第１のパケットの受信時間は、第２のパケットの受信時間と同じである。

Ｓ２０３．切り替えデバイスは、同期関係および第１のパケットのタイムスタンプに基づいて、第１のオーディオストリームの切り替えポイントのパラメータ値を決定し、同期関係および第２のパケットのタイムスタンプに基づいて、第２のオーディオストリームの切り替えポイントのパラメータ値を決定し、ここで、切り替えポイントのパラメータ値は、切り替えポイントのタイムスタンプまたは切り替えポイントのシーケンス番号である。

Ｓ２０４．切り替えデバイスは、第１のオーディオストリーム内にあり、かつパラメータ値が第１のオーディオストリームの切り替えポイントのパラメータ値よりも大きいパケットを、第２のオーディオストリーム内にあり、かつパラメータ値が第２のオーディオストリームの切り替えポイントのパラメータ値よりも大きいパケットに切り替える。

ステップＳ２０４において、切り替えデバイスは、第１のオーディオストリーム内にあり、かつパラメータ値が第１のオーディオストリームの切り替えポイントのパラメータ値よりも大きいパケットを、第２のオーディオストリーム内にあり、かつパラメータ値が第２のオーディオストリームの切り替えポイントのパラメータ値よりも大きいパケットに切り替える。具体的には、切り替えデバイスは、第１のオーディオストリーム内にあり、かつパラメータ値が第１のオーディオストリームの切り替えポイントのパラメータ値より大きいパケットを破棄し、第２のオーディオストリーム内にあり、かつパラメータ値が第２のオーディオストリームの切り替えポイントのパラメータ値より大きいパケットを転送する。第１のオーディオストリームの切り替えポイントのパラメータ値を決定した後、切り替えデバイスは、第１のオーディオストリーム内にあり、かつパラメータ値が第１のオーディオストリームの切り替えポイントのパラメータ値以下であるパケットを受信してもよいことに留意されたい。この場合、切り替えデバイスは、第１のオーディオストリーム内にあり、かつパラメータ値が第１のオーディオストリームの切り替えポイントのパラメータ値以下であるパケットを転送してもよい。追加的に、切り替えデバイスは、第２のオーディオストリームの切り替えポイントのパラメータ値が決定された後に受信され、かつパラメータ値が第２のオーディオストリームの切り替えポイントのパラメータ値以下であるパケットを破棄してもよい。

可能な例では、切り替えデバイスが少なくとも２つの出力ポート、例えばポート１とポート２を含む場合、切り替えを実行する前に、切り替えデバイスは、ポート１を使用して第１のオーディオストリームと第２のオーディオストリームを監視デバイスに送信し、ポート２を使用して第１のオーディオストリームをダウンストリームデバイスに送信する。第２のオーディオストリームは、ポート２では転送されず、これは、破棄と見なされてもよい。切り替えを実行した後、切り替えデバイスは、ポート１を使用して、第１のオーディオストリームおよび第２のオーディオストリームを監視デバイスに依然として送信し、ポート２上で第２のオーディオストリームをポート２のダウンストリームデバイスに転送する。第１のオーディオストリームは、もはやダウンストリームデバイスに転送されず、これは、第１のオーディオストリームがポート２上で破棄されると見なされてもよい。

任意選択で、切り替え命令は、出力オーディオストリームを切り替えるためのポートを示すために使用されるポート番号を更に搬送してもよい。

可能な実施態様では、切り替えデバイスが、第１のオーディオストリームの第１のパケットのタイムスタンプおよび第２のオーディオストリームの第２のパケットのタイムスタンプに基づいて、第１のオーディオストリームと第２のオーディオストリームとの間の同期関係を以下の方式で決定してもよい。

第１の例では、第１のオーディオストリームのサンプリング周波数が第２のオーディオストリームのサンプリング周波数と同じであるときに、切り替えデバイスは、第１のオーディオストリームの第１のパケットのタイムスタンプと第２のオーディオストリームの第２のパケットのタイムスタンプに基づいて、第１のオーディオストリームと第２のオーディオストリームとの間の同期関係を決定する。

例えば、第１のパケットのタイムスタンプと第２のパケットのタイムスタンプとの差の絶対値が第１のしきい値以下である場合、第１のオーディオストリームと第２のオーディオストリームは同期され、そうでなければ、第１のオーディオストリームと第２のオーディオストリームは同期されない。例えば、最初のしきい値は０または２ｍｓである。

第２の例では、第１のオーディオストリームのサンプリング周波数が第２のオーディオストリームのサンプリング周波数と異なるときに、切り替えデバイスは、第１のオーディオストリームのサンプリング周波数と第２のオーディオストリームのサンプリング周波数とに基づいて、かつ基準サンプリング周波数に基づいて、第１のパケットのタイムスタンプと第２のパケットのタイムスタンプとを統一し、切り替えデバイスは、第１のパケットの統一タイムスタンプと第２のパケットの統一タイムスタンプとに基づいて、第１のオーディオストリームと第２のオーディオストリームとの間の同期関係を決定する。

例えば、第１のパケットの統一タイムスタンプと第２のパケットの統一タイムスタンプとの差の絶対値が第２のしきい値以下である場合、第１のオーディオストリームと第２のオーディオストリームは同期され、そうでなければ、第１のオーディオストリームと第２のオーディオストリームは同期されない。例えば、第２のしきい値は０または２ｍｓである。

第１のオーディオストリームのサンプリング周波数は、第１のオーディオストリームにおけるＮ個の受信パケットのタイムスタンプに基づいて決定され、第２のオーディオストリームのサンプリング周波数は、第２のオーディオストリームにおけるＭ個の受信パケットのタイムスタンプに基づいて決定され、ＭおよびＮは両方とも正の整数である。基準サンプリング周波数は、第１のオーディオストリームのサンプリング周波数、第２のオーディオストリームのサンプリング周波数、またはプリセットサンプリング周波数である。

可能な実施態様では、切り替えデバイスは、第１のパケットの統一タイムスタンプを第１のオーディオストリームの切り替えポイントのタイムスタンプとして使用し、第２のパケットの統一タイムスタンプを第２のオーディオストリームの切り替えポイントのタイムスタンプとして使用してもよい。しかしながら、伝送プロセスにおいてパケットが順序ずれである可能性があるため、もしパケットが順序ずれであるならば、前述の方式は、パケットの通常の切り替えおよび伝送を保証することができない。パケットシーケンス番号に基づいて受信されたパケットをキャッシュするための方法が、通常、従来技術で使用される。しかしながら、切り替えプロセスでは、書き込み、アドレス指定、および読み出しなどの動作は、キャッシュ空間内で連続的に実行される必要があり、これは、システムの複雑性を増加させ、リソースを浪費する。この出願のこの実施形態では、パケット時間は、第１のオーディオストリームの切り替えポイントのパラメータ値と第２のオーディオストリームの切り替えポイントのパラメータ値とが決定されるときに考慮されてもよい。いくつかのパケットの持続時間が第１のパケットのタイムスタンプに加えられ、得られた合計が第１のオーディオストリームの切り替えポイントのタイムスタンプとして使用され、いくつかのパケットの持続時間が第２のパケットのタイムスタンプに加えられ、得られた合計が第２のオーディオストリームの切り替えポイントのタイムスタンプとして使用されて、順序ずれによって引き起こされる異常な切り替えを回避する。

したがって、切り替えデバイスは、同期関係および第１のパケットのタイムスタンプに基づいて、第１のオーディオストリームの切り替えポイントのパラメータ値を決定し、同期関係および第２のパケットのタイムスタンプに基づいて、第２のオーディオストリームの切り替えポイントのパラメータ値を以下のようにして決定してもよい。

切り替えデバイスは、同期関係、第１のパケットのタイムスタンプ、および第１のオーディオストリームのパケット時間に基づいて、第１のオーディオストリームの切り替えポイントのパラメータ値を決定し、同期関係、第２のパケットのタイムスタンプ、および第２のオーディオストリームのパケット時間に基づいて、第２のオーディオストリームの切り替えポイントのパラメータ値を決定する。

第１のオーディオストリームのパケット時間は、第１のオーディオストリーム内のＮ個の受信パケットのタイムスタンプに基づいて決定され、第２のオーディオストリームのパケット時間は、第２のオーディオストリーム内のＭ個の受信パケットのタイムスタンプに基づいて決定される。

続いて、簡単に説明するために、サンプリング周波数とパケット時間をまとめてオーディオ情報と称する。

可能な実装では、第１のオーディオストリームのオーディオ情報に含まれるサンプリング周波数とパケット時間、および第２のオーディオストリームのオーディオ情報に含まれるサンプリング周波数とパケット時間は、以下の方式で決定してもよい。

オーディオストリームのオーディオ情報は、オーディオストリームの切り替えに影響する。したがって、この出願のこの実施形態では、オーディオ情報を決定する主なアイデアは、オーディオストリームのパケットをサンプリングし、パケットタイムスタンプの統計学習によってオーディオ情報のサンプリング周波数およびパケット時間を得ることである。

例えば、表１は、４４．１ｋＨｚ、４８ｋＨｚ、および９６ｋＨｚの３つのサンプリング周波数、１２５μｓおよび１ｍｓの２つのタイプのパケット時間、およびＳＭＰＴＥ２１１０で指定されている隣接するシーケンス番号を有する２つのパケット間のタイムスタンプ差の理論値を示す。

具体的には、隣接するシーケンス番号を有する２つのパケット間のタイムスタンプ差のものであり、かつ異なるサンプリング周波数とパケット時間に対応する理論値は、以下の式（１）を使用して決定されてもよい。

表１と式（１）から、オーディオストリームのサンプリング周波数とパケット時間の両方が、隣接するパケット間のタイムスタンプの差に関すると決定されてもよい。隣接するパケットは隣接するシーケンス番号を有する２つのパケットである。これに基づいて、第１のオーディオストリームのオーディオ情報に含まれるサンプリング周波数とパケット時間、および第２のオーディオストリームのオーディオ情報に含まれるサンプリング周波数およびパケット時間を決定するときに、切り替えデバイスは、最初に、第１のオーディオストリームの第１のタイムスタンプ増分グループおよび第２のオーディオストリームの第２のタイムスタンプ増分グループを得る。

第１のタイムスタンプ増分グループは、第１のオーディオストリーム内のＮ個の受信パケットのタイムスタンプに基づいて決定されるＮ－１個の第１のタイムスタンプ増分を含み、第２のタイムスタンプ増分グループは、第２のオーディオストリーム内のＭ個の受信パケットのタイムスタンプに基づいて決定されるＭ－１個の第２のタイムスタンプ増分を含む。

次に、切り替えデバイスは、第１のタイムスタンプ増分グループに基づいて、第１のオーディオストリームのサンプリング周波数およびパケット時間を決定し、第２のタイムスタンプ増分グループに基づいて、第２のオーディオストリームのサンプリング周波数を決定する。

タイムスタンプ増分は、２つのパケット間のタイムスタンプ差である。タイムスタンプ増分は、複数の方法で得てもよい。以下に２つの例を示す。

第１の可能な例では、２つの連続して受信されたパケット間のタイムスタンプ差がタイムスタンプ増分として使用される。具体的には、第１のタイムスタンプ増分は、第１のオーディオストリーム内の２つの連続的に受信されたパケット間のタイムスタンプ差であり、第２のタイムスタンプ増分は、第２のオーディオストリーム内の２つの連続的に受信されたパケット間のタイムスタンプ差である。

第２の可能な例では、複数のパケットが連続的に受信され、パケットはパケットのシーケンス番号に基づいてソートされ、次に、隣接するシーケンス番号を有する２つのパケット間のタイムスタンプ差がタイムスタンプ増分として使用される。具体的には、第１のタイムスタンプ増分は、第１のオーディオストリーム内の隣接するシーケンス番号を有する２つの受信パケット間のタイムスタンプ差であり、第２のタイムスタンプ増分は、第２のオーディオストリーム内の隣接するシーケンス番号を有する２つの受信パケット間のタイムスタンプ差である。

以下は、特定のシナリオを参照してパケット時間を決定する方法を説明する。

表１で、隣接するシーケンス番号を有する２つのパケット間のタイムスタンプ差の理論値（これは、後の説明では理論値と称する）に基づいて、パケット時間が１２５μｓであるときに、５．５、６、および１２の３つの理論値が存在し、パケット時間が１ｍであるときに、４４．１、４８、および９６の３つの理論値が存在することが分かり得る。したがって、表１から、それぞれ１２５μｓ、１ｍｓに対応する理論値が明らかに変化することが分かり得る。したがって、しきい値ｄＴＳ_{ｔｈｒｅｓ}を設定してもよく、計算を通じて得られたパケットのタイムスタンプ差の平均値

とｄＴＳ_{ｔｈｒｅｓ}を比較した結果に基づいて、パケットの時間が１２５μｓまたは１ｍｓであることを決定してもよい。
例えば、

であるときに、オーディオストリームのパケット時間が第１の値である、例えば、ｔ_{ｐａｃｋｔ}＝１２５μｓであるか、または

であるときに、オーディオストリームのパケット時間が第２の値である、例えば、ｔ_{ｐａｃｋｅｔ}＝１ｍｓである。例えば、１２よりも大きく４４．１未満の値は、ｄＴＳ_{ｔｈｒｅｓ}の値として選択されてもよい。パケット時間のより良い決定を保証するために、１２と４４．１の間の中間値、例えば、２５が選択されてもよい。

ネットワークによって実際に受信された、決定されるオーディオストリームのタイムスタンプ増分平均

は、式（２）を使用した計算を通じて得られてもよい。決定されるオーディオストリームは、第１のオーディオストリームまたは第２のオーディオストリームであってもよい。

ｄＴＳ_ｉは、決定されるオーディオストリームのタイムスタンプ増分グループのｉ番目のタイムスタンプ増分を表し、ｄＳＥＱ_ｉは、ｉ番目のタイムスタンプ増分に対応する２つのパケット間のシーケンス番号差を表し、ｗは、決定されるオーディオストリームのタイムスタンプ増分グループのタイムスタンプ増分の数を表す。例えば、決定されるオーディオストリームが第１のオーディオストリームであるときに、ｗ＝Ｎ－１であり、または決定されるオーディオストリームが第２のオーディオストリームであるときに、ｗ＝Ｍ－１である。

この出願のこの実施形態では、第１のタイムスタンプ増分グループおよび第２のタイムスタンプ増分グループが得られた後、サンプリング周波数は、第１のタイムスタンプ増分グループおよび第２のタイムスタンプ増分グループに基づいて決定される。

例えば、切り替えデバイスは、以下の方式で、第１のタイムスタンプ増分グループに基づいて、第１のオーディオストリームのサンプリング周波数を決定してもよい。
複数の第１のフィッティング誤差を得るために、Ｎ－１個の第１のタイムスタンプ増分、各第１のタイムスタンプ増分に対応する２つのパケット間のシーケンス番号の差、および隣接するパケット間のタイムスタンプ差のものであって、切り替えデバイスによってサポートされる複数の理論サンプリング周波数にそれぞれ対応する理論値に基づいて、線形フィッティングを実行し、隣接するパケット間のタイムスタンプ差のものであって、複数の第１のフィッティング誤差における最小の第１のフィッティング誤差に対応する理論値を決定し、隣接するパケット間のタイムスタンプ差のものであって、最小の第１のフィッティング誤差に対応する理論値に対応する理論サンプリング周波数を、第１のオーディオストリームのサンプリング周波数として使用する。

同様に、切り替えデバイスは、以下の方式で、第２のタイムスタンプ増分グループに基づいて、第２のオーディオストリームのサンプリング周波数を決定してもよい。
複数の第２のフィッティング誤差を得るために、Ｍ－１個の第２のタイムスタンプ増分、各第２のタイムスタンプ増分に対応する２つのパケット間のタイムスタンプ差、および隣接するパケット間のタイムスタンプ差のものであって、切り替えデバイスによってサポートされる複数の理論サンプリング周波数にそれぞれ対応する理論値に基づいて、線形フィッティングを実行し、隣接するパケット間のタイムスタンプ差のものであって、複数の第２のフィッティング誤差における最小の第１のフィッティング誤差に対応する理論値を決定し、隣接するパケット間のタイムスタンプ差のものであって、最小の第２のフィッティング誤差に対応する理論値に対応する理論サンプリング周波数を、第２のオーディオストリームのサンプリング周波数として使用する。

例えば、フィッティングモデルは線形モデルｙ＝ｋｘおよび

であってもよい。

は、表１の理論値である。例えば、第１のオーディオストリームのサンプリング周波数が決定されるときに、フィッティングは、計算を通じてフィッティング誤差σを得るために、２つの受信パケット間のシーケンス番号差およびタイムスタンプ増分差（ｄＳＥＱ_ｉ，ｄＴＳ_ｉ）を使用して、線形方程式に従って実行される。

は、表１の最初の理論値であり、Ｎ－１は、第１のタイムスタンプ増分の数である。

グループは、式（３）を使用して得られ、フィッティング誤差σに対してソーティングを実行して、最小フィッティング誤差σ_ｍｉｎと対応する

値を得て、サンプリング周波数ｆ_{ｓａｍｐｌｅ}を

に基づいて得る。サンプリング周波数と理論値の対応については、表２を参照のこと。

追加的に、この出願のこの実施形態では、オーディオストリームのオーディオ情報を決定するためのパケット（すなわち、Ｎ個のパケットまたはＭ個のパケット）は、切り替え命令が受信される前に受信されてもよく、または切り替え命令が受信された後に受信されてもよい。以下に、２つの可能な例を使用して説明する。

例１において、Ｎ個のパケットは、切り替え命令が受信された後に受信される第１のオーディオストリーム内の最初のＮ個のパケットであり、Ｍ個のパケットは、切り替え命令が受信された後に受信される第２のオーディオストリーム内の最初のＭ個のパケットであり、Ｎは、Ｍに等しくてもよいし、Ｎは、Ｍに等しくなくてもよい。この出願のこの実施形態において、後続の説明では、例えば、Ｎは、Ｍに等しい。例１において示されるケースでは、第１のオーディオストリームの切り替えポイントのパラメータ値を決定するために使用される第１のパケットは、オーディオ情報が決定されるときに受信されるパケットであってもよい。確かに、別のパケットを代替的に使用してもよいが、オーディオ情報が決定されたときに受信したパケットを選択すると、切り替え待ち時間を低減することができる。第２のオーディオストリームの切り替えポイントのパラメータ値を決定するために使用される第２のパケットは、第２のオーディオストリーム内にあり、かつオーディオ情報が決定されたときに受信されるパケットであってもよい。確かに、別のパケットを代替的に使用してもよいが、オーディオ情報が決定されたときに受信したパケットを選択すると、切り替え待ち時間を低減することができる。

例２において、Ｎ個のパケットは、切り替え命令が受信される前に受信される第１のオーディオストリーム内のＮ個のパケットであり、Ｍ個のパケットは、切り替え命令が受信される前に受信される第２のオーディオストリーム内のＭ個のパケットであり、Ｎは、Ｍに等しくてもよいし、Ｎは、Ｍに等しくなくてもよい。

例えば、第１のオーディオストリームに対して、第１のオーディオストリームのパケットが受信され始めるときに、連続して受信されたＮ個のパケットが、オーディオ情報を決定するために使用されるパケットとして使用される。あるケースでは、オーディオ情報を決定するために使用されるＮ個のパケットを連続して受信するプロセスでは、切り替え命令は受信されない。このケースでは、切り替えポイントのパラメータ値を決定するために使用される第１のパケットは、切り替え命令が受信されたときに受信される第１のパケットであってもよいし、確かに別のパケットであってもよいが、切り替え待ち時間は、第１のパケットが選択されたときに最も小さい。別のケースは、オーディオ情報を決定するために使用されるＮ個のパケットを連続的に受信するプロセスでは、切り替え命令は受信されるが、オーディオ情報の計算には影響しない。このケースでは、切り替えポイントのパラメータ値を決定するために使用される第１のパケットは、オーディオ情報が決定されたときに受信されるパケットであってもよいし、確かに別のパケットであってもよいが、切り替え町時間は、オーディオ情報が決定されたときに受信されるパケットが選択されたときに最も小さい。

例えば、オーディオストリームはＳＭＰＴＥ２１１０とＡＥＳ６７を満たし、オーディオストリームのパケットのタイムスタンプはリアルタイムトランスポートプロトコル（（ｒｅａｌ－ｔｉｍｅｔｒａｎｓｐｏｒｔｐｒｏｔｏｃｏｌ、ＲＴＰ）クロックのサンプルであり、タイムスタンプに対応する時間はサンプリングモーメントとエポックモーメントの間のオフセットである。式（４）で示されるように、秒当たりのタイムスタンプ増分は、オーディオサンプリング周波数の値である。

ここで、ｔは、パケットの収集モーメントを表し、ｔ_{ｅｐｏｃｈ}は、エポックモーメントであり、ｆは、オーディオストリームのサンプリング周波数であり、ｍは、タイムスタンプ反転回数であり、ＴＳは、パケットのタイムスタンプを表し、ｎは、タイムスタンプが占めるビット数を表す。

タイムスタンプ反転は、ｎビットのタイムスタンプがパケットのタイムスタンプを表すことができないときに、パケットのタイムスタンプが反転されることを意味する。例えば、ｎは４であり、前のパケットのタイムスタンプが１１１１である場合、次のパケットのタイムスタンプは反転され、したがって００００となる。

ＳＭＰＴＥ２１１０およびＡＥＳ６７のタイムスタンプは通常３２ビットを占める。タイムスタンプＴＳは３２ビットを使用して記録されるときに反転されるため、タイムスタンプ計算式（４）におけるｎ＝３２は、後続の説明において、例として３２を用いていることを示す。スイッチアウトストリームとして使用される第１のオーディオストリームと、スイッチインストリームとして使用される第２のオーディオストリームは、異なるサンプリング周波数を有するため、異なるタイムスタンプ計算基準を有し、同じサンプリングモーメントにおいて異なるタイムスタンプに対応する。したがって、スイッチインストリームおよびスイッチアウトストリームが同期されたとして、タイムスタンプ差がある。したがって、切り替えポイントのパラメータ値が計算されるときに、タイムスタンプは、基準サンプリング周波数に基づいて最初に統一されてもよい。基準サンプリング周波数は、スイッチインストリームのサンプリング周波数またはスイッチアウトストリームのサンプリング周波数であってもよい。あるいは、タイムスタンプは、同じ規格の別のサンプリング周波数に基づいて統一されてもよい。

例えば、スイッチアウトストリームのタイムスタンプが、スイッチインストリームのサンプリング周波数に基づいて統一される場合、スイッチアウトストリームのタイムスタンプは、以下の式（５）を使用することによって、スイッチインストリームのサンプリング周波数に基づいて統一されてもよい。

は、スイッチインストリームのサンプリング周波数であり、

は、スイッチアウトストリームのサンプリング周波数であり、

は、スイッチアウトストリームの非統一タイムスタンプであり、

は、スイッチアウトストリームの統一タイムスタンプである。

タイムスタンプの反転レートが非常に遅いことを考慮して、ｍは、現在のモーメントに基づいて計算を通じて得られてもよいし、または式（６）を使用していて計算を通じて得られてもよい。

t_ｃｕｒは、現在のモーメントであり、ｔ_{ｅｐｏｃｈ}は、エポックモーメントである。一般に、エポックモーメントが国際原子時刻（ｉｎｔｅｒｎａｔｉｏｎａｌａｔｏｍｉｃｔｉｍｅ、ＴＡＩ）１９７０－０１－０１Ｔ００：００：００である場合、現在の時刻もまたＴＡＩによって表されるモーメントである必要がある。

ＴＡＩは、いくつかの元素が極めて安定な原子エネルギー準位遷移周波数を有するという事実に従って、セシウム原子（Ｃｓ１３２．９）ベースのエネルギー準位遷移原子秒が時間スケールとして使用され、国際時間表現としてＴＡＩとも称されることを意味する。

この出願のこの実施形態では、第１のオーディオストリームの切り替えポイントのパラメータ値と第２のオーディオストリームの切り替えポイントのパラメータ値とを決定するとき、第１のオーディオストリームのサンプリング周波数が第２のオーディオストリームのサンプリング周波数と異なる場合、タイムスタンプは、式（５）および式（６）に従って基準サンプリング周波数に基づいて最初に統一される。次に、第１のオーディオストリームと第２のオーディオストリームの同期状態は、統一されたタイムスタンプに基づいて決定され、次に、第１のオーディオストリームの切り替えポイントのパラメータ値と第２のオーディオストリームの切り替えポイントのパラメータ値は、同期状態に基づいて決定される。

一例では、非同期持続時間ｔｎｓｙｎｃは、第１のパケットの統一タイムスタンプと第２のパケットの統一タイムスタンプを使用して計算を通じて得られ、第１のオーディオストリームと第２のオーディオストリームの同期状態は、非同期持続時間に基づいて決定されてもよい。

例えば、非同期持続時間が非同期しきい値（ｔｈｒｅｓｈｏｌｄ１）（非同期持続時間は、第１のオーディオストリームと第２のオーディオストリームとの間の非同期時間差であり、非同期しきい値は、オーディオインターバル範囲の手動で決定された経験的値に基づいて決定されてもよく、例えば、非同期しきい値の値範囲は、１～５ｍｓである）よりも長い場合、第１のオーディオストリームと第２のオーディオストリームは同期されていないと決定される。

例えば、非同期持続時間は、

であり、ＴＳ _ｏ ^０は、第１のオーディオストリーム内の第１のパケットの統一タイムスタンプを表し、ＴＳ_ｉ ^０は、第２のオーディオストリーム内の第２のパケットの統一タイムスタンプを表し、ｆ_ｉｏは、第１のタイムスタンプに対応するサンプリング周波数を表し、Ｋは、１よりも大きい整数である。

別の例では、第１のパケットの統一タイムスタンプと第２のパケットの統一タイムスタンプとの差に基づいて、第１のオーディオストリームと第２のオーディオストリームが同期しているかどうかが決定される。

である場合、第１のオーディオストリームと第２のオーディオストリームは同期していないと決定され、そうでなければ、第１のオーディオストリームと第２のオーディオストリームは同期していると決定される。

追加的に、第１のオーディオストリームの切り替えポイントのパラメータ値と、第２のオーディオストリームの切り替えポイントのパラメータ値とは、複数の方式で決定されてもよい。以下に、実施可能な３つの方法を示す。

第１の実現可能な方法では、第１のオーディオストリームと第２のオーディオストリームが同期している場合、第１のオーディオストリームの第１のパケットのタイムスタンプを第１のオーディオストリームの切り替えポイントのタイムスタンプとして使用してもよく、第２のオーディオストリームの第２のパケットのタイムスタンプを第２のオーディオストリームの切り替えポイントのタイムスタンプとして使用してもよい。

第２の実現可能な方法では、第１のオーディオストリームと第２のオーディオストリームが同期している場合、第１のオーディオストリームの切り替えポイントのものであって、かつ第１の実現可能な方法で決定されたタイムスタンプに特定の待ち時間を加えた後で、得られた合計が切り替えポイントのタイムスタンプとして使用され、第２のオーディオストリームの切り替えポイントのものであって、かつ第１の実現可能な方法で決定されたタイムスタンプに特定の待ち時間を加えた後で、得られた合計が切り替えポイントのタイムスタンプとして使用される。

例えば、第１のパケットの統一タイムスタンプと第２のパケットの統一タイムスタンプに基づいて、第１のオーディオストリームと第２のオーディオストリームが同期していると決定された場合、

および

である。

ＴＳ_ｉ＿ＳＷは、第２のオーディオストリームの切り替えポイントのタイムスタンプを表し、ＴＳ_ｉは、第２のパケットの非統一タイムスタンプを表し、ｔｉ＿ｐｋｔは、第２のオーディオストリームのパケット時間を表し、ｄｔｓ_ｉは、隣接するパケット間のタイムスタンプ差のものであって、第２のオーディオストリームのサンプリング周波数に対応する理論値を表し、ＴＳ_ｏ＿ＳＷは、第１のオーディオストリームの切り替えポイントのタイムスタンプを表し、ＴＳ_ｏは、第１のオーディオストリームの非統一タイムスタンプを表し、ｔｏ＿ｐｋｔは、第１のオーディオストリームのパケット時間を表し、ｄｔｓ_ｏは、隣接するパケット間のタイムスタンプ差のものであって、第１のオーディオストリームのサンプリング周波数に対応する理論値を表し、Ｋ１は、第１のプリセット持続時間を表す。

第３の実現可能な方法では、第１のオーディオストリームと第２のオーディオストリームが同期していない場合、第１のオーディオストリームおよび／または第２のオーディオストリームに対して特定の待ち時間（例えば、非同期持続時間）を加えた後、得られた合計が切り替えポイントのタイムスタンプとして使用されてもよい。第２のオーディオストリームが第１のオーディオストリームよりも早い場合、第２のオーディオストリームに対して特定の待ち時間（例えば、非同期持続時間）を加え、得られた合計が切り替えポイントのタイムスタンプとして使用されるため、第２のオーディオストリームが第１のオーディオストリームと同期する。順序ずれのケースを考慮すると、別の特定の待ち時間を、特定の待ち時間が加えられた第１のオーディオストリームと第２のオーディオストリームに対して別々に加えてもよく、得られた合計が切り替えポイントのタイムスタンプとして使用される。第２のオーディオストリームが第１のオーディオストリームより遅い場合、第１のオーディオストリームは第２オーディオストリームと同期される。順序ずれのケースを考慮すると、同期した第１のオーディオストリームと第２のオーディオストリームに対して別の特定の待ち時間を別々に加えてもよく、得られた合計が切り替えポイントのタイムスタンプとして使用される。

例えば、第１のパケットの統一タイムスタンプと第２のパケットの統一タイムスタンプに基づいて、第１のオーディオストリームと第２のオーディオストリームが同期しておらず、第１のパケットの統一タイムスタンプが第２のパケットの統一タイムスタンプよりも遅い、すなわち、第２のオーディオストリームが第１のオーディオストリームよりも早いと決定される場合、

および

であるか、または
第１のパケットの統一タイムスタンプと第２のパケットの統一タイムスタンプに基づいて、第１のオーディオストリームと第２のオーディオストリームが同期しておらず、第１のパケットの統一タイムスタンプが第２のパケットの統一タイムスタンプよりも早い、すなわち、第２のオーディオストリームが第１のオーディオストリームよりも遅いと決定される場合、

および

である。Ｋ２は、第２のプリセット持続時間である。

この出願のこの実施形態では、第１のオーディオストリームの切り替えポイントのパラメータ値と第２のオーディオストリームの切り替えポイントのパラメータ値とが決定されるときに、第１のオーディオストリームのサンプリング周波数が第２のオーディオストリームのサンプリング周波数と同じである場合、第１のオーディオストリームと第２のオーディオストリームとの間の同期関係は、第１のパケットのタイムスタンプと第２のパケットのタイムスタンプとに基づいて直接決定され、第１のオーディオストリームの切り替えポイントのパラメータ値と第２のオーディオストリームの切り替えポイントのパラメータ値とは、同期関係に基づいて決定されてもよい。非同期時間は、サンプリング周波数が同じあるときと、サンプリング周波数が異なるときとで異なる方式で決定される。

例えば、非同期時間

であり、ＴＳ_ｏは、第１のパケットのタイムスタンプを表し、ＴＳ_ｉは、第２のパケットのタイムスタンプを表し、ｆ_ｉｏは、第１のオーディオストリームのサンプリング周波数または第２のオーディオストリームのサンプリング周波数を表す。

第１のオーディオストリームの切り替えポイントのパラメータ値と第２のオーディオストリームの切り替えポイントのパラメータ値は、サンプリング周波数が同じときと、サンプリング周波数が異なるときとで、ｔ_{ｎｓｙｎｃ}がｔ_{１ｎｓｙｎｃ}に置き換えられる場合、同様の方式で決定されるが、詳細は、繰り返し説明されない。

図３は、切り替えポイントのタイムスタンプを決定するプロセスの一例の概略図である。例えば、第１のオーディオストリームのサンプリング周波数は、第２のオーディオストリームのサンプリング周波数とは異なり、２つのオーディオストリームが同期されているかどうかは、非同期持続時間に基づいて決定される。

Ｓ３０１．ｔ_{ｎｓｙｎｃ}＞ｔｈｒｅｓｈｏｌｄ１が満たされるかどうかを決定し、Ｙｅｓである場合、Ｓ２０２を実行し、Ｎｏである場合、Ｓ３０５を実行する。

Ｓ３０２．第１のパケットの統一タイムスタンプが第２のパケットの統一タイムスタンプより遅いかどうかを決定し、Ｙｅｓである場合、Ｓ３０３を実行し、Ｎｏである場合、Ｓ３０４を実行する。

Ｓ３０３．

および

である。

Ｓ３０４．

および

である。

Ｓ３０５．

および

である。

例えば、ｔ_{ｎｓｙｎｃ}＞ｔｈｒｅｓｈｏｌｄ１であるときに、第１のオーディオストリームと第２のオーディオストリームが同期していないと決定され、またはｔ_{ｎｓｙｎｃ}≦ｔｈｒｅｓｈｏｌｄ１であるときに、第１のオーディオストリームと第２のオーディオストリームが同期していないと決定される。ｔｈｒｅｓｈｏｌｄ１は、０または２ｍｓであり得る。

例えば、この出願のこの実施形態では、別のしきい値をさらに設定してもよく、これを第３のしきい値と呼び、第３のしきい値は、ｔｈｒｅｓｈｏｌｄ１よりも大きくてもよい。ｔ _{ｎｓｙｎｃ}＞第３の閾値である場合、第１のオーディオストリームと第２のオーディオストリームとが極端に大きく同期していないと決定され、第１のオーディオストリームの切り替えポイントのタイムスタンプと第２のオーディオストリームの切り替えポイントのタイムスタンプとは、Ｓ３０５を使用して決定されてもよい。

例えば、この出願のこの実施形態では、パラメータ値は、切り替えポイントのタイムスタンプであってもよく、またはシーケンス番号であってもよい。したがって、切り替えは、切り替えポイントのタイムスタンプに基づいて実行されてもよいし、切り替えポイントのシーケンス番号に基づいて実行されてもよい。切り替えポイントのタイムスタンプが決定された後、切り替えポイントのシーケンス番号は、切り替えポイントのタイムスタンプに基づいて決定されてもよい。

さらに、可能な例では、ステップＳ２０４において、切り替えデバイスは、第１のオーディオストリーム内にあり、かつパラメータ値が第１のオーディオストリームの切り替えポイントのパラメータ値よりも大きいパケットを、第２のオーディオストリーム内にあり、かつパラメータ値が第２のオーディオストリームの切り替えポイントのパラメータ値よりも大きいパケットに切り替え、例えば、パラメータ値がタイムスタンプであり、以下の方式で、スイッチインストリーム／スイッチアウトストリーム内のパケットのタイムスタンプが切り替えポイントのタイムスタンプよりも大きいかどうかが決定されてもよい。切り替えポイントのタイムスタンプが計算を通じて得られた後、スイッチインストリーム／スイッチアウトストリームの現在のパケットのタイムスタンプが得られる。現在のパケットのタイムスタンプが切り替えポイントのタイムスタンプよりも小さい場合、２つの可能性が存在する。すなわち、１つの可能性は、現在のパケットのタイムスタンプも切り替えポイントのタイムスタンプも反転されず、現在のパケットが切り替えポイントに達していないことである。もう１つの可能性は、現在のパケットのタイムスタンプが反転され、切り替えポイントのタイムスタンプが反転されず、現在のパケットが切り替えポイントを超えていることである。現在のタイムスタンプが切り替えポイントのタイムスタンプよりも大きい場合、２つの可能性が存在する。すなわち、１つの可能性は、現在のパケットのタイムスタンプも切り替えポイントのタイムスタンプも反転されず、現在のパケットが切り替えポイントを超えていることである。もう１つの可能性は、現在のパケットのタイムスタンプが反転されず、切り替えポイントのタイムスタンプが反転され、現在のパケットが切り替えポイントに達していないことである。

例えば、タイムスタンプによって占有されるビットの数ｎ＝３２が、例として使用される。現在のパケットのタイムスタンプが切り替えポイントのタイムスタンプよりも大きく、現在のパケットのタイムスタンプと切り替えポイントのタイムスタンプの差が２＾３１より大きい場合、切り替えポイントのタイムスタンプが反転され、現在のタイムスタンプが反転されないと決定される。現在のパケットのタイムスタンプが切り替えポイントのタイムスタンプよりも小さく、切り替えポイントのタイムスタンプと現在のパケットのタイムスタンプの差が２＾３１より大きい場合、切り替えポイントのタイムスタンプが反転されず、現在のパケットのタイムスタンプが反転されると決定される。

図４Ａおよび図４Ｂは、切り替えデバイスが第１のオーディオストリーム内にあり、かつパラメータ値が第１のオーディオストリームの切り替えポイントのパラメータ値よりも大きいパケットを、第２のオーディオストリーム内にあり、かつパラメータ値が第２のオーディオストリームの切り替えポイントのパラメータ値よりも大きいパケットに切り替える実施態様プロセスの例の概略図である。たとえば、パラメータ値はタイムスタンプである。

Ｓ４０１ａ．第１のオーディオストリーム内の現在のパケットのタイムスタンプＴＳ１を得る。

Ｓ４０２ａ．ＴＳ１が第１のオーディオストリームの切り替えポイントのタイムスタンプＴＳ_ｉ＿ＳＷよりも大きいかどうかを決定し、Ｙｅｓの場合、ステップＳ４０３ａを実行し、Ｎｏの場合、ステップＳ４０４ａを実行する。

Ｓ４０３ａ．Ｄｉｆｆ＿ＴＳ１＝ＴＳ１－ＴＳ_ｉ＿ＳＷを得る。

Ｓ４０５ａ．Ｄｉｆｆ＿ＴＳ１＞２＾３１であるかどうかを決定し、Ｙｅｓの場合、４０６ａを実行し、Ｎｏの場合、Ｓ４０７ａを実行する。

Ｓ４０６ａ．切り替えポイントのタイムスタンプが反転され、この場合、現在のパケットが切り替えポイントを超えず、現在のパケットを転送する。

Ｓ４０７ａ．現在のパケットを破棄する。

Ｓ４０４ａ．Ｄｉｆｆ＿ＴＳ２＝ＴＳ１＿ＳＷ－ＴＳ_ｉを得る。

Ｓ４０８ａ．Ｄｉｆｆ＿ＴＳ２＞２＾３１であるかどうかを決定し、Ｙｅｓの場合、Ｓ４０９ａを実行し、Ｎｏ場合、Ｓ４１０ａを実行する。

Ｓ４０９ａ．現在のパケットのタイムスタンプが反転され、現在のパケットが切り替えポイントを超え、現在のパケットを破棄する。

Ｓ４１０ａ．現在のパケットを転送する。

Ｓ４０１ｂ．第２のオーディオストリーム内の現在のパケットのタイムスタンプＴＳ２を得る。

Ｓ４０２ｂ．ＴＳ２が第２のオーディオストリームの切り替えポイントのタイムスタンプＴＳ_ｏ＿ＳＷよりも大きいかどうかを決定し、Ｙｅｓの場合、ステップＳ４０３ｂを実行し、Ｎｏの場合、ステップＳ４０４ｂを実行する。

Ｓ４０３ｂ．Ｄｉｆｆ＿ＴＳ１＝ＴＳ２－Ｔｓ_ｏ＿ＳＷを得る。

Ｓ４０５ｂ．Ｄｉｆｆ＿ＴＳ１＞２＾３１であるかどうかを決定し、Ｙｅｓの場合、Ｓ４０６ｂを実行し、Ｎｏの場合、Ｓ４０７ｂを実行する。

Ｓ４０６ｂ．切り替えポイントのタイムスタンプが反転しており、この場合、現在のパケットが切り替えポイントを超えていないことを決定し、現在のパケットを破棄する。

Ｓ４０７ｂ．現在のパケットを転送する。

Ｓ４０４ｂ．Ｄｉｆｆ＿ＴＳ２＝ＴＳ_ｏ＿ＳＷ－ＴＳ_ｏを得る。

Ｓ４０８ｂ．Ｄｉｆｆ＿ＴＳ２＞２＾３１であるかどうかを決定し、Ｙｅｓの場合、Ｓ４０９ｂを実行し、Ｎｏの場合、Ｓ４１０ｂを実行する。

Ｓ４０９ｂ．現在のパケットのタイムスタンプが反転され、現在のパケットが切り替えポイントを超え、現在のパケットを転送する。

Ｓ４１０ｂ．現在のパケットを破棄する。

以下では、特定のアプリケーションシナリオを参照して、この出願のこの実施形態を詳細に説明する。

ここでは、例えば、２つの切り替えられるオーディオストリームは、ＳＭＰＴＥ２１１０規格を満たし、２つのオーディオストリームに含まれるパケットは、ＲＴＰパケットである。

まず、２つのオーディオストリーム間の切り替えを例として使用する。図５は、切り替えられる２つのオーディオストリームを示す。図５では、例えば、２つのオーディオストリームのオーディオ情報は、切り替え命令が受信された後に学習される。特定のオーディオ情報学習方式については、図２に示す実施形態の説明を参照のこと。詳細は、ここでは再度説明しない。図５において、オーディオストリーム１はスイッチアウトストリームであり、オーディオストリーム２はスイッチインストリームである。

任意選択で、この出願では、各オーディオストリームに対して切り替えフローテーブルをさらに確立して、オーディオストリームの切り替え状態、オーディオ情報などを記録してもよい。

例えば、図６は、切り替えフローテーブルの形態を示す。

図６において、ストリームタイプＴＹＰＥは、オーディオストリームの状態を表し、３つの状態が存在する。すなわち、通常転送ストリーム、スイッチインストリーム、およびスイッチアウトストリームである。

タイムスタンプ（ＴＳ）は、オーディオストリーム内の現在のパケットのタイムスタンプを表し、ＲＴＰ．ＴＳから得られてもよい。

シーケンス番号（ＳＮ）は、オーディオストリーム内の現在のパケットのシーケンス番号を表し、ＲＴＰ．ＳＮから得られてもよい。

タイムスタンプ差合計（ＳＵＭ＿ＤＴＳ）は、オーディオ情報学習プロセスで受信したパケット間のタイムスタンプ差の合計を表す。

シーケンス番号差合計（ＳＵＭ＿ＤＳＥＱ）は、統計学習プロセスで受信したパケット間のシーケンス番号差の合計を表す。

パケット時間Ｔ＿ＰＫＴ（Ｔ＿ＰＫＴ）は、オーディオストリームのパケット時間を表す。例えば、２つのタイプのパケット時間が存在する。すなわち、１２５μｓ、および１ｍｓである。

サンプリング周波数（Ｆ＿ＳＭＰＬ）は、オーディオストリームのサンプリング周波数を表す。例えば、３つのサンプリング周波数が存在する。すなわち、４４．１ｋＨｚ、４８ｋＨｚ、および９６ｋＨｚである。

切り替えポイントタイムスタンプＴＳ＿ＳＷは、切り替えポイントのタイムスタンプを表す。

切り替えポイントシーケンス番号（ＴＳ＿ＳＮ）は、切り替えポイントのシーケンス番号を表す。

シーケンス番号オフセット（ＳＮ＿ＯＦＳＴ）は、スイッチアウトストリームの転送中のＲＴＰシーケンス番号オフセット値を表す。

学習フラグ（Ｆ＿ＬＮ）は、オーディオストリームのオーディオ情報が学習され始めることを示すフラグを表す。

学習フェーズ終了フラグ（Ｆ＿ＦＬ）は、オーディオストリームのオーディオ情報の学習フェーズの終了フラグを表す。

切り替えポイントの計算終了フラグ（Ｆ＿ＦＳＷ）は、切り替えポイントの計算が終了したことを示すフラグを表す。

図７は、オーディオストリーム切り替え方法の一例の概略フローチャートである。

Ｓ７０１ａ．オーディオストリーム１内のパケットの転送をスキップする。

Ｓ７０１ｂ．オーディオストリーム２内のパケットを通常転送する。

Ｓ７０２．切り替え命令を受信する。切り替え命令は、オーディオストリーム１をオーディオストリーム２に切り替えるように指示するために使用される。

オーディオストリーム１の切り替えフローテーブル内のストリームタイプは、スイッチアウトストリームに更新され、オーディオストリーム２の切り替えフローテーブル内のストリームタイプは、スイッチインストリームに更新される。

例えば、オーディオ情報学習フェーズに入り、切り替え命令が受信されたパケットの次のパケットから開始され、２つのオーディオストリームの切り替えフローテーブルにおける学習フラグＦ＿ＬＮエントリは、例えば１に設定されるように更新されてもよい。

Ｓ７０３ａ．オーディオストリーム１のオーディオ情報を学習するプロセスを実行する。オーディオ情報は、サンプリング周波数を含み、パケット時間をさらに含んでもよい。Ｓ７０３ｂ．オーディオストリーム２のオーディオ情報を学習するプロセスを実行する。

オーディオストリーム１とオーディオストリーム２内の各パケットを受信した後、パケットのタイムスタンプと切り替えフローテーブル内のタイムスタンプＴＳとの差と、パケットのシーケンス番号と切り替えフローテーブル内のシーケンス番号ＳＮとの差を計算し、その差に基づいて切り替えフローテーブル内のＳＵＭ＿ＤＴＳとＳＵＭ＿ＤＳＥＱを更新し、現在受信しているパケットに基づいてフローテーブル内のＴＳエントリとＳＮエントリの値を更新する（学習フェーズにおける最初のパケットに対しては、フローテーブルのＴＳエントリとＳＮエントリのみを更新する必要があり、他の動作を実行する必要はない）。

Ｓ７０４ａ．学習を終了し、オーディオストリーム１のオーディオ情報を得る。

Ｓ７０４ｂ．学習を終了し、オーディオストリーム２のオーディオ情報を得る。

学習終了後、ＳＵＭ＿ＤＴＳおよびＳＵＭ＿ＤＳＥＱに基づき、オーディオストリーム１およびオーディオストリーム２の各々のパケット時間およびサンプリング周波数などのオーディオ情報を得て、パケット時間およびサンプリング周波数は、フローテーブル内のパケット時間Ｔ＿ＰＫＴおよびサンプリング周波数Ｆ＿ＳＭＰＬ値にそれぞれ更新される。２つのオーディオストリームの切り替えフローテーブル内の学習フェーズ終了フラグＦ＿ＦＬは、さらに更新されてもよく、例えば、１に設定されてもよい。

Ｓ７０５．オーディオストリーム１のタイムスタンプ基準とオーディオストリーム２のタイムスタンプ基準を統一する。例えば、オーディオストリーム１およびオーディオストリーム２の各々において学習が終了した最初のパケットは、オーディオストリーム１のタイムスタンプ基準とオーディオストリーム２のタイムスタンプ基準を統一するように選択される。

Ｓ７０６．オーディオストリーム１の切り替えポイントのタイムスタンプと、オーディオストリーム２の切り替えポイントのタイムスタンプとを別々に決定する。

学習フェーズ終了フラグＦ＿ＦＬが１になった後、切り替えポイントの計算を開始する。オーディオストリーム１のタイムスタンプ参照とオーディオストリーム２のタイムスタンプ参照が統一され、同期状態が決定される。オーディオストリーム１の切り替えポイントのタイムスタンプおよび／またはシーケンス番号、オーディオストリーム２の切り替えポイントのタイムスタンプおよび／またはシーケンス番号、およびオーディオストリーム２のシーケンス番号オフセットが計算される。

例えば、図８に示すように、順序ずれを考慮すると、オーディオストリーム１ではシーケンス番号８２のパケットの受信時間がシーケンス番号８１のパケットの受信時間よりも早く、オーディオストリーム２ではシーケンス番号１７のパケットの受信時間がシーケンス番号１６のパケットの受信時間よりも早い。したがって、特定の待ち時間が、切り替えポイントの計算されたタイムスタンプまたはシーケンス番号に加えられ、得られたオーディオストリーム１の切り替えポイントのタイムスタンプは３８４であり、得られたオーディオストリーム１の切り替えポイントのシーケンス番号は１６である。オーディオストリーム２の切り替えポイントのタイムスタンプは３８８であり、オーディオストリーム２の切り替えポイントのシーケンス番号は８１である。

Ｓ７０７ａ．オーディオストリーム２内にあり、かつタイムスタンプがオーディオストリーム２の切り替えポイントのタイムスタンプよりも大きいパケットを破棄する。

Ｓ７０７ｂ．オーディオストリーム１内にあり、かつタイムスタンプがオーディオストリーム１の切り替えポイントのタイムスタンプよりも大きいパケットを破棄する。

切り替えポイント計算終了フラグが真の後、オーディオストリーム１およびオーディオストリーム２の各々におけるパケットのタイムスタンプが切り替えポイントのタイムスタンプよりも大きいかどうかが決定される。図８に示すように、タイムスタンプがオーディオストリーム２において３８４以上であるパケットは、もはや転送されない。タイムスタンプがオーディオストリーム１において３８８以上であるパケットが転送される。具体的には、オーディオストリーム２では、タイムスタンプが４３２であるパケットの受信時間は、タイムスタンプが３８４であるパケットの受信時間よりも早いが、タイムスタンプが４３２であるパケットは、もはや転送されない。オーディオストリーム１では、タイムスタンプが４８０であるパケットの受信時間は、タイムスタンプが３８８であるパケットの受信時間よりも早いが、タイムスタンプが４８０であるパケットは転送される必要がある。

追加的に、オーディオストリーム１（スイッチインストリーム）内のパケットが転送されるときに、宛先ＩＰと宛先ポートが修正される。切り替えプロセスにおけるＲＴＰシーケンス番号の連続性を保証するために、オーディオストリーム１（スイッチインストリーム）内の転送されたパケットのシーケンス番号は、オーディオストリーム１のシーケンス番号オフセット値とオーディオストリーム２のシーケンス番号オフセット値に基づいて修正されてもよい。

例えば、図９に示すように、切り替え前に、オーディオストリーム２のシーケンス番号オフセット値に基づいて、オーディオストリーム２のシーケンス番号９０～９４は、計算を通じてシーケンス番号３０００～３００４であるべきであると決定される。切り替え後、シーケンス番号は３００５から始まるべきである。オーディオストリーム１内のパケットのシーケンス番号は、切り替えが始まるときに、１００５から始まり、オーディオストリーム１のシーケンス番号オフセット値が２０００であると判断し、シーケンス番号オフセット値２０００を計算を通じて各シーケンス番号に加えるようにする。

任意選択で、オーディオストリーム１とオーディオストリーム２との間の切り替えが始まった後にプリセット持続時間が満了した後、オーディオストリーム１とオーディオストリーム２は安定状態に入り、切り替えが終了するときに、オーディオストリーム１とオーディオストリーム２との切り替えフローテーブル内のストリームタイプが更新されてもよい。加えて、切り替えフローテーブル内のストリームタイプとシーケンス番号オフセットとは異なる他のフィールドが、リセットされてもよい。

加えて、Ｙ個のオーディオストリームを別のＹ個のオーディオストリームに切り替えてもよく、Ｙは２以上の正の整数である。例えば、図１０を参照すると、２つのオーディオストリームは、別の２つのオーディオストリームに切り替えられる。複数のオーディオストリーム間の切り替えと２つのオーディオストリーム間の切り替えとの違いは、切り替えプロセスにおいて、切り替えポイントのタイムスタンプおよび／またはシーケンス番号が計算される前に、スイッチインストリームに含まれる２つのオーディオストリームのタイムスタンプおよびスイッチアウトストリームに含まれる２つのオーディオストリームのタイムスタンプが、最初に、同じタイムスタンプ基準に基づいて統一され、４つのオーディオストリーム内にあり、かつ基準に基づいて統一された後に得られるタイムスタンプが比較されて、スイッチインストリームに含まれる２つのオーディオストリームのうちの早いタイムスタンプを有するオーディオストリーム、およびスイッチアウトストリームに含まれる２つのオーディオストリームのうちの早いタイムスタンプを有するオーディオストリームが決定される点にある。スイッチインストリームのタイムスタンプは、スイッチインストリーム内の早いタイムスタンプを有するオーディオストリームに基づいて決定され、スイッチアウトストリームのタイムスタンプは、スイッチアウトストリーム内の早いタイムスタンプを有するオーディオストリームに基づいて決定される。例えば、図１０に示すように、スイッチインストリームは、オーディオストリームａおよびオーディオストリームｂを含み、スイッチアウトストリームは、オーディオストリームｃおよびオーディオストリームｄを含む。図１０から、オーディオストリームｂは、スイッチインストリームのオーディオストリームａよりも早く、オーディオストリームｃは、スイッチアウトストリームのオーディオストリームｄよりも早いことが分かる。スイッチインストリームおよびスイッチアウトストリームの切り替えポイントのタイムスタンプおよび／またはシーケンス番号は、オーディオストリームｂおよびオーディオストリームｃのタイムスタンプに基づいて別々に決定されてもよい。特定の決定方式については、図２および図７に示す実施形態の説明を参照のこと。詳細は、ここでは再度説明しない。

図１１に示されるように、前述の方法の実施形態と同じ発明の概念に基づいて、この出願の実施形態は、さらに装置を提供する。装置は、受信ユニット１１０１、処理ユニット１１０２、および送信ユニット１１０３を含んでもよい。

可能な実施態様では、装置は、前述の方法における切り替えデバイスの機能を実装する。装置は、切り替えデバイスであってもよいし、切り替えデバイス内の１つ以上のプロセッサ、または１つ以上のチップであってもよい。具体的には、受信ユニット１１０１、処理ユニット１１０２、送信ユニット１１０３は、前述の方法の実施形態のいずれかにおいて、切り替えデバイスによって実行する対応する機能を実行してもよい。ここでは、詳細は記載しない。

この出願のこの実施態様において、ユニット分割は、一例であり、単に論理機能分割である。実際の実施態様では、別の分割方式が存在してもよい。追加的に、この出願のこの実施形態における機能ユニットは、１つのプロセッサに統合されてもよいし、物理的に単独で存在してもよいし、２つ以上のユニットが１つのユニットに統合されてもよい。統合ユニットは、ハードウェアの形態で実施されてもよいし、ソフトウェア機能ユニットの形態で実施されてもよい。

図１２に示すように、同じ概念に基づいて、この出願は、装置１２００を提供する。装置１２００は、少なくとも１つのプロセッサ１２１０を含む。装置は、プログラム命令および／またはデータを記憶するように構成されている少なくとも１つのメモリ１２２０をさらに含んでもよい。メモリ１２２０は、プロセッサ１２１０に結合される。この出願のこの実施形態における結合は、装置、ユニット、またはモジュール間の間接的な結合または通信接続であり、電気的、機械的、または他の形態で実施してもよく、装置、ユニット、またはモジュール間の情報交換のために使用される。プロセッサ１２１０は、メモリ１２２０と協調動作を実行してもよい。プロセッサ１２１０は、プロセッサ１２１０がプログラム命令を呼び出してプロセッサ１２１０の機能を実施するように、メモリ１２２０に記憶されたプログラム命令を実行してもよい。任意選択で、少なくとも１つのメモリ１２２０のうちの少なくとも１つは、プロセッサ１２１０に含まれてもよい。装置１２００は、通信インターフェース１２３０をさらに含んでもよい。装置１２００は、通信インターフェース１２３０を使用して、他の装置と情報を交換してもよい。通信インターフェース１２３０は、回路、バス、トランシーバ、または情報を交換するように構成され得る任意の他の装置であってもよい。

装置１２００は、切り替えデバイスに適用される。具体的には、装置１２００は、切り替えデバイスであってもよいし、前述の実施形態のいずれかに従った方法において切り替えデバイスの機能を実施する際に切り替えデバイスをサポートすることができる装置であってもよい。例えば、装置１２００内の少なくとも１つのプロセッサ１２１０は、前述の実施形態のいずれかに従った方法における切り替えデバイスの機能を実施するように構成されている。

例えば、装置１２００は、チップまたはチップシステムであってもよい。任意選択で、この出願のこの実施形態では、チップシステムは、チップを含んでもよいし、チップおよび別の個別デバイスを含んでもよい。

この出願のこの実施形態では、通信インターフェース１２３０、プロセッサ１２１０、およびメモリ１２２０の間の特定の接続媒体は、制限されない。この出願のこの実施形態では、メモリ１２２０、プロセッサ１２１０、および通信インターフェース１２３０は、図１２におけるバスを使用して接続される。図１２において、バスは太線を使用して示されている。他の構成要素間の接続方式は、説明のための単なる例にすぎず、制限を課すものではない。バスは、アドレスバス、データバス、制御バスなどに分類されてもよい。表現を容易にするために、図１２のバスを表すためには１つの太線のみが使用されるが、これは、バスが１つのみ、またはバスのタイプが１つのみであることを意味するものではない。

この出願のこの実施形態では、プロセッサは、汎用プロセッサ、デジタル信号プロセッサ、特定用途向け集積回路、フィールドプログラマブルゲートアレイもしくは別のプログラマブル論理デバイス、個別ゲートもしくはトランジスタ論理デバイス、または個別ハードウェアコンポーネントであってもよいし、この出願の実施形態で開示される方法、ステップ、および論理ブロック図を実施または実行してもよい。汎用プロセッサは、マイクロプロセッサ、任意の従来のプロセッサなどとしてもよい。この出願の実施形態を参照して開示される方法のステップは、ハードウェアプロセッサによって直接的に実行されてもよいし、プロセッサ内のハードウェアとソフトウェアモジュールとの組み合わせを使用して実行されてもよい。

この出願のこの実施形態では、メモリは、ハードディスク（ｈａｒｄｄｉｓｋｄｒｉｖｅ、ＨＤＤ）またはソリッドステートドライブ（ｓｏｌｉｄ－ｓｔａｔｅｄｒｉｖｅ、ＳＳＤ）などの不揮発性メモリであってもよいし、ランダムアクセスメモリ（ｒａｎｄｏｍ－ａｃｃｅｓｓｍｅｍｏｒｙ、ＲＡＭ）などの揮発性メモリ（ｖｏｌａｔｉｌｅｍｅｍｏｒｙ）であってもよい。代替的に、メモリは、命令またはデータ構造の形態で期待されるプログラムコードを搬送または記憶するように構成することができ、コンピュータにアクセス可能であるが、これに限定されない他の任意の媒体であってもよい。代替的に、この出願のこの実施形態のメモリは、記憶機能を実施することができ、プログラム命令および／またはデータを記憶するように構成されている回路または任意の他の装置であってもよい。

前述の実施形態に基づいて、この出願の実施形態は、さらに、コンピュータ記憶媒体を提供する。記憶媒体は、ソフトウェアプログラムを記憶し、１つ以上のプロセッサによって読み出され実行されるときに、ソフトウェアプログラムは、前述の実施形態のうちの１つ以上に従って方法を実施することができる。コンピュータ記憶媒体は、ＵＳＢフラッシュドライブ、リムーバブルハードディスク、リードオンリーメモリ、ランダムアクセスメモリ、磁気ディスク、または光ディスクなどのプログラムコードを記憶することができる任意の媒体を含んでもよい。

前述の実施形態に基づいて、この出願の実施形態は、チップをさらに提供する。チップは、前述の実施形態のうちのいずれか１つまたは複数において機能を実施する、例えば、前述の方法における情報またはメッセージを取得または処理するように構成されているプロセッサを含む。任意選択で、チップは、メモリをさらに含み、メモリは、プロセッサが機能を実行するために必要なプログラム命令およびデータを記憶するように構成されている。チップは、チップを含んでもよいし、チップおよび別の個別デバイスを含んでもよい。

当業者は、この出願の実施形態が、方法、システムまたはコンピュータプログラム製品として提供され得ることを理解すべきである。したがって、この出願は、ハードウェアのみの実施形態、ソフトウェアのみの実施形態、またはソフトウェアとハードウェアの組み合わせを有する実施形態の形態を使用してもよい。追加的に、この出願は、コンピュータ使用可能プログラムコードを含む、１つ以上のコンピュータ使用可能な記憶媒体（限定するものではないが、磁気ディスクメモリ、ＣＤ－ＲＯＭ、光メモリなどを含む）上に実施されるコンピュータプログラム製品の形態を使用してもよい。

この出願は、この出願の実施形態による方法、デバイス（システム）、およびコンピュータプログラム製品のフローチャートおよび／またはブロック図を参照して説明される。コンピュータプログラム命令は、フローチャートおよび／またはブロック図の各プロセスおよび／または各ブロック、およびフローチャートおよび／またはブロック図のプロセスおよび／またはブロックの組み合わせを実施するために使用され得ると理解されたい。これらのコンピュータプログラム命令は、汎用コンピュータ、専用コンピュータ、埋め込みプロセッサ、または別のプログラマブルデータ処理デバイスのプロセッサに提供されてもよく、コンピュータまたは別のプログラマブルデータ処理デバイスのプロセッサによって実行される命令が、フローチャートの１つ以上のプロセスおよび／またはブロック図の１つ以上のブロックにおいて特定の機能を実施するための装置を生成するように、マシンを生成する。

これらのコンピュータプログラム命令は、代替的に、コンピュータまたは別のプログラマブルデータ処理デバイスが特定の方式で動作するように命令することができるコンピュータ可読メモリに記憶されてもよく、コンピュータ可読メモリに記憶された命令が、命令装置を含むアーチファクトを生成するようにする。命令装置は、フローチャート中の１つ以上のプロセスおよび／またはブロック図中の１つ以上のブロック中の特定の機能を実施する。

これらのコンピュータプログラム命令は、代替的に、コンピュータまたは別のプログラマブルデータ処理デバイスにロードされてもよく、一連の動作およびステップがコンピュータまたは別のプログラマブルデバイス上で実行され、それによって、コンピュータに実施された処理を生成する。したがって、コンピュータまたは別のプログラマブルデバイス上で実行される命令は、フローチャート中の１つ以上のプロセスおよび／またはブロック図中の１つ以上のブロック中の特定の機能を実施するためのステップを提供する。

当業者は、この出願の範囲から逸脱することなく、この出願に様々な修正および変更を加えることができることは明らかである。このようにして、この出願は、この出願の特許請求の範囲およびそれらの同等の技術に含まれる限り、この出願のこれらの修正および変更をカバーすることを意図している。

Claims

オーディオストリーム切り替え方法であって、
切り替えデバイスによって、切り替え命令を受信することであって、前記切り替え命令は、送信された第１のオーディオストリームから第２のオーディオストリームに切り替えるように指示する、受信することと、
前記切り替えデバイスによって、前記第１のオーディオストリームの第１のパケットのタイムスタンプと前記第２のオーディオストリームの第２のパケットのタイムスタンプとに基づいて、前記第１のオーディオストリームと前記第２のオーディオストリームとの間の同期関係を決定することであって、前記第１のパケットの受信時間は、前記第２のパケットの受信時間と同じである、決定することと、
前記切り替えデバイスによって、前記同期関係と前記第１のパケットの前記タイムスタンプとに基づいて、前記第１のオーディオストリームの切り替えポイントのパラメータ値を決定し、前記同期関係と前記第２のパケットの前記タイムスタンプとに基づいて、前記第２のオーディオストリームの切り替えポイントのパラメータ値を決定することであって、前記切り替えポイントの前記パラメータ値が、前記切り替えポイントのタイムスタンプまたは前記切り替えポイントのシーケンス番号である、決定することと、
前記切り替えデバイスによって、前記第１のオーディオストリーム内にあり、かつパラメータ値が前記第１のオーディオストリームの前記切り替えポイントの前記パラメータ値より大きいパケットを、前記第２のオーディオストリーム内にあり、かつパラメータ値が前記第２のオーディオストリームの前記切り替えポイントの前記パラメータ値より大きいパケットに切り替えることと、を含み、
前記切り替えデバイスによって、前記第１のオーディオストリームの第１のパケットのタイムスタンプと前記第２のオーディオストリームの第２のパケットのタイムスタンプとに基づいて、前記第１のオーディオストリームと前記第２のオーディオストリームとの間の同期関係を決定することは、
前記第１のオーディオストリームのサンプリング周波数が、前記第２のオーディオストリームのサンプリング周波数と異なるときに、前記切り替えデバイスによって、前記第１のオーディオストリームの前記サンプリング周波数と前記第２のオーディオストリームの前記サンプリング周波数とに基づいて、かつ基準サンプリング周波数に基づいて、前記第１のパケットの前記タイムスタンプと前記第２のパケットの前記タイムスタンプとを統一することと、前記切り替えデバイスによって、前記第１のパケットの統一タイムスタンプと前記第２のパケットの統一タイムスタンプとに基づいて、前記第１のオーディオストリームと第２のオーディオストリームとの間の前記同期関係を決定することと、を含み、
前記第１のオーディオストリームの前記サンプリング周波数は、前記第１のオーディオストリーム内のＮ個の受信パケットのタイムスタンプに基づいて決定され、前記第２のオーディオストリームの前記サンプリング周波数は、前記第２のオーディオストリーム内のＭ個の受信パケットのタイムスタンプに基づいて決定され、ＭとＮの両方は、正の整数であり、前記基準サンプリング周波数は、前記第１のオーディオストリームの前記サンプリング周波数、前記第２のオーディオストリームの前記サンプリング周波数、またはプリセットサンプリング周波数である、方法。
前記第１のオーディオストリームの前記サンプリング周波数および前記第２のオーディオストリームの前記サンプリング周波数は、
前記切り替えデバイスによって、前記第１のオーディオストリームの第１のタイムスタンプ増分グループと、前記第２のオーディオストリームの第２のタイムスタンプ増分グループとを得ることであって、
前記第１のタイムスタンプ増分グループは、前記Ｎ個のパケットの前記タイムスタンプに基づいて決定されるＮ－１個の第１のタイムスタンプ増分を含み、前記第２のタイムスタンプ増分グループは、前記Ｍ個のパケットの前記タイムスタンプに基づいて決定されるＭ－１個の第２のタイムスタンプ増分を含み、
前記第１のタイムスタンプ増分は、前記第１のオーディオストリーム内の２つの連続的に受信されたパケット間のタイムスタンプ差であり、前記第２のタイムスタンプ増分は、前記第２のオーディオストリーム内の２つの連続的に受信されたパケット間のタイムスタンプ差であるか、または、前記第１のタイムスタンプ増分は、前記第１のオーディオストリーム内の受信された隣接パケット間のタイムスタンプ差であり、前記第２のタイムスタンプ増分は、前記第２のオーディオストリーム内の受信された隣接パケット間のタイムスタンプ差である、ことと、
前記切り替えデバイスによって、前記第１のタイムスタンプ増分グループに基づいて、前記第１のオーディオストリームの前記サンプリング周波数を決定し、前記第２のタイムスタンプ増分グループに基づいて、前記第２のオーディオストリームの前記サンプリング周波数を決定することと、を行うことにより決定される、請求項１に記載の方法。
前記Ｎ個のパケットは、前記切り替え命令が受信された後に受信される前記第１のオーディオストリーム内の最初のＮ個のパケットであり、前記Ｍ個のパケットは、前記切り替え命令が受信された後に受信される前記第２のオーディオストリーム内の最初のＭ個のパケットであり、ＮはＭに等しい、請求項２に記載の方法。
前記第１のパケットは、前記第１のオーディオストリーム内にあり、前記第１のオーディオストリームの前記サンプリング周波数が決定されたときに受信されるパケットであり、前記第２のパケットは、前記第２のオーディオストリーム内にあり、前記第２のオーディオストリームのオーディオ情報が決定されたときに受信されるパケットである、請求項３に記載の方法。
前記切り替えデバイスによって、前記同期関係と前記第１のパケットの前記タイムスタンプとに基づいて、前記第１のオーディオストリームの切り替えポイントのパラメータ値を決定し、前記同期関係と前記第２のパケットの前記タイムスタンプとに基づいて、前記第２のオーディオストリームの切り替えポイントのパラメータ値を決定することは、
前記切り替えデバイスによって、前記同期関係、前記第１のパケットの前記タイムスタンプ、および前記第１のオーディオストリームのパケット時間に基づいて、前記第１のオーディオストリームの前記切り替えポイントの前記パラメータ値を決定し、前記同期関係、前記第２のパケットの前記タイムスタンプ、前記第２のオーディオストリームのパケット時間に基づいて、前記第２のオーディオストリームの前記切り替えポイントの前記パラメータ値を決定することを含み、
前記第１のオーディオストリームの前記パケット時間は、前記Ｎ個のパケットの前記タイムスタンプに基づいて決定され、第２のオーディオストリームの前記パケット時間は、前記Ｍ個のパケットの前記タイムスタンプに基づいて決定される、請求項２～４のいずれか一項に記載の方法。
前記第１のオーディオストリームの前記切り替えポイントのパケットタイムスタンプと、前記第２のオーディオストリームの前記切り替えポイントのパケットタイムスタンプとが、
前記第１のパケットの前記統一タイムスタンプと前記第２のパケットの前記統一タイムスタンプとに基づいて、前記第１のオーディオストリームと第２のオーディオストリームとが同期されていると決定された場合、

、および

であるという条件、
前記第１のパケットの前記統一タイムスタンプが、前記第２のパケットの前記統一タイムスタンプよりも遅い場合、

、および

であるという条件、または
前記第１のパケットの前記統一タイムスタンプが、前記第２のパケットの前記統一タイムスタンプよりも早い場合、

、および

であるという条件を満たし、

であり、ＴＳ_ｏ ^０は、前記第１のパケットの前記統一タイムスタンプを表し、ＴＳ_ｉ ^０は、前記第２のパケットの前記統一タイムスタンプを表し、ｆ_ｉｏは、前記基準サンプリング周波数を表し、ＴＳ_ｉ＿ＳＷは、前記第２のオーディオストリームの前記切り替えポイントの前記タイムスタンプを表し、ＴＳ_ｉは、前記第２のパケットの非統一タイムスタンプを表し、ｔｉ＿ｐｋｔは、前記第２のオーディオストリームの前記パケット時間を表し、ｄｔｓ_ｉは、隣接するパケット間のタイムスタンプ差のものであって、前記第２のオーディオストリームの前記サンプリング周波数に対応する理論値を表し、ＴＳ_ｏ＿ＳＷは、前記第１のオーディオストリームの前記切り替えポイントの前記タイムスタンプを表し、ＴＳ_ｏは、前記第１のオーディオストリームの非統一タイムスタンプを表し、ｔｏ＿ｐｋｔは、前記第１のオーディオストリームの前記パケット時間を表し、ｄｔｓ_ｏは、隣接するパケット間のタイムスタンプ差のものであって、前記第１のオーディオストリームの前記サンプリング周波数に対応する理論値を表し、Ｋ１は、第１のプリセット持続時間を表し、Ｋ２は、第２のプリセット持続時間を表す、請求項５に記載の方法。
決定されるオーディオストリームのパケット時間が、

である場合、前記決定されるオーディオストリームの前記パケット時間が第１の値であるという条件、または

である場合、前記決定されるオーディオストリームの前記パケット時間が第２の値であるという条件を満たし、前記決定されるオーディオストリームが、前記第１のオーディオストリームまたは前記第２のオーディオストリームであり、

であり、

は、前記決定されるオーディオストリームのタイムスタンプ増分グループに基づいて決定されたタイムスタンプ増分平均を表し、ｄＴＳ_{ｔｈｒｅｓ}は、隣接するパケット間のタイムスタンプ差のものであり、異なるパケット時間に対応する理論値に関し、ｄＴＳ_ｉは、前記決定されるオーディオストリームの前記タイムスタンプ増分グループのｉ番目のタイムスタンプ増分を表し、ｄＳＥＱ_ｉは、前記ｉ番目のタイムスタンプ増分に対応する２つのパケット間のシーケンス番号差を表し、ｗは、前記決定されるオーディオストリームの前記タイムスタンプ増分グループのタイムスタンプ増分の数を表す、請求項５または６に記載の方法。
前記切り替えデバイスによって、前記第１のタイムスタンプ増分グループに基づいて、前記第１のオーディオストリームの前記サンプリング周波数を決定することは、
複数の第１のフィッティング誤差を得るために、前記Ｎ－１個の第１のタイムスタンプ増分、各第１のタイムスタンプ増分に対応する２つのパケット間のシーケンス番号の差、および隣接するパケット間のタイムスタンプ差のものであって、前記切り替えデバイスによってサポートされる複数の理論サンプリング周波数にそれぞれ対応する理論値に基づいて、線形フィッティングを実行することと、
隣接するパケット間のタイムスタンプ差のものであって、前記複数の第１のフィッティング誤差における最小の第１のフィッティング誤差に対応する理論値を決定することと、
隣接するパケット間のタイムスタンプ差のものであって、前記最小の第１のフィッティング誤差に対応する前記理論値に対応する理論サンプリング周波数を、前記第１のオーディオストリームの前記サンプリング周波数として使用することと、を含むか、または
前記切り替えデバイスによって、前記第２のタイムスタンプ増分グループに基づいて、前記第２のオーディオストリームの前記サンプリング周波数を決定することは、
複数の第２のフィッティング誤差を得るために、前記Ｍ－１個の第２のタイムスタンプ増分、各第２のタイムスタンプ増分に対応する２つのパケット間のタイムスタンプ差、および隣接するパケット間のタイムスタンプ差のものであって、前記切り替えデバイスによってサポートされる複数の理論サンプリング周波数にそれぞれ対応する理論値に基づいて、線形フィッティングを実行することと、
隣接するパケット間のタイムスタンプ差のものであって、前記複数の第２のフィッティング誤差における最小の第１のフィッティング誤差に対応する理論値を決定することと、
隣接するパケット間のタイムスタンプ差のものであって、前記最小の第２のフィッティング誤差に対応する前記理論値に対応する理論サンプリング周波数を、前記第２のオーディオストリームの前記サンプリング周波数として使用することと、を含む、請求項２～７のいずれか一項に記載の方法。
オーディオストリーム切り替え装置であって、
切り替え命令を受信することであって、前記切り替え命令は、送信された第１のオーディオストリームから第２のオーディオストリームに切り替えるように指示する、受信することを行うように構成されている受信ユニットと、
前記第１のオーディオストリームの第１のパケットのタイムスタンプと前記第２のオーディオストリームの第２のパケットのタイムスタンプとに基づいて、前記第１のオーディオストリームと前記第２のオーディオストリームとの間の同期関係を決定することであって、前記第１のパケットの受信時間は、前記第２のパケットの受信時間と同じである、決定することと、前記同期関係と前記第１のパケットの前記タイムスタンプとに基づいて、前記第１のオーディオストリームの切り替えポイントのパラメータ値を決定し、前記同期関係と前記第２のパケットの前記タイムスタンプとに基づいて、前記第２のオーディオストリームの切り替えポイントのパラメータ値を決定することであって、前記切り替えポイントの前記パラメータ値が、前記切り替えポイントのタイムスタンプまたは前記切り替えポイントのシーケンス番号である、決定することと、を行うように構成されている処理ユニットと、
前記第１のオーディオストリーム内にあり、かつパラメータ値が前記第１のオーディオストリームの前記切り替えポイントの前記パラメータ値より大きいパケットを、前記第２のオーディオストリーム内にあり、かつパラメータ値が前記第２のオーディオストリームの前記切り替えポイントの前記パラメータ値より大きいパケットに切り替えることを行うように構成されている送信ユニットと、を含み、
前記第１のオーディオストリームの前記第１のパケットの前記タイムスタンプと前記第２のオーディオストリームの前記第２のパケットの前記タイムスタンプとに基づいて、前記第１のオーディオストリームと前記第２のオーディオストリームとの間の前記同期関係を決定するときに、前記処理ユニットは、
前記第１のオーディオストリームのサンプリング周波数が、前記第２のオーディオストリームのサンプリング周波数と異なるときに、前記第１のオーディオストリームの前記サンプリング周波数と前記第２のオーディオストリームの前記サンプリング周波数とに基づいて、かつ基準サンプリング周波数に基づいて、前記第１のパケットの前記タイムスタンプと前記第２のパケットの前記タイムスタンプとを統一することと、前記第１のパケットの統一タイムスタンプと前記第２のパケットの統一タイムスタンプとに基づいて、前記第１のオーディオストリームと第２のオーディオストリームとの間の前記同期関係を決定することとを行うように構成されており、
前記第１のオーディオストリームの前記サンプリング周波数は、前記第１のオーディオストリーム内のＮ個の受信パケットのタイムスタンプに基づいて決定され、前記第２のオーディオストリームの前記サンプリング周波数は、前記第２のオーディオストリーム内のＭ個の受信パケットのタイムスタンプに基づいて決定され、ＭとＮの両方は、正の整数であり、前記基準サンプリング周波数は、前記第１のオーディオストリームの前記サンプリング周波数、前記第２のオーディオストリームの前記サンプリング周波数、またはプリセットサンプリング周波数である、装置。
前記処理ユニットは、
前記第１のオーディオストリームの第１のタイムスタンプ増分グループと、前記第２のオーディオストリームの第２のタイムスタンプ増分グループとを得ることであって、
前記第１のタイムスタンプ増分グループは、前記Ｎ個のパケットの前記タイムスタンプに基づいて決定されるＮ－１個の第１のタイムスタンプ増分を含み、前記第２のタイムスタンプ増分グループは、前記Ｍ個のパケットの前記タイムスタンプに基づいて決定されるＭ－１個の第２のタイムスタンプ増分を含み、
前記第１のタイムスタンプ増分は、前記第１のオーディオストリーム内の２つの連続的に受信されたパケット間のタイムスタンプ差であり、前記第２のタイムスタンプ増分は、前記第２のオーディオストリーム内の２つの連続的に受信されたパケット間のタイムスタンプ差であるか、または、前記第１のタイムスタンプ増分は、前記第１のオーディオストリーム内の受信された隣接パケット間のタイムスタンプ差であり、前記第２のタイムスタンプ増分は、前記第２のオーディオストリーム内の受信された隣接パケット間のタイムスタンプ差である、ことと、
前記第１のタイムスタンプ増分グループに基づいて、前記第１のオーディオストリームの前記サンプリング周波数を決定し、前記第２のタイムスタンプ増分グループに基づいて、前記第２のオーディオストリームの前記サンプリング周波数を決定することと、を行うことにより、前記第１のオーディオストリームのサンプリング周波数および前記第２のオーディオストリームのサンプリング周波数を得るようにさらに構成されている、請求項９に記載の装置。
前記Ｎ個のパケットは、前記切り替え命令が受信された後に受信される前記第１のオーディオストリーム内の最初のＮ個のパケットであり、前記Ｍ個のパケットは、前記切り替え命令が受信された後に受信される前記第２のオーディオストリーム内の最初のＭ個のパケットであり、ＮはＭに等しい、請求項１０に記載の装置。
前記第１のパケットは、前記第１のオーディオストリーム内にあり、前記第１のオーディオストリームの前記サンプリング周波数が決定されたときに受信されるパケットであり、前記第２のパケットは、前記第２のオーディオストリーム内にあり、前記第２のオーディオストリームのオーディオ情報が決定されたときに受信されるパケットである、請求項１１に記載の装置。
前記同期関係と前記第１のパケットの前記タイムスタンプとに基づいて、前記第１のオーディオストリームの切り替えポイントのパラメータ値を決定し、前記同期関係と前記第２のパケットの前記タイムスタンプとに基づいて、前記第２のオーディオストリームの切り替えポイントのパラメータ値を決定するときに、前記処理ユニットは、
前記同期関係、前記第１のパケットの前記タイムスタンプ、および前記第１のオーディオストリームのパケット時間に基づいて、前記第１のオーディオストリームの前記切り替えポイントの前記パラメータ値を決定し、前記同期関係、前記第２のパケットの前記タイムスタンプ、前記第２のオーディオストリームのパケット時間に基づいて、前記第２のオーディオストリームの前記切り替えポイントの前記パラメータ値を決定するように構成されており、
前記第１のオーディオストリームの前記パケット時間は、前記Ｎ個のパケットの前記タイムスタンプに基づいて決定され、第２のオーディオストリームの前記パケット時間は、前記Ｍ個のパケットの前記タイムスタンプに基づいて決定される、請求項１０～１２のいずれか一項に記載の装置。
前記第１のオーディオストリームの前記切り替えポイントのパケットタイムスタンプと、前記第２のオーディオストリームの前記切り替えポイントのパケットタイムスタンプとが、
前記第１のパケットの前記統一タイムスタンプと前記第２のパケットの前記統一タイムスタンプとに基づいて、前記第１のオーディオストリームと第２のオーディオストリームとが同期されていると決定された場合、

、および

であるという条件、
前記第１のパケットの前記統一タイムスタンプが、前記第２のパケットの前記統一タイムスタンプよりも遅い場合、

、および

であるという条件、または
前記第１のパケットの前記統一タイムスタンプが、前記第２のパケットの前記統一タイムスタンプよりも早い場合、

、および

であるという条件を満たし、

であり、ＴＳ_ｏ ^０は、前記第１のパケットの前記統一タイムスタンプを表し、ＴＳ_ｉ ^０は、前記第２のパケットの前記統一タイムスタンプを表し、ｆ_ｉｏは、前記基準サンプリング周波数を表し、ＴＳ_ｉ＿ＳＷは、前記第２のオーディオストリームの前記切り替えポイントの前記タイムスタンプを表し、ＴＳ_ｉは、前記第２のパケットの非統一タイムスタンプを表し、ｔｉ＿ｐｋｔは、前記第２のオーディオストリームの前記パケット時間を表し、ｄｔｓ_ｉは、隣接するパケット間のタイムスタンプ差のものであって、前記第２のオーディオストリームの前記サンプリング周波数に対応する理論値を表し、ＴＳ_ｏ＿ＳＷは、前記第１のオーディオストリームの前記切り替えポイントの前記タイムスタンプを表し、ＴＳ_ｏは、前記第１のオーディオストリームの非統一タイムスタンプを表し、ｔｏ＿ｐｋｔは、前記第１のオーディオストリームの前記パケット時間を表し、ｄｔｓ_ｏは、隣接するパケット間のタイムスタンプ差のものであって、前記第１のオーディオストリームの前記サンプリング周波数に対応する理論値を表し、Ｋ１は、第１のプリセット持続時間を表し、Ｋ２は、第２のプリセット持続時間を表す、請求項１３に記載の装置。
決定されるオーディオストリームのパケット時間が、

である場合、前記決定されるオーディオストリームの前記パケット時間が第１の値であるという条件、または

である場合、前記決定されるオーディオストリームの前記パケット時間が第２の値であるという条件を満たし、前記決定されるオーディオストリームが、前記第１のオーディオストリームまたは前記第２のオーディオストリームであり、

であり、

は、前記決定されるオーディオストリームのタイムスタンプ増分グループに基づいて決定されたタイムスタンプ増分平均を表し、ｄＴＳ_{ｔｈｒｅｓ}は、隣接するパケット間のタイムスタンプ差のものであり、異なるパケット時間に対応する理論値に関し、ｄＴＳ_ｉは、前記決定されるオーディオストリームの前記タイムスタンプ増分グループのｉ番目のタイムスタンプ増分を表し、ｄＳＥＱ_ｉは、前記ｉ番目のタイムスタンプ増分に対応する２つのパケット間のシーケンス番号差を表し、ｗは、前記決定されるオーディオストリームの前記タイムスタンプ増分グループのタイムスタンプ増分の数を表す、請求項１３または１４に記載の装置。
前記第１のタイムスタンプ増分グループに基づいて、前記第１のオーディオストリームの前記サンプリング周波数を決定するときに、前記処理ユニットは、
複数の第１のフィッティング誤差を得るために、前記Ｎ－１個の第１のタイムスタンプ増分、各第１のタイムスタンプ増分に対応する２つのパケット間のシーケンス番号の差、および隣接するパケット間のタイムスタンプ差のものであって、前記装置によってサポートされる複数の理論サンプリング周波数にそれぞれ対応する理論値に基づいて、線形フィッティングを実行することと、
隣接するパケット間のタイムスタンプ差のものであって、前記複数の第１のフィッティング誤差における最小の第１のフィッティング誤差に対応する理論値を決定することと、
隣接するパケット間のタイムスタンプ差のものであって、前記最小の第１のフィッティング誤差に対応する前記理論値に対応する理論サンプリング周波数を、前記第１のオーディオストリームの前記サンプリング周波数として使用することと、を行うように構成されており、または
前記第２のタイムスタンプ増分グループに基づいて、前記第２のオーディオストリームの前記サンプリング周波数を決定するときに、前記処理ユニットは、
複数の第２のフィッティング誤差を得るために、前記Ｍ－１個の第２のタイムスタンプ増分、各第２のタイムスタンプ増分に対応する２つのパケット間のタイムスタンプ差、および隣接するパケット間のタイムスタンプ差のものであって、前記装置によってサポートされる複数の理論サンプリング周波数にそれぞれ対応する理論値に基づいて、線形フィッティングを実行することと、
隣接するパケット間のタイムスタンプ差のものであって、前記複数の第２のフィッティング誤差における最小の第１のフィッティング誤差に対応する理論値を決定することと、
隣接するパケット間のタイムスタンプ差のものであって、前記最小の第２のフィッティング誤差に対応する前記理論値に対応する理論サンプリング周波数を、前記第２のオーディオストリームの前記サンプリング周波数として使用することと、を行うように構成されている、請求項１０～１５のいずれか一項に記載の装置。
コンピュータ可読記憶媒体であって、前記コンピュータ可読記憶媒体は、コンピュータプログラムを記憶し、前記コンピュータプログラムは、コンピューティングデバイスによって実行されるときに、前記コンピューティングデバイスが、請求項１～８のいずれか一項に記載の方法を実施する、コンピュータ可読記憶媒体。