JP7635196B2 - リアルタイム通信における強化学習 - Google Patents
リアルタイム通信における強化学習 Download PDFInfo
- Publication number
- JP7635196B2 JP7635196B2 JP2022500820A JP2022500820A JP7635196B2 JP 7635196 B2 JP7635196 B2 JP 7635196B2 JP 2022500820 A JP2022500820 A JP 2022500820A JP 2022500820 A JP2022500820 A JP 2022500820A JP 7635196 B2 JP7635196 B2 JP 7635196B2
- Authority
- JP
- Japan
- Prior art keywords
- computing device
- real
- sending
- receiving computing
- receiving
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L65/00—Network arrangements, protocols or services for supporting real-time applications in data packet communication
- H04L65/80—Responding to QoS
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/004—Artificial life, i.e. computing arrangements simulating life
- G06N3/006—Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/092—Reinforcement learning
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/096—Transfer learning
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/04—Inference or reasoning models
- G06N5/043—Distributed expert systems; Blackboards
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L1/00—Arrangements for detecting or preventing errors in the information received
- H04L1/004—Arrangements for detecting or preventing errors in the information received by using forward error control
- H04L1/0041—Arrangements at the transmitter end
- H04L1/0042—Encoding specially adapted to other signal generation operation, e.g. in order to reduce transmit distortions, jitter, or to improve signal shape
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/06—Management of faults, events, alarms or notifications
- H04L41/0631—Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
- H04L41/065—Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis involving logical or physical relationship, e.g. grouping and hierarchies
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/16—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks using machine learning or artificial intelligence
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/50—Network service management, e.g. ensuring proper service fulfilment according to agreements
- H04L41/5003—Managing SLA; Interaction between SLA and QoS
- H04L41/5009—Determining service level performance parameters or violations of service level contracts, e.g. violations of agreed response time or mean time between failures [MTBF]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/50—Network service management, e.g. ensuring proper service fulfilment according to agreements
- H04L41/5061—Network service management, e.g. ensuring proper service fulfilment according to agreements characterised by the interaction between service providers and their network customers, e.g. customer relationship management
- H04L41/5067—Customer-centric QoS measurements
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/08—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
- H04L43/0805—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability
- H04L43/0817—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability by checking functioning
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/04—Network management architectures or arrangements
- H04L41/046—Network management architectures or arrangements comprising network management agents or mobile agents therefor
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/08—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Software Systems (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Mathematical Physics (AREA)
- General Physics & Mathematics (AREA)
- Computing Systems (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Multimedia (AREA)
- Medical Informatics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Business, Economics & Management (AREA)
- General Business, Economics & Management (AREA)
- Environmental & Geological Engineering (AREA)
- Databases & Information Systems (AREA)
- Information Transfer Between Computers (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Description
Claims (22)
- 送信側コンピューティング・デバイスと受信側コンピューティング・デバイスとの間でのリアルタイム通信においての予想されるユーザの知覚する経験品質(QoE)を最適化する方法であって、
前記送信側コンピューティング・デバイスのエージェントが、前記送信側コンピューティング・デバイスの現在の状態を、前記送信側コンピューティング・デバイスの現在の状態のデータと、前記受信側コンピューティング・デバイスから受信したネットワーク統計とに基づき決定するステップであって、前記ネットワーク統計は、前記受信側コンピューティング・デバイスにおいて受信したリアルタイム通信の品質を示す、ステップと、
前記エージェントが、前記送信側コンピューティング・デバイスの、複数の送信パラメータを含む現在の行動を決定するステップと、
前記エージェントが、前記送信パラメータを前記送信側コンピューティング・デバイスに提供するステップと、
前記送信パラメータに従って、前記送信側コンピューティング・デバイスから前記受信側コンピューティング・デバイスへ、リアルタイム・オーディオ通信とリアルタイム・ビデオ通信とのうちの1以上を含むリアルタイム通信を送信するステップと、
前記エージェントが、前記受信側コンピューティング・デバイスから該受信側コンピューティング・デバイスにより決定された報酬及び第2のネットワーク統計を受け取るステップであって、前記報酬は、送信されて前記受信側コンピューティング・デバイスで受信された前記リアルタイム通信と関連する1以上の受信パラメータに基づく、ステップと、
前記エージェントが、前記現在の状態と、前記現在の行動と、前記第2のネットワーク統計と、前記報酬とに基づいて、将来の報酬の合計の予想値を決定するステップと、
前記エージェントが、将来の報酬の前記合計の前記予想値を最大化するように、前記送信側コンピューティング・デバイスの前記複数の送信パラメータのうちの少なくとも1つを変更するステップと
を含む方法。 - 請求項1に記載の方法であって、強化学習モデルの状態行動価値関数が将来の報酬の前記合計の前記予想値を決定する、方法。
- 請求項2に記載の方法であって、前記状態行動価値関数の出力を前記強化学習モデルの制御ポリシー学習モデルへ提供するステップと、前記制御ポリシー学習モデルが、前記状態行動価値関数の前記出力に基づいて前記複数の送信パラメータのうちの前記少なくとも1つを変更するステップとを更に含む方法。
- 請求項1に記載の方法であって、前記報酬は、送信されて前記受信側コンピューティング・デバイスで受信された前記リアルタイム通信と関連する前記1以上の受信パラメータに基づくユーザの知覚する経験品質(QoE)計量を含む、方法。
- 請求項4に記載の方法であって、QoE機械学習モデルを用いて前記ユーザの知覚するQoEを決定するステップを更に含み、前記QoE機械学習モデルは、前記受信側コンピューティング・デバイスでのネットワーク統計と、受信側コンピューティング・デバイス統計と、送信されて前記受信側コンピューティング・デバイスで受信された前記リアルタイム通信のユーザ・フィードバックとの評価を行う、方法。
- 請求項4又は5に記載の方法であって、QoE機械学習モデルを用いて前記ユーザの知覚するQoEを決定するステップを更に含み、前記QoE機械学習モデルは、送信されて前記受信側コンピューティング・デバイスで受信された前記リアルタイム通信のペイロードを評価する、方法。
- 請求項1から6のうちの何れか一項に記載に方法であって、前記複数の送信パラメータのうちの前記少なくとも1つは、送信レート・パラメータ、レゾリューション・パラメータ、フレーム・レート・パラメータ、量子化パラメータ(QP)、又は、前方誤り訂正(FEC)パラメータを含む、方法。
- 請求項1から7のうちの何れか一項に記載の方法であって、双方向リアルタイム通信のために、前記送信側コンピューティング・デバイスは更に受信側コンピューティング・デバイスとして動作し、前記受信側コンピューティング・デバイスは更に送信側コンピューティング・デバイスとして動作する、方法。
- リアルタイム通信においての予想されるユーザの知覚する経験品質(QoE)を最適化するための強化学習モデルを訓練する方法であって、
送信側コンピューティング・デバイスのエージェントが、前記送信側コンピューティング・デバイスの現在の状態を、前記送信側コンピューティング・デバイスの現在の状態のデータと、受信側コンピューティング・デバイスから受信したネットワーク統計とに基づき決定するステップであって、前記ネットワーク統計は、前記受信側コンピューティング・デバイスにおいて受信したリアルタイム通信の品質を示す、ステップと、
前記エージェントが、前記送信側コンピューティング・デバイスの、複数の送信パラメータを含む現在の行動を決定するステップと、
前記エージェントが、前記送信パラメータを前記送信側コンピューティング・デバイスに提供するステップと、
前記送信パラメータに従って、前記送信側コンピューティング・デバイスから前記受信側コンピューティング・デバイスへ、リアルタイム・オーディオ通信とリアルタイム・ビデオ通信とのうちの1以上を含むリアルタイム通信を送信するステップと、
前記エージェントにおいて、前記受信側コンピューティング・デバイスから該受信側コンピューティング・デバイスにより決定された報酬及び第2のネットワーク統計を受け取るステップであって、前記報酬は、前記受信側コンピューティング・デバイスで受信された前記リアルタイム通信と関連する1以上の受信パラメータに基づく、ステップと、
前記エージェントが、前記現在の状態と、前記現在の行動と、前記第2のネットワーク統計と、前記報酬とに基づいて、将来の報酬の合計の予想値を決定するステップと、
前記エージェントが、将来の報酬の前記合計の前記予想値を最大化するように、前記複数の送信パラメータのうちの少なくとも1つを変更するステップと
を含む方法。 - 請求項9に記載の方法であって、
強化学習モデルの状態行動価値関数が将来の報酬の前記合計の前記予想値を決定し、
前記方法は、前記状態行動価値関数の出力を前記強化学習モデルの制御ポリシー学習モデルへ提供するステップと、前記制御ポリシー学習モデルが、前記状態行動価値関数の前記出力に基づいて前記複数の送信パラメータのうちの前記少なくとも1つを変更するステップとを更に含む、
方法。 - 請求項9に記載の方法であって、
前記報酬は、送信されて前記受信側コンピューティング・デバイスで受信された前記リアルタイム通信と関連する前記1以上の受信パラメータに基づくユーザの知覚する経験品質(QoE)計量を含み、
前記方法は、QoE機械学習モデルを用いて前記ユーザの知覚するQoEを決定するステップを更に含み、前記QoE機械学習モデルは、前記受信側コンピューティング・デバイスでのネットワーク統計と、受信側コンピューティング・デバイス統計と、送信されて前記受信側コンピューティング・デバイスで受信された前記リアルタイム通信のユーザ・フィードバックとの評価を行う、
方法。 - 請求項9から11のうちの何れか一項に記載の方法であって、前記送信側コンピューティング・デバイスと、受信側コンピューティング・デバイスと、ネットワークとはシミュレートされる、方法。
- 請求項12に記載の方法であって、前記送信側コンピューティング・デバイスと、受信側コンピューティング・デバイスと、ネットワークとは、離散事象を用いてシミュレートされる、方法。
- 請求項9から13のうちの何れか一項に記載に方法であって、前記送信側コンピューティング・デバイスと前記受信側コンピューティング・デバイスとのそれぞれは通信アプリケーションを実行し、前記ネットワークの1以上の条件は1以上の所定のパラメータに従って制御される、方法。
- 請求項9から11のうちの何れか一項に記載の方法であって、前記ネットワークはライブの実際のネットワークを含む、方法。
- 請求項15に記載に方法であって、前記送信側コンピューティング・デバイスと、受信側コンピューティング・デバイスと、ネットワークとはライブの環境にあり、ライブのリアルタイム通信の送信に基づいて前記エージェントを連続的に訓練するステップを更に含む方法。
- リアルタイム通信においての予想されるユーザの知覚する経験品質(QoE)を最適化するためのシステムであって、
実行可能命令を記憶したメモリと、
前記実行可能命令を実行するプロセッサと
を含み、前記実行可能命令は、実行されると、前記プロセッサに、
送信側コンピューティング・デバイスのエージェントが、前記送信側コンピューティング・デバイスの現在の状態を、前記送信側コンピューティング・デバイスの現在の状態のデータと、受信側コンピューティング・デバイスから受信したネットワーク統計とに基づき決定するステップであって、前記ネットワーク統計は、前記受信側コンピューティング・デバイスにおいて受信したリアルタイム通信の品質を示す、ステップと、
前記エージェントが、前記送信側コンピューティング・デバイスの、複数の送信パラメータを含む現在の行動を決定するステップと、
前記エージェントが、前記送信パラメータを前記送信側コンピューティング・デバイスに提供するステップと、
前記送信パラメータに従って、前記送信側コンピューティング・デバイスから受信側コンピューティング・デバイスへ、リアルタイム・オーディオ通信とリアルタイム・ビデオ通信とのうちの1以上を含むリアルタイム通信を送信するステップと、
前記エージェントが、前記受信側コンピューティング・デバイスから該受信側コンピューティング・デバイスにより決定された報酬及び第2のネットワーク統計を受け取るステップであって、前記報酬は、送信されて前記受信側コンピューティング・デバイスで受信された前記リアルタイム通信と関連する1以上の受信パラメータに基づく、ステップと、
前記エージェントが、前記現在の状態と、前記第2のネットワーク統計と、前記現在の行動と、前記報酬とに基づいて、将来の報酬の合計の予想値を決定するステップと、
前記エージェントが、将来の報酬の前記合計の前記予想値を最大化するように、前記送信側コンピューティング・デバイスの前記複数の送信パラメータのうちの少なくとも1つを変更するステップと
を実行させる、システム。 - 請求項17に記載のシステムであって、
前記実行可能命令は、前記プロセッサに、強化学習モデルの状態行動価値関数を用いて将来の報酬の前記合計の前記予想値を決定することを更に実行させ、
前記実行可能命令は、前記プロセッサに、前記状態行動価値関数の出力を前記強化学習モデルの制御ポリシー学習モデルへ提供するステップと、前記制御ポリシー学習モデルが、前記状態行動価値関数の前記出力に基づいて前記複数の送信パラメータのうちの前記少なくとも1つを変更するステップとを更に実行させる、
システム。 - 請求項17に記載のシステムであって、
前記報酬は、送信されて前記受信側コンピューティング・デバイスで受信された前記リアルタイム通信と関連する前記1以上の受信パラメータに基づくユーザの知覚する経験品質(QoE)計量を含み、
前記実行可能命令は、前記プロセッサに、QoE機械学習モデルを用いて前記ユーザの知覚するQoEを決定するステップを更に実行させ、前記QoE機械学習モデルは、前記受信側コンピューティング・デバイスでのネットワーク統計と、受信側コンピューティング・デバイス統計と、送信されて前記受信側コンピューティング・デバイスで受信された前記リアルタイム通信のユーザ・フィードバックとの評価を行う、
システム。 - 請求項17から19のうちの何れか一項に記載のシステムであって、前記実行可能命令は、前記プロセッサに、更に、双方向リアルタイム通信のために、前記送信側コンピューティング・デバイスを受信側コンピューティング・デバイスとして動作させる、システム。
- 請求項17から20のうちの何れか一項に記載にシステムであって、前記複数の送信パラメータのうちの前記少なくとも1つは、送信レート・パラメータ、レゾリューション・パラメータ、フレーム・レート・パラメータ、量子化パラメータ(QP)、又は、前方誤り訂正(FEC)パラメータを含む、システム。
- 請求項18に記載のシステムであって、前記強化学習モデルは、アクター・クリティック(actor-critic)モデル、Q学習(q-learning)モデル、ポリシー・グラジエント(policy gradient)モデル、テンポラル・ディファレンス(temporal difference)モデル、又は、モンテカルロ木探索(monte-carlo tree search)モデルを含む、システム。
Applications Claiming Priority (3)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US16/507,933 | 2019-07-10 | ||
| US16/507,933 US11373108B2 (en) | 2019-07-10 | 2019-07-10 | Reinforcement learning in real-time communications |
| PCT/US2020/036541 WO2021006972A1 (en) | 2019-07-10 | 2020-06-08 | Reinforcement learning in real-time communications |
Publications (3)
| Publication Number | Publication Date |
|---|---|
| JP2022540137A JP2022540137A (ja) | 2022-09-14 |
| JP2022540137A5 JP2022540137A5 (ja) | 2023-06-14 |
| JP7635196B2 true JP7635196B2 (ja) | 2025-02-25 |
Family
ID=71620506
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2022500820A Active JP7635196B2 (ja) | 2019-07-10 | 2020-06-08 | リアルタイム通信における強化学習 |
Country Status (6)
| Country | Link |
|---|---|
| US (2) | US11373108B2 (ja) |
| EP (1) | EP3997853A1 (ja) |
| JP (1) | JP7635196B2 (ja) |
| KR (1) | KR102821070B1 (ja) |
| CN (2) | CN120075207A (ja) |
| WO (1) | WO2021006972A1 (ja) |
Families Citing this family (12)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2020062911A1 (en) * | 2018-09-26 | 2020-04-02 | Huawei Technologies Co., Ltd. | Actor ensemble for continuous control |
| US11558275B2 (en) * | 2020-02-13 | 2023-01-17 | Microsoft Technology Licensing, Llc | Reinforcement learning for jitter buffer control |
| AU2021252927A1 (en) * | 2020-04-07 | 2022-11-10 | Assia Spe, Llc | Systems and methods for remote collaboration |
| CN115868161B (zh) * | 2020-06-30 | 2026-01-13 | 微软技术许可有限责任公司 | 基于强化学习的速率控制 |
| CN114912041B (zh) * | 2021-01-29 | 2026-01-30 | 伊姆西Ip控股有限责任公司 | 信息处理方法、电子设备和计算机程序产品 |
| US12192820B2 (en) * | 2021-03-22 | 2025-01-07 | Intel Corporation | Reinforcement learning for multi-access traffic management |
| US12149708B2 (en) * | 2021-08-16 | 2024-11-19 | Nvidia Corporation | Machine learning of encoding parameters for a network using a video encoder |
| CN116170375A (zh) | 2021-11-25 | 2023-05-26 | 华为技术有限公司 | 一种参数调整方法和装置 |
| EP4258730B1 (en) * | 2022-04-05 | 2026-01-14 | Mavenir Systems, Inc. | Method for programmable and customized intelligence for traffic steering in 5g networks using open ran architectures |
| CN115412437B (zh) * | 2022-08-17 | 2024-11-12 | Oppo广东移动通信有限公司 | 数据处理方法及装置、设备、存储介质 |
| US20240403649A1 (en) * | 2022-11-29 | 2024-12-05 | Sri International | Modularized architecture optimization for semi-supervised incremental learning |
| US12549730B2 (en) | 2023-09-22 | 2026-02-10 | Nvidia Corporation | Adaptive quantization for video pipelines in automotive systems and applications |
Citations (9)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2003244695A (ja) | 2002-02-14 | 2003-08-29 | Kddi Corp | 映像情報伝送方式、それに用いられる装置およびプログラム |
| JP2007081623A (ja) | 2005-09-13 | 2007-03-29 | Matsushita Electric Ind Co Ltd | 音声動画通信システム及びデータ通信端末装置 |
| JP2007519341A (ja) | 2004-01-09 | 2007-07-12 | シスコ テクノロジー インコーポレイテッド | 無線ローカルエリアネットワーク(wlan)をシミュレートし管理するシステム及び方法 |
| JP2010016662A (ja) | 2008-07-04 | 2010-01-21 | Kddi Corp | メディアストリームの階層数を制御する送信装置、方法及びプログラム |
| JP2010288277A (ja) | 2009-06-12 | 2010-12-24 | Ntt Docomo Inc | ユーザ体感品質の測定に基づく符号化方法、端末およびシステム |
| JP2013106202A (ja) | 2011-11-14 | 2013-05-30 | Fujitsu Ltd | パラメータ設定装置、コンピュータプログラム及びパラメータ設定方法 |
| WO2018222435A1 (en) | 2017-05-31 | 2018-12-06 | Netflix, Inc. | Temporal placement of a rebuffering event |
| WO2019059134A1 (ja) | 2017-09-22 | 2019-03-28 | 株式会社Nttドコモ | 通信品質調整システム |
| WO2019082861A1 (ja) | 2017-10-25 | 2019-05-02 | 日本電気株式会社 | 送信装置、受信装置および映像配信方法 |
Family Cites Families (35)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US7400588B2 (en) | 2003-08-01 | 2008-07-15 | Thomson Licensing | Dynamic rate adaptation using neural networks for transmitting video data |
| EP2371085A1 (en) * | 2008-12-17 | 2011-10-05 | Telefonaktiebolaget L M Ericsson (PUBL) | Monitoring media services in telecommunications networks |
| US9538220B2 (en) * | 2009-06-12 | 2017-01-03 | Wi-Lan Labs, Inc. | Video streaming quality of experience degradation control using a video quality metric |
| US8792347B2 (en) * | 2012-06-01 | 2014-07-29 | Opera Software Ireland Limited | Real-time network monitoring and subscriber identification with an on-demand appliance |
| EP2747357B1 (en) | 2012-12-21 | 2018-02-07 | Alcatel Lucent | Robust content-based solution for dynamically optimizing multi-user wireless multimedia transmission |
| US11153333B1 (en) * | 2018-03-07 | 2021-10-19 | Amdocs Development Limited | System, method, and computer program for mitigating an attack on a network by effecting false alarms |
| US10445653B1 (en) * | 2014-08-07 | 2019-10-15 | Deepmind Technologies Limited | Evaluating reinforcement learning policies |
| US10465931B2 (en) | 2015-01-30 | 2019-11-05 | Schneider Electric It Corporation | Automated control and parallel learning HVAC apparatuses, methods and systems |
| US10530826B2 (en) * | 2015-08-27 | 2020-01-07 | Cavium, Llc | Method and apparatus for providing a low latency transmission system using adjustable buffers |
| CN107851216B (zh) * | 2015-09-11 | 2022-03-08 | 谷歌有限责任公司 | 一种用于选择待由与环境进行交互的强化学习代理执行的动作的方法 |
| US20180082213A1 (en) * | 2016-09-18 | 2018-03-22 | Newvoicemedia, Ltd. | System and method for optimizing communication operations using reinforcement learning |
| US11062207B2 (en) | 2016-11-04 | 2021-07-13 | Raytheon Technologies Corporation | Control systems using deep reinforcement learning |
| US20180165602A1 (en) | 2016-12-14 | 2018-06-14 | Microsoft Technology Licensing, Llc | Scalability of reinforcement learning by separation of concerns |
| US10559215B2 (en) * | 2017-04-26 | 2020-02-11 | International Business Machines Corporation | Education reward system and method |
| US11088947B2 (en) * | 2017-05-04 | 2021-08-10 | Liveu Ltd | Device, system, and method of pre-processing and data delivery for multi-link communications and for media content |
| US10234848B2 (en) | 2017-05-24 | 2019-03-19 | Relativity Space, Inc. | Real-time adaptive control of additive manufacturing processes using machine learning |
| US20180374138A1 (en) * | 2017-06-23 | 2018-12-27 | Vufind Inc. | Leveraging delayed and partial reward in deep reinforcement learning artificial intelligence systems to provide purchase recommendations |
| EP3480741B1 (en) * | 2017-10-27 | 2024-07-17 | DeepMind Technologies Limited | Reinforcement and imitation learning for a task |
| KR102061345B1 (ko) * | 2017-12-18 | 2019-12-31 | 경희대학교 산학협력단 | 강화 학습 기반 암호화 및 복호화 수행 방법 및 이를 수행하는 클라이언트, 서버 시스템 |
| CN108737382B (zh) | 2018-04-23 | 2020-10-09 | 浙江工业大学 | 基于Q-Learning的SVC编码HTTP流媒体自适应方法 |
| US20210081753A1 (en) * | 2018-05-18 | 2021-03-18 | Google Llc | Reinforcement learning in combinatorial action spaces |
| CN108924935A (zh) * | 2018-07-06 | 2018-11-30 | 西北工业大学 | 一种基于强化学习算法功率域的noma中的功率分配方法 |
| CN109255443A (zh) * | 2018-08-07 | 2019-01-22 | 阿里巴巴集团控股有限公司 | 训练深度强化学习模型的方法及装置 |
| US10726134B2 (en) * | 2018-08-14 | 2020-07-28 | Intel Corporation | Techniques to detect perturbation attacks with an actor-critic framework |
| US11238372B2 (en) * | 2018-08-27 | 2022-02-01 | Vmware, Inc. | Simulator-training for automated reinforcement-learning-based application-managers |
| CN109243021B (zh) | 2018-08-28 | 2021-09-17 | 余利 | 基于用户体验分析的深度强化学习式智能门锁系统及装置 |
| US11509703B2 (en) * | 2018-09-26 | 2022-11-22 | Vmware, Inc. | System and method for widescale adaptive bitrate selection |
| US10581736B1 (en) * | 2018-11-13 | 2020-03-03 | At&T Intellectual Property I, L.P. | Traffic matrix prediction and fast reroute path computation in packet networks |
| US20200162535A1 (en) * | 2018-11-19 | 2020-05-21 | Zhan Ma | Methods and Apparatus for Learning Based Adaptive Real-time Streaming |
| US11138378B2 (en) * | 2019-02-28 | 2021-10-05 | Qualtrics, Llc | Intelligently summarizing and presenting textual responses with machine learning |
| EP3751803A1 (en) * | 2019-06-13 | 2020-12-16 | Hughes Network Systems, LLC | Enhanced network communication using multiple network connections |
| US11635995B2 (en) * | 2019-07-16 | 2023-04-25 | Cisco Technology, Inc. | Systems and methods for orchestrating microservice containers interconnected via a service mesh in a multi-cloud environment based on a reinforcement learning policy |
| US11153375B2 (en) * | 2019-09-30 | 2021-10-19 | Adobe Inc. | Using reinforcement learning to scale queue-based services |
| KR20210121842A (ko) * | 2020-03-31 | 2021-10-08 | 엘지전자 주식회사 | 강화 학습을 이용한 차량 충전 방법 및 그 시스템 |
| US20210397959A1 (en) * | 2020-06-22 | 2021-12-23 | Google Llc | Training reinforcement learning agents to learn expert exploration behaviors from demonstrators |
-
2019
- 2019-07-10 US US16/507,933 patent/US11373108B2/en active Active
-
2020
- 2020-06-08 EP EP20740744.6A patent/EP3997853A1/en active Pending
- 2020-06-08 WO PCT/US2020/036541 patent/WO2021006972A1/en not_active Ceased
- 2020-06-08 CN CN202510219557.2A patent/CN120075207A/zh active Pending
- 2020-06-08 CN CN202080049824.1A patent/CN114128235B/zh active Active
- 2020-06-08 JP JP2022500820A patent/JP7635196B2/ja active Active
- 2020-06-08 KR KR1020227000677A patent/KR102821070B1/ko active Active
-
2022
- 2022-05-24 US US17/752,052 patent/US11699084B2/en active Active
Patent Citations (10)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2003244695A (ja) | 2002-02-14 | 2003-08-29 | Kddi Corp | 映像情報伝送方式、それに用いられる装置およびプログラム |
| JP2007519341A (ja) | 2004-01-09 | 2007-07-12 | シスコ テクノロジー インコーポレイテッド | 無線ローカルエリアネットワーク(wlan)をシミュレートし管理するシステム及び方法 |
| JP2007081623A (ja) | 2005-09-13 | 2007-03-29 | Matsushita Electric Ind Co Ltd | 音声動画通信システム及びデータ通信端末装置 |
| JP2010016662A (ja) | 2008-07-04 | 2010-01-21 | Kddi Corp | メディアストリームの階層数を制御する送信装置、方法及びプログラム |
| JP2010288277A (ja) | 2009-06-12 | 2010-12-24 | Ntt Docomo Inc | ユーザ体感品質の測定に基づく符号化方法、端末およびシステム |
| JP2013106202A (ja) | 2011-11-14 | 2013-05-30 | Fujitsu Ltd | パラメータ設定装置、コンピュータプログラム及びパラメータ設定方法 |
| WO2018222435A1 (en) | 2017-05-31 | 2018-12-06 | Netflix, Inc. | Temporal placement of a rebuffering event |
| WO2019059134A1 (ja) | 2017-09-22 | 2019-03-28 | 株式会社Nttドコモ | 通信品質調整システム |
| US20200280766A1 (en) | 2017-09-22 | 2020-09-03 | Ntt Docomo, Inc. | Communication quality adjusting system |
| WO2019082861A1 (ja) | 2017-10-25 | 2019-05-02 | 日本電気株式会社 | 送信装置、受信装置および映像配信方法 |
Also Published As
| Publication number | Publication date |
|---|---|
| CN120075207A (zh) | 2025-05-30 |
| US11699084B2 (en) | 2023-07-11 |
| US11373108B2 (en) | 2022-06-28 |
| US20220300841A1 (en) | 2022-09-22 |
| KR20220031001A (ko) | 2022-03-11 |
| JP2022540137A (ja) | 2022-09-14 |
| KR102821070B1 (ko) | 2025-06-13 |
| WO2021006972A1 (en) | 2021-01-14 |
| CN114128235B (zh) | 2025-03-11 |
| CN114128235A (zh) | 2022-03-01 |
| EP3997853A1 (en) | 2022-05-18 |
| US20210012227A1 (en) | 2021-01-14 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP7635196B2 (ja) | リアルタイム通信における強化学習 | |
| Ding et al. | A multi-channel transmission schedule for remote state estimation under DoS attacks | |
| KR102592036B1 (ko) | 사용자 중심 컨텐츠 스트리밍을 위한 방법 및 시스템 | |
| CN114616810B (zh) | 网络路径重定向 | |
| Xu et al. | Impact of flow-level dynamics on QoE of video streaming in wireless networks | |
| US12113680B2 (en) | Reinforcement learning for jitter buffer control | |
| Magaña et al. | Remote access protocols for Desktop-as-a-Service solutions | |
| CN115412776B (zh) | 一种近场场景下视频传输中的网络质量评估方法及设备 | |
| US20160043924A1 (en) | System and method for monitoring user activity on a plurality of networked computing devices | |
| US11989115B2 (en) | Agent-side chatbot simulator with throttling capabilities | |
| CN111629024A (zh) | 一种数据传输控制方法、装置、存储介质及电子设备 | |
| Vega et al. | Cognitive streaming on android devices | |
| CN113422751B (zh) | 基于在线强化学习的流媒体处理方法、装置及电子设备 | |
| Du et al. | Learning-based transport control adapted to non-stationarity for real-time communication | |
| CN116192766B (zh) | 用于调整数据发送速率和训练拥塞控制模型的方法及装置 | |
| US10511513B2 (en) | Ping pair technique for detecting wireless congestion | |
| CN114401253A (zh) | 一种基于WebRTC的模拟网络中视频传输方法 | |
| Li et al. | Pandia: Open-source Framework for DRL-based Real-time Video Streaming Control | |
| Jagmagji | Enhancing Self-Clocked Rate Adaptation in High-Speed Future Networks: Adaptive and Predictive Congestion Control | |
| CN119906638A (zh) | 一种数据传输方法及装置 | |
| Hernandez-Gobertti | Ph. D. Forum: Wireless Optimization Strategies for Real-Time Haptic Communications | |
| WO2025077611A1 (zh) | 视频处理方法、系统及相关装置 | |
| HK40059904A (en) | Streaming media processing method and device based on online reinforcement learning, and electronic equipment | |
| HK40059904B (zh) | 基於在线强化学习的流媒体处理方法、装置及电子设备 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230606 |
|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230606 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20240524 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20240603 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240902 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20240927 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20241220 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20250121 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20250212 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 7635196 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: R3D02 |