JP2009525643A - 強化学習及び伝播によるネットワークプロトコルオプションの最適化 - Google Patents
強化学習及び伝播によるネットワークプロトコルオプションの最適化 Download PDFInfo
- Publication number
- JP2009525643A JP2009525643A JP2008552663A JP2008552663A JP2009525643A JP 2009525643 A JP2009525643 A JP 2009525643A JP 2008552663 A JP2008552663 A JP 2008552663A JP 2008552663 A JP2008552663 A JP 2008552663A JP 2009525643 A JP2009525643 A JP 2009525643A
- Authority
- JP
- Japan
- Prior art keywords
- options
- component
- option
- selection
- server
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/08—Configuration management of networks or network elements
- H04L41/0803—Configuration setting
- H04L41/0813—Configuration setting characterised by the conditions triggering a change of settings
- H04L41/0816—Configuration setting characterised by the conditions triggering a change of settings the condition being an adaptation, e.g. in response to network events
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/50—Network services
- H04L67/60—Scheduling or organising the servicing of application requests, e.g. requests for application data transmissions using the analysis and optimisation of the required network resources
- H04L67/61—Scheduling or organising the servicing of application requests, e.g. requests for application data transmissions using the analysis and optimisation of the required network resources taking into account QoS or priority requirements
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L69/00—Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass
- H04L69/24—Negotiation of communication capabilities
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/16—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks using machine learning or artificial intelligence
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Computer Security & Cryptography (AREA)
- Computer And Data Communications (AREA)
- Telephonic Communication Services (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
- Information Transfer Between Computers (AREA)
- Communication Control (AREA)
Abstract
【選択図】 図4
Description
1.
2.t←0、k←1、s0から開始する。
3.分布
4.Bellman最適方程式に対してサンプルバックアップストラテジを使用して推定されるQ関数:
5.kを増加し、t←t+1とする。
6.終了条件が満たされなければ、ステップ2に戻る。
7.任意選択的に、環境の構成設定を取得し、そのポリシー(推定されるQ関数)を中央集権化された環境にアップロードする。
Claims (20)
- ネットワークのサーバの学習コンポーネントにより、1つ以上のクライアント及び前記ネットワークの環境とインタラクトすることと、
前記学習コンポーネントにより、前記ネットワークのプロトコルを介したネットワーク通信のための異なる状態における1つ以上のオプションの異なる試行を行うことと、
前記学習コンポーネントにより、前記異なる試行に対する性能フィードバックを、報酬として受取ることと、
前記学習コンポーネントにより、前記1つ以上のオプションのネゴシエーションのために前記サーバに関連する意思決定ポリシーを向上させるよう前記異なる試行及び関連する結果として得られる報酬を使用することと、
を含む方法。 - 前記学習コンポーネントにより、前記異なる試行及び報酬に基づいたオプションの最適セットと、前記オプションの最適セットに関連する前記環境の観察された構成設定とを、中央集権化された場所にアップロードすることを更に含む、請求項1に記載の方法。
- 1つ以上の他のサーバは、前記オプションの最適セットを、前記中央集権化された場所からダウンロードして前記1つ以上の他のサーバの前記環境における新しい学習処理を開始する初期ポイントとして使用する、請求項2に記載の方法。
- 前記オプションネゴシエーションコンポーネントは、強化学習アルゴリズムを適用して、前記1つ以上のオプションのネゴシエーションのために前記サーバに関連する前記意思決定ポリシーを向上させる、請求項1に記載の方法。
- 前記強化アルゴリズムは、Q学習法を使用する、請求項4に記載の方法。
- 前記Q学習アルゴリズムは、前記オプションネゴシエーションコンポーネントによるオプション選択のための最適ポリシーの価値関数を反復計算する、請求項5に記載の方法。
- 前記オプションネゴシエーションコンポーネントは、簡易ファイル転送プロトコル(TFTP)サーバの一部である、請求項1に記載の方法。
- 通信プロトコル用の1つ以上のオプションを選択し、前記1つ以上のオプションの前記選択に関連する性能フィードバックとして報酬を受取り、前記報酬に基づいて前記1つ以上のオプションの前記選択を調整するオプションネゴシエーションコンポーネントと、
前記報酬及び調整された選択に基づいて前記オプションネゴシエーションコンポーネントにより選択される前記1つ以上のオプションの最適セットを使用してファイルを転送するファイル転送コンポーネントと、
を含む装置。 - 前記オプションネゴシエーションコンポーネントは、選択すべき前記1つ以上のオプション、前記選択に対する前記性能フィードバック、及び、前記選択の前記調整を決定する強化学習アルゴリズムを適用する、請求項8に記載の装置。
- 前記強化アルゴリズムは、Q学習アルゴリズムを使用する、請求項9に記載の装置。
- 前記Q学習アルゴリズムは、前記オプションネゴシエーションコンポーネントによるオプション選択のための最適ポリシーの価値関数を反復計算する、請求項10に記載の装置。
- 前記オプションネゴシエーションコンポーネント及び前記ファイル転送コンポーネントは、簡易ファイル転送プロトコル(TFTP)サーバのコンポーネントである、請求項8に記載の装置。
- 前記オプション選択コンポーネントは更に、オプションの前記最適セットと、オプションの前記最適セットに関連する環境の関する構成設定とを、中央集権化された場所にアップロードする、請求項8に記載の装置。
- 1つ以上のサーバは、オプションの前記最適セットを、前記関連する環境に類似する環境用にダウンロードする、請求項13に記載の装置。
- ネットワーク環境と、
前記ネットワーク環境に、ネットワークインターフェイスを介して通信可能に接続されるサーバと、
を含み、
前記サーバは、
通信プロトコル用の1つ以上のオプションを選択し、前記1つ以上のオプションの前記選択に関連する性能フィードバックとして報酬を受取り、前記報酬に基づいて前記1つ以上のオプションの前記選択を調整するオプションネゴシエーションコンポーネントと、
前記報酬及び調整された選択に基づいて前記オプションネゴシエーションコンポーネントにより選択される前記1つ以上のオプションの最適セットを使用してファイルを転送するファイル転送コンポーネントと、
を含む、システム。 - 前記オプションネゴシエーションコンポーネントは、選択すべき前記1つ以上のオプション、前記選択に対する前記性能フィードバック、及び、前記選択の前記調整を決定する強化学習アルゴリズムを適用する、請求項15に記載のシステム。
- 前記強化アルゴリズムは、Q学習アルゴリズムを使用する、請求項9に記載の装置。
- 前記Q学習アルゴリズムは、前記オプションネゴシエーションコンポーネントによるオプション選択の最適ポリシーの価値関数を反復計算する、請求項10に記載の装置。
- 前記サーバは、簡易ファイル転送プロトコル(TFTP)サーバである、請求項15に記載のシステム。
- 前記オプションネゴシエーションコンポーネントは、前記異なる試行及び報酬に基づいたオプションの最適セットと、前記オプションの最適セットに関連する前記環境の観察された構成設定とを、中央集権化された場所にアップロードする、請求項15に記載のシステム。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/CN2006/000545 WO2007109923A1 (en) | 2006-03-29 | 2006-03-29 | Optimization of network protocol options by reinforcement learning and propagation |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009525643A true JP2009525643A (ja) | 2009-07-09 |
JP4825270B2 JP4825270B2 (ja) | 2011-11-30 |
Family
ID=38540777
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008552663A Expired - Fee Related JP4825270B2 (ja) | 2006-03-29 | 2006-03-29 | 強化学習及び伝播によるネットワークプロトコルオプションの最適化 |
Country Status (6)
Country | Link |
---|---|
US (1) | US8438248B2 (ja) |
JP (1) | JP4825270B2 (ja) |
CN (1) | CN101416466B (ja) |
DE (1) | DE112006003821B4 (ja) |
GB (1) | GB2450257B (ja) |
WO (1) | WO2007109923A1 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2020074177A (ja) * | 2016-02-05 | 2020-05-14 | ファナック株式会社 | 操作メニューの表示を学習する機械学習器,数値制御装置,工作機械システム,製造システムおよび機械学習方法 |
JP2021132327A (ja) * | 2020-02-20 | 2021-09-09 | 国立大学法人京都大学 | 制御装置、それを備えた基地局、コンピュータに実行させるためのプログラムおよびプログラムを記録したコンピュータ読み取り可能な記録媒体 |
Families Citing this family (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050251556A1 (en) * | 2004-05-07 | 2005-11-10 | International Business Machines Corporation | Continuous feedback-controlled deployment of message transforms in a distributed messaging system |
US20050251811A1 (en) * | 2004-05-07 | 2005-11-10 | International Business Machines Corporation | Distributed messaging system supporting stateful |
US7886180B2 (en) * | 2004-05-14 | 2011-02-08 | International Business Machines Corporation | Recovery in a distributed stateful publish-subscribe system |
US20070297327A1 (en) * | 2006-06-27 | 2007-12-27 | International Business Machines Corporation | Method for applying stochastic control optimization for messaging systems |
US20090141737A1 (en) * | 2007-11-30 | 2009-06-04 | Texas Instruments Incorporated | Systems and methods for prioritized channel access hardware assistance design |
CN101702743A (zh) | 2009-11-04 | 2010-05-05 | 中兴通讯股份有限公司 | 移动终端浏览器的自适应调整方法与装置 |
US20120030150A1 (en) * | 2010-07-29 | 2012-02-02 | Telcordia Technologies, Inc. | Hybrid Learning Component for Link State Routing Protocols |
US9118637B2 (en) | 2011-03-09 | 2015-08-25 | Arris Enterprises, Inc. | Dual-mode download manager |
US8769137B2 (en) * | 2011-06-23 | 2014-07-01 | Honeywell International Inc. | Systems and methods for negotiated accelerated block option for trivial file transfer protocol (TFTP) |
JP5772345B2 (ja) * | 2011-07-25 | 2015-09-02 | 富士通株式会社 | パラメータ設定装置、コンピュータプログラム及びパラメータ設定方法 |
JP5733166B2 (ja) * | 2011-11-14 | 2015-06-10 | 富士通株式会社 | パラメータ設定装置、コンピュータプログラム及びパラメータ設定方法 |
US10719777B2 (en) | 2016-07-28 | 2020-07-21 | At&T Intellectual Propery I, L.P. | Optimization of multiple services via machine learning |
US20180082210A1 (en) * | 2016-09-18 | 2018-03-22 | Newvoicemedia, Ltd. | System and method for optimizing communications using reinforcement learning |
JP6457472B2 (ja) * | 2016-12-14 | 2019-01-23 | ファナック株式会社 | 制御システム及び機械学習装置 |
GB2557674B (en) * | 2016-12-15 | 2021-04-21 | Samsung Electronics Co Ltd | Automated Computer Power Management System, Apparatus and Methods |
US10536505B2 (en) * | 2017-04-30 | 2020-01-14 | Cisco Technology, Inc. | Intelligent data transmission by network device agent |
CN107367929B (zh) * | 2017-07-19 | 2021-05-04 | 北京上格云技术有限公司 | 更新q值矩阵的方法、存储介质和终端设备 |
CN109587519B (zh) * | 2018-12-28 | 2021-11-23 | 南京邮电大学 | 基于q学习的异构网络多径视频传输控制系统及方法 |
CN114356535A (zh) * | 2022-03-16 | 2022-04-15 | 北京锦诚世纪咨询服务有限公司 | 无线传感器网络的资源管理方法和装置 |
Family Cites Families (26)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US1659800A (en) * | 1927-01-28 | 1928-02-21 | Perle A Bailey | Shaving comport |
JPH06164672A (ja) * | 1992-11-19 | 1994-06-10 | Toshiba Corp | データ通信システム |
JPH1098502A (ja) * | 1996-09-20 | 1998-04-14 | Fujitsu Ltd | データ移動体通信方式 |
US6694317B1 (en) * | 1997-12-31 | 2004-02-17 | International Business Machines Corporation | Method and apparatus for high-speed access to and sharing of storage devices on a networked digital data processing system |
US20020058532A1 (en) * | 1998-09-25 | 2002-05-16 | Snelgrove William Martin | Method and system for negotiating telecommunication resources |
JP2000250875A (ja) * | 1999-02-26 | 2000-09-14 | Toshiba Corp | ブートプログラム配信装置及びプログラムを記憶したコンピュータ読み取り可能な記憶媒体 |
JP2001136173A (ja) * | 1999-11-02 | 2001-05-18 | Matsushita Electric Ind Co Ltd | 無線ホームネットワークの通信方法および無線ホームネットワークシステム |
JP4523694B2 (ja) | 2000-03-21 | 2010-08-11 | アンリツ株式会社 | 情報処理システム |
JP2001339591A (ja) * | 2000-05-25 | 2001-12-07 | Murata Mach Ltd | 通信端末装置 |
JP2003030067A (ja) * | 2001-07-12 | 2003-01-31 | Fujitsu Ltd | 通信管理装置、通信システム、通信管理プログラムおよび通信プログラム |
US6665651B2 (en) * | 2001-07-18 | 2003-12-16 | Colorado State University Research Foundation | Control system and technique employing reinforcement learning having stability and learning phases |
US7170876B2 (en) * | 2002-04-30 | 2007-01-30 | Qualcomm, Inc. | Outer-loop scheduling design for communication systems with channel quality feedback mechanisms |
CN1169332C (zh) * | 2002-09-29 | 2004-09-29 | 清华大学 | 一种基于客户端反馈的传输协议选择方法 |
US7821666B2 (en) * | 2002-12-20 | 2010-10-26 | Hewlett-Packard Development Company, L.P. | Alternative to pre-printed special forms |
US7366760B2 (en) * | 2003-01-03 | 2008-04-29 | Microsoft Corporation | System and method for improved client server communications of email messages |
US7719991B2 (en) * | 2003-01-21 | 2010-05-18 | Qualcomm Incorporated | Reverse rate indicator detection |
US7013238B1 (en) * | 2003-02-24 | 2006-03-14 | Microsoft Corporation | System for delivering recommendations |
EP1503548A1 (en) * | 2003-08-01 | 2005-02-02 | fg microtec GmbH | Distributed Quality of Service Management System |
EP1505845B1 (de) * | 2003-08-05 | 2006-03-22 | Tektronix International Sales GmbH | Verfahren und Vorrichtung zum Ermitteln mindestens eines Übertragungsparameters in einem Übertragungssystem |
US7519718B2 (en) * | 2004-02-27 | 2009-04-14 | International Business Machines Corporation | Server-side protocol configuration of accessing clients |
US7478160B2 (en) * | 2004-04-30 | 2009-01-13 | International Business Machines Corporation | Method and apparatus for transparent negotiations |
US20070299915A1 (en) * | 2004-05-02 | 2007-12-27 | Markmonitor, Inc. | Customer-based detection of online fraud |
JP2005352639A (ja) * | 2004-06-09 | 2005-12-22 | Nec Corp | アクセス支援サーバ、システム、方法、プログラム |
JP2006035388A (ja) * | 2004-07-28 | 2006-02-09 | Riyuukoku Univ | 学習装置およびそれを備えた動作物体、学習方法、学習プログラムおよびそれを記録したコンピュータ読取り可能な記録媒体 |
US8363604B2 (en) * | 2005-02-01 | 2013-01-29 | Qualcomm Incorporated | Method and apparatus for controlling a transmission data rate based on feedback relating to channel conditions |
US20060274899A1 (en) * | 2005-06-03 | 2006-12-07 | Innomedia Pte Ltd. | System and method for secure messaging with network address translation firewall traversal |
-
2006
- 2006-03-29 CN CN200680054135.XA patent/CN101416466B/zh not_active Expired - Fee Related
- 2006-03-29 GB GB0812411.7A patent/GB2450257B/en not_active Expired - Fee Related
- 2006-03-29 US US10/591,378 patent/US8438248B2/en not_active Expired - Fee Related
- 2006-03-29 WO PCT/CN2006/000545 patent/WO2007109923A1/en active Application Filing
- 2006-03-29 DE DE200611003821 patent/DE112006003821B4/de not_active Expired - Fee Related
- 2006-03-29 JP JP2008552663A patent/JP4825270B2/ja not_active Expired - Fee Related
Non-Patent Citations (1)
Title |
---|
CSNJ200910036050, 儀間 聡 Satoshi Gima, "ネットワークの状態に応じた選択型ストリーミングシステム", 第28回情報理論とその応用シンポジウム 予稿集 第2分冊 Proceedings of the28th Symposium on Inform, pp.625−628 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2020074177A (ja) * | 2016-02-05 | 2020-05-14 | ファナック株式会社 | 操作メニューの表示を学習する機械学習器,数値制御装置,工作機械システム,製造システムおよび機械学習方法 |
JP2021132327A (ja) * | 2020-02-20 | 2021-09-09 | 国立大学法人京都大学 | 制御装置、それを備えた基地局、コンピュータに実行させるためのプログラムおよびプログラムを記録したコンピュータ読み取り可能な記録媒体 |
JP7272606B2 (ja) | 2020-02-20 | 2023-05-12 | 国立大学法人京都大学 | 制御装置、それを備えた基地局、コンピュータに実行させるためのプログラムおよびプログラムを記録したコンピュータ読み取り可能な記録媒体 |
Also Published As
Publication number | Publication date |
---|---|
WO2007109923A1 (en) | 2007-10-04 |
US20090187641A1 (en) | 2009-07-23 |
GB2450257B (en) | 2012-01-04 |
JP4825270B2 (ja) | 2011-11-30 |
CN101416466B (zh) | 2014-05-28 |
GB0812411D0 (en) | 2008-08-13 |
GB2450257A (en) | 2008-12-17 |
US8438248B2 (en) | 2013-05-07 |
DE112006003821T5 (de) | 2009-01-15 |
DE112006003821B4 (de) | 2010-12-16 |
CN101416466A (zh) | 2009-04-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4825270B2 (ja) | 強化学習及び伝播によるネットワークプロトコルオプションの最適化 | |
JP3654360B2 (ja) | 制御システムおよび方法、情報処理装置および方法、情報処理端末および方法、記録媒体、並びにプログラム | |
US20180124051A1 (en) | Response Method and System in Virtual Network Computing Authentication, and Proxy Server | |
KR100621092B1 (ko) | P2p 프로토콜을 이용하여 어플리케이션을 공유하는 방법및 장치 | |
TWI385967B (zh) | 智慧型交換器管理模組系統與方法 | |
CA2944912C (en) | Session-based device configuration | |
US8413208B2 (en) | Access control and protocol/policy determination based on the client's environment | |
EP3053346A1 (en) | Method and apparatus for real-time sharing of multimedia content between wireless devices | |
US20030061361A1 (en) | System and methods for automatic negotiation in distributed computing | |
US20070136301A1 (en) | Systems and methods for enforcing protocol in a network using natural language messaging | |
AU2008298594A1 (en) | Software method and system for controlling and observing computer networking devices | |
JP2017175593A (ja) | ルータの脆弱性を除去する方法及びシステム | |
US20120191829A1 (en) | Method and apparatus of performing remote registry configuration | |
US20180084087A1 (en) | Virtual desktop | |
US20070136472A1 (en) | Systems and methods for requesting protocol in a network using natural language messaging | |
US7756975B1 (en) | Methods and systems for automatically discovering information about a domain of a computing device | |
CN113301050A (zh) | 网页页面多用户实时登录登出管理方法、系统、终端及介质 | |
US9537716B1 (en) | Establishing a direct connection between remote devices | |
CN111988269A (zh) | 经由分布式数据存储库提供授权信息的策略管理系统 | |
EP2979428B1 (en) | Efficient socket transfer | |
JP6363139B2 (ja) | スマートデバイスの脆弱性を除去する方法及びシステム | |
CN118041704B (zh) | Kubernetes容器访问方法、装置、计算设备及存储介质 | |
US11363080B1 (en) | Managed intelligent discovery and mesh connectivity orchestration for collaboration solutions | |
Lee et al. | Control of information appliances using instant messaging | |
KR101860967B1 (ko) | 소유권들에 기초하여 홈 네트워크 환경 내에서의 범용 플러그 앤 플레이 동작들에 대한 보안을 제공하는 방법 및 시스템 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20101111 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110208 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110307 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110823 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110909 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4825270 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140916 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |