JP2001514403A - 分配された非線形プロセスのインテリジェントな実時間制御のためのマルチプルエージェントのハイブリッド制御アーキテクチャ - Google Patents

分配された非線形プロセスのインテリジェントな実時間制御のためのマルチプルエージェントのハイブリッド制御アーキテクチャ

Info

Publication number
JP2001514403A
JP2001514403A JP2000508020A JP2000508020A JP2001514403A JP 2001514403 A JP2001514403 A JP 2001514403A JP 2000508020 A JP2000508020 A JP 2000508020A JP 2000508020 A JP2000508020 A JP 2000508020A JP 2001514403 A JP2001514403 A JP 2001514403A
Authority
JP
Japan
Prior art keywords
agent
control
plan
memory
loop
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2000508020A
Other languages
English (en)
Other versions
JP3628961B2 (ja
Inventor
コーン、ウルフ
ネロデ、アニル
Original Assignee
ヒノミクス・コーポレーション
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ヒノミクス・コーポレーション filed Critical ヒノミクス・コーポレーション
Publication of JP2001514403A publication Critical patent/JP2001514403A/ja
Application granted granted Critical
Publication of JP3628961B2 publication Critical patent/JP3628961B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B19/00Programme-control systems
    • G05B19/02Programme-control systems electric
    • G05B19/418Total factory control, i.e. centrally controlling a plurality of machines, e.g. direct or distributed numerical control [DNC], flexible manufacturing systems [FMS], integrated manufacturing systems [IMS] or computer integrated manufacturing [CIM]
    • G05B19/41865Total factory control, i.e. centrally controlling a plurality of machines, e.g. direct or distributed numerical control [DNC], flexible manufacturing systems [FMS], integrated manufacturing systems [IMS] or computer integrated manufacturing [CIM] characterised by job scheduling, process planning, material flow
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models
    • G06N5/043Distributed expert systems; Blackboards
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B2219/00Program-control systems
    • G05B2219/30Nc systems
    • G05B2219/33Director till display
    • G05B2219/33055Holon, agent executes task and cooperates with other, distributed control
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B2219/00Program-control systems
    • G05B2219/30Nc systems
    • G05B2219/33Director till display
    • G05B2219/33065Ontogenetic learning, agent learns and adapt its own behaviour
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B2219/00Program-control systems
    • G05B2219/30Nc systems
    • G05B2219/33Director till display
    • G05B2219/33073Ion control agent has communication, database, suggestion, decision, action, detect
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/02Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]

Landscapes

  • Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Quality & Reliability (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Automation & Control Theory (AREA)
  • Software Systems (AREA)
  • Manufacturing & Machinery (AREA)
  • Multi Processors (AREA)
  • Feedback Control In General (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

(57)【要約】 マルチプルエージェントハイブリッド制御アーキテクチャ(MAHCA)20は分配されたプロセスの解析、設計、実行のためにエージェントを使用する。エージェントのネットワークはさらに複雑な文倍制御プロセスを制御するように構成されることができる。エージェントのネットワークはグローバルな性質を生成するために相互作用する。グローバルな性質は個々のエージェントの性質から生じ、知的名不変の原理のネットワークのグローバルな制約を与えることにより中央制御なしに行なわれる。各更新時にネットワーク中の各エージェントの活性プランは各エージェントの知識ベース28の知識クラウスにより決定された適合関係をモジュロする等価の性質を符号化する。制御ループ236 および各エージェントの応答学習ループは別々に構成されることができる。MAHCAはオーディオまたはビデオデータの処理および記憶のための圧縮/圧縮復元のために使用されることができる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】
本発明は、一般に小規模のシステムおよび大規模のシステムの両方のリアルタ
イムの知識に基づいた制御に関する。特に、本発明は、エージェントの集合によ
ってその論理(セットのベース)および展開(連続ベース)の性質が制御される
素子で構成され、空間的および/または時間的に分布されたシステムのコンピュ
ータベースの制御に関する。
【0002】
【従来の技術】
コンピュータ制御されたシステムは、その制御の責務を実行する際に人間にア
ドバイスを与えるため、あるいは適切な制御動作を自律的に実行するためのいず
れかの場合に使用される素子の集合である。コンピュータ制御されたシステムは
また、アドバイスを与える素子および自律素子の両方を組合わせたものを有して
いてもよい。
【0003】 分布されたリアルタイムのコンピュータ制御されたシステムの代表的な素子 には、コンピュータ、通信ネットワーク、ソフトウェア、センサ(アナログ−デ
ジタル変換器)およびアクチュエータ(デジタル−アナログ変換器)が含まれて
いる。システムは、一般に所望の性質によりしばしば表される所望の高レベルの
イベントベースの目標(安全性の目標あるいは品質の目標)を達成し維持するた
めに制御され、また、しばしば微分あるいは微分方程式として表される所望の低
レベルの展開ベースの目標(角度位置の変化の正確な割合あるいは変位速度の正
確な制御等)を達成するために制御される。
【0004】 現在の工学環境によって、種々の制御機構の実験的試みを行うための広範な 実験が支持される。システムの制約のより一層正確なステートメントと、考慮さ
れた制御機構の故障モードを発見するようにより広範に組み合わされた実験を行
うための一層パワフルなシミュレーション環境とを提供するために、過去数十年
にわたって多数の試みが行われてきた。システムが解析され、設計され、実行さ
れ、維持されると、工学環境において行われたこれらの広範な実験は、分布され
たシステムの自律あるいは(人間がループ中にいる)半自律制御を達成するため
にコンピュータ制御されたシステムによって使用されたモデルおよびアルゴリズ
ムの証明、確認および信任を行うために使用される。
【0005】 既存の技術的試みは、小規模のシステムに対しては大きな成功を収めた。し かしながら、米国商務省によると、リアルタイムのシステムの70乃至90%が
その目標への到達および配置に失敗している。さらに、配置されたこれらのシス
テムの場合、ソフトウェアに起因する初期のシステムのコストの割合は上昇し続
け、初期の獲得のコストの30乃至90%になる。大規模の分布したシステムを
構成する際の主な失敗の原因は、リアルタイムのプロセスを同期させることが困
難なことである。
【0006】 最良の既存の技術は、システム性質に関する論理的制約、地理的制約および 展開の制約を組合わせるコンピュータ制御システムを構成するための工学的経験
および発見的学習に依存している。これらのシステムの証明、確認および信任は
、一連のシミュレーションあるいはベンチマーク実験を通してシステムの故障モ
ードを発見および補正し、それに続いて発見された故障モードを補正するという
高価で決定的でない開発努力によって達成される。上述のように、リアルタイム
で大規模に制御を行う試みはしばしば失敗し、著しくリソースを消耗した後にそ
の計画は放棄されてしまう。成功したものでも更新が困難であり、その理由は、
証明、確認および信任の一連の実験はシステムが変えられる都度反復されなけれ
ばならないからである。
【0007】 本発明は、宣言された制約を満足させる制御ソフトウェアの生成によって現 在の技術を改良する。この技術は厳密な数学上の結果に基づいており、それによ
って、試みが打診され(知識ベースでの断定と矛盾する定理は証明しない)、完
了する[知識ベースによって説明された点の範囲内の任意の点にシステム状態が
(宣言された近さの規範内で)到達するようにするアクションを生じさせる定
理を証明する]。この形式的な理論的な結果と、本発明において実際に実行され
た場合の結果によって、分布された大規模のリアルタイムの制御システムを信頼
された素子から増分的に構成することができる。従って、既存の素子が信頼度を
得る程度まで、本発明は、先の実験を繰返さずに一層規模の大きいシステム中に
その素子を含むことを可能にする。さらに、従来からの、生産ラインのアプリケ
ーションから構成された良く理解された小規模のシステムの場合、本発明によっ
てシステムパラメータを広い範囲で信頼可能に変更することができる。
【0008】 現在、マルチプルエージェント・ハイブリッド制御アーキテクチャ(MAH CA)に類似した製品は存在していない。MAHCAの特徴は次のようなもので
ある。 1.MAHCAは、システム性質における論理および展開の制約を組合わせるシ
ステム状態の一般的な記述を使用する。最良の商業的にシミュレートされた製品
は、長年の間システム性質のそのような組み合わされた記述を支持してきた。商
業的シミュレーションシステムの例にはSIMNONおよびACSLが含まれて
おり、それらは両方とも非線形システムの記述、システムの平衡点の発見および
線形制御装置の設計のために平衡なシステムの線形化を支持する。最良の実験の
プロトタイプは、コーネル大学のDSTOOLであり、それはMAHCAのもの
に最も近いシステム記述を使用する。Lund Institute of Tecnology のMats And
erson 氏による最近の博士論文において、ハイブリッドシステムのシミュレーシ
ョンについて論じられている。その論文において、システムモデリング言語Om
olaと、シミュレーションシステムOmSimについて説明されている。これ
らの製品および実験用システムは、故障モードの発見を含むシステム性質の発見
を含むが、それらは不所望な性質を補償するための制御装置の生成を支持しては
いない。 2.MAHCAのシステムの性質の論理および展開の記述によって、累加的な制
御の解が与えられる。制御システムの設計のための商業的製品が存在し、それは
実験から制御コードを生成するものを含む。最良の商業的システムはMATLA
B、MATRIX−XおよびBEACONである。最良の実験用プロトタイプは
ドイツのANDECSと、ハネウェル(Honeywell) 社のHONEY−Xと、ウォ
ータールー大学(University of Waterloo ) のMETLである。METLは、シ
ステム性質の論理および展開の記述の両方と、論理および展開の制約と合致する
制御解とを与えることを支持する。しかしながら、METLは、現在入手可能な
全ての他の制御設計ツールのように、故障モードの実験上の発見と、組み合わさ
れた解を構成するための工学上の発見的学習のアプリケーションとに依存してい
る。 3.MAHCAは、イベントの線形および非線形スケジューリングの両方を解決
するためにシステムを支持する。商業製品は、イベントのディスクリートなシー
ケンスのスケジューリングを行うために存在している。ディスクリートな製造の
ための最適なスケジューリングパッケージとして、GENSYM 社の製品G2を拡張
したものが現在市場に出ている。この製品は、他のスケジューリングパッケージ
と同様に、非線形問題として知られているものに対する線形の近似の解に依存し
ている。MAHCAは、その線形近似と同様に非線形のスケジューリングの問題
を解決する。 4.MAHCAは汎用のアーキテクチャのデスクリプタを使用する。大規模のリ
アルタイムのシステムのための汎用のアーキテクチャは、かなり長い間開発され
てきた。米国の国家標準局とアメリカ航空宇宙局が共同開発したNASREMア
ーキテクチャは、1989年に公開標準として発行物に記載された。リアルタイ
ムで分布された制御を行うためのこの文献のアーキテクチャは、幾つかの大規模
のシステムの開始点ならびに次世代制御装置プロジェクトの開始、および先行研
究プロジェクト機関(ARPA)の領域特定ソフトウェアアーキテクチャ(DS
SA)プロジェクトによって支持された素子ベースのプログラミングにおける2
つのプロジェクトの開始として使用されている。これらのプロジェクトの1つは
、宣言のシステムアーキテクチャ、すなわちARDECTEKNOWLEDGE
(ARTEK)モデルのための最良の実験用プロトタイプを有している。しか
しながら、NASREMおよびARTEKのいずれも、それらのアーキテクチャ
のシンタクスによって記述されたシステムのための制御プログラムの開発を支持
しない。MAHCAは、大規模のシステムのための基準アーキテクチャを記述す
るためにNASREMあるいはARTEKシンタクスのいずれかを使用すること
ができ、また、アーキテクチャのアプリケーションの設計の目標と合致するのに
必要なアクションを実行するために制御ソフトウェアを生成することができる。
また、NASREMおよびARTEKは両方とも、大規模の分布されたシステム
に対する同期の要求の宣言を支持するが、どちらも要求された同期を達成する制
御を解する構成を支持しない。
【0009】 MAHCAは、(NIST)およびアメリカ航空宇宙局(NASA)によっ て文献“NASA/NBS Standards Reference Model for Telerobot Control System
Architecture (NASREM) ”(NIST(NBS の前身)Technical Note 1235, April 1989
) において記載されたリアルタイムの制御アーキテクチャの能力を実質的に拡張
する異種システムをフレキシブルに構成するための技術を提供する。NASRE
Mの実験に基づいたアーキテクチャは、インテリジェントでリアルタイムのコン
ピュータ制御されたシステムを実験的に開発するための最も論理的な構成のツー
ルを表している。NASREMアーキテクチャは、大規模のシステムのための最
も幅広く実行されたアーキテクチャの1つであり、アメリカ国防省によって行わ
れたリアルタイムの素子ベースの制御リサーチの開始点であった。NASREM
は、幾つかの非常に有効な特徴を含んでおり、それらはMAHCAエージェント
で実効される次のようなものを含んでいる。 1.NASREMは、速いタイムスケールで実行される階層の低いレベルと、遅
いタイムスケールで実行される階層の高いレベルとに基づいて、複雑なリアルタ
イムのシステムを固定の階層に分割するのを支持する。タイムスケールは、最も
遅いタイムスケールでのシステムの展開の数時間の観察から最も速いタイムスケ
ールでのシステムの展開の数ミリ秒間の観察へ名目上変化する。 2.NASREMはさらに、階層の各層において複雑なリアルタイムのシステム
を固定された階層的区画に分割するのを支持し、それは次のような感知・決定・
動作の模範例に従って各層を制御する固定の閉ループによる方法のための素子に
対応する。感知・決定・動作の例は以下の通りである。 a.階層における各層(タイムスケール)においてシステムの状態を感知する。
階層中の最も低いレベルにおいて自動的に入力を感知および提供するためにアナ
ログ−デジタル変換器が使用され、一方、階層中の最も高いレベルにおいて人間
による照合、システム照合に対する応答、あるいは決定を得るためにユーザイン
ターフェイスが使用される。 b.どのアクションあるいはプランが実行されるかを決定する。階層中の最も低
い層においてどのアクションが行われるかを決定するために、ディスクリートな
イベントシステムに対して使用される順次連続したマシンのためのスケジューリ
ング・アルゴリズムと、異なる動作モードに適切な閉ループ制御アルゴリズムに
対して、あるいは定義の明確な動作点の周囲での使用に適切な適応性のある制御
アルゴリズムに対して利得スケジューリングを達成するために実験用に作られた
スイッチング・テーブルとが使用される。 c.階層中の各層におけるシステムの現在の状態に対して適切なアクションを行
うように機能する。階層において低いレベルは高いレベルよりも速いタイムスケ
ールで動作するため(最も低いレベルのタイムスケールは最も高いレベルよりも
数桁速い)、高いレベルで行われたそれぞれのアクションと比較して低いレベル
では多くのアクションが行われる。
【0010】 各階層の区画は、それが制御するレベルに対して感知・決定・動作サイクル を実行するために固定速度で進行する。速度は、ユーザの性能の要求に基づいて
システムに合わせることができ、あるいは、速度は既存のプロセスの物理的な要
求に基づいて実験的に決定されてもよい。各層は、システムの現在の状態および
次のサイクルに対して行われる決定に関する制約に関する知識を含む全体的な知
識ベースにアクセスする。 3.NASREMは、システムの性質をシステムのタイムスケールに従った名目
上の区画に基づいて実行された主要な論理的活動に分割する。これによって、複
雑なシステムが増分的に設計され、プロトタイプにされ、組み立てられ、試験さ
れ、実用されるように、層における高レベルの論理的機能を最も簡単なものから
最も複雑なものへ加える意図的な設計が支持される。
【0011】 複雑な大規模のシステムを実行するための広範囲に行われた実験に基づいた NASREMおよびその他のアーキテクチャは、成功を収めた工学的方法であっ
た。しかしながら、システムの寸法および複雑さが増加するにつれ、この技術は
、成功を収めようとする試みにおいて次第に効果が無くなってきた。これらのア
ーキテクチャの中心的な問題は、レベルの同期がアプリケーションに依存してい
ることである。MAHCA同期は一般的な不変原理で行われる。別の深刻な欠点
は恐らくレベルの構成が実効的な方法により補正されないことである。
【0012】
【発明が解決しようとする課題】
本発明の目的は、非線形であり、時間的に変化し、時間的および空間的に分布
された小規模および大規模のシステムをリアルタイムで制御するほぼ正確で最適
に近いシステムを増分的に構成するための汎用アーキテクチャを提供することで
ある。本発明は、最初にシステム記述の最適に近い解が存在することを証明し、
次にシステムの所定の非線形性、妨害、不確定性、および時間の経過と共に生じ
る変化にも関わらず最適に近い性能を達成する自動制御を生成することによって
、非線形性でリアルタイムの分布されたプロセスを閉ループで最適に近い状態で
自律制御を行うためのコンピュータの使用に適した方法を提供する。
【0013】 本発明の別の目的は、ハイブリッドシステムの性質における論理および展開 の制約の宣言を可能にするクローズの言語を構成することである。システムアー
キテクチャに対するこの断言的な試みによって、サブシステムの相互作用する素
子間の関係に関して複雑なシステムが定義される。
【0014】 本発明の別の目的は、大規模の、分布されたシステムに適した解を得るため のコストを実質的に減少するために、最適に近い解の“十分に近い”特性の技術
を利用する宣言の構造を明示的に支持することである。これは、論理および展開
のモデルの近さの規範と合致する制約の自動緩和を通して行われる。自動緩和は
、制約の統語論的(syntactical) 変換を通して達成される。
【0015】 本発明の別の目的は、1組の工学ツールを提供し、システムと、エージェン トのネットワークを通して性質を同期するシステムのシステムとに素子を組み入
れるための適切なクローズの宣言を決定する際にシステムエンジニアを助けるこ
とである。
【0016】 本発明の別の目的はエージェント同期を与えることである。これはエージェ ント間の不変原理を満足することにより実現される。各更新時間で、ネットワー
クの各エージェントのアクチブプランは、各エージェントの知識ベースの知識ク
ローズにより決定される等価動作のモジュール一致関係をエンコードする。
【0017】 本発明の別の目的はエージェントのアーキテクチャモデルに別々のループ、 特に制御ループと応答学習ループを与えることであり、これらのループは別々に
実行される。しかしながら、制御ループと応答学習ループは2つの結合チャンネ
ルにより相互動作する。この分離は分離されていないループを有するエージェン
トと論理的に等しく実行するが、さらに高速度で実質上メモリの必要性が少ない
【0018】 本発明のさらに別の目的は、エージェントアーキテクチャを実効するためダ イレクトメモリマップ(DMM)を使用することである。DMMは知識を変換す
るための処理である。処理の入力で、エージェントの知識は方程式の論理クロー
ズの集合としてエンコードされる。これらのタイプのクローズはこれらの特性の
グラフィック記述とエージェント知識の実効時間表示との間の非常に実効的なブ
リッジである。DMMはメモリパッチと呼ばれるデータ構造を与えることにより
エージェント知識のコンパイラとして動作し、これは各エージェントの知識ベー
スに含まれる知識を組織することに使用される。メモリパッチはキャリアマニホ
ルドのトポロジのオープンセットの計算表示である。
【0019】 本発明のさらに別の目的は、メモリパッチ構造の基本機構として内容のアド レス可能なメモリを使用することでる。内容のアドレス可能なメモリはメモリセ
ルの内容と比較されるパターンを記憶するための被比較数と呼ばれる特定化され
たレジスタを使用する。メモリセルの内容は被比較数のパターンと一致するか部
分的に一致されるならば、そのセルは付勢される。DMMは2つの被比較数、即
ち、現在状態の被比較数と、目標被比較数とを有する。
【0020】 本発明のさらに別の目的は、MAHCAを圧縮/圧縮解凍に応用することで あり、これはオーディオまたはビデオソースの処理および記憶からなる。ソース
の処理および記憶はDMMデータ構造と、記憶されたDMMデータ構造のオンラ
インまたはオフライン圧縮解凍として実現される。ソースの処理は圧縮と圧縮解
凍エージェントの知識モデルのセットの正確性を変更することにより変化される
ことができる損失の多い処理である。圧縮されていないデータソースはデータペ
ージのシーケンスである。ビデオの場合、ページは画素からなるフレームである
。オーディオの場合、ページはカウントの集合である。
【0021】 本発明の関連した目的は、別のアプリケーションの信頼できる素子を宣言に より新しいシステムのアーキテクチャに含むことによって再使用されることをエ
ージェントのネットワークが支持することである。宣言により含むことによって
、従来からの素子を新しいシステムの信頼できる素子の部品として証明、確認、
および信任するのに必要な実験が減少される。
【0022】 本発明の関連した目的は、システム性質に関する論理および展開の制約と合 致するオートマタをオンラインで生成することによって、宣言による制約および
最適性の規範に従ったスケジュールおよび計画の生成および修正が支持されるよ
うにすることである。
【0023】 本発明のこれらおよびその他の目的は、本発明の技術に従って、論理および 展開の素子ならびに従来からのあるいは新しい素子を含む異種の素子をオンライ
ンで集積して時間的あるいは空間的に分布された非線形で、大規模で、リアルタ
イムのシステムの構築および同期をするためのアーキテクチャおよび方法の形態
のソフトウェアおよびハードウェア工学的ツールを提供することによって達成さ
れる。この工学的ツールは、システム性質の宣言と一致するオートマタの生成を
通して異種の素子のフレキシブルなオンラインの集積を達成する。これらのオー
トマタは、エージェントのネットワーク中の局部エージェントによって実行され
、それによってシステムの機能およびシステム動作の時間的および空間的規模の
増分的な拡張を支持する。この工学的ツールは、個々のエージェントのための基
礎アーキテクチャと、エージェントのネットワークのための基礎アーキテクチャ
を含んでいる。このツールは、幅広い種類の分布されたリアルタイムのアプリケ
ーションに既に適用されたモジュール式の能力のセットを含んでおり、ハイブリ
ッドシステムの設計、解析および実行のための工学的能力の最初のセットとして
与えられる。
【0024】
【課題を解決するための手段】
従って、MAHCAは、エージェントの層、ソフトウェアアプリケーション、
データベースシステム、広範囲および局部的な通信ネットワーク、センサ、アク
チュエータおよび物理的ネットワーク素子を設計し、構成するための多層アーキ
テクチャを提供する。MAHCAはまた、分布されたプロセスの動作を同期させ
るために、多層アーキテクチャを通じて動作するマルチプルエージェント論理的
通信ネットワーク用のアーキテクチャを提供する。MAHCAはまた、個々の素
子間の性質の協働的および非協働的な戦略ならびにシステムの性質の集合および
分解を支持するように構成できる。
【0025】 MAHCAの最上のレベルはエージェントのネットワークである。このエー ジェントのネットワークは、現在のシステム状態の制限に従うオンラインでの応
答的なコードの生成によって異種素子の同期を応答的に支持する協働的に動作す
るシステムであると考えることができる。異種素子は、多くのタイムスケールで
動作するように時間的に分布でき、多くの場所で動作するように空間的に分布で
きる。局部的な素子の性質は、局部的に定義された最適性の規範と、全体的に定
義された最適性の規範と、局部的な性質に関する論理的制約と、素子の展開に関
する局部的な制約と、連続性に関する全体的な制約と、局部エージェントに対し
てハイブリッドシステム状態で捕捉された際の局部的および全体的なシステム状
態とに合致するように局部的エージェントによって制御される。全体的なシステ
ムの性質の展開は、局部的エージェントの制御性質と、性質が局部的エージェン
トによって制御される素子の展開から発生する。
【0026】 MAHCAの次のレベルはアプリケーション層であり、その高レベルの論理 的インターフェイスはエージェントのネットワークによって同期される。ネット
ワーク中の単一のエージェント、あるいは多数のエージェントの集合は、制御さ
れるアプリケーションあるいはアプリケーションのセットにおいて別のプロセス
の高レベルの論理を使用する1または複数の展開プロセスの同期に適合するよう
に構成できる。
【0027】 MAHCAの次のレベルはデータベース層であり、その入力および出力はア プリケーション層によって名目上制御されるが、個々のエージェントはデータベ
ースの動作を直接制御するように構成できる。
【0028】 MAHCAの次のレベルはネットワーク制御装置およびスケジュール装置レ ベルであり、それは論理通信ネットワークを横切ってメッセージを送信するため
の通信プロトコルを実行する。
【0029】 MAHCAの最も低い層は物理ネットワーク層である。この層は、送信およ び受信装置のハードウェアと、ローカルエリアネットワークおよびワイドエリア
ネットワークに使用される送信媒体とを含んでいる。これはまた、リアルタイム
の制御アプリケーションのためのセンサおよびアクチュエータに対する層である
。 現在の明細およびパラメータ値に応じたソフトウェアを生成するためにエー
ジェントによって行われたステップのシーケンスは次のようなものである。 1.システム状態のキャリアマニホルドにおける変化の計算法の問題として元の
問題を再度公式化する。キャリアマニホルドは、ネットワークのシミュレーショ
ンモデルとノードにおけるシミュレーションモデルとを結合したものである。状
態の軌跡およびそれらの展開はこのキャリアマニホルドにおいて生じる。この方
法は、全体的および局部的な問題に対するシステムの状態の制御関数を捜し、そ
の制御関数は、分布されたリアルタイムの制御の問題に関して要求された全ての
目標を完全に達成するように状態の軌跡においてネガチブでないコスト関数を最
小にする。 2.最小にされているコスト関数を表すラグランジュ方程式L(x,u)を状態
速度(割合)uに関して凸にすることによって変化の標準的な計算法の問題が凸
の変化性の問題と置換される。凸の問題は、元の問題と比較すると、測定された
値の解(ときとして弱い、あるいはL.C.Youngと呼ばれる)を有してい
る。この解は、元の問題の全体の極小に近くなるように本来の問題の局部の極小
の間で適切にチャターするチャタリング制御を行うことである。しかしながら、
この解は単なる抽象的なものであり、時間の局部的および全体的な制御関数を与
えるだけである。 3.代りに状態のフィードバック制御関数を得るために、凸の変化性の問題を適
切なハミルトン・ヤコービ・ベルマンの方程式に変換する。この変換はMAHC
Aエージェントのプランナにより自動的に行われる。適切な境界条件に対するこ
の方程式の“ε解”は、フィードバック制御の生成子を表している状態空間に関
して有効な無限小変換を与える。 4.所定の状態において可能である制御関数は、タンジェント空間において円錐
形であり、タンジェント空間と共に移動する。最適な状態軌道にしたがうと、最
適に近い対応した制御が行われる。制御は、アフィン接続のクリストッフェル記
号に基づいており、これはキャリアマニホルドの特性である。アフィン接続は先
に述べられた目標と合致するために通信ネットワークおよびノードにおける近似
を管理するのに必要な全体的および局部的なオートマタすなわち制御プログラム
のリアルタイムの状態変換関数を行う。全体的なプログラムは、ノード間でのメ
ッセージの受渡しに責任がある。全体的なシステムの要求された運動力学(ダイ
ナミック)は、各ノードにおいて全体的に連続条件を実行することによって、分
布されたシステムの中央制御(全体的な裁定)なしに達成される。 MAHCA
がNASREM等の実験に基づいたアーキテクチャによって提供する最も重要な
利点は、実行のためのアーキテクチャにおける新しい素子の証明、確認、および
信任を行うのに必要な実験が実質的に少なくなることである。これは、オートマ
タのオンラインでの生成を通して達成され、それによって、分布されたプロセス
を応答的に同期させる。応答的な同期は、宣言されたシステム性質に従うことを
確実にする証明プロセスを通して達成される。これらの性質は、安全性および品
質の制約に関連した論理的な断言ならびに性能および正確の制約に関連した展開
の断定を含むことができる。MAHCAは、次のような幾つかの非常に有効な特
徴を有している。 1.MAHCAは、速いタイムスケールで実行される階層の低いレベルと遅いタ
イムスケールで実行される階層の高いレベルとに基づいて複雑なリアルタイムの
システムを名目上の階層に分割することを支持し、また、中間のタイムスケール
で応答するオートマタのオンラインの生成を支持し、それによって、実効的に、
連続した階層が支持される。タイムスケールは、最も遅いタイムスケールでシス
テムの展開を観察する数時間から、最も速いタイムスケールでシステムの展開を
観察するミリ秒まで名目上変化する。さらに、MAHCAは、名目上の階層にお
ける層の間でリンクを生成するために応答するように構成され、それによって、
めったに起こらないイベントに対するタイミングの制約がそのイベントが生じた
ときに満足される。 2.MAHCAはさらに、複雑なリアルタイムのシステムを階層の各層における
固定された階層の区画に分離することを支持し、それはNASREMシーケンス
に類似した感知・決定・動作の例に従って各層を制御するための固定の閉ループ
法のための素子に対応する。階層の各区画は、それが制御するレベルに対して感
知・決定・動作サイクルを実行するために固定速度で進行する。しかしながら、
MAHCAはまた、中間のタイムスケールで応答するオートマタをオンラインで
生成するのを支持し、それによって実効的に連続した階層が支持される。例えば
、通常の工学的活動は、複雑なプロセスを中間ステップに分離し、ステップのシ
ーケンスを、人間が介在して、あるいは人間が介在せずに実行される活動のシナ
リオにアレンジすることである。
【0030】 MAHCAは、階層あるいは階層的な方法でアレンジされた論理的イベント としての活動のシナリオの構成および増分的な変化を支持する。実行の速度は、
ユーザによる性能に関する要求に基づいたシステムに設計され、または、既存の
プロセスの物理的な要求に基づいて実験的に決定される。各層は、システムの現
在の状態と、次のサイクルに対して行われる決定に関する制約を含んでいてもよ
い全体的知識ベースにアクセスする。 3.MAHCAは、システムの性質をシステムのタイムスケールに従って名目上
の区画に基づいて行われた主要な論理的活動に分割することを支持する。これは
複雑なシステムが増分的に設計され、プロトタイプにされ、組立てられ、試験さ
れ、実用されたときに、層における高レベルの論理的ファンクショナリティを最
も簡単なものから最も複雑なものへ付加する意図的な設計を支持する。従って、
MAHCAが実験に基づいたアーキテクチャをよりフレキシブルに実行するよう
に構成することができる。しかしながら、MAHCAはまた、エージェントの決
定の性質に基づいたより一般的な素子の組立てを支持し、それによって、予めア
レンジされた緩和の規範に従ってオンラインで修正されることができる。
【0031】 前述のNASREMアーキテクチャに対する議論と同様に、MAHCAは汎 用のリアルタイムの(あるいはリアルタイムでない)アーキテクチャの動作を厳
密に模倣するように構成されるか、あるいは、固定されたアーキテクチャを増分
的に改良するための組込まれたフレキシビリティを有するように構成されるかの
いずれかにすることができる。従って、大きいシステムにおいて従来からあるシ
ステムを含み、ファンクショナリティの増分的な拡張を支持することができる。
しかしながら、MAHCAがリアルタイムシステムのための既存のアーキテクチ
ャよりも優れている最も重要な改良点は、ハイブリッドシステムのモデルおよび
現在のシステムの入力に従って最適に近い解をオンラインで生成することにより
一層少ないコストで安全性が高く確実性の高い動作を達成する能力である。
【0032】 前述の説明は以下の本発明の詳細な説明が最良に理解されるように、本発明 の特性および技術的利点を広く概略している。本発明の付加的な特徴および利点
を以下説明し、これは本発明の特許請求の範囲の主題を形成している。説明する
概念および特別な実施形態が、本発明の同一の目的を実行するためにその他の構
造を変更または設計する基礎として容易に使用されてもよいことが当業者により
認識されるであろう。このような等価構造が特許請求の範囲で説明されているよ
うな本発明の技術的範囲を逸脱しないことが当業者により認識されるであろう。
【0033】
【発明の実施の形態】
本発明とその利点をより完全に理解するために、添付図面を伴った以下の説明
を参照する。 図1は、全米情報基盤等のネットワークあるいはネットワークの集合の積層ア
ーキテクチャ10全体を示しており、高い方の層の素子が通常ソフトウェア中に設
置され、低い方のレベルの素子が通常ハードウェア接続MAHCA中で設置され
るアーキテクチャを示している。アーキテクチャの最も低いレベルは常にハード
ウェアで構成される。MAHCAは、分布された古いあるいは新しいアプリケー
ションを同期させるためにリアルタイムの“ミドルウェア”として機能する。
【0034】 MAHCAは論理的エージェントネットワーク11における多数のエージェン トの集合であり、それは、アプリケーション層、マルチメディアデータベースシ
ステム層、ネットワーク制御装置およびスケジュール装置層ならびに物理的通信
ネットワーク層を含んでいることが好ましい、マルチメディアプロセスのための
クライアントサーバ・アプリケーションのような分布されたアプリケーションの
通常の多層構造12を通して実行されたシステム性質を同期させる。このフレキシ
ブルなアーキテクチャによって、異種分布プロセスを同期させるためのオープン
アーキテクチャが提供される。分布されたアプリケーションの多層構造12は、製
造、通信、連邦あるいは州政府、軍事指令および制御、銀行業務ならびに医療プ
ロセス等の多数の分布されたプロセスのアプリケーションの都合のよいモデルで
ある。マルチプルエージェントの集合11は、複雑でリアルタイムの分布されたプ
ロセスがシステム素子の活動の同期を通して都合よく制御されるようにするハイ
ブリッドシステム制御パラダイムを実行する。
【0035】 MAHCAによって実行された計算モデル、式の応答推定によって、ハイブ リッドシステムのコンピュータベースの制御のための新しいパラダイムをオンラ
インで実行し、それによって、最初に現在の制御問題に対する解が存在すること
を証明し、次に、成功の証明プロセスの結果から制御オートマタを発生するか、
あるいは不成功の証明プロセスの故障モードを承認された緩和の規範に従って修
復するように応答する。
【0036】 この証明プロセスは2つの自由度を支持し、それらは、(1)設計者あるい はユーザによる問題のステートメントの高レベルの意味論のオフラインでの調整
、ならびに厳密なシンタクス変換を通した論理的制約のオンラインでの調整を支
持する論理的自由度と、(2)固定動作点周囲で正確な結果を達成するのに適し
た展開の関係の明快な宣言を支持する展開自由度である。好ましい実施形態によ
れば、オープンアーキテクチャは、マルチプルエージェントネットワークおよび
式の応答推定におけるエージェント間を通るメッセージに基づいている。
【0037】 MAHCAは、ソフトウェアおよびハードウェアの素子12の階層として構成 され、そのトポロジーは、新しい素子の追加と古い素子の削除を通して時間と共
に変化する。素子の追加および削除は、論理的エージェントネットワーク中のエ
ージェントの生成および消去を通して同期される。そのアーキテクチャは、固有
の領域モデルのテンプレートおよびアプリケーションの製造ラインのための基準
アーキテクチャをフレキシブルに構成することと、特定のアプリケーションのた
めの領域モデルおよびアプリケーションアーキテクチャを特定するためにこれら
の領域モデルおよび基準アーキテクチャを特定化することを支持する。
【0038】 計算モデルによって、システム性能において信頼度を達成するのに必要な実 験の数の減少を通してシステム素子の構成の証明、確認、および信任が容易にな
る。この実験の減少は、素子の動作を集積するためのオートマタのほぼ正確な生
成を通して可能となり、それによって、既に実行されて個々の素子に関して信頼
を得た実験は、構成されたシステムに対して繰返される必要はない。
【0039】 図1の論理的エージェントネットワーク11のモデルの場合、i=1,…,N (t)とすると、Ai は現在の時間tにおいて活性のエージェントを示す。こ
のモデルにおいて、tは実線上の値をとる。各時間tにおいて、ネットワーク中
の各エージェントのステータスは、局部的に微分可能なマニホルドM中の点によ
って与えられる。ネットワークの目標は、1組のマルチメディアの分布された対
話型プロセスをほぼ最適に制御することであることが好ましく、ネットワークの
基本的な目標は、マルチメディアサービスに対する不満足な要求を最小にするこ
とである。アクティブなエージェントAi の要求は連続関数(?)Di によって
次のように与えられる。 Di :M×T→R+ (1) ここにおいてTは実線(時間−空間)であり、R+ は正の実線である。分布され
た対話型シミュレーションに使用されたマルチメディアプロセスの同期を達成す
るように構成された論理的エージェントネットワーク11について考えてみる。次
に、マニホルドM中の点pが次のデータアーキテクチャによって表される。 p(id,proc(proc data),sim(sim data) in(synch data),mp(mult data) (2) ここにおいて、idは有限のセットID中の値をとる識別子であり、proc
()は分布された対話型シミュレーション(DIS)プロセスステータスを特徴
付ける関係であり、その関係はproc dataと表記されたパラメータのリ
ストに依存し、そのパラメータは含まれたプロセスのロードおよびタイミング特
性を定め(既存の各シミュレーションプロセスは通常異なるデータアーキテクチ
ャを有していることに注意)、sim()は表されたマルチメディアプロセスの
特性を得る関係であり、その関係はsim dataと表記されたパラメータの
リストに依存し、それは論理的エージェントネットワーク11と両立するアブスト
ラクションのレベルにおいて示されたプロセスのその点における制約のインスタ
ンスを特徴付ける。
【0040】 また、式(2)において、()の中身は、図1の階層的組織に関して論理ネ ットワーク11の同期情報が得られる関係である。特にそれは動作点におけるプロ
トコルを特徴付ける。これは、優先レベル、連結度および時定数等の情報を含ん
でいる。最終的に、式(2)において、関係mp()によって多重度情報が伝送
され、すなわちそれはこの点におけるネットワークの利用度のレベルを表す。関
連したパラメータのリストであるmult dataは、ネットワークのロード
を反映する統計的パラメータで構成されている。
【0041】 マニホルドMの点のデータアーキテクチャにおけるパラメータのリストは、 整数(ユーザの数等)、実数(トラフィックロード等)およびディスクリート値
(プロセス識別子あるいはスイッチ等)で構成できる。それらはネットワーク
および活性プロセスのステータスを特徴付ける。時間の経過に従ってこれらのパ
ラメータの展開を計算することは、MAHCAの中心的な役割である。
【0042】 論理的エージェントネットワーク11のダイナミックスは、マニホルドMに関 する所定の軌跡によって特徴付けられる。これらの軌跡は、ネットワークおよび
そのステータスを通る情報の流れを特徴付ける。デマンド関数の生成子は次の式
で定義され、
【数1】
【0043】 ここにおいて、I(t)は時間tにおける活性のエージェントと、DIS制御装
置におけるエージェントによって発せられたアクションのセットである。これら
のアクションは、マニホルドMにおいて定義された極小変換として実行される。
時間tにおける活性エージェントiに対する式(3)中の関数の一般的なアーキ
テクチャは、次の式(4)から与えられ、 Di (p,t)=Fi (Ci u ,D,αi )(p,t) (4) ここにおいて、Fi はスムース関数であり、Dはデマンド関数のベクトルであり
、Ci u は不満足なデマンド関数であり、αi はi番目のエージェントによって
発せられた指令アクションである。
【0044】 一般的に、マニホルドMは、以下の3つのアイテムで構成された(トポロジ ーΘを有する)位相空間であり、それら3つのアイテムとは、 1.RK の同相写像であり、kは整数である、式(2)の形式の点のセット。 2.[X]Uj =Mとなるように{Uj }であるマニホルドMの計数可能な一群
の部分的に開いたサブセット。 3.一群のスムース関数{ψj |ψj :Uj →Vj }であり、各jに対して、V j はRk における開いたセットである。セットUj は、文章において座標の近傍
あるいはチャートとして示されている。各チャートに対して、対応する関数ψj はその座標チャートと呼ばれている。“スムース”関数は、任意に多数の連続的
な導関数を所有している。 4.座標チャート関数は、以下の付加的な状態を満足させ、すなわち、 Uj [Y]Ui ≠0となるように任意のチャートUj ,Ui が与えられた場合
、関数ψOψj -1:(Uj [Y]Ui )→(Uj [Y]Ui )はスムースである
【0045】 マニホルドMの一般的な定義は、制御システムアプリケーションのために特 別に行われる。マニホルドMに関連したトポロジーΘを検討するとき、Mの点は
、proc data、sim data、synch dataおよびmul
dataのリストにおけるパラメータの値の間隔によってアーキテクチャが
特徴付けられる限定的なアーキテクチャ(式(2)を参照)を有することが注目
される。これらのパラメータの数はkに等しい。これらのパラメータに関する“
知識”は、Rk に関するトポロジーΩを定めることによってモデルに含められる
。 Ωにおける開いたセットは、パラメータについての既知の事実をコード化す
るクローズ(clause)から構成される。マニホルドMのトポロジーΘは、次のよう
にΩの項で定義される:Ωにおける各開いたセットWに対して、W[Z]Vj
Z]Rk となるようにセットψj -1(W)はΘになければならない。これらのセ
ットは、各p[E]Uに対してUに含まれたこのフォームに近傍がある場合のみ
U [Z´]MとなるようにΘに対するベースを形成し、すなわち、p[Z]ψ j -1 (W)[Z´]UとなるようなW[Z]Uj であり、ψj :Uj →Vj であ
り、チャートはpを含んでいる。
【0046】 MAHCAのインテリジェントDIS制御装置によって指令されたアクショ ンを特徴付けるために、マニホルドMに関する導関数が導入される。Fp をマニ
ホルドMの点pの近くに定められた実数値のスムース関数の空間とする。fおよ
びgをFp における関数とする。Fp の導関数vは次のような写像であり、 v:Fp →Fp これは次の2つの特性を満足させる。 v(f+g)=(v(f)+v(g))(p) (線形性) v(f・g)(p)=(v(f)・g+f・v(g))(p) (ライプニッツの法則) 導関数は、マニホルドMにおけるベクトルフィールドと、関連した積分曲線のク
ラスとを定める。Cは、IをRのサブインターバルとした場合にφ:I→Mによ
ってパラメータ化されたマニホルドM上のスムース曲線であるとする。局部座標
において、p=(p1 ,…,pk )であると、Cは、tに関する導関数がφ(t
)=(φ1 (t),…,φk (t))で表されるk個のスムース関数φ(t)=
(φ1 (t),…,φk (t))によって与えられる。Mにおける曲線上の等
価の関係は、マニホルドM中の点における接線ベクトルの定義の基礎として導入
される。p[E]Mとする。pを通過する2つの曲線φ1 (t)およびφ2 (t
)は、次の2つの仮定、すなわち、 あるtに対して、τがI[Z´]Rにある場合、
【数2】
【0047】 これを満足させる場合、p(表記:φ1 〜φ2 )において等価であると言われる
。 明らかに、〜はpを通過するマニホルドMにおける曲線のクラスにおける等価値
関係を定める。[φ]はφを含む等価のクラスであるとする。[φ]に対する接
線ベクトルは導関数v|p であり、局部座標(p1 ,…,pk )において次の式
によって定義される。
【0048】 f:M→Rをスムース関数とすると、
【数3】
【0049】 pにおける全ての等価なクラスに関連した接線ベクトルのセットは、pにおける
接線ベクトル空間と呼ばれるベクトル空間を定義し、それはTMp で表される。
マニホルドMに関連した接空間のセットは一緒に“接着”されて接線束と呼ばれ
るマニホルドを形成し、それは次の式によるTMで表される。
【数4】
【0050】 この接着がどのように行われるかを明確に特定することが重要である。ベクトル
フィールドの概念を導入し、モデル中のその関連を議論した後に、接着の実行が
特定される。
【0051】 マニホルドM上のベクトルフィールドは、v|p が点から点へスムースに変 化する状態のM:v|p [E]TMp の各点への導関数vの割当てである。この
モデルではベクトルフィールドは局部座標中で表される。接線ベクトルは選択さ
れた局部座標に関して表されるが、この定義は選択された局部座標とは関係がな
い。(p1 ,…,pk )を局部座標とすると、
【数5】
【0052】 式(5)と(6)とを比較すると、p=φ(t)が、任意の点における接線ベク
トルが同じ点の値vと一致するマニホルドMにおけるパラメータ化された曲線で
ある場合、全てのtに対して、 φ(t)=v|φ(t) であることは注意される。局部座標において、p=(φ1 (t),…,φk (t
))は、通常の微分方程式の自律系に対する解でなければならず、すなわち、 j=1,…,kに対して、 (dpj /dt)=λj (p) (7) マルチメディア分布対話型シミュレーションアプリケーションにおいて、DI
S制御装置によって発せられた各指令は、マニホルドMのベクトルフィールドと
して実行される。制御装置における各エージェントは、“原始的”な予め定めら
れたベクトルフィールドの組合わせとして指令フィールドを構成する。マニホル
ドMに対して選択されたトポロジーΘは、計量されることができず、初期の条件
を与えられ、方程式(7)に特有の解は古典的な意味では保証できない。しかし
ながら、それらは緩和曲線と呼ばれるMにおける連続的軌跡のクラスにおいて解
を有している。このクラスにおいて、式(7)に対する解は特有のものである。
緩和曲線がプロセス制御の公式および実行に適用されたときの緩和曲線の基本的
な特徴は後に説明される。緩和曲線がDISプロセットモデルおよび制御に関連
したときの緩和曲線の特性を説明するために、Mにおけるフローの概念が導入さ
れなければならない。
【0053】 vをベクトルフィールドとすると、マニホルドMにおける点pを通過する任 意のパラメータ化された曲線φ(t)は、p=φ(t)であり、局部座標におい
てv|p が式(5)を満足させる場合には、vに関連した積分曲線と呼ばれる。
ベクトルフィールドvに関連し、Ψ(t,p)で表された積分曲線は、次の特性
、すなわち、
【数6】
【0054】 を満足させる場合には、vによって発生された“フロー”と呼ばれる。
【0055】 MAHCAに対してこの概念を特別化するために、通信ネットワーク中のエ ージェントiは活性であるとする。現在の定められたインターバルの幅[t,t
+Δ)においてΔ>0であるとする。Ui (p,t)とすると、p[E]Mはイ
ンターバルの始まりにおける満足されないデマンドである。エージェントiは、
次のような原始的なアクションのセットを有している。
【数7】
【0056】 エージェントiは、インターバル[t,t+Δ)中に1以上のこれらのアクシ
ョンのスケジュールを定め、現在のサービス要求Sri(t,p)と論理的エージ
ェントネットワーク中の活性のエージェントのデマンドD(p,t)=[D1
(p,t),…,DN(t)(p,t)]の関数としてアクションvijが実行されな
ければならないΔのフラクションαij(p,t)を決定する。
【0057】 図2は、3つの原始部分を含むアクションのスケジュールを概念的に示して いる。図2は、図1に示された論理的エージェントネットワーク11における個々
のエージェントを示しており、それによってエージェントに関連したフローを変
更する無限小のアクションのスケジュールが実行される。個々のエージェントは
、宣言的な知識を与えるために構成され、式の論理言語で書込まれ、それによっ
て、制御されたシステムは、システムの目標を満足させる実際の最適な軌道と比
較して、最適に近い軌道である連続的軌跡(エージェントiのアクションに関連
したフローΨ)を辿る。式の論理言語のフォーマットは、より一般的なホーン(H
orn)クローズフォーマットの限定されたバージョンである。
【0058】 局部的エージェントiのアクションに関連したフローΨi 13は、時間tnjに おいて行われ、時間インターバルΔi,njの期間続くアクションに従って時間nj においてインターバルΔ18を通じて変化する。スムースな線のセグメント17を局
部的エージェントiの最適な軌道εと考えると、MAHCAによって発生された
アクションは、時間インターバルを通じてシステムの状態を最適に近い軌跡上に
維持する。長時間にわたる全体的な同期は、システムの状態が最適に近い軌道に
戻るように適切なアクションを行うために最適な状態からの逸脱に反応するオー
トマタをオンラインで生成することによって達成される。このオンラインでの発
生プロセスは、システムに関連したフィンスラーマニホルドに対するアフィン接
続を計算することによって達成される。アフィン接続によって、全体の最終的な
目標の状況を最適な軌道に沿って現在のインスタンスに並列に移動することがで
き、また、システムの状態を最適に近い方法でその現在の状態から最終的な目標
の状態に移すために現在のアクションを実行することができる。
【0059】 図2のスケジュールに関連したフローΨi 13は、各アクションに関連したフ ローから次のように計算されることができる。
【数8】
【0060】 式(10)によって与えられたフローΨi 13は、エージェントiによって観察
された際にプロセスの展開を特徴付ける。フローΨi 13に関連したベクトルフィ
ールドvi p 16は、微分および式(8)でのフロー発生アイデンティティによ
って得られる。p14において与えられたこのベクトルフィールドvi p 16は次
の式、すなわち、 vi p 16=[vi,ni,[vi,n2,vi,n3]] (11) に比例し、ここにおいて、[.,.]はリー・ブラケットである。リー・ブラケ
ットは次のように定義される。v,wをマニホルドMにおける導関数とし、fを
任意の実数値のスムース関数f:M→Rとする。v,wのリー・ブラケットは、
[v,w](f)=v(w(f))−w(v(f))によって定められた導関数
である。従って、プロセスを制御するためにi番目のエージェントによって発生
された複合のアクションvi p は、式(11)の形式を組合わせたものである
。さらに、チャタリングの補助定理および双対関係のバージョンから、このアク
ションはエージェントに使用可能な原始的アクションの線形の組合わせとして次
のように表すことができ、
【数9】
【0061】 ここにおいて、係数γj i は時間のフラクション(α)ij(p,t)19によって
定められ、そのそれぞれの原始的アクションvij16はエージェントiによって使
用される。
【0062】 スムース関数について複合のアクションvi p によって定められたフィー ルドの効果は、テイラー級数で式(10)の右側を展開することによって計算さ
れる。特に、マルチメディア分布相互作用シミュレーションアプリケーションの
制御に使用されるMAHCAの場合、点pにおいて開始するインターバル[t,
t+Δ)を通じたフローΨi 13による不満足なデマンドの展開は次の式によっ
て与えられる。 Ci u (t+Δ,p'')=Ci u (tΨi (t+Δ,p) (13) (p,t)近くのテイラー級数で方程式(13)の右側を展開すると、次のよう
な式が生成され、
【数10】
【0063】 マニホルドMのトポロジーは論理的クローズによって生成されるので、式(14
)の右側の級数は有限の多数の非ゼロの項のみを有する。直観的に、導関数の計
算検出力において、このMAHCAは異なる近傍点の間で区別することだけが必
要であるために前述のようになる。マニホルドMのトポロジーΘの公式化におい
て、これはクローズの情報によってのみ与えられる。各エージェントの知識ベー
スは有限の多項だけを有しているため、導関数の検出力がゼロとなる級数を展開
する項がある。これは、その項によって式(14)の右側の級数が局部的に有限
のオートマトンによって効果的に発生できるために重要である。このオートマト
ンの構成は後に展開される。原始的アクションのセットが各エージェントに使用
可能である場合、複合アクションvi p はフラクション関数αi のベクトルに
よって決定される。
【0064】 等式(4)において公式化されたモデルの特定の特性が以下に記載される。 時間tおよび点p[E]Mにおいて、エージェントiの満足されないデマンド関
数は次のように表され、
【数11】
【0065】 ここにおいて、tは先の更新インターバルの終了点であり、Sriはエージェント
iに対するサービス要求関数であり、Qi,k はエージェントkの現在のデマンド
のどれだけがエージェントiに割当てられるかを決定する乗数である。この割当
ては、両方のエージェントが制御しているプロセスの特性と、エージェントの知
識ベースにおいてコード化されたプロセスの説明から決定される。従って、エー
ジェントkからエージェントiへのサービスのための実際の要求は、項Qi,k
k (p,t)である。エージェントkによってエージェントiに送られた情報
は、先のインターバルの終りにおけるデマンドDk である。最後に、点p[E]
Mは、式(15)において現れるエージェントによって制御されたプロセスの現
在のステータスを伝送し、エージェントkはQi,k ≠0である場合にはプロセス
を制御する。
【0066】 図3は制御された分散プロセスを有するMAHCAフレームネットワークを 示している。各円はエージェント20を表し、これは事前に特定された同期および
/または制御機能を実行する。各エージェントの動作は3つの情報アイテムの関
数、即ち1)プロセスからエージェントまで流れる知覚データまたはオンライン
状態データと、2)エージェントの知識ベースでエンコードされたアクチブ知識
または選択された情報データと、3)事前に特定された論理ネットワークによる
その他のエージェントからのエージェント間制限またはオンライン状態情報であ
る、エージェントはその他のエージェントへの処理または制限データのための命
令動作を発することにより制御および同期機能を実行する。
【0067】 図3のフレームワークは非常に一般的である。これは多数のダイナミック分 散プロセスと、それらの制御および同期アクチビティの表示を示している。例え
ばディスクリートナマルチコンポーネント製造プロセスを考察する。このプロセ
スはアセンブリステーションとプロダクト転送サブシステムからなるアセンブリ
ラインにより実行される。各アセンブリステーションは入来アイテムに部分的な
アセンブリタスクを行い、これらのアイテムは適切な転送サブシステムによって
、アセンブリの次の段を実行するステーションへ誘導される。このシナリオでは
、各アセンブリステーションと転送サブシステムは割当てられたエージェントの
命令または監督の下でそのタスクを実行する。エージェントはそのステーション
のダイナミックと、制限と、動作ルールについて、知識ベースのエンコードされ
た知識から知る。これは知覚情報からステーションの現在状態について知る。こ
れはこれが選択できる動作に課された制限の形でその他のエージェントから同期
情報を捕捉し受信する。
【0068】 式の応答推定、すなわちMAHCAの計算モデルは、図2に示された標準素 子のセットを通して各エージェントにおいて実行される。MAHCAはエージェ
ントの集合であり、図2は単一のエージェントの素子を示している。単一のエー
ジェント20は、6個の素子、すなわち、知識ベースビルダ22(ユーザからの手動
の入力を支持する)、プランナ24、推定手段26、知識ベース28、アダプタ30、お
よび知識デコーダ32(別のエージェントからの自動入力を支持する)から構成さ
れている。計算モデルは、現在のシステム状態を捕捉するためにキャリアマニホ
ルドにおける点を使用し、システム状態が発展するときに制御間でチャタリング
を行うことによって最適に近い結果を得る。必要とされる最適に近い制御は、ア
フィン接続のクリストッフェルの記号によって代数的に表される。
【0069】 知識ベースビルダ22は、システムの宣言のブロック図による表示のツールで あり、式の論理言語のフォーマットに制約を与える。プランナ24は、システムの
所望の性質を表すステートメントを存在的に定量化された論理式として発生し、
それは本明細書においては性質ステートメントと呼ばれる。プランナはまたエー
ジェントの最適基準を構成し修復する。推定手段26は、このステートメントが知
識ベース28において現在活性である定理であるかどうかを決定する。現在の定理
は、現在のインスタンス化による知識ベース中の活性のクローズの集合である。
性質ステートメントが知識ベース28の現在の状態から論理的に導かれた場合、推
定手段26は、この性質ステートメントが真実であることが証明された場合の副作
用として、現在の制御アクションスケジュールを発生する。推定手段はエージェ
ントの最適問題のための空ではない解決セットが存在するか否かを決定する。こ
のような解決セットが存在するならば、これは適切な制御動作を推定し、新しい
状態情報とエージェント間制限情報が存在する。知識ベース28は、エージェント
によって制御された動作あるいはプロセスの要求を記憶する。それはまた、シス
テムの制約、エージェント間のプロトコルおよび制約、センサのデータ、動作お
よび論理的原理、ならびに式の項のドメインにおいて定められた原始的推論動作
のセットをコード化する。これは基本的にエージェントの知識を記憶し更新する
【0070】 性質ステートメントが知識ベース28の現在の状態から論理的に導かれない場 合、すなわち、所望の性質が実現可能でない場合、推定手段26は、置換あるいは
修正のために故障の項をアダプタ30に送る。アダプタは故障の項を修復し補正項
を計算する。最終的に、知識デコーダ32は、別のエージェントからのデータを受
信し翻訳し、それらをそのエージェントの知識ベース28に組み入れる。
【0071】 エージェントの機能は図4で示されているアーキテクチャによって実行され る。エージェントアーキテクチャは2つの相互動作非同期ループ、即ち制御ルー
プ235 と応答学習ループ236 により動作する。制御ループ235 は制御動作とエー
ジェント状態を、現在の知識の関数として発生し、内部で発生したプランを満足
する。応答学習ループ236 はエージェントプランを観察されたエージェント動作
の関数として変更する。これらの2つのループは6つの相互動作するモジュール
のうちの5つ、即ち、特にプランナ、推定手段、知識ベース、アダプタ、知識デ
コーダを経て実行される。アーキテクチャの2つのループは別々に実行される。
この分離は直接メモリマップ(DMM)概念を行うのに必要であり、これは図2
5で示されている構成により説明される。
【0072】 図5を参照すると、好ましい実施形態は制御エージェントと協働するネット ワークを構築するために図4において定められたような個々のエージェントのセ
ットを使用する。ネットワークは階層として構成できるが、より一般的にそれは
エージェント間の関係の方向グラフとして構成される。協働する制御エージェン
トの現在のネットワークは、宣言可能な制御装置エージェント34、境界線制御装
置エージェント33および通信路35を含んでいる。エージェントは、複雑なアーキ
テクチャにおいてユーザあるいは別の主要な素子とインターフェイスする境界線
制御装置エージェント33として構成でき、あるいは、単一のエージェントは制御
される素子のドメインにおける境界制御装置エージェント33および別の宣言可能
な制御装置エージェントと相互作用する宣言可能な制御装置エージェント34とし
て構成できる。エージェントの論理ネットワークは、設定された通信路35に沿っ
てメッセージを渡す。
【0073】 図6は、永久的なエージェントおよび一時的なエージェントの両方を有する エージェントのネットワークの展開を示している。ネットワークは、新しいエー
ジェントの活性化と古いエージェントの不活性化を通して時間tからt+Δに渡
って展開する。それぞれの個々のエージェントは、全体的および局部的な制約、
局部センサ入力、および接続されたエージェントからの入力に従って局部的なア
クションを行う。制御エージェントと協働するネットワークは、全体的な目標の
達成を同期させるために局部的な制御アクションを行う。局部的なエージェント
は最適さに関する局部的な規範を設け、それは同じ最適さの戦略(Min−Ma
x、Team、パレート、シュタッケルベルグ、あるいはナッシュ)あるいは異
なった最適さの戦略のいずれも使用できるが、全て全体的な最適さの規範および
全体的な保存則に一致しなければならない(平衡の制約)。同期性は、個々のエ
ージェントの応答性の使用によって達成および維持され、それによって、全体的
なアプリケーションを有する共用されたデータ素子の値に対して位相のコヒーレ
ンスが維持される(すなわち、エージェントは全体的な保存則あるいは全体的な
規範と一致する各エージェントに基づいた合意を達成するように応答する)。
【0074】 論理的エージェントネットワークは、永続的なタスクを実行する永久的エー ジェントと、活性リンク48によって結合された一時的なタスクを実行する一時的
エージェントとによって構成されている。ネットワークの展開は、誕生した新し
いエージェント44と、不活性な古いエージェント42と、現在のシステムの状態お
よび現在のエージェントのアクションに関連したフローが最適に近い軌道を辿る
ように適切なアクションを行うために要求されたような不活性化リンク46とで構
成されている。MAHCAのこの特徴の2つの結果、(1)大きいシステムを徐
々に構成および強化することが支持され、(2)システムのタイムスケールある
いは転位スケールに従ってシステムの機能を階層に分離することを支持する工学
的設計を有するリアルタイムのシステムのための連続階層の設置が支持される。
【0075】 多重エージェントハイブリッド制御アーキテクチャは、時間t+Δにおいて 新しいエージェント44の自律的生成を支持する。新しいエージェントが誕生する
と、一時的なエージェントによる一時的なタスクの一時的な受入れ、あるいは、
永久的なエージェントの生成による長期間にわたるシステム位相の変更が支持さ
れる。展開の間、そのアーキテクチャによって古いエージェント42およびエージ
ェント40からのリンク46の自律的な不活性化が支持される。古いエージェントの
不活性化によって、もはや必要とされないプロセスを終了させるためのシステム
の変更が支持される。
【0076】 図7は、式関連クローズのセットとして構成された図4に示された知識ベー ス28の詳細を示している。式関連クローズは、システム展開に関する論理および
展開の両方の制約を宣言するために使用される。知識ベースは、階層に重ね合わ
されて構成された下部の種々の法則45、一般的制御明細46、プロセス表示47、ゴ
ールクラス表示48、制御性能明細49、ダイナミック制御明細50、およびモデルビ
ルダ実現51を有している。ドメイン知識のこの構成は、素子の代数的宣言からよ
り複雑な記述のシステム性能の要求を生成する手段である。宣言は、式の論理言
語で式関連クローズとして記載されることができる。
【0077】 この階層の底部は、マニホルドMの代数的およびトポロジカルな構造を特徴 付ける種々の法則45の式を含んでいる。これらは、関連した形態のタームで表さ
れる。代数的な観点から、それらは代数的なをモデルとする。マニホルドを種々
の等価の変形としてモデル化することによって、MAHCAが推論することがで
きる等価なクローズでDISプロセスに含まれたシミュレーションの状態ダイナ
ミックを得る。MAHCA中の各エージェントの知識ベースはこの知識のコピー
を含んでいる。しかしながら、動作中には対応するクローズは異なった例示の状
態であり、何故ならば、それらが知覚データに依存しているからである。
【0078】 一般的制御明細46は、プロセス表示47およびゴールクラス表示48と共に階層 の次のレベルにある。一般的制御明細46は、システムの一般的な所望された性質
を表すクローズである。それらは、宣言する理性的な制御装置のクラスに特有の
安定性、複雑さおよび頑丈さに関するステートメントを含んでいる。一般的制御
明細46は、式の論理言語形式で種々の法則を組合わせることによって構成される
。 プロセス表示47は、ダイナミックな性質およびプロセスの構造を特徴付ける
クローズによって与えられ、それはセンサおよびアクチュエータを含んでいる。
これらのクローズは、ダイナミックな性質のための保存原理として、および構造
のための不変原理として記載されている。
【0079】 ゴールクラス表示48は、ドメイン中の所望の動作点(マニホルドM中の点) のセットを特徴付けるクローズを含んでいる。これらのクローズはソフト制約と
して表され、すなわち、有限の時間インターバルの間、侵害することができる制
約である。それらは制御装置の究極的な目的を表しているが、時間の経過に応じ
た性質を表してはいない。目標(ゴール)のクローズはエージェントに依存して
いる。ゴールクラス表示のクローズもまた、式の論理言語形式で種々の法則を組
合わせることによって構成される。
【0080】 制御性能明細49は、問題依存およびエージェント依存の規範および制約を表 すために使用されるクローズを含んでいる。制御性能明細クローズは、知識ベー
スが重ね合わされた階層における次の層を備えている。それらは応答の速度およ
び時間等の特有の制約と、状態の軌跡の質的な特性とを含んでいる。制御性能明
細クローズもまた、式の論理言語形式で種々の法則を組合わせることによって構
成される。
【0081】 ダイナミック制御明細50は、センサおよび目標指令の関数として本体が変更 されるクローズである。ダイナミック制御明細クローズは、知識ベースが重ね合
わされた階層において次の層を備えている。ダイナミック制御明細クローズもま
た、式の論理言語形式で種々の法則を組合わせることによって構成される。
【0082】 モデルビルダ実現51は、証明のための可変の例および定理を生成するための 手順モデル(オートマトン)を構築する手段を構成するクローズを含んでいる。
モデルビルダ実現51のクローズは、知識ベースの階層中の最上層を構成する。
【0083】 図8は、式関連クローズとして図4において示されたような単一のエージェ ントの知識ベース28の基本的な要素を示している。エージェントの知識ベースに
記憶されたクローズは、システム性質に関する1組の論理および展開の制約に従
うオートマタを生成するために使用される。式関連クローズ52は、システム性質
に関する知識の基本ユニットである。基本的な式関連クローズのシンタクスはホ
ーン(Horn ) クローズのシンタクスである。すなわち、そのクローズはシンタク
スを有しており、それらはヘッド53、含意関数(IF)54およびボディ56である
。 知識ベースは、2次の拡張を有する等しい1次論理クローズのセットで構成
されている。クローズのシンタクスは前置言語のものに類似している。各クロー
ズは次のような形式のものであり、 ヘッド<ボディ (16) ここにおいて、ヘッド53は2進[真、偽]における値をとる関数形式p(x1 ,
x2 ,…,xn )であり、x1 ,x2 ,…,xn は制御装置のドメインDにおけ
る変数あるいはパラメータである。クローズのヘッド部に現れる変数は普遍的に
定量化されると仮定される。記号<は、論理的含意関数(IF)54を表している
【0084】 クローズのボディ56はサブボディ60の論理和62であり、各サブボディは論理 項64の論理積66である。各論理項は、式68、オーダー70および名称72である。項
i の論理積は次の形で表され、 e1 Λe2 Λ…em (17) ここにおいて、Λは論理的“アンド”66である。式(17)における各項は関係
式である。関係式は次のうちの1つであり、すなわち、等式、不等式、カバー形
式、あるいはクローズヘッドのいずれかである。これらの式のそれぞれの論理値
は真あるいは偽のいずれかである。関係式ei は、その関係形式が満足されたと
きに変数がとったドメインDの値のSi の組のセットに対しては真であり、その
セットの補数に対しては偽である。すなわち、ei =ei (x1 ,…,xn )の
場合、Si はDn の空の部分集合である可能性もあり、
【数12】
【0085】 関係式の基本的な構造が表1に与えられている。
【数13】
【0086】 表1において、wおよびvは、定義および特性公理が知識ベースに含まれている
動作の有限のセットに関連した多項式である。多項式vは、次の式の対象であり
【数14】
【0087】 ここにおいて、Ω' は直積演算で変数記号{x1 ,…,xn }によって生成され
たフリーモノイドである。項(v,ω)は、ω[E]Ω' においてvの係数と呼
ばれる。多項式vの係数は、クローズの定義域中の値をとる。このドメインは以
後、手短に説明される。
【0088】 式(16)と(17)の論理的解釈は、ボディの項の論理積がクローズのヘ ッドの変数の例に対して共通に真である場合、ヘッドは真であることを意味して
いる。クローズのヘッドにおける変数が値をとるドメインはマニホルドMである
。マニホルドMは次のようなデカルト積に含まれており、 M[Z]G×S×X×A (18) ここにおいてGは目標の空間であり、Sは感知データの空間であり、Xは制御装
置の状態の空間であり、Aは制御アクションの空間である。G,S,X,Aはそ
れ自体でそのトポロジカルな構造が知識ベース中の特定化されたクローズによっ
て定められるマニホルドである。アプリケーションに依存するこれらのクローズ
は、制御の下でプロセスの閉ループ性質における要求をコード化する。事実、変
動的な公式の項において後に定義される閉ループ性質は、マニホルドMにおける
値を有する連続曲線によって特徴付けられる。この連続状態は中央であり、何故
ならば、それは閉ループ性質によって要求が満足されるようにするアクションを
システムが探すように要求することと等しいからである。
【0089】 図9は、連続75のアルゴリズムを介してハイブリッド表示76に埋め込まれた プロセス74を示している。そのアルゴリズムは、ドメイン77からキャリアマニホ
ルド79への不変の写像78を構成する。知識ベースのドメインにおいて知識を宣言
するドメイン(知識のルール)77である式関連クローズは、キャリアマニホルド
中にチャート(開かれたセット)79を有する1対1の写像78を有する。一般的な
制御の問題の場合、図7に示された知識ベース管理機構は、宣言の階層を種々の
法則の要素からドメインのモデルを構成するレベルへ提供する。知識ベース管理
機構はまた、最適化のフレームワークにおいて含むためのディスクリートなプロ
セスの連続を助ける。この試みはまた、一般的なディスクリートプロセス(例え
ば、販売員の選別および巡回の問題等)にも適用できる。連続の表示における手
順の埋め込みは、最適に近い軌道の決定に使用できる関数を展開するためにシス
テムの状態の統一された表示を与える際の基本的なステップである。
【0090】 知識ベース中の各クローズの表示的意味論は、(1)保存原理、(2)不変 原理、あるいは(3)制約原理のいずれかである。保存原理は、システムあるい
は計算リソースのダイナミックスにおける特定のプロセスのバランスについての
1または複数のクローズである。保存則は、制御された物理的あるいは論理的手
段がその性能特性を満足させるときに当てはまる。例えば、クローズとしてコー
ド化された式(15)は論理的通信ネットワークにおけるデマンドの保存を表す
。説明のために、この法則が以下に示される。
【数15】
【0091】 式(19)において、第1の式の項は、現在の時間におけるエージェントiに対
する不満足なデマンドを過去の不満足なデマンドならびにiにおいてiに接続さ
れた他のエージェントの正味の現在のデマンドに関連させる。法則の最後の項は
回帰を行う。
【0092】 別の例として、計算リソースの保存を表す以下のクローズを考慮すると、
【数16】
【0093】 ここにおいて、“Load”はVIPS(可変の例示/秒)において測定された
現在の計算上の負荷に対応し、“process”は実行のために考慮されたク
ローズであり、“Op count”はプロセス中の現在の項の数である。保存
則は常に、上述の例のように、範囲が単一のクローズである必要がない回帰を含
んでいるが、幾つかのクローズを通した連鎖を有していてもよい。
【0094】 不変原理は、一般的な意味において一定の運動を確立する1または複数のク ローズである。これらの原理は定常状態を含み、それは構造および測地線によっ
て証明された定理の公式化においてきわめて重要な役割を演じる。DISプロセ
スの制御において、不変原理は品質の応答の要求を特定する。すなわち、それら
はシステムが満足させなければならないトラフィックロードの関数として性能の
レベルを特定する。不変原理の重要性は、それらが予期しない事象を検出するた
めに提供する基準にある。例えば、DISプロセスにおいて、要求が満たされた
後の更新時間は、通常の動作状態の下では一定である。この不変性を指定する式
クローズは一定のグラウンド形態を有しており、この値からの逸脱は正常状態か
らの逸脱を表す。
【0095】 制約原理は、アクチュエータあるいはセンサ、および最も重要なことに性質 のポリシーに対する工学的制限を表すクローズである。例えば、DISプロセス
において、入力のフローの大きさあるいはアクセスの速度を制御する値の応答の
速度の特性は、システムのリレーショナルベース中に記憶された経験上のグラフ
(例えば、トラフィックボリュームをパラメータとした場合のバイト数対速度
等)によって与えられる。このアプリケーションにおける別の例は、マニホルド
Mにディスクリートな可変の軌跡を埋め込むためのリフト戦略を定めるクローズ
によって与えられる(補間の規則)。クローズの知識ベースは、図7によって先
に示されたような重ね合わされた階層構造において組織されている。
【0096】 図10は、分布されたリアルタイムのシステムを同期させるために個々のエ ージェントによって行われるアクションを示している。アクションは、式関連ク
ローズに含まれた制約と、センサからの入力および論理エージェントネットワー
ク中の別のエージェントからの入力に従う各エージェントにより生成されたオー
トマタによって実行される。単一のエージェントは、キャリアマニホルド中の点
において変換を行うことによってオートマタを生成する。この図は、キャリアマ
ニホルド中の点において適切に変換を実行する単一のエージェントの素子から生
じたデータフローを示している。データフロー図は、ユーザからの入力、論理エ
ージェントネットワーク中の別のエージェントからの入力、先の決定サイクルか
らの現在のエージェントの状態118 、または先の決定サイクルにおいて行われた
アクションから感知された結果を使用して、知識ベースが更新される(80)毎にシ
ステムの状態がどのように更新されるかを示している。システムの状態はキャリ
アマニホルド中の点の値で維持され、それは論理および展開の特性である。単一
のエージェントのデータフロー図は、各更新インターバルにおいて論理および展
開の制約に従うオートマトンの抽出の際にキャリアマニホルド中の点の値がどの
ように変更されるかを示す。
【0097】 データフロー図はプランインスタント化84のアーキテクチャを示しており、 それは、知識ベース86(図4において参照番号28で示されている)における現在
の更新80の項の統一82を通して図4に示されたプランナ24によって達成され、ア
イテムポテンシャルは図4に示された推定手段26から受け取られた故障項102 か
ら図4に示されたアダプタによって構成される。アクティブな関係88は、図4に
示されたプランナ24から性質の規範を受け取り、緩和の規範を構成するために緩
和の原理を適用した結果である。正準方程式92は、ダイナミックプログラミング
式を構成するために(線形化、等化、防護およびフリーズ90を使用して)緩和さ
れた規範に対してレヴィ・チヴィタ接続原理を適用した結果である。推定オート
マトンは、推定ブループリントコンストラクタ94(演繹および展開、転移出力関
係)を使用して構成される(96)。その後、推定手順(一体の接頭辞ループ分解ト
リマー)98を使用してオートマトンが構成される。推定オートマトンの実行100
が目標の規範との一致に失敗した場合、故障項102 は図4に示されたアダプタ30
に送られ、そこにおいて、緩和(コンミュテータルール不活勢緩和)104 のシン
タクスの規則が適応化106 を行うために適用される。プランの項は、ラグランジ
ュの構成部108 を使用してポテンシャルとして再度公式化され(110) 、システム
の故障を補正するために応答ループ120 として例84のために図4に示されたプラ
ンナ24に送られる。構成された推定オートマトンの実行100 が目標の規範の最適
に近い制約と一致する場合、指令アクションが出力され(112) 、エージェント間
の要求が出力され(114) 、システムの状態は標準応答ループ118 として更新され
る(116) 。
【0098】 個々のエージェントの実行インターバルにわたる個々の(無限小の)アクシ ョンのセットは通常、実行ループ(標準応答ループ)118 を通して識別され、選
択され、実行される。個々のエージェントに対するMAHCAの実行ループは、
局部的な制約に対する個々のエージェントのためのシステム性質の論理および展
開の両方の制約とスムースに一致させる手段である。論理エージェントネットワ
ークのエージェントによってアクションインターバルセットを通じて実行された
アクションのセットは、分布されたシステムに対して、多数のタイムスケールお
よび多数の変位距離に対するシステムの性質の論理的および展開制約の両方とス
ムースに一致させる手段である。
【0099】 複合された問題に対する解の証明に失敗した場合、個々のエージェントの知 識ベース中のクローズは、制約のシンタクスの緩和の規則に従って故障を補正さ
れる。この制約の緩和に続いて、個々のエージェントの実行インターバルにわた
る1組の個々の(無限小の)アクションは、故障(故障ループ)120 を補正する
ために応答ループを通して識別され、選択され、実行される。MAHCAの故障
ループは、アーキテクチャ中の論理および展開の両方の自由度を強固に得るため
の手段である。安全性および品質の制約等の論理的制約に対する許容可能な緩和
規範は、展開の制約の正確な動作規範の緩和のための一般的なフレームワークに
おいて支持される。これらの許容可能な自由度は、個々の非線形プロセスの頑強
な制御を支持するために局部レベルで動作し、また、大規模な分布されたシステ
ムの頑強な制御を支持するために全体レベルで動作する。
【0100】 連続表示における論理の制約の埋め込みは、最適に近い軌道を決定するため に使用できる関数を展開するようにシステム状態の統一された表示を適用する際
の基礎的なステップである。キャリアマニホルドはシステム状態の統一された宣
言を形成するための手段であり、それは論理および展開のパラメータを含んでい
る。論理的ラグランジュの方程式(式20)は、論理の制約および展開の制約を
システム性質の連続表示に埋め込む手段である。図4に示された知識デコーダ32
は、ユーザ入力、センサ入力、および連続表示における他のエージェントからの
入力に対してディスクリート値および展開値を位置付けるように機能する。
【0101】 図11は、システム状態の統一モデルを構成し、システムの解に必要な不変 変換を実行する数学的エンティティとしてキャリアマニホルドを示している。M
AHCAは、新しい方法で変数を計算するアプリケーションに基礎を置いている
。個々のエージェントにより構成されたオートマタによって生成された制御のた
めの記号による公式は、最適な制御の問題の変形を公式のためのパラメータ計算
に関連した適切なフィンスラーマニホルドに関するカルタン接続の係数のための
式と見なすことができる。キャリアマニホルド121 は、適切なフィンスラーマニ
ホルドのMAHCAバージョンである。Wolf Kohn 氏等による文献“Hybrid Sys
tem as Finsler Manifolds : Finite State Control as Approximation to Conn
ections ”(Wolf Kohn et al.eds., Springer Verlag 1995)に示されたような以
下のカラテオドリのリードは、制約によって定められた微分可能マニホルドにお
いて生じたときにハイブリッドシステムの状態の展開を説明する。フィンスラー
マニホルドの重要な特性は、所定の点におけるマニホルドの接線空間上でノルム
を定めるために使用されるフィンスラー長の計算のための計測グラウンド形態を
導入することである。このフィンスラー計測の使用は、各更新インターバルにお
けるε最適制御法則を計算するために重要である。
【0102】 キャリアマニホルド121 は、システム性質における論理、幾何学および展開 の制約の統一のための基礎的な数学的エンティティである。キャリアマニホルド
中の点p122 は、式(2)において先に説明されたような論理および展開のパラ
メータを有している。従来のシステムの表示はシステムモデルを論理モデルと展
開モデル123 とに分割したが、プロセスモデルの連続性のコーン・ネローデの定
義124 は論理モデルと展開モデルを連続表示に融合するためにキャリアマニホル
ドの使用を支持する。
【0103】 図12は図10に類似しているが、幾つかの事象と演算子についての異なる 説明を含んでおり、これは図25で示されているDMM構成には重要である。図
12はMAHCAエージェントのプロログプロトタイプ構成のデータフロー図を
与えている。この図面では、ボックスは計算の事象を表し、円は事象の推定演算
子を表している。事象はその事象で動作する推定演算子によりデータ流と共に次
の事象へ変換される。この動作は常に単一化により実行される。Lloyd, J. W.
の“Foundations of Logic Programming”、Springer-Verlag 、第2版、1992年
を参照する。
【0104】 更新インターバルの開始時に現れる第1の事象はプラン例示化237 である。 この例示化はエージェントの現在の所望の動作を捕捉する最適化基準としてエン
コードされる。緩和演算子238 はこの最適化基準を凸化する。この凸化はもとの
基準を所望の程度まで近付ける新しい基準を獲得することに必要とされ、計算的
に実効的な解が存在するならば、これらの構成を可能にする。新しい基準はダイ
ナミックプログラミング式239 の形態で存在する。この式の形態と特性は、Kohn
,W. J. JamesとA. Nerode の“The Declarative Approach to Design of Robust
Control Systems”CACSD 、1996年、An Arbor.MI 、1996年9月に記載されてい
る。前述の2つの事象はエージェントアーキテクチャのプランナモジュールによ
り機能的に実行される。
【0105】 エージェントは推定オートマトン240 と呼ばれる解を生成するオンライン処 理の構成によりダイナミックプログラミング式を解く。解は制御下でプロセスへ
送信される制御動作とエージェントの現在状態からなる。解は3ステップで生成
される。第1に、ダイナミックプログラミング式が2つのサブプロブラム、即ち
ゴール後方伝播と現在のインターバル最適化に変換される。これらの2つのサブ
プロブラムの協調解は2つのレベルの一定の状態マシーン(各レベルは2つのう
ちの一方のサブプロブラムに対する解を計算する)により生成され、現在のプラ
ンに関する推定オートマトンと呼ばれる。このステップの終端時の事象は推定オ
ートマトン240 のブループリントであり、正準方程式241 として図5では呼ばれ
ている。
【0106】 第2のステップでは、正準方程式241 は演繹、展開、出力関係推定演算子242
により動作され、それによって推定オートマトン240 を構成する。最後に、第 3のステップで、推定オートマトン243 は最初に推定オートマトンを、さらに簡
単な推定オートマトンの等価(即ち同一動作)の直−並列ネットワークに分解す
ることにより実行される。これはユニタリ、接頭辞、ループ分解、トリマ推定演
算子244 により正準方程式から実行される。推定オートマトンがステップ243 で
実行するとき、これは実行される制御動作を決定することに使用される知識ベー
スのクローズをアクセスし、次のエージェント状態は図25で示されている直接
メモリマップ概念に基づいている。
【0107】 前述した3つのステップは制御ループ245 のステップの反復期間に推定手段 により与えられるほとんどの機能を実行する。推定オートマトン243 の実行が適
切であるならば、即ち、現在のエージェント状態からエージェントゴールまで状
態パスが存在するならば、オートマトンの出力関係は対応する命令動作242 と、
エージェント間状態248 と、更新されたエージェント状態249 と、知識ベース25
0 センサベースの更新249 を発生する。推定オートマトンはリセットされ、処理
が反復される。適切な監視推定演算子246 が推定オートマトン故障を検出しない
ならば、推定オートマトンは再度次の更新インターバルで使用され、応答学習ル
ープ251 に関するコードは休止している。2つのループを分離する利点のうちの
1つは、マルチタスク環境において、応答学習ループ257 の予備的な部分が制御
ループ245 と同時に動作されることができ、応答学習事象期間に実質上時間性能
が改良される。
【0108】 図13は、現在のシステムの目標のセット、システム性質に関する現在の論 理および展開の制約のセット、現在のユーザからの入力のセット、および現在の
センサ値のセットが与えられた次のオートマトンの生成の際のMAHCAの動作
の基本的な方法を示している。これらのパラメータは全て宣言され、図4に示さ
れた推定手段26に対する式関連クローズとして生じる。この図は、システムの目
標を達成し、一方、論理および展開の制約ならびに現在のシステムの入力に従う
ようにするために最適に近いアクションを提供するオートマトンを発生するよう
に推定手段によって行われる動作のシーケンスを示している。
【0109】 推定手段は、図4に示されたプランナ24から定理を取出し、コスト関数に関 して最適に近いアクションを実行するオートマトンを生成するか、あるいは、図
4に示されたアダプタ30が新しい定理を構成するために図4に示されたプランナ
24に緩和された規範を供給できるように故障項を生成するかのいずれかを行う。
ハイブリッド制御システムアーキテクチャおよび推定手段の動作によって、結果
的に目標の規範に到達するように最適に近い軌道を辿るようにアクションを実行
するオートマタが生成される。緩和された規範126 は、図4に示されたプランナ
24から展開の規範125 を受取り、緩和の原理146 を適用した結果得られる。アク
ションの式であるダイナミックプログラミング式127 は、レヴィ・チヴィタ接続
原理144 を緩和された規範126 に適用した結果得られる。正準方程式128 は、推
定ブループリント(青写真)構成子142 を使用してダイナミックプログラミング
式127 から構成される。推定オートマトン130 は、オートマタ構成子140 を使用
して正準方程式128 から構成される。次に、オートマトンを構成するために図1
0に示された推論方法(一体接頭辞ループ分解トリマー)98が使用される。構成
された推定オートマトン130 のオートマタの実行138 が目標の規範134 との合致
に失敗した場合、故障項およびエージェント状態が図4に示されたアダプタ30に
送られ、そこにおいて、適応を実行するために緩和のためのシンタクスルールが
適用される。構成された推定オートマトンの実行138 が目標の規範の最適に近い
制約と上手く合致した場合、指令アクションが出力され(132) 、エージェント間
の要求が出力され、システムの状態が通常の応答ループとして更新される。
【0110】 ドメインが特定されている図4に示された定理プランナ24の機能は、各更新 インターバルの間にそのインターバルを通してエージェント(例えばエージェン
トi等)によって観察されたように、システムの所望の展開の記号によるステー
トメントを生成することである。それが生成する定理ステートメントは以下の形
式を有している。
【0111】 原始的アクションのセットが与えられた場合、式(12)の形態の制御スケ ジュールvi p と、制御インターバル[t,t+Δ)におけるフラクション関
数の微分dαi (・)(図2参照)が存在し、それによってdαi (・)は次の
汎関数
【数17】
【0112】 式(20)において、Li は現在の制御インターバル[t,t+Δ)に対して
エージェントiによって観察されるシステムの局部的緩和ラグランジュ方程式と
呼ばれる。その状態のデカルト積および制御空間を知識ベース中のクローズによ
って定められたトポロジーを有する実線に写像するこの関数は、ダイナミックス
、制約およびエージェントiによって観察されるシステムの要求を捕捉する。緩
和されたラグランジュの方程式の関数Li は、システムを全体として特徴付ける
全体的なラグランジュの方程式の関数Lの座標中のi番目のエージェントの座標
において知識ベースによって定められたトポロジーにおける連続的な投影である
。 式(15)から得られた式(21)において、p[E]Mは、エージェント
によって観察される制御下のプロセスの状態を表し、Gi は現在のインターバル
に目標をもたらす並列移動演算子である。演算子Gi は、複合フロー(式(10
)参照)をマニホルドにリフトすることによって構成される。複合フローおよび
アクションスケジュールは、一度フラクション関数(測度)αi がわかると決定
され、 この関数は最適化の式(20)および(21)の結果である。特に、ア
クションスケジュールは、原始的アクション(式(12)を参照)の線形結合と
して構成される。
【0113】 式(21)の表現は、エージェントによって解かれる緩和された最適化の問 題に課される3つの制約を構成する。第1の制約は現在のインターバルの終わり
において状態の一般値を表す局部的な目標の制約である。第2の制約は、ネット
ワーク中の別のエージェントによってエージェントに課せられた制約を表してい
る。最後に、第3の制約は、dαi (・)が確率測定であることを示している。
【0114】 緩和し、ドメインを適切に選択した場合、式(20)および(21)におい て述べられた最適化の問題は、凸の最適化の問題である。これは重要であり、そ
れは、解が存在する場合、それが特有であることが保証され、また、定理を証明
するためにエージェントが使用する推定方法の計算上の効果が保証されるからで
ある。
【0115】 式(20)における項dαi (・)は、エージェントがインターバル[t, t+Δ)の間に実行できる原始的指令あるいは制御アクションのセットにおける
ラドン確率測定である。それは、そのインターバルの期間中、原始的アクション
のそれぞれにかかる時間の比率を測定する。制御エージェントの中心機能は、各
制御インターバルに対してこのアクションの混合を決定することである。この機
能は、現在の定理によって述べられた最適化の問題の解が存在するかどうかを知
識ベースの現在の状態から推論することによって実行され、それが存在する場合
には、対応するアクションの生成および状態の更新を行う。
【0116】 式(20)および(21)によって与えられた定理のステートメントの構成 は、図4に示されたプランナ24において実行される中心的なタスクである。それ
は、現在のインターバル中にエージェントによって観察される所望のプロセスの
展開を特徴付け、それによって、その要求は満足され、システムは最適な方法で
その目標に向かって“移動”する。
【0117】 式(20)において積分された関数は、“キャッチ・オール”ポテンシャル と呼ばれる項を含み、それは図4に示された知識ベース28中のどのクローズにも
関係がない。その機能は、モデル化されていないダイナミックイベントを測定す
ることである。この監視機能は図4に示されたアダプタ30によって実行され、そ
れは前述のリーブラケットに類似した一般の交換子の原理を実行する。この原理
の下では、キャッチ・オールポテンシャルの値が空である場合、現在の定理のス
テートメントはシステムの状態を適切にモデル化する。反対に、その定理が当て
はまらない場合、それはその定理の現在のステートメントとシステムの状態との
間が不整合であり、キャッチ・オールポテンシャルが故障の原因となった定理の
式の項を実行していることを示している。これらの項は無効にされ、(図4に示
された知識ベース28における式のクローズによってそれ自体定義された)交換原
理に従って図4に示された推定手段26によって一緒に共役され、適合ダイナミッ
ククローズとして知識ベースに記憶される。その後、図4に示されたアダプタ30
は、ポテンシャル記号を発生し、それは適合クローズおよび対応する同調の制約
によって特徴付けられる。
【0118】 新しいポテンシャル記号と同調の制約は、図4に示されたプランナ24に送ら れ、それは修正された局部規範と目標の制約とを生成する。このようにして構成
された新しい定理は、システムの適合された性質を表す。これは、このモデルに
おける応答性の構造の適合に不可欠なものである。
【0119】 同期は次のようなアクションを行うオートマタの生成を通して達成される。 すなわち、それは(1)ハイブリッドシステム状態の統一されたステートメント
を生成し、システム状態の展開がトポロジカルな連続性の制約を破ったことを決
定し、その証明手順を故障にし、連続性を取り戻すように応答を要求するための
ベースであるハイブリッドシステムに対する連続性のコーン・ネローデの定義と
、(2)最適に近い性能を達成するために結果的に個々の(無限小の)アクショ
ンの適切なチャタリング結合を選択するコーン・ネローデ・ジェームスの最適性
とを与えるアクションである。全体的および局部的な目標を満足させるために論
理および展開の両方の制約を受ける分布されたプロセスを制御するためのアクシ
ョンの、スムースで最適に近い同期は、ハイブリッド制御アーキテクチャを適用
した主な結果である。MAHCAはダイナミックな分布されたプロセスを最適に
近い形で制御するのに効果的であるため、それはまたスタティックシステムの最
適に近い解に適切である。
【0120】 図14は、個々のアクション間のチャタリングを通してハイブリッドシステ ムの問題i156 の最適に近い解を得るプロセスを示している。図14は、原始的
アクションvi 146 およびΔ150 のフラクションΔi 152 がインターバル[t,
t+Δ)148,154 においてアクティブとなるような両者の関係を示している。チ
ャタリングとは、更新インターバルΔ150 のサブインターバルΔi 152 における
無限小の制御アクションvi の間のスイッチングを言うものである。エージェン
トのアクションは、各エージェントに適切な時間Δ150 の有限のインターバルの
間に行われる。最適に近いアクションを行うオートマタは、各インターバルに対
して更新される。
【0121】 この点において、頑丈さの問題にアドレスしなければならない。かなりの程 度まで、各制御装置のエージェントの図4に示されたアダプタ30は、故障あるい
は予想不可能なイベントから回復するための一般的で計算上有効な手段をシステ
ムに提供する。定理の故障は、エージェントにとってシステムがどのようなもの
であるかを想定したものと、その実際に観察したものとの間の不整合の徴候であ
る。適合クローズは、回復の戦略を表すエージェントの知識ベース中に知識を組
み込む。次に説明される推定手段は、その通常動作の一部としてこの戦略を行う
【0122】 図4に示された推定手段26は、オンラインの式の定理の証明手段である。そ れが証明できる定理のクラスは、式(20)および(21)の形態のステートメ
ントによって表され、次の形態の式の項の存在的に定量化されたの論理積によっ
て表され、
【数18】
【0123】 ここにおいて、Zは、それぞれがドメインD中の値をとる変数の組であり、pは
D=G×S×X×Aにおけるパラメータのリストであり(すなわち、マニホルド
Mの一点)、{Wi ,Vi }はセミリング多項式代数の項であり、 D<Ω> (23) D={D,〈+,・,1,0〉}は、加算の単位が0であり、乗算の単位が1で
あるセミリング代数である。
【0124】 式(22)において、reli ,i=1,…,n,は、多項式代数において 2進関係にある。各reli は、等しい関係(近似的に等しい)であるか、不等
の関係(≠)であるか、あるいは部分的順序関係のいずれかである。所定の定理
において、1以上の部分的順序関係が現れてもよい。各定理において、項の少な
くとも1つの項は、代数において完備束を定める部分的順序であり、それは最適
化の問題に対応する。この完備束は、最適化の問題が最少である場合には、有し
ている成分が最少である。
【0125】 式(22)の定理のステートメントと、式のクローズの知識ベースが与えら れると、推定手段は、ステートメントが論理的に知識ベースにおけるクローズに
従うかどうかを決定し、そうである場合、証明の副作用として、Zに値を与える
D中のエントリを有する空でないサブセットを生成する。これらのエントリは、
エージェントのアクションを決定する。従って、副作用は、エージェントの決定
変数の例示である。式(23)において、Ωは原始的単項演算{vi }のセット
である。各vi は、セミリング代数を写像し、その要素は、Zに関するそれ自体
の演算子の合成を含むベキ級数である。 vi :D<<Z>>→D<<Z>> (24) これらの演算子は知識ベース中の公理によって特徴付けられ、プロセスに依存
する。形式的論理において、実行された推論原理は次のように述べることができ
る。Σを知識ベース中のクローズのセットとする。→は示唆を表す。定理を証明
することは、それが論理的にΣに従うことを示すことであり、すなわち、 Σ→定理 (25) 証明は、次の推論公理の適用のシーケンスによって達成される。 ・等式の公理 ・収斂の公理 ・不等式の公理 ・知識ベースの公理 ・部分的順序の公理 ・制限の公理 ・適合の公理 推論原理のそれぞれは、デカルト積における演算子として次のように表され、 D<<W>>→D<<W>> (26) 各推論演算子は、関連した項を別の関連した項に変換する。推定手段は、定理
の式の項に推論演算子のシーケンスを適用した後、初めてこれらの項を式(27
)の形式の基礎式のセットに減少するか、あるいはそのような基礎の形態が存在
しないと定義するかのいずれかである。
【数19】
【0126】 推定手段が上述の手順を実行する機構は、可変の目標のインスタント化のための
手順、すなわち、局部的に有限のオートマトン(証明オートマトンと呼ばれる)
を構成することである。この重要な特徴は、本発明のアプローチに特有のもので
ある。証明手順は、特定の定理のステートメントおよび現在扱っている例示的な
知識ベースに注文によって特定される。
【0127】 図15は、図4に示され、図13にさらに詳細に示された推定手段26によっ て構成されたオートマトンに可能なアクションのシーケンスを説明する証明オー
トマトンの概念的構造を示している。エージェントは、択一の有限集合から選択
された無限小のアクション間のチャタリングによってインターバルにわたって最
適な制御を達成する。無限小のアクションは、図14に示されたアクション更新
インターバルΔ150 のサブインターバルにわたって続く。アクションは、制御の
問題に対する最適に近い解を得ることができることを証明する際の副作用として
生成された証明オートマタによって実行される。
【0128】 推定手段によって生成された証明オートマトンの構造が図15に示されてい る。図15において、初期状態160 は、定理に関連した式158 を表している。一
般的に、以下のそれぞれの状態162,164 は、一続きの推論ルールai ,bi ,c i ,di ,ei を次の経路、すなわち、
【数20】
【0129】 によって表された初期状態に適用することによって得られた定理の等式に対応す
る。オートマトンの各エッジは、可能な推論の1つに対応する。ある状態は、そ
の式が同じ繰返しである場合、あるいは知識ベース中に解が記憶されている正準
方程式に対応する場合には終了である。
【0130】 オートマトンの状態のグラフを横断する際に、値あるいは式が変数に割り当 てられる。終了状態において式の項は全てグラウンド状態(式(27)参照)で
ある。初期状態で開始し、終了状態で終わる少なくとも1つの経路をオートマト
ンが含んでいる場合、定理は所定の知識ベースに関して真であり、結果的な可変
のインスタント化は有効である。そうでない場合、定理は間違いである。
【0131】 推定手段によって証明可能な各定理の論理積中にある完全な部分的順序の項 の機能は、証明オートマトンを構成するためのガイドを提供することである。こ
れは、定理の式の項を、クリーン・シュッツェンベルガーの式(Kleene-Schutzen
berger Equation)(KSE)と呼ばれ、証明オートマトンの構成のためのブルー
プリントを構成する正準固定点の式に変換することによって行われる。この固定
点は、それが解を有する場合には、式(20)および(21)において公式化さ
れた最適化の問題の解と一致する。KSEの一般的な形式は次のようなものであ
る。
【数21】
【0132】 式(28)において、Eは各エントリが上述の推論演算子のベースから構成され
た合理的形態である方形マトリックスであり、Tは知識ベースからの式の形態の
ベクトルである。Eにおける空でないエントリEijのそれぞれは、状態iとjと
を接続している証明オートマトンにおけるエッジに対応する。E(p)とZとの
間の2進演算子は、演算子に“推論を適用する”ことを表している。終了状態は
、Tの空でない項によって判断され決定される。p項は、E(・)における推論
演算子の項の注文されたパラメータ値である。推定手段によって実行された方法
の要約は図13に示されている。
【0133】 オートマトンの構成は正準方程式から実行され、推論ルールを非決定的に適 用することによって実行されるのではない。このアプローチは正準方程式の計算
の複雑さを減少し(低い多項式)、推論ルールを直接適用する(指数的)よりも
はるかに良い。オートマトンは、n log2 n 時間を要求するオートマト
ン分解手順を使用して(それにおいてnはオートマトンの状態の数に近似的に等
しい)状態、アクションおよび評価変数のインスタンスを生成するようにシミュ
レートされる。この“分解および克服”方式は、オートマトンを並列の一体のも
のの継続(1つの初期状態および1つの終了状態)オートマタに帰納的に分解す
る。この分解によって結果的に生じたオートマタのそれぞれは、その他のものか
ら独立して実行される。結果的なオートマタのネットワークの性質は、本来のオ
ートマタから得られた性質と同一であるが、時間の複雑さは実現可能なものであ
る。
【0134】 各制御エージェントに対する図4に示された推定手段26は2つの機能を満足 させる。すなわち、プランナ(式(20)および(21))によって生成された
各エージェントのシステム性質の定理に対する証明を生成し、知識デコータの中
心的素子として機能する。性質定理を証明するためのその機能が以下説明される
。後に、その機能は知識デコーダの一部として示される。
【0135】 プランナの定理、式(20)、(21)を証明するためにどのように推定手 段が使用されるかを示すために、最初にこの定理が式(22)のパターンに変換
される。式(20)、(21)は凸の最適化の問題を公式化するため、最適にす
るために必要かつ十分な条件が次のダイナミックプログラミング公式によって与
えられ、
【数22】
【0136】 式(29)において、最適な実行のためのコスト関数と呼ばれる関数Vi は、現
在のインターバル内の任意の点から開始している最小を特徴付ける。第2の式は
、式(20)、(21)において説明された問題に対する対応するハミルトン・
ヤコビ・ベルマンの式であり、ここにおいて、[Η]は緩和された問題に対する
ハミルトン関数である。この公式によって、証明する演繹的定理と最適な制御理
論との間で形式的な結合が行われる。推定手段によって形式的な制御の問題をリ
アルタイムで最適に解を得ることができ、結果的に、インテリジェントに分布さ
れた形のリアルタイム制御でマルチプルエージェントシステムを制御することを
可能にする。式(29)に対する解を推論するための中心的な着想は、代数の合
理的ベキ級数で次のように実行のためのコスト関数V(.,.)を展開すること
である。 D<<Y,τ>> (30) Vを式(29)における第2の式のVi と置き換えると、2つのアイテム、すな
わち、Vの係数に対する多項式のセットおよび最適さを表すための部分的順序式
が与えられる。Vが凸であり、合理的であるため、Vの係数を特徴付けるのに必
要な式の数は有限である。係数の式の論理積の結果的なストリングおよび最適さ
の部分的順序式は式(22)にある。
【0137】 要約すると、各エージェントに対して、図4に示された推定手段26は、以下 の方式に従って動作する。
【0138】 ステップ1:現在の定理の式(20)および(21)をロードし、 ステップ2:式(29)を介して定理を式(22)に変換し、 ステップ3:先に説明された図13に示されたチャートに従って証明を実行
する。
【0139】 定理が論理的に知識ベースに従う場合(すなわち、それが真である場合)、 推定手段の手順はステップ3においてアクションαi ()で終了する。定理が論
理的に知識ベースに従わない場合、図4に示されたアダプタ30が付勢され、定理
は先に概略を述べられた戦略に従って図4に示された定理プランナ24によって変
更される。この機構は、エージェントにおける応答性には不可欠のものである。
緩和および凸のために、この機構によってドメインの制御可能なセットがこの補
正戦略のない機構よりも大きいことが確実とされる。
【0140】 図4に示された知識デコーダ32は、知識ベースのエージェント間の特定化ク ローズを更新することによってネットワークからの知識データをエージェントの
知識ベースに変換する。これらのクローズは、式(29)における第2の制約を
特徴付ける。特に、それらは各エージェントにおける残りのネットワークによっ
て課せられた制約を表す。それらはまた、全体から局部への変換を特徴付ける。
最−後に、それらはエージェント間の制約を完全に制約のない規範に組み込むた
めの一般化された乗数を構成するための規則を提供し、その後それは、式(29
)における最初の式の非線形最適化問題のための実行のためのコスト関数を構成
するために使用される。一般化された乗数は、制約をポテンシャル項に変換する
演算子である。次に、このポテンシャルは本来のラグランジュ方程式に組み込ま
れ、それは制約の原因を明確に示する。
【0141】 図4に示された知識デコーダ32は、式(14)に対して説明されたものに類 似した手順で乗数の構造および変換を推定するために使用される組込まれた推定
手段を有している。特に、乗数および変換は、式(30)において定義された代
数の合理的ベキ級数で展開される。その後、式(22)の形式の定理を構成する
のに必要な式と部分的順序の式の論理積とを決定するために二重性に必要な条件
が使用され、式(22)の形式の定理の証明は、制約を別のポテンシャルとして
エージェントのラグランジュ方程式に結び付けるための乗数を生成する。
【0142】 全体から局部へそれぞれ変換するための式の論理積は、以下のような不変の 埋め込みの原理を適用することによって構成される。すなわち、各エージェント
に対して、現在のインターバルにおける所定の時間tにおけるアクションは、式
(29)に従って計算されたように、公式が先行、現在、および次のインター
バルを含むように拡張されたときにtにおいて計算されたアクションと同じであ
る。 規範の移動性および凸の性質によって、原理は水平方向全体に解析的に拡
大される。不変の埋め込み式は式(29)で与えられたダイナミックプログラミ
ング式と同じ構造を有しているが、対応する局部的なものの代わりに全体的な規
範および全体的なハミルトニアンを使用する。
【0143】 局部的から全体的への変換は、不変の埋め込み式を式(22)の形の式の定 理として表すことによって得られた全体的から局部的への変換を反転させること
によって得られる。これらの反転は、緩和されたラグランジアンの凸の性質およ
びベキ級数の合理性のために存在する。
【0144】 図16は、各エージェントが行うことに関して図4に示された知識デコーダ3
2の機能を示している。上述の乗数は、現在のエージェント165 によって観察さ れる、システムの相互作用およびエージェントの相互作用169 を通してシステム
の残りおよび別のエージェントを等しいものの仲間のシステム167 および仲間の
エージェント168 に集合させる効果を有している。図16に示された集合モデル
は、各エージェント166 がどのようにしてネットワークの残りを認めるかを説明
する。この特有の特徴によって、特有の方法でアーキテクチャの計量性を特徴付
けることができる。すなわち、アプリケーションの計算上の複雑さを決定するた
めに、最も複雑なエージェント166 (すなわち、最も複雑な規範を有する局部的
エージェント)とその仲間168 だけが考慮される。
【0145】 図17は、エージェント同期を示している。これはエージェント間の不変原 理を満足して実現される。この原理は、各更新時間で、ネットワークの各エージ
ェントのアクチブプランが、ネータ関係と呼ばれる各エージェントの知識クロー
ズにより決定される等価動作のモジュール合同をエンコードすることを宣言して
いる(Logan,J.D.“Invariant Variational Principles”、Academic Press、19
87年参照)。これらの関係はエージェントの知識ベースにエンコードされている
制御下のプロセスのモデル間の類似性を捕捉する。したがって、エージェント16
6 がネットワーク169 に関して共時性がないとき、少なくとも1つのエンコード
されたネータ関係は失敗し、これはエージェント推定手段で故障を起こし、さら
にエージェントと残りのエージェントとの同期252 を再設定するためにエージェ
ントの応答学習ループの付勢を起こす。
【0146】 実際の観点から考慮すると、ネータ関係に関するエージェントモデル間の等 価性は1つのバーチャルドメインとしてのドメイン知識の概念を許容し、エージ
ェントはこのドメインの異なる区域でナビゲートする。この概念は図25で示さ
れている直接メモリ構成により使用される。しかしながらエージェントの同期25
2 はネットワークの各エージェントに対してセベニン(Thevenin)エージェント
としても知られるコンパニオンエージェントを構成することにより設定される。
【0147】 セベニンエージェントのエージェントの知識ベースはネットワークはその他 のエージェントによる制御下でプロセスの抽象されたモデルをエンコードする。
このレベルの抽象は、エージェントがプロセスについて有する説明と競合する。
ネットワーク同期の問題は各とそのコンパニオンセベニンエージェントとの同期
に演繹する。
【0148】 エージェントの同期は以下のように動作する。各エージェントはコンパニオ ンエージェントと呼ばれる1つのエージェントとしてMAHCAネットワークの
残りのエージェントを観察する。エージェントとそのコンパニオンエージェント
はエージェント対と呼ばれ、ここではエージェントはエージェント対の主エージ
ェントと呼ばれる。換言すると、コンパニオンエージェントと呼ばれるバーチャ
ルエージェントが存在し、コンパニオンエージェントと主エージェントとの相互
動作はMAHCAネットワークの残りのエージェントと主エージェントとの相互
動作に等しい。
【0149】 コンパニオンエージェントはMAHCAエージェントと同様のアーキテクチ ャを有する。コンパニオンエージェント状態は主エージェントに関する特性を要
約したネットワークのその他のエージェントの状態の抽象である。
【0150】 主エージェントの推定手段は、MAHCAネットワークのその他のエージェ ントと主エージェントのゴールにより実行されるプランの関数として主エージェ
ントのドメインへのMAHCAネットワークのその他のエージェントのダイナミ
ックの状態およびクロックタイム変換を構成する。
【0151】 不変ルールと呼ばれる特別なルールセットは、各プライムエージェントの知 識ベースに記憶される。このルールは主エージェントとコンパニオンエージェン
トの状態に機能的に依存する。
【0152】 主エージェントとそのコンパニオンエージェントが共時性であるならば、現 在の更新時間で、主エージェントの不変ルールは、エージェントの不変値と呼ば
れる一定の予めエンコードされた値に評価する。このルールを評価する副効果は
状態およびクロックタイム変換のインスタレーションである。
【0153】 主エージェントはネットワークと同期していないならば、その不変ルールは エージェントの不変値とは異なる値に評価する。この状況が検出されたとき、主
エージェントの推定手段は失敗し、主エージェントのアダプタとプランナにより
実行されるプラン同期変化をトリガーする。
【0154】 図18は、MAHCAをディスクリートな製造プラント172 の計画、スケジ ューリング、および制御に適用する一例を示している。図1に示されたような論
理的エージェントネットワーク11は、イベントベースの素子の論理演算を故障し
たスケジュール180 の修復等の連続ベースの素子の展開演算と同期させることが
でき、それによって、プログラム可能な論理制御装置(PLC)182 によって実
行されるアクションの最適に近いスケジュールを達成するために高レベルのディ
スクリートな製造プラニング関数178 の出力の実行を同期させる。PLC素子に
要求されたアクションは、展開の制約と一致しなければならない。そのようなシ
ステムは、通常の商業的なプラニングソフトウェアおよび商業的なプログラム可
能な論理的制御装置を使用して構成された高レベルのプランナ178 と低レベルの
制御182 との間のハイブリッドシステムスケジューラーの“接着体”として機能
する単一のエージェントであるスケジューラ180 を設けることができ、すなわち
、エージェントとしてプランナ、スケジューラおよび制御装置が設けられている
マルチプルエージェントシステムである。制御装置182 は、プラント172 、入力
170 および製品174 の状態を検出する感知/試験176 の素子を通して物理的プラ
ントにインターフェイスする。制御装置は、制御アクション183 によってプラン
トの動作を管理する。
【0155】 図19は、図18に示されたようなディスクリートな製造プラントのための 、2つのエージェントのマルチプルエージェントネットワークの一例を示してい
る。生産者190 、ノード制御装置エージェント196 、消費者192 およびノード制
御装置エージェント200 は、設定された優先順位および生産の制約に従って生産
要求の実行を同期させるように、動作セルのアクションの最適に近いスケジュー
ルを生成および修正のために使用できる。この同期は、システムの目標を、エー
ジェント通信198 を介してメッセージを生産者ノード制御装置エージェント196
に送る消費者ノード制御装置エージェント200 に導入させることによって達成さ
れる。エージェントは、センサ202 を使用して生産者190 および消費者192 の状
態を知覚し、指令されたアクション204 を使用してシステムの状態を変化させる
。生産者および消費者の相互作用は、物理的相互作用194 によって制約される。
2つのエージェントのネットワークによって生成されたアクションは、プラント
の動作と同期する。
【0156】 図20は、図18に示されたようなディスクリートな製造アプリケーション のための5つのエージェントのマルチプルエージェントネットワークの一例を示
している。(図1および図13に示されているような)マルチプルエージェント
ネットワークは、ディスクリートな製造プラントの制御のために5個のセルを同
期するように構成することができる。図20は、モールドされたプラスティック
の製品の製造プロセスを制御する5つの永久的エージェントを有するAHCAを
示している。そのプラントは、5つの機能セルで構成されている。
【0157】 セル1の210 は、出荷および受取り機能を実行し、また、工場を通して材料 および製品を輸送できるオートメーション化されたフォークリフト220 も含んで
いる。セル1の機能は、出荷および受取りMAHCAエージェント221 によって
制御され、スケジュールを作成される。このセルにおけるエージェントは、人間
の演算子222 と対話することに注意すべきである(MAHCAは半自律のタスク
を実行することができる)。
【0158】 セル2の212 、すなわち、経理のエージェントは、経理およびプラントの調 整機能を実行する。このエージェントはまた、セル3の素子、すなわち、オート
メーション化された倉庫の貯蔵所213 において在庫目録作成および制御機能を実
行する。
【0159】 セル3の214 は、未加工の材料を混合し、最終的な製品において使用される 樹脂混合物を生成するブレンダ230 で構成されている。ブレンダは、ブレンダ制
御エージェント224 によって制御される。
【0160】 セル4の216 は、モールダ226 およびモールド制御エージェント228 で構成 されている。このエージェント228 はまた、セル5の処理素子に対する制御機能
を行う。
【0161】 包装装置234 を含んでいるセル5の218 はまた、MAHCAの包装制御エー ジェント232 によって制御されている。
【0162】 さらに、MAHCAのフレームワークは、これらの機能を並列な解に適した 表示に変換することによって、通常の手順がより迅速に動作するようにできる。
これは微分方程式でディスクリートなプロセスを変換するための記号によるアル
ゴリズムである連続化によって達成され、その解はそのプロセスによって計算さ
れた値を含んでいる。連続化は、実行する減少された命令セットコンピュータ(
RISC)手順を実行する代わりに、選択されたサンプリング点における解がそ
の手順の出力値と一致するような微分方程式を解く一般的な方法である。そのア
ルゴリズムの重要な要素は、通常の微分方程式の展開への帰納を符号化する一般
的な方法である。第2の重要な要素は、そのプログラムを1組の制約のセットと
して見なし、また、終了のためのプログラムの実行を、制約によって定められた
フィンスラーマニホルドにおける対応するラグランジュの方程式の問題に対する
最適に近い解の発見として見なすことである。
【0163】 この問題に対して対応するハミルトン・ヤコビ・ベルマンの式をオンライン で解く際に、元のプログラムの個々のデジタル命令は、マニホルドにおけるベク
トルフィールドの無限小の生成子として符号化する。デジタルの解を与える最適
に近いチャタリング解は、これらのベクトルフィールドのチャタリングの組合わ
せである。チャタリングは任意の順序に行われることができ、すなわち、各デジ
タル命令のベクトルフィールドはチャターの所定の部分の期間中に注目されるが
、順番は関係がないことを意味している。これは、デジタルプログラムを連続的
に実行する際の急激な並列化の原因となる。チャターはマニホルドのデカルト接
続の接続係数を介して発見される。これは任意のデジタルプログラムを事実上加
速するために使用され、また、わずかな変更で永久的に処理するために適用され
る。MAHCAのこの変更されたアプリケーションにおいて、ラグランジュの方
程式の問題の公式化はMAHCA公式化であり、フィンスラー空間はMAHCA
キャリアマニホルドであり、無限小はMAHCAにおいて計算されたものである
。各MAHCAエージェントは個々の方法の速度を速めることができ、エージェ
ントのネットワークは手順のアンサンブルの速度を速めることができる。
【0164】 図21は別々のループを有するエージェントのアーキテクチャモデルを示し ている。この分離は先に説明した構成と論理的に等しく実行するが、さらに高速
度で実質上メモリの必要性が少ない。
【0165】 図21は図4、10、12のアーキテクチャと同一の機能を有するMAHC Aエージェントの構成アーキテクチャの設計図であるが、ここでは制御ループ25
3 と応答学習ループ256 は別々に構成されている。図21で示されている構成で
は、制御ループと応答学習ループは2つの結合チャンネルにより相互動作する。
これらの結合チャンネルのうちの一方である符号を付けられたプラン258 は応答
学習ループ256 のプランナ257 から制御ループ253 の推定オートマトン制御装置
254 へ進む。第2の結合チャンネルである故障ターム267 は制御ループ253 の推
定オートマトン制御装置254 から応答学習ループ256 のアダプタモジュール265
に進む。
【0166】 図21のアダプタ265 およびプランナ267 は図4の対応するモジュールと同 一である。しかしながらこれらの構成は異なる。図4のアーキテクチャでは、プ
ランナ30とアダプタ24は計算のための基本的概要と一致する符号的パターンを使
用する。図21のアーキテクチャでは、等価機能が一定の状態マシーンの反復的
な分解および実行により実現される。基本である反復的な一定の状態マシーンの
分解処理が図22に示されている。この処理は推定オートマトン制御装置モジュ
ールでも使用される。
【0167】 図22の長方形は計算ステップを表し、円は推定演算子と呼ばれる計算ステ ップの変換を表す。処理への入力は、一定の状態のマシーンの目的とする動作を
捕捉する正準方程式291 と呼ばれる式である。図22の正準方程式はkleene-Sch
utzenberger Equation(KSE)のバージョンである。KSEの一般的な形態を
以下示す。これは図21のアーキテクチャのモジュールで実行される全ての処理
の一般的なブループリントである。 Q(V)=E(V)・Q(V)+T(X) V[E]I、命令空間、 X[E]CS、計算空間であり、
【数23】
【0168】 KSE式では、マトリックスEの各エントリは推定の基礎から構成される有理
数の形態であり、Tは知識ベースからの式形態のベクトルである。マトリックス
Eの(i,j)番目のエントリが空ではないエントリであるならば、これは状態
iから状態jまでの一定の状態マシーンのエッジを表している。E(V)とQ
(V)の間の2進演算子“.”は“推定を与える”演算子を表している。この演
算子は単一化と呼ばれ、評価ルーチンとして実行される。この演算子を実行する
ELLコードを以下示す。エバル(eval)と呼ばれる単一化処理のトップレベル
は、現在のメモリパッチデータ構造とその隣接構造とを付加しそれらにエバルを
反復的に提供することにより実行される。この処理は2つのダイナミックデータ
ベース、即ち部分的な単一化結果を保持する値 表と、パッチに関するアクチブ
ルールを保持するop predとを使用する。幾つかの変形により、同一の一
体化処理がエージェントアーキテクチャの全てのモジュールに使用される。
【0169】 図21のモジュールの各処理は、以下の1以上のネストされた初期的なサブ 処理の形態からなる。
【数24】
【0170】 図22では、並列分解285 変換は一定の状態マシーンを並列のシリーズの単一
化オートマトン286 に分解する。単一化オートマトン296 は1つの初期状態と1
つの終端状態とを有する一定の状態マシーンである。縦続き分解287 は各単一化
オートマトンを一連の接頭辞オートマトン288 に変換し、その後ループオートマ
トン289 が後続する。接頭辞オートマトンはその終端状態からの変換をもたない
単一化オートマトンであり、ループオートマトンはその初期状態と終端状態が一
致する単一化オートマトンである。線形化はステップ290 で、ループオートマト
ンの初期状態と同一のエッジとして新しい終端状態を構成することによりループ
オートマトン289 を変更し、ベースオートマトン294 を形成する。アクセス可能
ではない状態はステップ293 で結果的なオートマトンからトリムされ、必要なら
ば全体的な分解処理が反復される。初期状態から終端状態までの単一路からなる
オートマトンがこの分解で行われるときはいつでも、このようなオートマトンは
パスオートマトンと呼ばれ、これは本来の一定の状態マシーンの適切な通路に対
応し、出力292 が行われる。インストール295 は正準方程式291 により特定化さ
れる制御規則を生成する。
【0171】 前述の処理の線形の複雑性は処理の決定論的ではない特性の直接結果である 。処理を通じて各パスを実行する部分的な結果は対応する出力状態232 で集めら
れる。処理により生成される分解の第1のパスオートマトンが実行され、その結
果が対応する出力状態に記憶される。一度、適切なパスオートマトンが発生され
、実行されると、分解処理が終了する(first finish half strategy)。
【0172】 知識モデルはメモリパッチと呼ばれる直接メモリマップの主要なデータ構造 をエンコードする。メモリパッチはキャリアマニホルドのトポロジのオープンセ
ットの計算表示である。図21の制御ループの知識モデルはメモリパッチの集合
である。各メモリパッチは以下のアイテムをエンコードする。 (a)キャリアマニホルドの対応するオープンセットに含まれている一般的な点
)(エージェント状態)のパターンである。このパターンは式(31)の境界とし
て呼ばれる。 (b)対応するパッチの一般的な点のパターンのインスタンスを示すときにエー
ジェントに有効な初期的な無限小制御動作または初期的な制御導出とも呼ばれる
初期的な制御動作の名称である。これらの名称は式(31)のopk である。 (c)レラクゼーション係数とも呼ばれるチャタリング係数の1セットの符号ま
たは値である。チャタリング係数の例示値は対応する初期的な制御動作が使用さ
れるエージェントの現在の更新インターバルの時間の割合を規定する。これらの
名称は式(31)のak である。 (d)対応するパッチの一般的な点のパターンのインスタンスを示すときにエー
ジェントに有効な初期的な無限小制御動作または初期的な制御導出とも呼ばれる
初期的な制御動作を推定するために推定オートマトン制御装置に必要とされるE
LLのセットに対するポインタの集合である。式(31)のpcck は、初期的な
制御動作opk に対応するELLクローズの集合の予めコンパイルされたバージ
ョンに対するポインタである。 (e)メモリパッチと隣接するメモリパッチとを鎖でつなぐ機構である。この機
構は式(31)のChristoffel symbol pointer と呼ばれ、クローズ(a)の一
般的な点の例示値が与えられるとき機能的な形態であり、推定オートマトン制御
装置が隣接メモリパッチへの変換を推定することを可能にする。クリストッフェ
ル記号に基づく式はメモリパッチの初期的な制御動作と、隣接するメモリパッチ
の初期的な制御動作との間に競合する関係を与える。一般的なパッチは可変数の
フィールドを有するデータ構造である。一般的な点のフィールド数は問題に依存
する。これらのフィールドはコンパニオンエージェントから来る状態情報と、エ
ージェントのセンサから来る現在の完治データとをエンコードする。計算の点か
ら考えると、メモリパッチはアイテム(a)−(e)のネストされたリストであ
る。メモリパッチの集合全体はそれ自体、エージェントのリストデータ構造をク
リストッフェル記号により与えられたリンクとを結合したタイプである。このデ
ータ構造のリンクは予め設定されているが、データ依存である。メモリパッチの
主要な帰納は対応するオープンセットのエージェントに有効な初期的な制御動作
についての知識を記憶することである。オートマトンとシステム処理とI/O処
理を実行するのに必要な一般的なクローズは、メモリパッチの記憶に使用される
タイプのメモリである(高価な)内容アドレス可能なメモリに記憶されない。例
えば、図23の推定オートマトン制御装置の変換を実行するのに必要な知識はメ
モリパッチに記憶されない。
【0173】 図23は推定オートマトン制御装置のフローチャートである。これは図13 の推定手段と同一の機能を有する。しかしながら図23の構成はそれ自体一定の
状態マシーンであり、前述のタイプの正準方程式により説明されることができる
。したがって、これは図22の処理により実行されることができる。このマシー
ンの各状態と変換の各エッジは前述のタイプの1以上のネストされた基本サブ処
理により実行される。推定オートマトン制御装置により処理されるデータは直接
メモリマップ(DMM)データ構造から抽出される。図22と同一の規約を使用
して、図23の長方形は計算ステップを表し、円と楕円は推定を表す。推定と共
に図23の各計算ステップは以下説明するような計算ステップを生成する。
【0174】 動作規範296 はプランナにより生成されたプランである。動作規範296 は最 適規範としてエンコードされ、図3を参照して(キャリアマニホルドにより)エ
ージェントにより観察されるときの制御下の分散プロセスの状態軌道と、各状態
点の状態に関する変化速度と、可変のエージェントクロックの関数である。この
規範はエージェントのラグランジュ関数として説明される。
【0175】 緩和された規範297 は動作規範296 の凸近似規範である。これは緩和原理298
をエンコードされた動作規範に適用することにより構成される。この推定演算 子はヤングの緩和原理のエンコードである。
【0176】 ダイナミックプログラミング式299 はベルマンの最適原理のハイブリッドバ ージョンである。これはW. Kohn 、J. Remmel 、A. Nerode の“Feedback Deriv
ations:Near optimal control for Hybrid System”、Proceedings of CESA'96
、 517〜521 頁に記載されている。ダイナミックプログラミング式はDP発生器
300 のアプリケーションによりレラックスされた規範から得られる。
【0177】 初期的な制御導出301 は初期的な制御動作または初期的な無限小制御動作と も呼ばれる。初期的な制御動作は、キャリアマニホルドの接ベクトル束とも呼ば
れ、ダイナミックプログラミング式299 から抽出される。現在のエージェント状
態付近で、これらはダイナミックプログラミング式を解決するエージェントの現
在状態からほぼ最適の軌道の接ベクトル空間の基礎を限定する。初期的な制御動
作が外部フィールド抽出手段302 の推定演算子を使用してダイナミックプログラ
ミング式から得られる。
【0178】 クリストッフェル記号データベース303 は現在のエージェント状態に基づい て機能的な形態である。これらはダイナミックプログラミング式規範から抽出さ
れる関係により決定され、エージェントラグランジュのヘッシアンに構造的に依
存する微分方程式への解として計算される。
【0179】 正準方程式304 はKSE式の形態のダイナミックプログラミング式の表示で ある。これは一定の状態マシーンを構成することによってダイナミックプログラ
ミング式299 を解くためのブループリントである。ダイナミックプログラミング
の公式化から正準方程式への変換を行う推定演算子は接続原理305 である。この
原理は接続による測地軌道のレヴィ・チヴィタ(Levi-Civita )公式に基づいて
いる。
【0180】 ゴールバック伝播手段オートマトン306 は一定の決定論的ではない状態マシ ーンであり、これはエージェント知覚データとクリストッフェル記号の関数であ
るメモリパチのセットにわたってナビゲーションをシミュレートする。このナビ
ゲーションはゴールから後方向に、現在の状態点を含むパッチ方向にほぼ最適の
軌道(測地軌道)のチューブに沿って実行される。このマシーンの状態変換を限
定している基礎をなす機構はレヴィ・チヴィタ平行転送処理である。ゴール伝播
手段オートマトンはオートマトンコンストラクタ推定演算子307 を適用すること
により正準方程式から符号形態で得られ、測地の微分方程式を解く測地解答手段
308 と呼ばれる処理によってクロストッフェル記号DBから実行するために例示
される。
【0181】 ローカルゴール309 は現在のメモリパチの隣接するパッチである現在のメモ リパッチまたはメモリパッチの点である。ローカルゴールは後方ナビゲーション
により得られる。即ちこれはゴールバック伝播手段オートマトンを実行すること
によって得られる。ゴールバック伝播手段オートマトンの実行310 はKSZE式
の分解処理を使用して実行される。
【0182】 最適オートマトン311 は初期的な制御導出とローカルゴールのチャタリング の組合わせ313 として次の更新インターバルの制御動作の計算を行う。最適のア
ルゴリズムを実行するマシーンはチャタリング係数と初期的な制御導出の関数と
して現在のメモリパッチの初期的な制御動作の反復的なリ−の括弧式を生成する
。更新インターバルとローカルゴールの終端における結果的な制御導出はレヴィ
・チヴィタの意味で相互に平行でなければならない。平行な例示手段(instanti
ator)312 は最適オートマトン311 のエッジのラベルを決定する。
【0183】 制御命令314 は最適動作により計算される制御導出を、制御信号空間の接ベ クトル空間にマップすることによって計算される。これはこの空間に制御導出を
発生する。次にアクチュエイタマップ315 は導出に与えられる。このアクチュエ
イタマップ315 の範囲はエージェントにより計算される可能なフィードバック制
御奇跡のセットである。アクチュエイタマップ315 は正準方程式を導出すること
により計算され、その解はアクチュエイタマップであり、対応するオートマトン
を構成し、その後、このオートマトンを図22の処理により実行する。
【0184】 図21で示されているように、制御ループ動作253 は2つのみのモジュール 、即ち、推定オートマトン制御装置254 と知識モデル255 とを含んでいる。推定
オートマトン制御装置254 は知識モデル255 により限定されるドメインでネビゲ
ートするアブストラクト状態機会である。知識モデルはエージェント知識をメモ
リパッチと呼ばれるオブジェクトへエンコードする。知識モデル255 は図2で与
えられるアーキテクチャモデルの知識ベース28と論理的に等しくないが、これは
内容アドレス可能なメモリ構造であり、知識ベースが考慮されているようなクロ
ーズの集合として考えるべきではない。制御ループ253 では、応答学習ループ25
6 のプランナ252 により発生されるプラン258 は固定されない。推定オートマト
ン制御装置機能254 は現在のプラン258 が知識モデル255 の現在状態260 と論理
的に競合するか否かを監視する。制御装置254 はまた適切な時間(制御プロセス
がこれらを予期するとき)に制御動作250 を発生し、その他のエージェントの状
態情報(エージェント制限)を発生する。モデル機能の知識は知覚入力261 の関
数としてエージェント知識を更新する。エージェントネットワーク入力262 と、
推定入力257 である。モデルの知識もエージェント状態260 を維持し更新する。
モジュールもエージェントネットワークのエージェント状態情報263 を発生する
【0185】 制御ループにより見られるプランナ257 により発生されるプラン258 は、プ ラン258 が知識モデル255 に記憶されるモデルから論理的に生じることを推定手
段257 が適切に証明できる限り、時間にわたって変化しない。したがって、プラ
ン252 が有効である感覚器官に、応答学習ループ256 は制御ループ253 と独立し
て動作する。応答学習と制御ループとの間の接続は、制御ループの推定手段254
が記憶されたモデル255 と現在のプラン158 との間の非競合性を決定したときに
のみ付勢される。
【0186】 応答学習ループ252 の推定オートマトン制御手段264 が制御ループ推定オー トマトン254 の成功を監視し、プランナ257 により発生されるプラン258 の正確
性を確証するように機能する。
【0187】 アダプタ265 の機能は故障のときに、制御ループ253 により発生される故障 項267 の機能としてプラン補正項266 を計算することである。
【0188】 応答学習ループの機能はエンコードされたエージェントゴールと故障項の関 数としての動作規範を発生することである。プランが一度、プランナにより公式
化されると、そのプランは、制御ループが所定の更新インターバルで制御信号を
発生しなくなるまでアクチブである。新しいプランを生成するため、プランナは
現在の動作規範の広範囲のポテンシャルを、アダプタにより発生する補正項と置
換する。アダプタによる補正項は制御ループによりそこに通過される故障項の機
能である。これは動作規範の新しい候補を生成する。
【0189】 その後、プランナはこの新しい座標を応答性学習ループの推定オートマトン 制御装置に送り、その推定オートマトン制御装置に記憶されている1組の一般的
なELLルールと新しい座標が一致するか否かを試験する。新しい座標がこれら
のルールと一致した場合、新しい座標は、さらに補正する必要があるかどうかを
チェックするアダプタに送られる。さらに補正する必要がある場合には、新しい
座標はプランナに送り返され、応答性学習ループの推定オートマトン制御装置に
よってアダプタに送られている性質基準(Behavior Criterion)に対して現在の座
標をこのアダプタが変更しなくなるまでプロセスが繰返される。最後に、新しい
性質基準に対する候補がアダプタによって修正されない場合、適合したもの(Ada
pted) がその候補をプランナに送り、次にこのプランナが制御ループの推定オー
トマトン制御装置にそれを送る。
【0190】 図24は、応答性学習ループの計算ステップを表している。図24において 、長方形は計算ステップを表し、円および楕円は推定演算子を表している。以下
、図24の各計算ステップ、ならびにその計算ステップを生成する推定演算子を
説明する。
【0191】 プラン例示からスタートし、推定オートマトン実行に進む計算ステップは、 性質基準としてスタートし、最適化オートマトンで終了する図23に示されてい
る推定オートマトン制御装置中のパスを簡約化して表わしたものある。これは、
プランナおよび推定オートマトン制御装置を応答性学習ループの一部分として示
した図21と一致する。図24の残りの計算ステップは、図21のアダプタモジ
ュールに対応する。
【0192】 故障項315 は、終端状態に到達することができなかった推定オートマトン制 御装置によって構成された最適化オートマトンの状態軌道セグメントである。こ
のようなオートマトンの終端状態は、常にゴールメモリパッチに対応する。これ
らの状態軌道は、最適化オートマトンを実施する基本的なサブ手順によって構成
されたパスオートマタに対応し、それらはメモリパスのシーケンスをトラバース
することを表している。これらの状態軌道のそれぞれのものにおける最後の項は
、それがゴール状態でないか、あるいはELLコードである“推定を適用”演算
子が呼出されたときに任意の値を例示することができなかったゴール状態である
ならば、実際には故障項である。これは、これらの状態軌道の1つの終わりに対
応したメモリパッチに関連したクローズの1以上のものが、その変数がそのクロ
ーズを真にする値に対して例示されることのできない修正可能なクローズである
ことを意味する。ここで、知識ベースのクローズは、2つのカテゴリーに分割さ
れることに注意されたい。モジュールの基本的演算特徴と定められたクローズの
ような修正不可能なクローズ、あるいは持続しなければならない不変状態に対応
したクローズが存在する。
【0193】 故障項がゴールクラス中にないメモリパッチに対応している場合、プランナ によって発生された修正されたプランのキャッチ・オールポテンシャルに補正項
が含まれることとなる補正ポテンシャルを生じさせるために交換子推定演算子が
使用される。この補正ポテンシャルは、次のように構成される。最初に、ポテン
シャルに対応した新しいルールが交換子推定演算子によって、とくに交換子(p
cci q ,pcci g ,)(境界q ,t)=pcciq(pcci q )(境界q
t)によって構成され、ここで上付き文字qはメモリパッチに対応し、上付き文
字gはゴールクラスを示し、下付き文字iはメモリパッチ中のi番目のpccを
示す。pcci q,new =交換子(pcci q ,pccig)(境界q ,t)とする
。“推定を適用”演算子は、このクローズに対応した新しいプリミティブ導出演
算子、とくにqに対応した状態をゴール状態gにより近いものにする効果を有す
るeval(pcci q,new ,境界q ,t)←opiq,new(境界q ,t)を構成
するために使用される。その後、交換子推定演算子は、現在のものに付加された
ときに、システムがqからgに転移することを可能にする所望の効果を生むポテ
ンシャル関数を構成する。このポテンシャルは次式によって与えられる:
【数25】
【0194】 このようにして構成された各ポテンシャルVq は、キャッチ・オール・ポテンシ
ャル中にそれを付加することによって新しいプラン中に組み込まれる。ここで、
明らかにしておくべき2つのポイントがある。第1に、pcci q,new は実際に
は新しいクローズに対するポインタであるが、ここでは説明のためにpcci q, new をこのクローズと同じものとみなす。第2に、この新しいクローズは、知識
モデル中に直接的に組み込まれない。知識モデル中への新しいクローズの組み込
みは、応答性学習により1以上のパスが形成されたときにのみ発生する。すなわ
ち、プランナによって構成された新しい性質基準に対応した新しい正準方程式が
構成された場合にのみ、それが知識モデル中に組み込まれる。
【0195】 故障項に対応したメモリパッチがゴールパッチである場合、変数は、クロー ズの1つで例示され、真とされることができない。この場合、性質基準は、更新
インターバル長ΔをΔ/2によって置換することによって狭められる。この場合
、プランナは緩和演算子によって新しい性質基準を構成することとなる。
【0196】 故障を生じさせる2つの別の場合が存在する。第1に、故障のあるパッチ中 のクローズは、知識モデルに記憶された現在の感覚(sensory) 情報と一致しない
可能性がある。この場合、クローズは消勢される。すなわち、ルールは、不活性
化演算子によって知識モデルから除去される。修正可能なルールだけが不活性化
されることができる。最後に、故障のあるメモリパッチに対応した開かれたセッ
トおよびゴールクラスに対応した開かれたセットは交差するが、その交差におけ
る境界の値に対する2つのメモリパッチのルールは適合しない場合の可能性があ
る。この場合、抽象(abstraction) 演算子は、故障メモリパッチとゴールメモリ
パッチとの組合せである新しいメモリパッチを生成する。この組合せを生成する
時の重要なステップは、2つのメモリパッチ中のプリミティブ制御導関数の組合
せであるその組合せに対するプリミティブ制御導関数の新しいリストを生成する
ことである。これは、以下のルール:pcci q (境界q [Y]境界g )≠pc
i g (境界g abstraction →境界q [X]境界g にしたがって抽象演算子に
よって実行される。
【0197】 適合完了のモジュール316 は、上述した故障項の4つのクラスに応じて実際 に新しいクローズおよびメモリパッチの少なくとも一方を生成するモジュールで
ある。プラン項再公式化のモジュール317 は、上述の故障項の4つのクラスに応
じて、キャッチ・オール・ポテンシャル、または知識ベースに付加された新しい
クローズを修正するモジュールである。
【0198】 図25は、直接メモリマップ(DMM)の概念図である。このDMMは、図 21乃至24のエージェントアーキテクチャを実施するために使用される。DM
Mは、知識を変換するための手順である。この手順の入力において、エージェン
トの知識268 は、式論理クローズ(図7,8)の集まりとして符号化される。こ
れらは、制御、所望のエージェント性質、制約、エージェントネットワーク相互
作用等の下で設計者がシステムの特性を符号化することを可能にするホーン(Hor
n)クローズの特別なクラスである。これらのタイプのクローズは、これらの特性
のグラフィック記述とエージェント知識の実行時間表示との間における非常に効
果的なブリッジである。DDMは、エージェント知識のコンパイラとして動作す
る。直接メモリマップは、各エージェントの知識ベースに含まれる知識を組織化
するために使用されるメモリパッチと呼ばれるデータ構造を提供する。メモリパ
ッチは、キャリアマニホルドのトポロジーにおける開かれたセットの計算表示で
ある。
【0199】 DMM手順は、2段階で発生するものとして概念化される。
【0200】 第1のステップにおいて、所定のエージェントELLクローズ271 から、D MMは展開構成要素、ドメイン記述子、変数およびパラメータを抽出する。導出
制御演算子と呼ばれる展開構成要素は、図26に示されているメモリパッチにお
けるハイブリッドエージェントのナビゲーションを実施するためのプログラム可
能な抽象マシンのプリミティブ命令である。ドメイン記述子は、エージェントに
よって制御されるプロセスの性質を制約する導出制御演算子以上の付加的な制約
である。
【0201】 その他大部分のプログラム可能なデジタルデバイスとは異なり、命令セット (すなわち、導出演算子のセット)は、ドメイン269 と無関係に規定されない
。すなわち、開かれたセット272 と呼ばれるドメイン中の各幾何学的オブジェク
トはそれに割当られた1組の導出制御演算子を有し、これはその開かれたセット
272 と関連した知識によって決定される。導出制御演算子は、ナビゲータが開か
れたセット272 中の点から同じ開かれたセットまたは隣接する開かれたセットの
いずれかの中にある別の点にどのように移動するかを規定する。プランナは、推
定オートマトン制御装置が各開かれたセット272 に対して集合(assemble)するこ
とを可能にする青写真を提供し、その組合せの特定の組合せが、もし可能ならば
、所望の局部性質を確実にする。しかしながら、2以上の開かれたセットは、制
御されるべきシステムの知識がドメイン空間の完全な分割を達成する程正確では
ない可能性があるため、自明でない共通部分(intersection)を有していなければ
ならない。これは、プランの実施が一般に非決定論的であることを意味する。こ
の非決定論は、オンライン最適化によって解決されることができる。
【0202】 第2のステップにおいて、基本的な幾何学的オブジェクトおよびそれらの対 応した制御導出演算子は、メモリパッチ273 と呼ばれる全データ構造の基本的構
成要素中にマッピングされる。メモリパッチ273 は、以下の形式のネストにされ
たリストである:
【数26】
【0203】 式(31)において、Boundariesとは、開かれたセット中の部分的に例示され
た点の形態をとる展開に対する境界状態を表し、各opi は、開かれたセットに
関連した導出制御演算子であり、各pcci は、対応した制御導出演算子opi の特性を特徴付ける制御クローズに対するポインタであり、各αi は、チャタリ
ング組合せ係数である。各αi は、次の状態に展開するためにエージェントが制
御導出演算子opi に対して使用する制御インターバルの一部分である。クリス
トッフェルのシンボルポインタは、ゴールメモリパッチを現在のメモリパッチ27
0 にマッピングして戻すために必要とされる機能的データに対するポインタであ
る。このマッピングを実施するアルゴリズムは、ハイブリッドシステム用の動的
プログラミングアルゴリズムの変形である。ゴールメモリパッチを現在のメモリ
パッチにマッピングして戻すことを実施するアルゴリズムは、ゴールパッチの内
容と適合する現在のメモリパッチ中の論理ゴールを計算するハイブリッド・ダイ
ナミック・プログラミング・アルゴリズムの並列転送構成要素を使用する。とく
に、アルゴリズムは、ゴールフィールド構成要素の並列形態を計算であり、現在
のメモリパッチの状態データによりそれらを評価する。
【0204】 このアーキテクチャの利点は、制御クローズに対するポインタpcci が、 制御導出演算子opi を特徴付けるクローズのセットのプロローグ解の結果を表
す予め処理されたモジュールを指すことができることである。これらの導出は、
オンラインで処理されない。処理されることのできるコードのタイプの一例は、
述語pred プロセスの呼出しグラフが示されている図26に与えられている
。述語pred プロセスは、一般ELLクローズをとり、クローズが後続する
計算で容易に修正または操作されることができるように、クローズの種々の部分
を分離および分類する。直接メモリマップアーキテクチャにおいて、これらのモ
ジュールは、DMMを使用してコンパイルしているあいだ統一をせずに線形分解
を実行することによって構成される。これは、計算の構成要素だけが最小に維持
されることを意味する。また、分解をオンラインで実行するためのメモリ要求が
減少されている。
【0205】 表 I [MAHCA実施の基本動作に対する時間の割合] 動 作 非DMM実施 DMM実施 統一 13% <8% 探索 42% 0% 分解 30% 9%* バックトラッキング 10% 0% I/O 5% 5% メモリ動作 0% 87% バス速度 〜10ミリ秒 〜100ナノ秒 (*)プレコンパイルされたもの 表Iはエージェントモジュールが演繹的推定の基本的動作に費やす更新時間の
%を比較したものである。第1の行は一体化についてのDMMではない実行によ
って費やされる時間の%が13%であり、一方、DMM実行によって費やされる
一体化についての時間が<8%であることを示している。この減少は、DMMで
はない実行一般的なロビンソンの一体化手順を使用し、一方DMMはメモリパッ
チのデータ構造について一体化を行うために最適化される/*基本サブ手順*/
の“推定を適用”する手順を使用することによるものである。条項サーチはDM
M実行では必要ない。その理由は知識条項は適当なパッチにマップされ、そのた
め実行中エージェントは現在のメモリパッチによってポイントされた条項を使用
し、他のものは使用しないからである。分解能はDMM実行においては必要とさ
れないで遥かに効率の良い適応と置換される。最後にMAHCAエージェントの
DMM実行の更新時間の大部分はメモリ動作に費やされる。しかしながら、これ
らのメモリ動作はデジタル信号プロセッサにおいて行なわれ、それにおいてはバ
ス速度は〜100ナノ秒/演算である。一方、DMMでない実行はバス速度がほ
ぼ〜10ミリ秒/演算である汎用プロセッサを必要とする。これはDMM実行エ
ージェントのスピードアップの主要な理由である。
【0206】 図27はエージェントの制御ループに対する直接メモリマップマシーン274 の図である。中央機能は知識モデルヲエンコードするメモリパッチのアクチブア
レイにより与えられる。エージェントメモリパッチアレイ275 の各エレメントは
式31に記載された構造を有する。この構造の基本的なメカニズムは内容アドレ
ス可能なメモリとして動作する。
【0207】 内容アドレス可能なメモリ方式は次のように動作する。被比較数と呼ばれる 特別化されたレジスタはメモリセルの内容と比較されるパターンを記憶する。メ
モリセルの内容が被比較数のパターンと整合する場合には、そのセルが活性化さ
れる。DMMは2つの被比較数、すなわち現在状態被比較数276 とゴール被比較
数277 とを有する現在状態被比較数276 により付勢されたメモリパッチの内容は
応答バッファ278 に転送される。ゴール被比較数277 により付勢されたメモリパ
ッチの内容はバック伝播279 と呼ばれる区域に転送される。被比較数パターンは
メモリパッチの5チュープル構造の2つの座標のみを含むが、メモリパッチの構
造に応じて他のものを使用することも可能である。
【0208】 応答区域278 に転送されたメモリパッチの内容はエージェントによって制御 されているプロセスについての情報の現在の状態を表している。パターン一体化
280 のプロセスにより、すべてのこま情報は応答メモリ中において集約され、そ
の応答メモリでは最初の2つの座標は即時化または部分的即時化される。応答メ
モリパッチの残りの3つの座標は次のように計算される。ハイブリッドシステム
理論は、ゴールデリベーション演算子のバック伝播の結果であるデリベーション
演算子を生成するように応答メモリパッチの制御デリベーション演算子の特有の
チャッタリング組み合わせが存在することを示している。ゴールデリベーション
演算子のバック伝播はレビ・シビタ(Levi−Civita)接続を介して並
列転送のプロセスにより得られる。このチャッタリング組合わせはデリベーショ
ン演算子に適用される一体化またはパターン整合の2つの適用により計算される
ことができる。チャッタリング組合わせは応答メモリパッチのチャッタリング係
数を与える。応答メモリパッチの条項の制御のためのポインタは応答のデリベー
ション演算子から計算されることができる。クリストフェル(Christoffel) 係数
は応答メモリパッチの境界条件に依存する関数である。これらの係数はデータベ
ースに記憶された係数の挟間のプロセスにより計算される。
【0209】 最後に、チャッタリングコンビネーションにより決定された制御デリベーシ ョン演算子はアクチュエータマップ281 と呼ばれる手順に供給される。この手順
は制御デリベーション282 を実行して次の更新までプロセスのために要求された
制御作用283 を生成する。
【0210】 次の更新のメモリパッチは現在のメモリパッチから構成され、感知データ284
は現在の更新時間に受信され、制約は他のエージェント285 から次の更新時間 に受信される。
【0211】 DMMはMAHCAを実行するための方式として、エージェントおよびエー ジェントネットワークの収合としてではなく、エレメントがバーチャルページで
あるバーチャルメモリスペースにおいてナビゲートするエージェントの集合とし
て観察される。ここでバーチャルページは図27に記載されたエージェントメモ
リパッチの形態のメモリパッチの集合であり、それは種アクチブメインではなく
補助メモリ中に記憶される。メモリパッチの境界条件フィールドは3つのパラメ
ータ、すなわちエージェントId、ページ番号、およびオフセット番号によって
調整される。第1のパラメータはパッチ中で符号化された知識のエージェント所
有者を設定する。第2のパラメータはメモリパッチのバーチャル頁与える。第3
のパラメータはバーチャルまたはドメイン中のその相対位置である。原理的にネ
ットワーク特性およびプロトコルはあたかも別のタイプのモデル知識のようにメ
モリパッチ中で符号化されることができる。それ故、エージェントは共通のメモ
リスペース中で動作しているプロセスの集合のようにドメインを見る。このエー
ジェントのモデルはネットワークの特性とプロトコルが予め知られており、安定
しているシステムを有する場合のみ実現可能である。しかしながら、多くの応用
ではネットワークのそのような全体的な知識は利用できない。その場合に、異な
ったモデルが使用されなければならず、それにおいては各エージェントは知識デ
コーダモジュールを有している。
【0212】 図28はDMM中のメモリパッチの役割の構成図である。それは内容アドレ スメモリを使用し、そのメモリは記憶のために可変フィールドを使用する。各可
変フィールドはメモリパッチデータ構造275 を記憶する。内容アドレスメモリに
よって使用されるメカニズムは次のとおりである。被比較数レジスタと呼ばれる
第1のレジスタはメモリフィールドに1つのパターンを放送する。内容が単一化
されたそれらのフィールドは、符号が/*基本的サブ手順/中で与えられている
適用関数の意味において、その被比較数により応答バッファと呼ばれるバッファ
にダウンロードされる。図28の内容アドレスメモリ構成において、2個の被比
較数レジスタが有り、それは現在状態レジスタ276 とゴール被比較数レジスタ27
7 である。
【0213】 これらのバッファに加えて、入力プロセッサ318 が有り、それはエージェン トセンサおよびそのコンパニオンエージェントから得られた情報によりメモリパ
ッチ275 中の境界のフィールドを更新する。その情報は現在状態レジスタ276 と
ゴール被比較数レジスタ277 の両者に送られて現在状態およびゴール被比較数の
フィールドを更新する。現在の状態被比較数のチャッタリング係数サブフィール
ドは最適化推定装置(また最適化オートマトンとも呼ばれる)により更新され、
この最適化推定装置は推定装置オートマトン制御装置の一部である。ゴール被比
較数はプランナ中に記憶されているゴールから構成されている。
【0214】 現在状態被比較数276 に応答してパッチされたこれらのメモリの内容は応答 バッファ278 にダウンロードされ、ゴール被比較数277 に応答するそれらのメモ
リパッチの内容は、バック伝播バッファ279 にダウンロードされる。
【0215】 メモリパッチの最初の2つのサブフィールドだけか現在状態およびゴール被 比較数により放送されるパターンにより一体化に対してテストされる。残りの3
つのサブフィールドはパッチのペイロードである。チャッタリング係数に対応す
るサブフィールドが最適推定装置によって一度更新されたならば被比較数レジス
タはその情報をメモリパッチの対応するフィールドにダウンロードし、それは現
在状態被比較数の放送に対応する。第4のサブフィールドは、第2のサブフィー
ルド中に記憶された未加工の制御導関数を定める規則条項の呼グラフに対するポ
インタを含んでいる。実際の呼グラフはレギュラーメモリに記憶され、対応する
パッチが付勢されたとき、すなわちデータが応答バッファにダウンロードされた
とき実行される。
【0216】 エージェントの知識ベースにおける規則は編集時間に予め処理され、それ故 、各メモリパッチに対してメモリパッチの第4のサブフィールドのエントリーが
計算できる。pccのチャッタリングにおける各エントリーは呼グラフに対する
ポインタであり、それはメモリパッチの第2のサブフィールドにおける対応する
未加工の制御作用を計算する。
【0217】 MAHCAの圧縮/圧縮復元に対する適用は、DMMデータ構造および記憶 されたDMMデータ構造のオンラインまたはオフライン圧縮としてオーディオま
たはビデオソースの処理および記憶からなる。ソースの処理は損失の多い処理で
あり、それは圧縮および圧縮復元エージェントの知識モデルにおけるセットの正
確さを変化させることによって変更されることができる。圧縮されないデータソ
ースはデータ頁のシーケンスである。ビデオの場合、頁は画素320 で構成される
フレームである。オーディオの場合には頁はカウント320 の集合である。
【0218】 頁319 はソースのクロックに関して順序が定められる。頁319 の圧縮シーケ ンスの目的は、2次元キャリアマニホルドにわたる運動表面として観察される。
圧縮アルゴリズムは次のようにMAHCAエージェントにおいて実行される。ソ
ースの各頁はゴールとしてのエージェントプランナに連続的に供給される。プラ
ンナは現在の3つの連続頁に対応するポテンシャルとしてプランフラグメントを
構築する。このポテンシャルはキャッチオールポテンシャルとして現在のプラン
に付加される。プランナは現在の最適の規則を生成してそれを推定オートマトン
制御装置に送る。この規則は頁からデータを捕捉する。
【0219】 推定オートマトン制御装置は供給された最後の頁をカバーするために座標測 地曲線321 を発生する。これは図29に示されている。推定オートマトン制御装
置はこれらの各座標をDMM構造にエンコードする。DMMエンコード流はソー
スの圧縮された形態を構成する。
【0220】 圧縮復元エージェントはプランナまたはアダプタを有しない。DMM流はい るプロセッサを介して圧縮復元エージェントの知識モデルに供給される。1つの
頁が受信されると、このエージェントの推定オートマトン制御装置はDMMデー
タを使用してアクチュエータマップの積分手順により座標測地曲線を生成する。
その結果は対応する圧縮 されない頁である。
【0221】 内容アドレス可能なメモリのアーキテクチャは直接メモリマップ(DMM) と呼ばれるMAHCAの構成の一部である。DMM連想メモリは特別の種類の連
想メモリである。DMM連想メモリは可変長のアレイ、すなわちアレイのフィー
ルドとして見られる可変ビット、エレメントのアレイである。
【0222】 DMM連想メモリのエレメントの各フィールドはパターン整合サブフィール ド322 およびペイロードサブフィールド323 と呼ばれるビットの2つのアレイか
ら構成される。パターン整合サブフィールドはそれ自身2つのサブアレイで構成
され、それは状態サブアレイ324 および演算子サブアレイ325 である。ペイロー
ドサブフィールドはそれ自身2つのサブフィールドで構成され、それは係数サブ
フィールド326 およびポインタサブフィールド327 である。
【0223】 DMM連想メモリ装置は図30に示された形態のDMM連想メモリエレメン トの内容アドレス可能なアレイから構成されている。アドレスは状態被比較数レ
ジスタおよびゴール被比較数レジスタと呼ばれる2つの被比較数レジスタにより
実行される。状態被比較数レジスタは2つのパターン整合サブフィールド、すな
わち状態サブフィールドと演算子サブフィールドを含んでいる。ゴール被比較数
レジスタはゴールサブフィールドと呼ばれる単一のパターン整合サブフィールド
を有している。
【0224】 パターン整合サブフィールドは被比較数レジスタの内容を整合する一体化置 換を決定するために必要な情報を含んでいる。状態被比較数レジスタは状態サブ
フィールドと演算子サブフィールドの両者に関して単一化する。ゴール被比較数
レジスタは状態サブフィールドに関してのみ単一化する。
【0225】 状態サブフィールド324 は制御下の処理または計算の得ることのできる状態 に対応するビットの可変長列である。演算子サブフィールド325 は新しい状態に
現在の状態を変換する1以上の原始的演算子をエンコードするビット列である。
【0226】 係数サブフィールド326 はトークンのリストのエンコードである。トークン は可変シンボルまたは0と1の間の範囲の有理数のいずれかである。ポインタサ
ブフィールド327 は連想ではないメモリ中に記憶された予備だし可能な手順に対
するポインタをエンコードする整数のリストである。DMM連想メモリ中の各エ
レメントに対して、演算子サブフィールド中のエンコードされた演算子の数は係
数サブフィールド中のエンコードされたトークンの数に等しく、それはポインタ
サブフィールド中のエンコードされたポインタの数に等しい。
【0227】 機能的に、演算子サブフィールド中でエンコードされた演算子325 は、対応 する連想メモリが単一化により選択されるとき状態の原始的な変換を決定する。
係数サブフィールド中のエンコードされたトークンはチャッタリング手順により
これらの原始的な変換からの複素数変換を構成する。ポインタサブフィールド中
のエンコードされたポインタは対応する原始的な変換を評価するためのエンコー
ド規則の条項に対するポインタである。
【0228】 DMMメモリ装置はメモリ中のダイナミックなナビゲートのための標準的出 ないハードウエアプロセッサのコンポーネントである。このプロセッサのブロッ
ク図は図28に示されている。この装置は8個の機能的サブシステムから構成さ
れている。
【0229】 入力プロセッサシステム318 は、外部センサおよびゴールデータを処理し、 メモリ中の幾つか、或いは全てのエレメントの状態サブフィールドに対する更新
を生成するサブシステムである。2つの被比較数レジスタの機能は、2つの警告
により標準メモリ中で発見されるものと類似している第1に、状態被比較数276
およびゴール被比較数277 は非同期的に動作し、したがって、メモリフィールド
中のソフトウエアコンポーネントはアクセス衝突空の回復のために設けられなけ
ればならない。第2に、比較規則は均等性の代りにロビンソン一体化と呼ばれる
一般化された交差に基づいている。状態およびゴール応答278 はメモリフィール
ド内容を集めるバッファであり、それは一体化ステップ後に、それぞれ状態被比
較数276 およびゴール被比較数277 により一体化される。一定化装置280 はバッ
ファ中のフィールドを単一のエレメントに結合する装置であり、その単一のエレ
メントは並列移送に基づいた一般化された一体化手順によってDMMシンタック
スト両立される。一体化装置322 により生成されたデータはメモリナビゲーショ
ンオートマトンまたは最適推定装置と呼ばれる外部プロセッサに供給され、それ
は次の状態被比較数に対する内容を計算し、ハイブリッドチャッタリングシステ
ムが制御下のプロセスに送るように作用する 以上のことから、分布された非線形性のプロセスのインテリジェントでリアル
タイムの制御と、通常の機能のリアルタイムの制御とを行うためにマルチプルエ
ージェント・ハイブリッド制御アーキテクチャを使用することができる。本発明
はもちろん、本発明の意図および技術的範囲から逸脱せずに本明細書に説明され
た以外の特定の方法で実行されてもよい。それ故、本明細書に表された実施形態
は、全ての見地において例示として考慮されるべきであり、制限を受けないもの
と見なされ、添付された請求の範囲およびそれに等価の範囲内の全ての変更がそ
の中に含まれていることが意図されている。
【図面の簡単な説明】
【図1】 マルチプルエージェント・ハイブリッド制御アーキテクチャの高レベルの層の
コンペーネントと低レベルのコンペーネントの構造を示す階層アーキテクチャ全
体を示す概略図。
【図2】 エージェントに関連したフローを変更する無限小のアクションのスケジュール
を実行する論理的エージェントネットワークの個々のエージェントを示す概略図
【図3】 制御された分布プロセスによりMAHCAフレームワークを示す概略図。
【図4】 論理的エージェントネットワーク中のノードに対する応答性制御装置を有する
ソフトウェアおよびハードウェアコンポーネントの構造を示している単一のエー
ジェントのコンポーネントを示す概略図。
【図5】 1群のエージェントを有しているエージェントのネットワークを示す概略図。
【図6】 永久的なエージェントと一時的なエージェントの両方を有するエージェントの
ネットワークの評価を示す概略図。
【図7】 階層の関係に配置された1組の式関連クローズとして配置された知識ベースを
示す概略図。
【図8】 式関連クローズとしての単一のエージェントの知識ベースの基本的コンポーネ
ントを示す概略図。
【図9】 ソフトウェアプロセスの連続を示す概略図。
【図10】 分布されたリアルタイムのシステムを同期させるために個々のエージェントに
よって行われた動作を示す概略図。
【図11】 システム状態の統一モデルが構成され、そこにおいて、システムの解に必要な
不変の変換が実行される数学上のエンティティとしてのキャリアマニホルドを示
す概略図。
【図12】 図10に示されたものに類似しているが、図25に示されているDMM形態に
とって重要な事象および演算子のいくつかに対して異なった記述を含んでいる個
々のエージェントによって行なわれるアクションを示す概略図。
【図13】 現在のシステムの目標のセットと、システム性質における現在の論理および展
開の制約のセットと、ユーザからの現在の入力の組と、現在のセンサ値が与えら
れた次のオートマトンを生成する際のマルチプルエージェント・ハイブリッド制
御アーキテクチャの動作の基本的な方法を示す概略図。
【図14】 個々のアクションの間のチャタリングを通してハイブリッドシステムの問題i
に関する最適に近い解を達成するプロセスを示す概略図。
【図15】 推定手段によって構成されたオートマトンに対して可能なアクションのシーケ
ンスを説明する証明オートマトンの概念的アーキテクチャを示す概略図。
【図16】 マルチプルエージェント・ハイブリッド制御アーキテクチャの公式化の有効な
結果を説明するダイポールネットワークの等価物を示す概略図。
【図17】 エージェント間の不変原理を満たすものによって行なわれるエージェント同期
を示す概略図。
【図18】 ディスクリートな製造プラントの計画、スケジューリングおよび制御に対して
マルチプルエージェント・ハイブリッド制御アーキテクチャを適用した一例を示
す概略図。
【図19】 ディスクリートな製造アプリケーションに対するエージェントが2つのマルチ
プルエージェント・ネットワークの一例を示す概略図。
【図20】 ディスクリートな製造アプリケーションに対するエージェントが5つのマルチ
プルエージェント・ネットワークの一例を示す概略図。
【図21】 図4、10および12のアーキテクチャと同じ機能を有しているが、制御ルー
プおよび応答性学習ループが別々に実施されるエージェントのアーキテクチャモ
デルの概略図。
【図22】 推定オートマトン制御装置モジュールにおいても使用される基本的な帰納的有
限状態マシン分解手順を示す概略図。
【図23】 図22の工程によって実行されることのできる図13に示されている推定装置
と同じ機能を有する推定オートマトン制御装置のフローチャート。
【図24】 応答学習ループの計算ステップを示す概略図。
【図25】 ディスクリートなメモリマップの概念図。
【図26】 メモリパッチ中のハイブリッドエージェントのナビゲーションを実施するため
のプログラム可能な要約マシンの原始的命令であるデリベーション制御演算子と
呼ばれる展開エレメントの概略図。
【図27】 エージェントの制御ループ用の直接メモリマップマシンの概略図。
【図28】 記憶のために可変フィールドを使用する、内容アドレス可能メモリを使用する
DMMにおけるメモリパッチの役割を示す概略図。
【図29】 推定オートマトン制御装置によって生成された供給された最後のページをカバ
ーする座標測地的曲線図。
【図30】 DMM関連メモリデバイスを形成するために使用されるDMM関連メモリ構成
要素の内容アドレス可能アレイを示す概略図。
───────────────────────────────────────────────────── フロントページの続き (81)指定国 EP(AT,BE,CH,CY, DE,DK,ES,FI,FR,GB,GR,IE,I T,LU,MC,NL,PT,SE),OA(BF,BJ ,CF,CG,CI,CM,GA,GN,GW,ML, MR,NE,SN,TD,TG),AP(GH,GM,K E,LS,MW,SD,SZ,UG,ZW),EA(AM ,AZ,BY,KG,KZ,MD,RU,TJ,TM) ,AL,AM,AT,AU,AZ,BA,BB,BG, BR,BY,CA,CH,CN,CU,CZ,DE,D K,EE,ES,FI,GB,GE,GH,GM,HR ,HU,ID,IL,IS,JP,KE,KG,KP, KR,KZ,LC,LK,LR,LS,LT,LU,L V,MD,MG,MK,MN,MW,MX,NO,NZ ,PL,PT,RO,RU,SD,SE,SG,SI, SK,SL,TJ,TM,TR,TT,UA,UG,U Z,VN,YU,ZW Fターム(参考) 5B045 AA05 DD01 GG01 5H004 GA30 GA34 KD52 KD62

Claims (26)

    【特許請求の範囲】
  1. 【請求項1】 分配されたハイブリッドシステムの局部プロセスを制御する
    エージェントにおいて、 バリッドである記憶された要求にしたがって局部プロセスを制御する制御ルー
    プと、 要求がバリッドでないとき記憶された要求を修正するための応答学習ループと
    を具備し、 前記制御ループは、記憶された要求がバリッドであるあいだは制御ループが応
    答学習ループから独立して動作するように応答学習ループから分離されているエ
    ージェント。
  2. 【請求項2】 制御ループは、 プランとして要求を記憶するための知識モデルと、 この知識モデルによって定められたドメイン中でナビゲートする要約状態マシ
    ーンを備え、プランが知識モデルの現在の状態と両立するか否かを決定する制御
    推定装置とを具備している請求項1記載のエージェント。
  3. 【請求項3】 プランが知識モデルの現在の状態と両立しないことを制御推
    定装置が指示するまでプランは固定される請求項2記載のエージェント。
  4. 【請求項4】 さらに、制御ループを応答学習ループと接続する結合チャン
    ネルを備え、 プランの両立しない故障項が結合チャンネルを通って制御推定装置から応答学
    習ループ送られ、結合チャンネルはプランが両立しないときにのみ活性である請
    求項3記載のエージェント。
  5. 【請求項5】 応答学習ループは、 論理的表現としてシステムの所望の性質の要求を表すプランを生成するための
    プランナと、 制御ループにおいて現在プランが活性であるか否かを決定するリアクチブ推定
    装置と、 推定装置に接続され、プランが現在制御ループ中において活性でない場合には
    プランに対する補正項を計算するアダプタとを具備している請求項1項記載のエ
    ージェント。
  6. 【請求項6】 さらに、制御ループを応答学習ループと接続する結合チャン
    ネルを備え、 補正されたプランは結合チャンネルを通ってプランナから制御ループに送られ
    、結合チャンネルはプランが活性でないときのみ活性である請求項5記載のエー
    ジェント。
  7. 【請求項7】 制御ループは、 プランとして要求を記憶する知識モデルと、 知識モデルにより定められたドメイン中でナビゲートしてプランが知識モデル
    の現在の状態と両立するか否かを決定する要約状態マシーンを備えている制御推
    定装置とを具備し、 応答学習ループは、 論理的表現としてシステムの所望の性質の要求を表すプランを生成するプラ
    ンナと、 制御ループ推定装置を監視することによって制御ループにおいて現在プランが
    活性であるか否かを決定するリアクチブ推定装置と、 推定装置に接続され、プランが現在制御ループ中において活性でない場合にプ
    ランに対する補正項を計算するアダプタとを具備している請求項1項記載のエー
    ジェント。
  8. 【請求項8】 制御ループは第1および第2の結合チャンネルを通って応答
    学習ループに接続され、 第1の結合チャンネルは制御推定装置からプランの非両立性を定める故障項を
    アダプタに中継し、 第2の結合チャンネルはプランナからプランに対する補正項を制御推定装置に
    中継する請求項7項記載のエージェント。
  9. 【請求項9】 結合チャンネルは制御ループ中のプランが両立しないために
    不活性であるとき故障項および補正項のみを中継する請求項8記載のエージェン
    ト。
  10. 【請求項10】 エージェントはデータソースからのデータの圧縮のために
    使用される請求項8記載のエージェント。
  11. 【請求項11】 データソースは、ビデオソースである請求項10記載のエ
    ージェント。
  12. 【請求項12】 データソースは、オーディオソースである請求項10記載
    のエージェント。
  13. 【請求項13】 データソースからの各データページは目的地としてプラン
    ナに供給され、 プランナは少なくとも2つの現在の連続するページに対応するポテンシャルと
    してプランフラグメントを構成し、 プランナはプランフラグメントから現在の最適の規則を生成してこの規則を制
    御推定装置に供給し、 制御推定装置はこの規則に基いて座標測地曲線を生成し、 それらの曲線は直接メモリマップ構造中に符号化され、 符号化された曲線は圧縮されたデータである請求項10記載のエージェント。
  14. 【請求項14】 エージェントは、データソースからの圧縮されたデータの
    圧縮復元のために使用される請求項8記載のエージェント。
  15. 【請求項15】 データソースは、ビデオソースである請求項14記載のエ
    ージェント。
  16. 【請求項16】 データソースは、オーディオソースである請求項14記載
    のエージェント。
  17. 【請求項17】 圧縮されたデータは知識モデルに与えられ、 制御推定装置は知識モデル中のデータを使用して積分手順により座標測地を構
    成し、 座標測地は圧縮されないデータに対応している請求項14項記載のエージェン
    ト。
  18. 【請求項18】 プランナおよびアダプタは計算動作中シンボルパターン整
    合を使用する請求項7記載のエージェント。
  19. 【請求項19】 リアクチブ推定装置は有限状態マシーンであり、計算動作
    に対する回帰的有限状態マシーン分解のための手段を具備している請求項7項記
    載のエージェント。
  20. 【請求項20】 回帰的有限状態マシーン分解のための手段はさらに、 並列直列の一体オートマトンに有限状態マシーンを変換するための並列合成手
    段と、 各一体オートマトンを一連の接頭オートマトンおよびループオートマトンに変
    換する縦続分解手段と、 ベースオートマトンを形成するために新しい終端状態を含むことによってルー
    プオートマトンを修正する線形化手段と、 アクセスできない状態を含むアクセスできないベースオートマトンのタイミン
    グ手段と、 各ベースオートマトンが有限状態マシーン中の成功した経路に対応することを
    決定する手段と、 プランに対する補正項都市手最終的に使用するためにアダプタに対して各成功
    したベースオートマトンを出力する手段とを具備している請求項19項記載のエ
    ージェント。
  21. 【請求項21】 アダプタは、制御推定装置から故障項を受信し、故障項の
    関数として補正項を計算し、 プランナは、アダプタから補正項を受信し、この補正項から新しいプランを生
    成し、 リアクチブ推定装置は、新しいプランを受信してリアクチブ推定装置により記
    憶されたELL規則と一致するかテストし、新しいプランが一致しない場合には
    新しいプランはアダプタに送り帰されて改善され、新しいプランが一致した場合
    には新しいプランが制御推定装置に送られる請求項7記載のエージェント。
  22. 【請求項22】 知識モデルは局部プロセスの要求を記憶するためにメモリ
    パッチを使用する請求項7記載のエージェント。
  23. 【請求項23】 制御ループは直接メモリマップマシーンである請求項1記
    載のエージェント。
  24. 【請求項24】 直接メモリマップマシーンは、 制御されているプロセスについての知覚情報および他のエージェントからの制
    約情報から入力情報を生成する入力と、 入力情報に対応する知識モデルを記憶するメモリパッチのアレイと、 記憶されたプロセスゴールを入力情報と比較し、プロセスゴールのパターンが
    メモリパッチのアレイの少なくとも1つのパターンと少くとも部分的に整合する
    場合にメモリパッチのアレイのメモリパッチの少なくとも1つを付勢するように
    動作するゴール被比較数レジスタと、 入力情報とプロセスの記憶された現在の状態とを比較し、現在の状態のパター
    ンが少なくとも部分的にメモリパッチのアレイの少なくとも1つのパターンと整
    合する場合にメモリパッチのアレイのメモリパッチの少なくとも1つを付勢する
    ように動作する現在の状態被比較数レジスタと、 現在の状態被比較数レジスタにより付勢されるプロセスの現在の状態を表す整
    合されたメモリパッチ内容を記憶するための応答バッファと、 ゴール被比較数レジスタにより付勢される整合されたメモリパッチ内容を記憶
    するためのバック伝播バッファと、 応答メモリパッチの一部を形成するために応答バッファ中に記憶された情報の
    一部を一体化する手段と、 応答バッファの内容とバック伝播バッファの内容とを組合わせて特有のチャッ
    タリングを使用して応答メモリパッチの残りの部分を計算する手段と、 冗長メモリパッチを使用してプロセスを制御するための要求されたチャッタリ
    ング作用を発生させる手段とを具備している請求項23記載のエージェント。
  25. 【請求項25】 メモリパッチのアレイは内容アクセス可能なメモリとして
    動作する請求項24記載のエージェント。
  26. 【請求項26】 メモリパッチはキャリアマニホルドのトポロジーにおける
    オープンセットの計算的表示である請求項24記載のエージェント。
JP2000508020A 1997-08-22 1998-08-18 分散非線形プロセスのインテリジェントな実時間制御のためのマルチプルエージェントのハイブリッド制御アーキテクチャ Expired - Fee Related JP3628961B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US08/916,418 US5963447A (en) 1997-08-22 1997-08-22 Multiple-agent hybrid control architecture for intelligent real-time control of distributed nonlinear processes
US08/916,418 1997-08-22
PCT/US1998/017056 WO1999010758A1 (en) 1997-08-22 1998-08-18 Multiple-agent hybrid control architecture for intelligent real-time control of distributed nonlinear processes

Publications (2)

Publication Number Publication Date
JP2001514403A true JP2001514403A (ja) 2001-09-11
JP3628961B2 JP3628961B2 (ja) 2005-03-16

Family

ID=25437237

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000508020A Expired - Fee Related JP3628961B2 (ja) 1997-08-22 1998-08-18 分散非線形プロセスのインテリジェントな実時間制御のためのマルチプルエージェントのハイブリッド制御アーキテクチャ

Country Status (6)

Country Link
US (1) US5963447A (ja)
EP (1) EP1044383A4 (ja)
JP (1) JP3628961B2 (ja)
AU (1) AU762880B2 (ja)
CA (1) CA2301922C (ja)
WO (1) WO1999010758A1 (ja)

Families Citing this family (114)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6317638B1 (en) * 1997-08-22 2001-11-13 Honeywell Inc. Multi-layer state machine for a hybrid real-time control system and method of operation thereof
US6751526B2 (en) * 1997-08-22 2004-06-15 Sony Corporation Method for describing robot structure and part of robot
US7269475B1 (en) * 1998-03-02 2007-09-11 Xerox Corporation Distributed control system with global contraints for controlling object motion with smart matter
US6195737B1 (en) * 1998-03-23 2001-02-27 Ati Technologies Inc. Method and apparatus for relative addressing of tiled data
GB9808609D0 (en) * 1998-04-22 1998-06-24 Automatic Parallel Designs Ltd Method and apparatus for designing sequential circuits
US6208955B1 (en) * 1998-06-12 2001-03-27 Rockwell Science Center, Llc Distributed maintenance system based on causal networks
US6487577B1 (en) * 1998-06-29 2002-11-26 Intel Corporation Distributed compiling
US6142019A (en) * 1998-06-29 2000-11-07 General Electric Co. Method of determining surface acoustic wave paths
JP3738139B2 (ja) * 1998-10-19 2006-01-25 松下電器産業株式会社 生産管理装置及び生産管理方法
JP4517409B2 (ja) * 1998-11-09 2010-08-04 ソニー株式会社 データ処理装置およびデータ処理方法
JP4147647B2 (ja) * 1998-11-09 2008-09-10 ソニー株式会社 データ処理装置およびデータ処理方法、並びに記録媒体
JP4258045B2 (ja) * 1998-11-09 2009-04-30 ソニー株式会社 ノイズ低減装置、ノイズ低減方法、および記録媒体
US6789054B1 (en) * 1999-04-25 2004-09-07 Mahmoud A. Makhlouf Geometric display tools and methods for the visual specification, design automation, and control of adaptive real systems
AU4852000A (en) * 1999-05-14 2000-12-05 Manna, Inc. Intelligent computer system
US6442441B1 (en) * 1999-05-17 2002-08-27 Ford Global Technologies, Inc. Method of automatically generating and verifying programmable logic controller code
CA2272739C (en) * 1999-05-25 2003-10-07 Suhayya Abu-Hakima Apparatus and method for interpreting and intelligently managing electronic messages
JP4344964B2 (ja) * 1999-06-01 2009-10-14 ソニー株式会社 画像処理装置および画像処理方法
FR2795830B1 (fr) 1999-07-01 2001-08-31 Lorraine Laminage Procede de pilotage d'un processus dynamique complexe
US6529705B1 (en) * 1999-07-12 2003-03-04 Paracomp, Inc. Computerized scientific method educational system for collecting and analyzing data from prerecorded experiments
US7099855B1 (en) 2000-01-13 2006-08-29 International Business Machines Corporation System and method for electronic communication management
US7478162B2 (en) * 2000-02-08 2009-01-13 British Telecommunications Public Limited Company Communications network
US6982955B1 (en) * 2000-03-28 2006-01-03 British Telecommunications Public Limited Company Communications network
US6947917B1 (en) * 2000-04-14 2005-09-20 Honeywell International Inc. Advanced recipe—a knowledge based information system for production processes
US6408277B1 (en) 2000-06-21 2002-06-18 Banter Limited System and method for automatic task prioritization
US7409356B1 (en) 2000-06-21 2008-08-05 Applied Systems Intelligence, Inc. Method and system for intelligent supply chain collaboration
US9699129B1 (en) 2000-06-21 2017-07-04 International Business Machines Corporation System and method for increasing email productivity
AU2001271351A1 (en) * 2000-06-21 2002-01-02 Applied Systems Intelligence, Inc. Method and system for providing an intelligent goal-oriented user interface to data and services
US8290768B1 (en) 2000-06-21 2012-10-16 International Business Machines Corporation System and method for determining a set of attributes based on content of communications
US6892192B1 (en) 2000-06-22 2005-05-10 Applied Systems Intelligence, Inc. Method and system for dynamic business process management using a partial order planner
US6751661B1 (en) 2000-06-22 2004-06-15 Applied Systems Intelligence, Inc. Method and system for providing intelligent network management
GB0022561D0 (en) * 2000-09-14 2000-11-01 British Telecomm Communications network
US6782372B1 (en) * 2000-09-28 2004-08-24 Sandia Corporation Latent effects decision analysis
US7702491B2 (en) 2000-09-29 2010-04-20 Ford Global Technologies, Llc Method of part flow model for programmable logic controller logical verification system
US6741898B2 (en) 2000-09-29 2004-05-25 Ford Motor Company Method of using neutral event file for manufacturing line analysis
US6748283B2 (en) 2000-09-29 2004-06-08 Ford Motor Company Method of using neutral event specification file for manufacturing line analysis
US7269580B2 (en) * 2000-10-03 2007-09-11 Celcorp, Inc. Application integration system and method using intelligent agents for integrating information access over extended networks
EP1199678A1 (fr) * 2000-10-17 2002-04-24 Martine Naillon Procédé de pilotago de processus décisionnel lors de la poursuite d'un but dans un domaine d'application déterminé, tel qu'économique, technique, organistionnel ou analogue
US6882965B1 (en) 2000-10-17 2005-04-19 Cadence Design Systems, Inc. Method for hierarchical specification of scheduling in system-level simulations
US20020047857A1 (en) * 2000-10-20 2002-04-25 Srinivas Venkatram Systems and methods for directed knowledge management using the DISHA platform
EP1202141B1 (en) * 2000-10-30 2007-12-12 Siemens Aktiengesellschaft Method of reducing finite controlling automata and corresponding computer-readable medium
US7146349B2 (en) * 2000-11-06 2006-12-05 International Business Machines Corporation Network for describing multimedia information
US7644057B2 (en) 2001-01-03 2010-01-05 International Business Machines Corporation System and method for electronic communication management
US7092858B1 (en) * 2001-01-17 2006-08-15 Synopsys, Inc. Method and apparatus for formally constraining random simulation
EP1368932A1 (en) * 2001-03-13 2003-12-10 BRITISH TELECOMMUNICATIONS public limited company Communications network
US7278134B2 (en) * 2001-04-27 2007-10-02 International Business Machines Corporation Three dimensional framework for information technology solutions
US7277832B2 (en) * 2001-05-04 2007-10-02 Bigwood Technology, Inc. Dynamical method for obtaining global optimal solution of general nonlinear programming problems
DE10125610A1 (de) * 2001-05-25 2002-12-12 Siemens Ag Verfahren und Computersystem zur Durchführung einer Simulation
WO2002099635A1 (en) * 2001-06-01 2002-12-12 The Johns Hopkins University System and method for an open autonomy kernel (oak)
US7275048B2 (en) * 2001-10-30 2007-09-25 International Business Machines Corporation Product support of computer-related products using intelligent agents
WO2003038749A1 (en) * 2001-10-31 2003-05-08 Icosystem Corporation Method and system for implementing evolutionary algorithms
GB2384580A (en) * 2001-12-14 2003-07-30 Empiricom Technologies Ltd Knowledge acquisition in expert systems
US6922681B2 (en) * 2001-12-20 2005-07-26 Xerox Corporation Problem partitioning method and system
US7092924B1 (en) * 2002-02-28 2006-08-15 Raytheon Company Method and system for assigning observations
US7149678B2 (en) * 2002-03-28 2006-12-12 Microsoft Corporation High level executable network abstract machine
US20030225474A1 (en) * 2002-05-31 2003-12-04 Gustavo Mata Specialization of active software agents in an automated manufacturing environment
US7437703B2 (en) * 2002-10-25 2008-10-14 Sap Ag Enterprise multi-agent software system with services able to call multiple engines and scheduling capability
US6647745B1 (en) * 2002-12-05 2003-11-18 Praxair Technology, Inc. Method for controlling the operation of a cryogenic rectification plant
US7228187B2 (en) * 2002-12-16 2007-06-05 Rockwell Automation Technologies, Inc. System and method for interfacing multi-agent system
US20040148178A1 (en) * 2003-01-24 2004-07-29 Brain Marshall D. Service management system
JP3809614B2 (ja) * 2003-02-14 2006-08-16 関西ティー・エル・オー株式会社 仮想パワーモニタを備えることにより制御対象の安定性を評価解析する機能を備えた制御システム
US20040176968A1 (en) * 2003-03-07 2004-09-09 Microsoft Corporation Systems and methods for dynamically configuring business processes
EP1611546B1 (en) * 2003-04-04 2013-01-02 Icosystem Corporation Methods and systems for interactive evolutionary computing (iec)
US7389230B1 (en) 2003-04-22 2008-06-17 International Business Machines Corporation System and method for classification of voice signals
US8495002B2 (en) 2003-05-06 2013-07-23 International Business Machines Corporation Software tool for training and testing a knowledge base
US20050187913A1 (en) 2003-05-06 2005-08-25 Yoram Nelken Web-based customer service interface
US7707548B2 (en) * 2003-07-22 2010-04-27 Verizon Business Global Llc Integration of information distribution systems
US7333960B2 (en) 2003-08-01 2008-02-19 Icosystem Corporation Methods and systems for applying genetic operators to determine system conditions
US7356518B2 (en) * 2003-08-27 2008-04-08 Icosystem Corporation Methods and systems for multi-participant interactive evolutionary computing
US7440992B1 (en) * 2003-09-16 2008-10-21 Agent Software Corporation Cell-based computing platform where services and agents interface within cell structures to perform computing tasks
US7647327B2 (en) 2003-09-24 2010-01-12 Hewlett-Packard Development Company, L.P. Method and system for implementing storage strategies of a file autonomously of a user
EP1577724B1 (en) * 2004-03-15 2009-10-07 Rockwell Automation Technologies, Inc. Agent program environment
US20050234598A1 (en) * 2004-04-15 2005-10-20 Discenzo Frederick M Autonomous agents for coordinated diagnostics, reconfiguration, and control for coupled systems
CA2571654A1 (en) * 2004-06-22 2005-12-29 British Telecommunications Public Limited Company Wireless ad hoc network
US7707220B2 (en) 2004-07-06 2010-04-27 Icosystem Corporation Methods and apparatus for interactive searching techniques
US7346478B2 (en) * 2004-09-21 2008-03-18 Ford Motor Company Method of embedding tooling control data within mechanical fixture design to enable programmable logic control verification simulation
WO2006062948A2 (en) * 2004-12-06 2006-06-15 Honda Motor Co., Ltd. Interface for robot motion control
US8423323B2 (en) 2005-09-21 2013-04-16 Icosystem Corporation System and method for aiding product design and quantifying acceptance
US20070142935A1 (en) * 2005-12-20 2007-06-21 Danielsson Bjorn M Method and arrangement in a computer system for controlling a process
US7308327B2 (en) * 2006-05-12 2007-12-11 Ford Motor Company Method of application protocol monitoring for programmable logic controllers
US7792816B2 (en) 2007-02-01 2010-09-07 Icosystem Corporation Method and system for fast, generic, online and offline, multi-source text analysis and visualization
US8589935B2 (en) * 2007-05-08 2013-11-19 L-3 Communications Corporation Heterogeneous reconfigurable agent compute engine (HRACE)
US20090070074A1 (en) * 2007-09-12 2009-03-12 Anilkumar Chigullapalli Method and system for structural development and optimization
US9079306B2 (en) * 2007-10-22 2015-07-14 Honda Motor Co., Ltd. Evaluation of communication middleware in a distributed humanoid robot architecture
US9613324B2 (en) * 2008-03-28 2017-04-04 International Business Machines Corporation Apparatus and methods for decomposing service processes and for identifying alternate service elements in service provider environments
EP2161637B1 (en) * 2008-09-04 2015-05-20 Siemens Aktiengesellschaft Method for updating manufacturing planning data for a production process
WO2011112365A2 (en) * 2010-03-09 2011-09-15 Siemens Corporation Efficient security-constrained optimal power flow (sc opf) analysis using convexification of continuos variable constraints within a bi-level decomposition scheme
US20110270432A1 (en) * 2010-05-03 2011-11-03 General Motors Corporation@@Gm Global Technology Operations, Inc. Scalable manufacturing assembly verification system
US20120209796A1 (en) * 2010-08-12 2012-08-16 Telcordia Technologies, Inc. Attention focusing model for nexting based on learning and reasoning
US8874242B2 (en) * 2011-03-18 2014-10-28 Rockwell Automation Technologies, Inc. Graphical language for optimization and use
US8897900B2 (en) * 2011-03-18 2014-11-25 Rockwell Automation Technologies, Inc. Graphical language for optimization and use
US20120239169A1 (en) * 2011-03-18 2012-09-20 Rockwell Automation Technologies, Inc. Transparent models for large scale optimization and control
US11188652B2 (en) 2012-10-02 2021-11-30 Mordecai Barkan Access management and credential protection
US9342695B2 (en) * 2012-10-02 2016-05-17 Mordecai Barkan Secured automated or semi-automated systems
US10133250B2 (en) 2014-06-20 2018-11-20 Veritone Alpha, Inc. Managing construction of decision modules to control target systems
GB2532208A (en) * 2014-11-07 2016-05-18 Ibm Host network controller
US10656628B2 (en) * 2015-05-12 2020-05-19 Siemens Aktiengesellschaft Control device for a production module and a method for operating the control device
FR3048522B1 (fr) * 2016-03-02 2018-03-16 Bull Sas Systeme de suggestion d'une liste d'actions a un utilisateur et procede associe
US20170271984A1 (en) 2016-03-04 2017-09-21 Atigeo Corp. Using battery dc characteristics to control power output
CN109478045B (zh) 2016-04-28 2022-09-27 维利通阿尔法公司 使用预测来控制目标系统
US10303131B2 (en) 2016-05-13 2019-05-28 Veritone Alpha, Inc. Using sensor data to assist in controlling a target system by modeling the functionality of the target system
US10394205B2 (en) 2016-11-29 2019-08-27 Virtual Peaker, Inc. Systems and methods for real-time control
US11348029B1 (en) * 2017-11-22 2022-05-31 Amazon Technologies, Inc. Transformation of machine learning models for computing hubs
US10666076B1 (en) 2018-08-14 2020-05-26 Veritone Alpha, Inc. Using battery state excitation to control battery operations
US10452045B1 (en) 2018-11-30 2019-10-22 Veritone Alpha, Inc. Controlling ongoing battery system usage while repeatedly reducing power dissipation
US10816949B1 (en) 2019-01-22 2020-10-27 Veritone Alpha, Inc. Managing coordinated improvement of control operations for multiple electrical devices to reduce power dissipation
US11644806B1 (en) 2019-01-24 2023-05-09 Veritone Alpha, Inc. Using active non-destructive state excitation of a physical system to model and control operations of the physical system
US11097633B1 (en) 2019-01-24 2021-08-24 Veritone Alpha, Inc. Using battery state excitation to model and control battery operations
US11069926B1 (en) * 2019-02-14 2021-07-20 Vcritonc Alpha, Inc. Controlling ongoing battery system usage via parametric linear approximation
CN110111146B (zh) * 2019-04-30 2023-07-11 东华大学 一种面向云实例选择的多目标优化求解方法
US11407327B1 (en) 2019-10-17 2022-08-09 Veritone Alpha, Inc. Controlling ongoing usage of a battery cell having one or more internal supercapacitors and an internal battery
CN114118434A (zh) * 2020-08-27 2022-03-01 朱宝 智能机器人及其学习方法
WO2022212916A1 (en) * 2021-04-01 2022-10-06 Giant.Ai, Inc. Hybrid computing architectures with specialized processors to encode/decode latent representations for controlling dynamic mechanical systems
US11892809B2 (en) 2021-07-26 2024-02-06 Veritone, Inc. Controlling operation of an electrical grid using reinforcement learning and multi-particle modeling
CN115586721A (zh) * 2022-10-08 2023-01-10 厦门大学 一种基于模型预测控制的短射程精确制导方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01243102A (ja) * 1988-03-25 1989-09-27 Hitachi Ltd プロセス制御方法
JPH0566804A (ja) * 1992-01-31 1993-03-19 Hitachi Ltd プロセス制御方法および装置
JPH05204409A (ja) * 1992-01-23 1993-08-13 Hitachi Ltd 知能型リアルタイムコントロ−ラ、機能分散階層型リ アルタイムコントローラ、均質階層型リアルタイムコ ントローラ、複合型リアルタイムコントローラ
JPH06161501A (ja) * 1992-11-17 1994-06-07 Hitachi Ltd 機器の制御装置
JPH08202409A (ja) * 1995-01-30 1996-08-09 Hitachi Ltd 分散制御装置、システム及びコントローラ

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4724495A (en) * 1982-11-15 1988-02-09 Hedberg David J Digital formatter, controller, and head assembly for video disk recording system, and method

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01243102A (ja) * 1988-03-25 1989-09-27 Hitachi Ltd プロセス制御方法
JPH05204409A (ja) * 1992-01-23 1993-08-13 Hitachi Ltd 知能型リアルタイムコントロ−ラ、機能分散階層型リ アルタイムコントローラ、均質階層型リアルタイムコ ントローラ、複合型リアルタイムコントローラ
JPH0566804A (ja) * 1992-01-31 1993-03-19 Hitachi Ltd プロセス制御方法および装置
JPH06161501A (ja) * 1992-11-17 1994-06-07 Hitachi Ltd 機器の制御装置
JPH08202409A (ja) * 1995-01-30 1996-08-09 Hitachi Ltd 分散制御装置、システム及びコントローラ

Also Published As

Publication number Publication date
AU9021798A (en) 1999-03-16
AU762880B2 (en) 2003-07-10
WO1999010758A1 (en) 1999-03-04
JP3628961B2 (ja) 2005-03-16
CA2301922C (en) 2005-08-09
EP1044383A4 (en) 2007-10-17
EP1044383A1 (en) 2000-10-18
CA2301922A1 (en) 1999-03-04
US5963447A (en) 1999-10-05

Similar Documents

Publication Publication Date Title
JP3628961B2 (ja) 分散非線形プロセスのインテリジェントな実時間制御のためのマルチプルエージェントのハイブリッド制御アーキテクチャ
EP0864120B1 (en) Multiple-agent hybrid control architecture
Xiang et al. Verification for machine learning, autonomy, and neural networks survey
Kim et al. Design of software system based on axiomatic design
Kohn et al. Multiple agent autonomous hybrid control systems
KR101935006B1 (ko) 멀티 에이전트 시스템에 포함되는 추종 에이전트 및 이의 제어 방법
JP2020177672A (ja) デジタルツインによるプロセス制御
JP2020177671A (ja) デジタルツインによるモデリング
Lane et al. Distributed problem solving and real-time mechanisms in robot architectures
dos Santos Soares et al. Real-time scheduling of batch systems using Petri nets and linear logic
Guo et al. Hierarchical motion planning under probabilistic temporal tasks and safe-return constraints
Sewlia et al. MAPS $^ 2$: Multi-Robot Anytime Motion Planning under Signal Temporal Logic Specifications
AU739208B2 (en) Multiple-agent hybrid control architecture
AU744460B2 (en) Multiple-agent hybrid control architecture
Li et al. Synthesizing cooperative controllers from global tasks of multi-robot systems
CA2235973C (en) Multiple-agent hybrid control architecture
Kohn et al. A hybrid systems approach to computer-aided control engineering
Brusaferri et al. Model Predictive Control in Discrete Manufacturing Shopfloors
Wan et al. The Component-based Design Method for Agent-based Multi-AGV System
Polisi Initialization Algorithms for Coupled Dynamic Systems
Mallozzi et al. Correct-by-Construction Design of Contextual Robotic Missions Using Contracts
Zhao et al. A Survey of Optimization-based Task and Motion Planning: From Classical To Learning Approaches
Kindson et al. A Simplified Approach to Distributed Message Handling in a CQRS Architecture
Liu et al. An Intelligent Switching Method of Multi-Resolution Models Oriented for Complex System Co-Simulation
Neupane et al. Plan Generation via Behavior Trees Obtained from Goal-Oriented LTLf Formulas

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040316

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20040616

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20040705

A524 Written submission of copy of amendment under section 19 (pct)

Free format text: JAPANESE INTERMEDIATE CODE: A524

Effective date: 20040916

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20041109

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20041209

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees