CN115066697A - 狭义ai代理的集合 - Google Patents
狭义ai代理的集合 Download PDFInfo
- Publication number
- CN115066697A CN115066697A CN202080084840.4A CN202080084840A CN115066697A CN 115066697 A CN115066697 A CN 115066697A CN 202080084840 A CN202080084840 A CN 202080084840A CN 115066697 A CN115066697 A CN 115066697A
- Authority
- CN
- China
- Prior art keywords
- agent
- agents
- sensed information
- narrow
- information units
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 claims abstract description 62
- 238000012545 processing Methods 0.000 claims abstract description 41
- 230000004044 response Effects 0.000 claims abstract description 37
- 230000008569 process Effects 0.000 claims description 15
- 230000008447 perception Effects 0.000 claims description 7
- 238000013528 artificial neural network Methods 0.000 claims description 4
- 238000005457 optimization Methods 0.000 claims description 2
- 230000009467 reduction Effects 0.000 claims description 2
- 238000013473 artificial intelligence Methods 0.000 description 100
- 230000006399 behavior Effects 0.000 description 12
- 238000000354 decomposition reaction Methods 0.000 description 7
- 238000013135 deep learning Methods 0.000 description 7
- 230000002776 aggregation Effects 0.000 description 5
- 238000004220 aggregation Methods 0.000 description 5
- 230000001276 controlling effect Effects 0.000 description 3
- 230000002996 emotional effect Effects 0.000 description 3
- 241000283070 Equus zebra Species 0.000 description 2
- 230000009471 action Effects 0.000 description 2
- 230000000875 corresponding effect Effects 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 108091027981 Response element Proteins 0.000 description 1
- 230000004931 aggregating effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 238000005265 energy consumption Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 230000036651 mood Effects 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 230000001953 sensory effect Effects 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 238000002604 ultrasonography Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/04—Inference or reasoning models
- G06N5/043—Distributed expert systems; Blackboards
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
- G06N20/20—Ensemble learning
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B25—HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
- B25J—MANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
- B25J9/00—Programme-controlled manipulators
- B25J9/16—Programme controls
- B25J9/1602—Programme controls characterised by the control system, structure, architecture
- B25J9/161—Hardware, e.g. neural networks, fuzzy logic, interfaces, processor
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B60—VEHICLES IN GENERAL
- B60W—CONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
- B60W60/00—Drive control systems specially adapted for autonomous road vehicles
- B60W60/001—Planning or execution of driving tasks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B25—HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
- B25J—MANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
- B25J9/00—Programme-controlled manipulators
- B25J9/16—Programme controls
- B25J9/1628—Programme controls characterised by the control loop
- B25J9/163—Programme controls characterised by the control loop learning, adaptive, model based, rule based expert control
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B19/00—Programme-control systems
- G05B19/02—Programme-control systems electric
- G05B19/04—Programme control other than numerical control, i.e. in sequence controllers or logic controllers
- G05B19/042—Programme control other than numerical control, i.e. in sequence controllers or logic controllers using digital processors
- G05B19/0426—Programming the control sequence
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- Evolutionary Computation (AREA)
- Computing Systems (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Automation & Control Theory (AREA)
- Computational Linguistics (AREA)
- Mechanical Engineering (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Medical Informatics (AREA)
- Transportation (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Human Computer Interaction (AREA)
- Life Sciences & Earth Sciences (AREA)
- Robotics (AREA)
- Fuzzy Systems (AREA)
- Traffic Control Systems (AREA)
- Stored Programmes (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
一种用于操作狭义AI代理的集合的方法,该方法可以包括:获取一个或多个感测到的信息单元;通过感知单元并基于所述一个或多个感测到的信息单元,确定集合中与所述一个或多个感测到的信息单元的处理相关的一个或多个相关狭义AI代理;其中,所述集合与第一多个场景相关;由所述一个或多个相关狭义AI代理处理所述一个或多个感测到的信息单元,以提供一个或多个狭义AI代理输出;以及由中间结果单元处理所述一个或多个狭义AI代理输出以提供中间结果;由响应单元基于所述中间结果生成响应;其中每个狭义AI代理与所述第一多个场景的相应部分相关。
Description
背景
本申请要求了序列号为62/932,066、递交日为2019年11月7日的美国临时专利申请的优先权,在此将其整体并入本文。
背景技术
需要基于人工智能(AI)的解决方案以最佳方式响应大量场景。
该要求使基于AI的解决方案高度复杂化,并且也使基于AI的解决方案的训练过程复杂化。
端到端深度学习、模型分解和基于行为的机器人技术是有限的基于AI的解决方案的示例。
端对端深度学习
例如,端对端深度学习包括构建模型,该模型学习将来自相机的原始像素映射到转向命令。不需要领域专业知识或注解数据——只需要一个巨大的网络。
端对端深度学习的一些优点包括:(a)能够设计模型而无需对问题有深入的了解,尽管问题很复杂,以及(b)不需要手动标记数据。
另一方面,端对端深度学习具有以下缺点:(i)需要学习边缘案例。这种架构导致罕见事件的概率呈指数级下降,这导致数据呈指数级增长是获得所需准确性所必需的,(i)端对端深度学习提供了一个黑盒——无法理解和预测,以及(iii)端对端深度学习无法扩展到复杂环境中的高度自主设备。
模型分解
模型分解涉及将任务分解为模块:传感器、感知、规划和控制。这些子系统共同作用以感知AV周围的环境,检测道路的可驾驶部分,规划到目的地的路线,预测周围其他汽车或行人的行为,规划轨迹,并最终执行运动。
模型分解的一些优点包括:(i)提供对系统的良好的了解,以及(ii)允许优化每个模块。
另一方面,模型分解存在以下缺点:(i)分解为模型使得很难将其组合回完整的场景,丢失了大量信息(例如预测、代理的意图等),(ii)处理大量不需要的信息——适应度战胜真理(Fitness Beats Truth),以及(iii)模型分解无法扩展到复杂环境中的高度自主设备。
基于行为的机器人技术
基于行为的机器人技术是机器人技术中的一种方法,其关注机器人,该机器人能够表现出复杂的行为,尽管对其直接环境进行建模的内部变量状态很少,主要通过感觉-运动链接逐渐纠正其动作。
基于行为的机器人技术的一些优点包括:(i)很好地学习简单的环境和任务的能力,(ii)需要很少的计算资源,以及(iii)允许“机械不精确”。
另一方面,基于行为的机器人技术具有以下缺点:(i)基于行为的机器人技术没有内部世界模型,(ii)反应式系统没有规划未来并且它们不知道外部世界的样子,(iii)此类系统无法使用内部表示来思考或学习新行为,以及(iv)基于行为的机器人技术无法扩展到复杂环境中的高度自主设备。
附图说明
结合附图,通过以下详细的描述将会更全面地理解和领会本公开的实施例,其中:
图1示出了包括集合的系统10的示例;
图2示出了一个方法的示例;和
图3示出了一个方法的示例。
具体实施方式
说明书和/或附图可涉及图像。图像是感测到的信息单元的示例。任何对图像的引用都可以比照适用于感测到的信息单元。感测到的信息单元可以比照适用于自然信号,例如但不限于自然产生的信号、代表人类行为的信号、代表与股票市场相关的操作的信号、医疗信号等。感测到的信息单元可以由至少一种类型的一个或多个传感器感测,例如可见光相机,或可以感测红外线、雷达图像、超声、电光、射线照相、LIDAR(光检测和测距)的传感器、基于非图像的传感器(加速度计、速度计、热传感器、气压计)等。
感测到的信息单元可以由一种或多种类型的一个或多个传感器感测。该一个或多个传感器可以属于相同的设备或系统——或者可以属于系统的不同设备。
可以提供一种系统,该系统是或包括狭义AI代理的集合。
集合可以包括感知路由器、多个狭义AI代理、一个协调器(或任何其他输出处理单元)和响应模块(例如用于控制自主设备的动器)。
狭义AI代理的数量例如可以超过1000个、可以超过10,000个、可以超过100,000个等等。
狭义AI代理是狭义的,因为它没有被训练来响应应该由整个集合处理的所有可能的(或所有可能发生的,或大多数的)场景。例如,每个狭义AI代理可以被训练以响应这些场景的一小部分(例如,小于1%)和/或可以被训练以仅响应形成场景的一些因素或元素或参数或变量。
狭义AI代理可以具有相同的复杂性和/或相同的参数(深度、能量消耗、技术实施),但是至少一些狭义AI代理可以彼此不同。
可以以监督和/或非监督方式训练狭义AI代理。
一个或多个狭义AI代理可以是神经网络或可以不同于神经网络。
集合可以包括一个或多个传感器和用于生成感测到的信息单元的任何其他实体和/或可以(通过接口)从一个或多个传感器接收一个或多个感测到的信息单元。因此,该集合可以包括用于接收感测信息的输入接口和/或I/O单元。该集合可以包括一个或多个传感器并从一个或多个其他传感器接收感测信息。
感知路由器可以处理一个或多个感测到的信息单元并确定哪些(一个或多个)狭义AI代理与一个或多个感测到的信息单元的处理相关。
不同的场景可以与相同数量的狭义AI代理相关联,或者可以与不同数量的狭义AI代理相关联。
确定哪些场景应该与狭义AI代理相关联可以基于在一个或多个时间段期间接收的信息单元手动地、自动地完成,可以基于感知路由器的输出来确定。另外或替代地——感知路由器可以被配置为检测手动或自动或通过手动和自动方式两者的组合选择的场景和/或场景元素。
协调器可以接收相关狭义AI代理的输出并且可以处理输出以提供可以发送到响应单元的中间结果,响应单元可以根据中间结果进行响应。该处理可以包括对相关狭义AI代理的输出应用任何函数,例如,选择一个或一些输出、平均输出、执行输出的加权和等。
函数可以预先确定、随时间学习、基于关于由响应单元生成的响应的反馈而修改等。
集合处理的场景可以属于各种领域——安全、汽车、医疗设备、机器人设备、网络分析、人机界面等。
提供了以下示例,但它们并不旨在限制所公开的集合的应用。
集合(和/或感知路由器、集合、协调器和响应单元可以由一个或多个处理器执行或托管)。处理器可以是处理电路。处理电路可以实施为中央处理单元(CPU)和/或一个或多个其他集成电路,例如专用集成电路(ASIC)、现场可编程门阵列(FPGA)、全定制集成电路等,或此类集成电路的组合。
包括集合、感知路由器、集合、协调器和响应单元的系统可以由一个或多个处理单元、由一个或多个集成电路等来实施。
图1示出了可以用于自主驾驶(或驾驶员辅助系统)的集合,其中响应单元可以控制自主车辆或者响应单元可以向驾驶员建议行进路线。
系统10接收一个或多个感测到的信息单元,例如图像、感知路由器30、狭义AI代理的集合40、协调器50和响应单元例如驱动器60。
集合可以是狭义AI代理的任何组或排列或聚集。图1通过显示与它们相关的场景来说明各种狭义AI代理-环形交叉路口、行人穿过斑马线、交通拥堵以及交通标志或障碍物。
感知路由器可以例如基于来自环境的感觉输入激活(例如通过发送一个或多个信息单元或其一部分)到正确的狭义代理,并且还可以根据其他因素,例如汽车的任务/路线等,确定激活哪个狭义AI代理(哪个是相关的狭义AI单元)。
图2将系统10'示为包括获取单元20(用于接收一个或多个感测到的信息单元15)、感知单元30'、狭义AI代理40(I)-40(K),K为狭义AI代理的数量、中间结果单元50'和响应单元60'。
例如,感测到的信息单元可以是输入图像——在下雨天进入环岛,环岛内有障碍物(轮胎、坑洼、水坑等)。
可以训练不同的狭义AI代理以响应不同的场景,这些场景可能是(或可能包括)丁字路口、不同的道路元素、斑马线、环形交叉路口、障碍物、不同的环境条件、雨、雾、夜晚、直行高速公路,上山,交通拥堵等)。不同障碍物和/或不同道路元素的示例在标题为“METHODAND SYSTEM FOR OBSTACLE DETECTION”的PCT专利申请WO2020/079508中说明,该专利申请全文并入本文。
不同的场景可以是不同的情形或者可根据情况而不同。
场景可以是例如以下中的至少一个:(a)车辆的位置,(b)一种或多种天气条件,(c)一个或多个上下文参数,(d)道路条件,(e)交通参数。
道路条件的各种示例可包括道路的粗糙度、道路的维护水平、坑洼或其他相关道路障碍物的存在、道路是否湿滑、被雪或其他颗粒覆盖。
交通参数和一个或多个上下文参数的各种示例可以包括时间(小时、天、时段或年、某些天的某些小时等)、交通负载、道路上车辆的分布,一辆或多辆车辆的行为(攻击性的、冷静的、可预测的、不可预测的等),道路附近行人的存在,车辆附近行人的存在,远离车辆的行人的存在,行人(攻击性的、冷静的、可预测的、不可预测的等)、与在车辆附近驾驶相关的风险、与在车辆内驾驶相关的复杂性、(靠近车辆)的至少一个幼儿园、学校、人群聚集等的存在。上下文参数可能与感测到的信息的上下文有关——上下文可取决于或与形成事件、陈述或想法的背景的环境有关。
可以训练相关的狭义AI代理以响应大量情况中的一种或多种情况。情况和基于情况的处理的示例在美国专利申请16/035,732中进行了说明,该专利申请通过引用并入本文。
作为环形交叉路口代理(被训练以响应环形交叉路口的存在)的相关狭义AI代理可以输出可包括转向角+5度、减速到20mps的驾驶指令。
作为障碍物代理的相关狭义AI代理可以输出驾驶指令,其可以包括在5米处将转向角设置为-25度。
作为雨代理(被训练以响应雨的存在)的相关狭义AI代理可以输出可包括减速20%的驾驶指令。
协调器可以被配置为接收这三个驾驶指令并且可以对其进行处理并且输出中间结果(在这种情况下为驾驶指令),即减速到16mps、将方向盘向右转动5度和在5米之后向左转动25度以绕过障碍物。这是与不同时间段(可能与不同时间段相关联的路线的不同段)相关的狭义AI代理的输出组合的示例。
该中间结果可用于控制自动驾驶车辆和/或向驾驶员建议所述驾驶路线。
该方法可以应用于控制机械手。
在该示例中,每个狭义AI代理都可以擅于抓取特定对象、形状、特质。
感知系统识别对象、给定对象的形状、特质,并激活相关的狭义AI代理。
每个相关的狭义AI代理输出指令(到机械手)用于抓取。
协调器输出最终动作策略——用于控制抓取对象的指令。
抓取操作可以由任何其他机械操作代替。
集合可以用于各种目的——例如导航一个或多个无人机。
集合可以提供通过人机界面转换为人类可感知输出的输出。MMI需要提供可能适合人的感知情绪的响应。
感知路由器可以分析来自一个或多个传感器的一个或多个感测到的信息单元以了解人的当前情绪状态。
例如-感测到的信息可以包括:(i)人正在说的内容,(ii)人的情绪状态(尴尬、不安、不确定等)。
感知路由器可以分析感测到的信息以了解情绪状态(例如——80%尴尬、10%不安、10%不确定)并激活相关狭义AI代理。每个狭义AI代理可以生成其输出,并且协调器整合(或以其他方式处理)所有相关狭义AI代理的输出,以确定发送到输出所需的视听输出的响应单元的响应内容(单词、音调等)。
图3说明了方法100。
方法100可以从获取一个或多个感测到的信息单元的步骤110开始。获取可以包括接收信息单元、感测信息单元等。信息单元可以包括任何数量的感测到的信息,可以包括任何格式的信息等。
步骤110可以由获取单元(诸如输入/输出单元、通信单元、检索单元、存储单元)、图像处理器、图像采集卡、一个或多个传感器等来执行。
步骤110之后可以是步骤120,即由感知单元并基于一个或多个感测到的信息单元确定集合中的一个或多个相关狭义AI代理,其可能与一个或多个感测到的信息单元的处理有关。
感知单元可以是感知路由器或者可以不同于感知路由器。
步骤120可以包括:确定一个或多个获取的场景,其可与一个或多个感测到的信息单元相关,和基于获取的一个或多个场景之间的关系以及第一多个场景与狭义AI代理之间的关联来确定狭义AI代理的相关性。
步骤120可以包括:当狭义AI代理可以与一个或多个获取的场景中的任何一个相关联时确定该狭义AI代理可能是相关的。
可以手动确定第一多个场景和狭义AI代理之间的关联。
可以基于由感知路由器做出的先前确定来确定第一多个场景与狭义AI代理之间的关联。
步骤120可以包括:确定可能与一个或多个感测到的信息单元相关的一个或多个获取的场景部分,以及基于一个或多个获取的场景部分以及第一多个场景与狭义AI代理之间的关联确定该狭义AI代理的相关性。
获取的场景部分中的至少一些可以与在一个或多个感测到的信息单元中感测到的一个或多个对象相关联。
步骤120之后可以向一个或多个相关狭义AI代理馈送一个或多个感测到的信息单元。这可以包括将一个或多个感测到的信息单元馈送到一个或多个相关狭义AI代理中的每一个。或者,这可以包括确定将一个或多个感测到的信息单元的哪一部分发送给每个相关的狭义AI代理。
在集合被配置为响应第一多个场景中的任何场景的意义上,它可以与第一多个场景相关。每个狭义AI代理在其可能与第一多个场景的相应部分相关的意义上是狭义的。
与第一多个场景中的一个相关的狭义AI代理的数量可以不同于与第一多个场景中的另一个相关的狭义AI代理的数量。
狭义AI代理的数量可以超过100、1000、10000、100000甚至更多。
可以训练狭义AI代理以响应第一多个场景的相应部分。
至少一些狭义AI代理可以包括神经网络的至少一部分。
集合的步骤120可以基于一个或多个感测到的信息单元并且基于至少一个附加参数。
至少一个附加参数可以是分配给该方法的目的。
步骤120之后可以是步骤130,即由一个或多个相关狭义AI代理处理一个或多个感测到的信息单元以提供一个或多个狭义AI代理输出。
该处理可以包括应用Al处理。可以训练狭义AI代理以任何方式应用AI处理。例如,一旦训练,狭义Al代理可以执行步骤130。
狭义AI代理输出可以是命令。
狭义AI代理输出可以是用于一辆自动驾驶车辆的命令。
狭义AI代理输出可以是高级驾驶员辅助系统(ADAS)命令。
狭义AI代理输出可以是响应单元的建议响应。
步骤130之后可以是步骤140,即由中间结果单元处理一个或多个狭义AI代理输出以提供中间结果。
中间结果单元可以是协调器或者可以不同于协调器。
中间结果单元可以被配置为从一个或多个狭义AI代理输出中选择至少一个选定的狭义AI代理输出。
中间结果单元可以被配置为平均一个或多个狭义AI代理输出。
一个或多个狭义AI代理输出中的每个狭义AI代理输出可以与时间段相关联。
一个或多个狭义AI代理输出中的不同狭义AI代理输出可以与不同时间段相关联,其中中间结果单元可以被配置为在不同时间段中的每个时间段产生可以对与时间段相关的狭义AI代理输出进行响应的中间结果。
中间结果可以包括用于驾驶车辆的指令。
中间结果可以包括用于操作机器人的指令。
中间结果单元的处理可以包括通过应用风险降低优化来组合多个狭义AI代理输出。
步骤140之后可以是由响应单元基于中间结果生成响应的步骤150。该响应可以包括(a)操作设备、单元或系统,(b)控制设备、单元或系统,(c)存储命令,(d)执行命令,(e)发送命令,(f)存储请求,(g)执行请求,以及(h)发送请求。
应当注意,方法100可以在步骤140结束。步骤150可以由与执行步骤110、120、130和140中的任何步骤的任何实体不同(例如,位置不同)的实体执行。
可以提供一种用于操作狭义AI代理的集合的方法,该方法可以包括:获取一个或多个感测到的信息单元;通过感知单元并基于一个或多个感测到的信息单元,确定集合中与一个或多个感测到的信息单元的处理相关的一个或多个相关狭义AI代理;其中,该集合与第一多个场景相关;由所述一个或多个相关狭义AI代理处理一个或多个感测到的信息单元,以提供一个或多个狭义AI代理输出;和由中间结果单元处理一个或多个狭义AI代理输出以提供中间结果;其中,中间结果指示对一个或多个感测到的信息单元的响应。
可以提供一种存储用于操作狭义AI代理集合的指令的非暂时性计算机可读介质,该操作可以包括:获取一个或多个感测到的信息单元;通过感知单元并基于一个或多个感测到的信息单元,确定集合中与一个或多个感测到的信息单元的处理相关的一个或多个相关狭义AI代理;其中,该集合与第一多个场景相关;由一个或多个相关狭义AI代理处理一个或多个感测到的信息单元,以提供一个或多个狭义AI代理输出;由中间结果单元处理一个或多个狭义AI代理输出以提供中间结果;和由响应单元基于中间结果生成响应,其中每个狭义AI代理与第一多个场景的相应部分相关。
可以提供一种存储用于操作狭义AI代理的集合的指令的非暂时性计算机可读介质,该操作可以包括:获取一个或多个感测到的信息单元;通过感知单元并基于一个或多个感测到的信息单元,确定集合中与一个或多个感测到的信息单元的处理相关的一个或多个相关狭义AI代理;其中,该集合与第一多个场景相关;由一个或多个相关狭义AI代理处理一个或多个感测到的信息单元,以提供一个或多个狭义AI代理输出;和由中间结果单元处理一个或多个狭义AI代理输出以提供中间结果;其中,中间结果指示对一个或多个感测到的信息单元的响应。
可以提供一种计算机化系统,该系统可以包括获取单元,该获取单元被配置为获取一个或多个感测到的信息单元;狭义AI代理的集合;感知单元,其被配置为基于一个或多个感测到的信息单元确定集合中与一个或多个感测到的信息单元的处理相关的一个或多个相关狭义AI代理;其中,该集合与第一多个场景相关;其中一个或多个相关狭义AI代理被配置为处理一个或多个感测到的信息单元,以提供一个或多个狭义AI代理输出;中间结果单元,其被配置为处理一个或多个狭义AI代理输出以提供中间结果;和响应单元,其被配置为基于中间结果生成响应;其中每个狭义AI代理与第一多个场景的相应部分相关。
可以提供一种计算机化系统,该系统可以包括获取单元,该获取单元被配置为获取一个或多个感测到的信息单元;狭义AI代理的集合;感知单元,其被配置为基于一个或多个感测到的信息单元确定集合中与一个或多个感测到的信息单元的处理相关的一个或多个相关狭义AI代理;其中,该集合与第一多个场景相关;其中一个或多个相关狭义AI代理被配置为处理一个或多个感测到的信息单元,以提供一个或多个狭义AI代理输出;中间结果单元,其被配置为处理一个或多个狭义AI代理输出以提供中间结果;其中,中间结果指示对一个或多个感测到的信息单元的响应;并且其中每个狭义AI代理与第一多场景的相应部分相关。
计算机化系统可以被配置为执行方法100的任何步骤或任何步骤组合。
存储用于执行方法100的任何步骤或任何步骤组合的指令的非暂时性计算机可读介质。
应当理解,如果需要,本公开的实施例的软件组件可以以ROM(只读存储器)形式实施。如果需要,软件组件通常可以使用传统技术在硬件中实施。还应理解,软件组件可以被实例化,例如:作为计算机程序产品或在有形介质上。在一些情况下,可以将软件组件实例化为可被适当的计算机理解的信号,尽管在本公开的某些实施例中可以排除这样的实例化。应当理解,为了清楚起见,在单独的实施例的上下文中描述的本公开的实施例的各种特征也可以在单个实施例中组合地提供。相反,为了简洁起见,在单个实施例的上下文中描述的本公开的实施例的各种特征也可以单独提供或以任何合适的子组合提供。本领域技术人员将理解,本公开的实施例不受上文具体示出和描述的内容的限制。相反,本公开的实施例的范围由所附权利要求及其等价物限定。
Claims (33)
1.一种用于操作狭义AI代理的集合的方法,该方法包括:
获取一个或多个感测到的信息单元;
通过感知单元并基于所述一个或多个感测到的信息单元,确定集合中与所述一个或多个感测到的信息单元的处理相关的一个或多个相关狭义AI代理;其中,所述集合与第一多个场景相关;
由所述一个或多个相关狭义AI代理处理所述一个或多个感测到的信息单元,以提供一个或多个狭义AI代理输出;以及
由中间结果单元处理所述一个或多个狭义AI代理输出以提供中间结果;和
由响应单元基于所述中间结果生成响应;
其中,每个狭义AI代理与所述第一多个场景的相应部分相关。
2.根据权利要求1所述的方法,对于至少一些狭义AI代理,所述相应部分小于所述第一多个场景的百分之一。
3.根据权利要求1所述的方法,其中,与所述第一多个场景中的一个相关的狭义AI代理的数量不同于与所述第一多个场景中的另一个相关的狭义AI代理的数量。
4.根据权利要求1所述的方法,其中,狭义AI代理的数量超过1000。
5.根据权利要求1所述的方法,其中,狭义AI代理的数量超过100000。
6.根据权利要求1所述的方法,其中,每个狭义AI代理被训练为响应所述第一多个场景的相应部分。
7.根据权利要求1所述的方法,其中,至少一些狭义AI代理包括神经网络的至少一部分。
8.根据权利要求1所述的方法,其中,确定一个或多个相关狭义AI代理包括:确定与所述一个或多个感测到的信息单元相关的一个或多个获取的场景,以及基于所述一个或多个获取的场景之间的关系以及所述第一多个场景与狭义AI代理之间的关联,确定所述狭义AI代理的相关性。
9.根据权利要求8所述的方法,其中,确定一个或多个相关狭义AI代理包括:当狭义AI代理与所述一个或多个获取的场景中的任一个相关联时,确定所述狭义AI代理是相关的。
10.根据权利要求8所述的方法,其中,所述第一多个场景与所述狭义AI代理之间的所述关联是手动确定的。
11.根据权利要求8所述的方法,其中所述第一多个场景与所述狭义AI代理之间的所述关联是基于由所述感知路由器先前做出的确定来确定的。
12.根据权利要求1所述的方法,其中,确定一个或多个相关狭义AI代理包括:确定与所述一个或多个感测到的信息单元相关的一个或多个获取的场景部分,以及基于所述一个或多个获取的场景部分之间的关系以及所述第一多个场景与狭义AI代理之间的关联确定所述狭义AI代理的相关性。
13.根据权利要求12所述的方法,其中,获取的场景部分中的至少一些与在所述一个或多个感测到的信息单元中感测到的一个或多个对象相关联。
14.根据权利要求1所述的方法,包括将所述一个或多个感测到的信息单元馈送到所述一个或多个相关狭义AI代理中的每一个。
15.根据权利要求1所述的方法,包括确定将所述一个或多个感测到的信息单元的哪一部分发送到每个相关狭义AI代理。
16.根据权利要求1所述的方法,其中,所述狭义AI代理输出是命令。
17.根据权利要求1所述的方法,其中,所述狭义AI代理输出是用于自主控制车辆的命令。
18.根据权利要求1所述的方法,其中,所述狭义AI代理输出是高级驾驶员辅助系统(ADAS)命令。
19.根据权利要求1所述的方法,其中,所述狭义AI代理输出是所述响应单元的建议响应。
20.根据权利要求1所述的方法,中间结果单元被配置为从所述一个或多个狭义AI代理输出中选择至少一个选定的狭义AI代理输出。
21.根据权利要求1所述的方法,中间结果单元被配置为对所述一个或多个狭义AI代理输出取平均。
22.根据权利要求1所述的方法,其中,所述一个或多个狭义AI代理输出中的每个狭义AI代理输出与时间段相关联。
23.根据权利要求1所述的方法,其中,所述一个或多个狭义AI代理输出的不同狭义AI代理输出与不同时间段相关联,其中,所述中间结果单元被配置为在所述不同时间段中的每个时间段产生对与所述时间段相关的狭义AI代理输出进行响应的中间结果。
24.根据权利要求22所述的方法,其中,所述中间结果包括用于驾驶车辆的指令。
25.根据权利要求22所述的方法,其中,所述中间结果包括用于操作机器人的指令。
26.根据权利要求1所述的方法,其中,所述中间结果单元的处理包括通过应用风险降低优化来组合多个狭义AI代理输出。
27.根据权利要求1所述的方法,其中,所述集合的所述一个或多个相关狭义AI代理的确定是基于所述一个或多个感测到的信息单元并且基于至少一个附加参数。
28.根据权利要求27所述的方法,其中,所述至少一个附加参数是分配给所述方法的目的。
29.一种操作狭义AI代理集合的方法,该方法包括:
获取一个或多个感测到的信息单元;
通过感知单元并基于所述一个或多个感测到的信息单元,确定集合中与所述一个或多个感测到的信息单元的处理相关的一个或多个相关狭义AI代理;其中,所述集合与第一多个场景相关;
由所述一个或多个相关狭义AI代理处理所述一个或多个感测到的信息单元,以提供一个或多个狭义AI代理输出;
由中间结果单元处理所述一个或多个狭义AI代理输出以提供中间结果;其中,所述中间结果指示对所述一个或多个感测到的信息单元的响应。
30.一种存储用于操作狭义AI代理的集合的指令的非暂时性计算机可读介质,所述操作包括:
获取一个或多个感测到的信息单元;
通过感知单元并基于所述一个或多个感测到的信息单元,确定集合中与所述一个或多个感测到的信息单元的处理相关的一个或多个相关狭义AI代理;其中,所述集合与第一多个场景相关;
由所述一个或多个相关狭义AI代理处理所述一个或多个感测到的信息单元,以提供一个或多个狭义AI代理输出;和
由中间结果单元处理所述一个或多个狭义AI代理输出以提供中间结果;和
由响应单元基于所述中间结果生成响应;
其中,每个狭义AI代理与所述第一多个场景的相应部分相关。
31.一种存储用于操作狭义AI代理的集合的指令的非暂时性计算机可读介质,该操作包括:
获取一个或多个感测到的信息单元;
通过感知单元并基于所述一个或多个感测到的信息单元,确定集合中与所述一个或多个感测到的信息单元的处理相关的一个或多个相关狭义AI代理;其中,所述集合与第一多个场景相关;
由所述一个或多个相关狭义AI代理处理所示一个或多个感测到的信息单元,以提供一个或多个狭义AI代理输出;和
由中间结果单元处理所述一个或多个狭义AI代理输出以提供中间结果;其中,所述中间结果指示对所述一个或多个感测到的信息单元的响应。
32.一种计算机化系统,包括:
获取单元,被配置为获取一个或多个感测到的信息单元;
狭义AI代理的集合;
感知单元,被配置为基于所述一个或多个感测到的信息单元确定所述集合中与所述一个或多个感测到的信息单元的处理相关的一个或多个相关狭义AI代理;其中,所述集合与第一多个场景相关;
其中,所述一个或多个相关狭义AI代理被配置为处理所述一个或多个感测到的信息单元,以提供一个或多个狭义AI代理输出;
中间结果单元,其被配置为处理所述一个或多个狭义AI代理输出以提供中间结果;和
响应单元,被配置为基于所述中间结果生成响应;
其中,每个狭义AI代理与所述第一多个场景的相应部分相关。
33.一种计算机化系统,包括:
获取单元,被配置为获取一个或多个感测到的信息单元;
狭义AI代理的集合;
感知单元,被配置为基于所述一个或多个感测到的信息单元确定所述集合中与所述一个或多个感测到的信息单元的处理相关的一个或多个相关狭义AI代理;其中,所述集合与第一多个场景相关;
其中,所述一个或多个相关狭义AI代理被配置为处理所述一个或多个感测到的信息单元,以提供一个或多个狭义AI代理输出;
中间结果单元,其被配置为处理所述一个或多个狭义AI代理输出以提供中间结果;其中,所述中间结果指示对所述一个或多个感测到的信息单元的响应;和
其中,每个狭义AI代理与所述第一多个场景的相应部分相关。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201962932066P | 2019-11-07 | 2019-11-07 | |
US62/932,066 | 2019-11-07 | ||
PCT/IB2020/060542 WO2021090299A2 (en) | 2019-11-07 | 2020-11-09 | Ensemble of narrow ai agents |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115066697A true CN115066697A (zh) | 2022-09-16 |
Family
ID=75845451
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202080084840.4A Pending CN115066697A (zh) | 2019-11-07 | 2020-11-09 | 狭义ai代理的集合 |
Country Status (5)
Country | Link |
---|---|
US (3) | US20230177405A1 (zh) |
EP (1) | EP4062333A4 (zh) |
JP (1) | JP2023547967A (zh) |
CN (1) | CN115066697A (zh) |
WO (2) | WO2021090299A2 (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20220200934A1 (en) * | 2020-12-23 | 2022-06-23 | Optum Technology, Inc. | Ranking chatbot profiles |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7426437B2 (en) * | 1997-10-22 | 2008-09-16 | Intelligent Technologies International, Inc. | Accident avoidance systems and methods |
EP3845427A1 (en) * | 2015-02-10 | 2021-07-07 | Mobileye Vision Technologies Ltd. | Sparse map for autonomous vehicle navigation |
WO2017177128A1 (en) * | 2016-04-08 | 2017-10-12 | The Trustees Of Columbia University In The City Of New York | Systems and methods for deep reinforcement learning using a brain-artificial intelligence interface |
US10572773B2 (en) * | 2017-05-05 | 2020-02-25 | Intel Corporation | On the fly deep learning in machine learning for autonomous machines |
US20200249637A1 (en) * | 2017-09-22 | 2020-08-06 | Nec Corporation | Ensemble control system, ensemble control method, and ensemble control program |
US10551840B2 (en) * | 2018-07-02 | 2020-02-04 | Baidu Usa Llc | Planning driven perception system for autonomous driving vehicles |
US11392738B2 (en) * | 2018-10-26 | 2022-07-19 | Autobrains Technologies Ltd | Generating a simulation scenario |
US11816709B2 (en) * | 2018-12-28 | 2023-11-14 | Pied Parker, Inc. | Image-based parking recognition and navigation |
US12076148B2 (en) * | 2019-07-05 | 2024-09-03 | The Penn State Research Foundation | Systems and methods for automated recognition of bodily expression of emotion |
US11928583B2 (en) * | 2019-07-08 | 2024-03-12 | International Business Machines Corporation | Adaptation of deep learning models to resource constrained edge devices |
-
2020
- 2020-11-09 EP EP20885730.0A patent/EP4062333A4/en active Pending
- 2020-11-09 CN CN202080084840.4A patent/CN115066697A/zh active Pending
- 2020-11-09 US US17/755,822 patent/US20230177405A1/en active Pending
- 2020-11-09 WO PCT/IB2020/060542 patent/WO2021090299A2/en unknown
- 2020-11-09 US US17/093,442 patent/US20210142225A1/en active Pending
-
2021
- 2021-04-17 US US18/036,150 patent/US20230419105A1/en active Pending
- 2021-04-17 WO PCT/IB2021/053181 patent/WO2022096942A1/en active Application Filing
- 2021-04-17 JP JP2023550732A patent/JP2023547967A/ja active Pending
Also Published As
Publication number | Publication date |
---|---|
EP4062333A4 (en) | 2024-06-05 |
EP4062333A2 (en) | 2022-09-28 |
US20230177405A1 (en) | 2023-06-08 |
US20230419105A1 (en) | 2023-12-28 |
JP2023547967A (ja) | 2023-11-14 |
WO2021090299A2 (en) | 2021-05-14 |
US20210142225A1 (en) | 2021-05-13 |
WO2021090299A3 (en) | 2021-07-01 |
WO2022096942A1 (en) | 2022-05-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11587329B2 (en) | Method and apparatus for predicting intent of vulnerable road users | |
KR102540436B1 (ko) | 차량 사고 예측 시스템 및 그 방법 | |
EP3918590A1 (en) | Neural network based navigation of autonomous vehicles through traffic entities | |
US20200004255A1 (en) | Method and arrangement for generating control commands for an autonomous road vehicle | |
CN112078593B (zh) | 基于多种网络协同模型的自动驾驶系统及方法 | |
Emuna et al. | Deep reinforcement learning for human-like driving policies in collision avoidance tasks of self-driving cars | |
CN111874007A (zh) | 基于知识与数据驱动的无人车分层决策方法、系统、装置 | |
US20240017746A1 (en) | Assessing present intentions of an actor perceived by an autonomous vehicle | |
WO2023023336A1 (en) | Detected object path prediction for vision-based systems | |
US12019449B2 (en) | Rare event simulation in autonomous vehicle motion planning | |
CN115066697A (zh) | 狭义ai代理的集合 | |
CN111465938A (zh) | 用于自动行驶的确定道路标记的装置 | |
DE112022002869T5 (de) | Verfahren und System zur Verhaltensprognose von Akteuren in einer Umgebung eines autonomen Fahrzeugs | |
CN113276863A (zh) | 车辆控制方法、装置、设备、介质及程序产品 | |
US12046013B2 (en) | Using relevance of objects to assess performance of an autonomous vehicle perception system | |
US12033399B1 (en) | Turn and brake action prediction using vehicle light detection | |
US11697435B1 (en) | Hierarchical vehicle action prediction | |
US20220382284A1 (en) | Perception system for assessing relevance of objects in an environment of an autonomous vehicle | |
US20230410469A1 (en) | Systems and methods for image classification using a neural network combined with a correlation structure | |
Mehune et al. | Robust and Adaptive Neural Networks for Self-Driving Cars in Challenging Road Conditions | |
CN116841292A (zh) | 一种基于云端计算的车辆控制方法及系统 | |
CN117422109A (zh) | 神经网络模型的构建方法及装置、轨迹预测方法及装置、计算设备、移动工具、存储介质 | |
Shreyas et al. | Adaptive Edge Computing for Autonomous Vehicles in Varying Environment | |
WO2022251769A1 (en) | Using relevance of objects to assess performance of an autonomous vehicle perception system | |
CN114415683A (zh) | 一种基于人工智能的无人驾驶汽车避碰方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |