陆军提高无人机群的学习能力精密仪器
发布时间:2022-10-21 15:27:19 来源:保成机械网
陆军提高无人机群的学习能力
陆军研究人员开发了一种强化学习方法,该方法将使无人驾驶的空中和地面车辆成群地最佳完成各种任务,同时最大程度地降低性能不确定性。
分组是一种操作方法,其中多个自治系统通过主动协调其动作来充当凝聚单元。
陆军研究人员说,未来的多领域战斗将需要成群的动态耦合,协调的异构移动平台来与敌方能力和针对美军的威胁相提并论中国机械网okmao.com。
美国陆军作战能力发展司令部陆军研究实验室的杰明·乔治博士说,陆军正在寻求采用技术来执行耗时或危险的任务。
乔治说:“实时为这些拥挤的车辆找到最佳的制导策略,是增强战士的战术态势意识,使美军在竞争激烈的环境中独占a头的关键要求。”
增强学习提供了一种方法,可以在无法使用精确的模型来精确控制不确定的代理以实现多目标目标时使用。然而,现有的强化学习方案只能以集中方式应用,这需要将整个群体的状态信息集中在中央学习者处。乔治说,这极大地增加了计算复杂性和通信要求,导致学习时间不合理。
为了解决这个问题,乔治与北卡罗来纳州立大学的Aranya Chakrabortty教授和俄克拉荷马州立大学的He Bai教授合作,致力于解决大规模的多主体强化学习问题。陆军通过主任对外合作倡议研究奖(Director's Research Award for External Collaborative Initiative)为这项工作提供了资金,这是一项实验室计划,旨在与外部合作伙伴合作,激发和支持新的创新研究。
这项工作的主要目的是为大型群体网络的数据驱动的最优控制开发理论基础,在该模型中,控制动作将基于低维测量数据而不是动态模型进行。
当前的方法称为“层次强化学习”(HRL),它将全局控制目标分解为多个层次结构,即多个小组级别的微观控制和广泛的群体层次的宏观控制。
乔治说:“每个等级都有自己的学习循环,分别具有本地和全球奖励功能。” “通过并行运行这些学习循环,我们能够显着减少学习时间。”
陆军研究人员设想了用于地面飞行器和空中飞行器协调的分级控制。信用:美国陆军图形
根据George的说法,群体的在线强化学习控制归结为使用系统或群体输入/输出数据来求解大规模代数矩阵Riccati方程。
研究人员解决此大型矩阵Riccati方程的最初方法是将群体分为多个较小的组,并并行执行组级局部增强学习,同时在每个组的较小尺寸压缩状态下执行全局增强学习。
他们当前的HRL方案使用了一种消散机制,该机制允许团队通过首先求解局部矩阵来近似求解大型矩阵方程的解。 强化学习问题,然后从局部控制器合成全局控制(通过解决最小二乘问题),求解。在汇总状态下进行全局强化学习的过程。这进一步减少了学习时间。
实验表明,与集中式方法相比,HRL可以将学习时间减少80%,同时将最佳损失限制为5%。
乔治说:“我们目前在人力资源管理方面的努力将使我们能够为无人驾驶的空中和地面飞行器群制定控制政策,从而使他们能够最佳地完成不同的任务集,即使这些蜂群特工的个人动力尚不清楚。”
乔治表示,他相信这项研究将对未来的战场产生影响,并且已经通过进行创新的合作而成为可能。
乔治说:“ ARL科学和技术社区的核心目的是创造和利用科学知识,以实现转型的过度竞争。” “通过通过ECI和其他合作机制进行外部研究,我们希望进行破坏性的基础研究,这将导致陆军现代化,同时成为陆军与全世界科学界的主要合作纽带。”
该小组目前正在努力通过考虑群体中智能体的最佳分组来进一步优化其HRL控制方案,以最大程度地减少计算和通信复杂性,同时限制最优间隙。
他们还研究使用深度递归神经网络来学习和预测最佳分组模式,以及在稠密的城市地形中的多域作战中,对先进的空中和地面车辆进行最佳协调的发达技术的应用。
George和ECI合作伙伴最近在2020年美国控制会议上组织并主持了多代理强化学习的受邀虚拟会议,他们在会议上介绍了他们的研究结果。
-
我国油墨工业差距较大永城保鲜机励磁电源童皮鞋小型叉车Rra
我国油墨工业差距较大我国油墨工业差距较大2003年02月12日中国已成为世界第四大油墨生产国(美国脱氮剂、日本、德国分别为第一、二、三位),2000年油墨产量约为20.7万吨,2000年油墨工业产值比
03月20日 15:38
-
探讨中国塑木复合材料市场的发展方向下音乐芯片砌块机缝制设备皮带机管道系统Rra
探讨中国塑木复合材料市场的发展方向下(五)新型塑木使用全新原料早期用于塑木复合的原料多为回收塑料和废木粉,近年来发展的趋势是采用塑料新原料和木材,配方也更先进,碳酸钙和粘土越
03月20日 13:05
-
机器换人后富余员工该何去何从阀门铜球感应炉喜糖盒电子台秤连接环Rra
机器换人后 富余员工该何去何从?近年来,国内部分先行企业通过采用自动化、智能化的设备来代替繁重的手工操作(以下简称“机器换人”)。中国国务院在2015年5月印发的“中国制造2025”战略
03月20日 12:44
-
山东方鼎荣获山东省专精特新企业荣誉称号气煤卫星天线数码相框木器涂料转印油墨Rra
山东方鼎荣获山东省“专精特新企业”荣誉称号日前,山东省中小企业局公布第五批山东省“专精特新”中小企业名录,山东方鼎安全玻璃科技有限公司被认定为专精特新“自主品牌”中小企业。山
03月20日 12:02
-
世纪星论坛重新开启防伪印刷紧定衬套仪器仪表胶合板六角螺帽Rra
世纪星论坛重新开启世纪星论坛于200保险杠6年7月1日重新开启,新老客户和关心组态软件的同行,可以4)限位保护:具有程控和机械两级限位保护航空煤油;就组态软件的相关问题进行讨论。印花材料
03月14日 04:45
-
数控机床无报警故障四例灭蚊器送气猪皮皮料驾校电机转子Rra
数控机床无报警故障四例笔者在实际工作中曾遇到过多次无报警的故障,维修的难度较大。现结合实例,将这类故障的诊断和维修方法介绍如下。1 X轴不执行自动返回参考点动作 该机床为某研究所生
03月14日 04:32