微软亚洲研究院提出一种使用预训练的大型语言模型(LLM)来进行工业控制的方法。该研究通过使用 GPT-4模型来控制空气调节系统(HVAC),并且仅需少量示例样本就能达到优于传统强化学习方法的效果。传统的强化学习方法在处理异构任务、样本低效以及在线适应新场景等方面存在问题,而使用预训练 LLM 可以作为解决方案。
论文地址:https://export.arxiv.org/abs/2308.03028
该研究使用 GPT-4模型和交互环境进行实验,得到了积极的结果。研究者还进行了消融研究,以确定不同部分在控制任务中的贡献。该研究的目标是探索直接使用预训练 LLM 进行工业控制任务的潜力,以及设计解决技术债较低的工业控制任务的方法。
这篇论文的主要贡献包括:
开发了一种可将基础模型用于工业控制但无需训练的方法,其能以较低的技术债用于多种异构的任务。
研究者通过 GPT-4控制 HVAC 进行了实验,得到了积极的实验结果,展现了这些方法的潜力。
研究者进行了广泛的消融研究(涉及泛化能力、示例选取和 prompt 设计),阐明了该方向的未来发展。
相关标签: 微软亚洲研究院提出可以将 LLM 用于工业控制 直接用GPT 4控制空调
评论列表 (条)