Adaptive Control of Resource Flow to Optimize Construction Work and Cash Flow via Online Deep Reinforcement Learning

Automation in Construction, 2023

引用方式: Jiang, C., Li, X., Lin, J.R.*, Liu, M., Ma, Z. (2023). Adaptive Control of Resource Flow to Optimize Construction Work and Cash Flow via Online Deep Reinforcement Learning. Automation in Construction, 150, 104817. doi: 10.1016/j.autcon.2023.104817 http://doi.org/10.1016/j.autcon.2023.104817 cited by count

摘要

建造过程工序、资源和现金流具有高度的复杂性和动态性,一旦管理不当往往会导致时间和成本超支、破产,甚至项目失败。现有的施工管控方法尚不能有效的实现不确定性动态环境中的资源高效调度和控制。因此,本文引入一种施工过程资源流自适应调度的模型和方法,以实现施工工序和现金流的优化。首先,研究将施工过程的工序、资源和现金流的复杂相互作用以及各类不确定因素的影响形式化为一个基于部分可观察的马尔可夫决策过程的数学模型;同时,研究引入基于深度强化学习(DRL)的方法实现了该模型的高效求解,以实现对人员、材料的连续自适应优化控制并优化工序及现金流。此外,为了辅助DRL的训练过程,研究同时建立了基于离散事件模拟的模拟器来模拟项目的动态特征和外部环境。实验表明,我们的方法优于朴素经验方法和遗传算法,在不同的项目和外部环境中具有显著优势,并且混合DRL和经验方法训练的决策代理可以产生最优方案。本研究贡献了耦合“工序-资源-现金”多要素的自适应控制和优化,并为工程施工过程利用DRL技术奠定了基础。

graphical abstract

论文下载链接

预印本下载链接

This study was supported by Research Project of Beijing Municipal Science & Technology Commission, Administrative Commission of Zhongguancun Science Park (20220468132) and the Research Development Project of the Ministry of Housing and Urban-Rural Development of the People’s Republic of China (K20210032).

相关项目资助情况:

发表评论