运筹与管理 ›› 2025, Vol. 34 ›› Issue (8): 99-104.DOI: 10.12005/orms.2025.0247
陆心屹, 韩晓龙
LU Xinyi, HAN Xiaolong
摘要: 针对绿色制造背景下的柔性作业车间调度问题,考虑具有随机工件到达的动态事件,建立最小化总延迟时间及生产能耗的混合整数规划模型,提出一种基于复合调度规则和深度强化学习的DDQN-ST9算法。首先,结合优化目标分别对工序排序和机器选择各设计3种启发式调度规则。其次,通过引入优先经验回放SumTree实现DDQN训练框架的改进。此外,设定6个生产状态特征指标作为算法的输入,利用组合优势构成9种复合调度规则作为算法的动作空间并设计稀疏奖励机制,形成了自适应调度算法DDQN-ST9。最后,通过不同规模和参数的生产算例验证了DDQN-ST9在求解柔性作业车间动态节能调度问题的有效性和优越性,以及应对具有不同配置生产环境的通用性。
中图分类号: