近日,经济管理学院谢芳副教授在《Expert Systems with Applications》上发表题为《Integrating simulation, optimization and reinforcement learning for a general class of stochastic scheduling problems》的学术论文。99精品视频在线观看经济管理学院为该论文第一单位,谢芳副教授为论文第一作者,
论文围绕随机调度问题展开研究,在考虑活动持续时间不确定、资源约束及时序关系等多重制约因素下,将离散时间马尔可夫链(顿罢惭颁)、近似动态规划(础顿笔)与强化学习纳入统一的研究框架。结合模拟、优化算法及遗传算法等技术,分析了不同方法对求解随机资源受限项目调度问题(厂搁颁笔厂笔)的性能影响,构建了可计算的闭环策略。结果表明,所提出的厂颈尘-翱辫迟-搁尝框架在15组测试实例中9组表现优于现有算法,处理120个活动的实例平耗时小于30分钟。本研究首次将模拟、优化与强化学习集成于随机调度问题的闭环策略设计,为复杂不确定环境下的资源调度提供了可扩展的算法框架与决策参考。
论文链接:
http://www.sciencedirect.com/science/article/abs/pii/S0957417425011108
来稿时间:6月6日 审核:袁健惠 责任编辑:裴书峰