机械工程学报 ›› 2026, Vol. 62 ›› Issue (5): 74-87.doi: 10.3901/JME.260229
• 特邀专栏:信息驱动的总装拉动生产模式、技术及应用 • 上一篇
黄铭1, 黄思翰1,2, 陈建鹏1, 董威1, 王柏村3, 阮兵4, 高云鹏5, 王国新1,2, 阎艳1,2
HUANG Ming1, HUANG Sihan1,2, CHEN Jianpeng1, DONG Wei1, WANG Baicun3, RUAN Bing4, GAO Yunpeng5, WANG Guoxin1,2, YAN Yan1,2
摘要: 随着新能源汽车产业的快速发展以及市场需求多样化、定制化趋势的兴起,一种新兴的岛式装配模式应运而生,用于解决传统汽车装配流水线柔性不足的问题。此外,在实际装配环境中以紧急插单为典型代表的不确定事件频发,严重制约着汽车总装的稳定性和生产效率。 因此,结合实际需要,开展不确定扰动下岛式装配线动态调度优化。首先,构建形成以最小化最大完工时间和插单变更指数为双优化目标的混合整数非线性规划模型。其次,设计了一种多目标对决双层深度Q网络(MO-D3QN)求解该模型。其中针对岛式装配场景中装配岛、装配工艺、装配产品以及生产运输环节的特征设计了状态指标和动作调度规则。面向双优化目标分别构建了连续型即时奖励函数组件,并采用加权和标量化方法实现奖励聚合。然后,通过对MO-D3QN算法模型的学习训练,实现在不同环境状态下最佳调度规则的选择。最后,在3种规模的实例上开展计算试验,结果表明MO-D3QN优于单一调度规则、随机选择策略和经典DQN,从而验证了MO-D3QN的有效性和竞争力。
中图分类号: