在城市交通环境,交通流的正确预测是比较困难,因为多个十字路口,这使得预设的交通控制 模型之间的相互作用和纠缠在一起,不能在所有的交通情况下始终保持高性能的预测。考虑 到的强化学习的所具有的自主学习能力,本文提出了基于多智能体强化学习的交通信号控制方 法。没有预设的控制模型,多协作代理可以学习相应的实时交通状况下的最优控制策略。通过 实验结果证明了这种方法的可行性和有效性。