随着大数据时代的来临,工作流应用开始由原有的基础设施转移到更加高效、可靠、廉价的云平台上。本文针对现有基于强化学习的云工作流调度算法收敛速度慢的问题,详细分析云工作流任务的执行流程,设计了一种细粒度的云工作流系统模型,提出了一种结合自适应自然梯度高斯过程回归和强化学习的云工作流调度算法。算法采用强化学习的任务分配算法解决虚拟机间负载均衡问题,并通过自适应自然梯度高斯过程回归加速最优策略的生成。在WorkflowSim平台下进行了验证,实验结果证明了本文算法在一定程度上加速了最优策略的收敛。