针对高超声速飞行器的跟踪控制问题,提出了一种自适应最优非线性控制方法。该方法在增强学习机制的基础上,采用行为-评价体系结构(actor-critic architecture)设计自适应控制器。控制器的结构由两个相互作用的神经网络组成,一个用于生成控制协议(称为actor NN),另一个用于评估控制策略(称为critic NN)。利用离散极小原理,得到了该自适应控制器的最优条件。仿真结果验证了该设计方法在高超声速飞行器跟踪控制中的有效性。