首先是拉普拉斯变换。
在s域内,就有了传递函数。
为了分析控制系统,就会引入计算零极点,画根轨迹图。
在用频率响应法分析系统的时候,就会引入波特图和奈奎斯特图,波特图和奈奎斯特图用到的是复变函数的理论。
为了设计自动控制系统,就要引入各种校正装置,但背后还是复变的理论支持。
到了离散系统,就要用到采样定理和z变换,此时的传递函数就是脉冲传递函数了。
矩阵论,线性代数是最重要的基础,没有它们,就没有状态空间模型。
传统的传递函数只能处理单输入单输出的情况,而且只看输入输出,相较于现代控制理论的状态的视角,其实是丢失了不少信息的。
为了分析线性动态系统,就会引入矩阵指数、状态转移矩阵、状态响应、输出响应。
分析系统稳定性的时候,引入李雅普诺夫分析方法,构造李雅普诺夫函数,用到二次型的知识。
对系统的能控性和能观性的许多分析与判据,都要涉及到矩阵论的知识,比如能控性矩阵满秩说明系统能控。
对于线性反馈系统的综合,就要引入状态反馈,但本质上还是矩阵论的东西,不过是引入怎样的状态反馈,来进行负反馈调节。
离散时间的线性系统,引入许多分析性指标stability, reachability, PBH test。
有限时间最优控制,线性二次型最优控制
用动态规划的思想设计控制器
在状态更新或者观测的时候如果有disturbance,就要引入Kalman Filter的方法。
引入finite horizon 和 infinite horizon的问题,控制器的设计涉及到LQR,然后扩展LQR,可以考虑状态或输入的限制,需要设计权重矩阵,这也是MPC控制器调参的重要内容。
首先是基于线性化的方法,这里要引入equilibrium point的概念,会有许多稳定性的定义,比如稳定,渐近稳定,指数稳定。然后,引入状态反馈、增益设计等方法。
然后,会讲到李雅普诺夫稳定,吸引域(Region of Attraction),这里的数学支撑是拉萨尔不变集原理,基于此,就有非线性控制中的重要方法了:反步法(Backstepping)。
再次考虑输入输出的关系,会有描述函数法。
还有一些advanced的非线性控制的方法,比如滑模控制,状态观测,基于观测器的输出反馈,跟踪。
这一部分自己也正在学习中,textbook是看的Dimitri P. Bertsekas的REINFORCEMENT LEARNING AND OPTIMAL CONTROL
想办法做值空间或策略空间近似:MPC就是将J star直接看做零;用神经网络来近似J star,得到的就是深度强化学习;Rollout方法也是试图近似J star得到J tilde。
除此之外,在控制人眼里看来,强化学习中的学习就是解决一个动态规划问题但不用explicit的数学模型。学习到了一个模型,就是系统辨识(System identification)之意。
更新:一张控制世界的地图,值得好好把玩