第四章: 拆解概念 老师为了让学生更好地理解这个复合概念,将其拆分为三个独立的部分来讲解:过程(Process)、随机(Stochastic / 随机性)和马尔可夫(Markov) 。 过程 (Process) 核心含义: 老师首先倒着讲解,强调“过程”一定和时间相关。 具体表现: 它代表一个“时序
第一部分:问题建模(Pre-Modeling)- 我的问题是什么类型? 在选择算法之前,您必须先将您的现实问题抽象为数学框架。根据第四章的内容,您的问题可以归入以下四种主要类型之一,它们的关键区别在于**“有无动作”(Agent是纯观测还是能决策)和“是否可观测”**(状态是透明的还是隐藏的)。