EranKK

科技行业挑过水,金融行业搬过砖。媒体行业码过字,交易行业割过肉。

0%

RL-model-content

本文参考是知乎上的一个专栏,阿里嘎多
参考地址

机器学习

  1. 线性回归理论推导
  2. 感知机
  3. BP神经网络反向传播推导
  4. Logistic回归推导
  5. SVM
  6. 决策树
  7. K近邻
  8. 朴素贝叶斯推导

    强化学习

  9. 基本概念
  10. 马尔科夫决策过程
  11. 值函数和贝尔曼方程
  12. 动态规划方法
  13. 蒙特卡洛方法
  14. 时间差分方法
  15. Q-Leaning 和 Sarsa
  16. 多臂赌博机
  17. Policy Gradient推导过程
  18. DQN的理解
  19. DQN的三个经典变种
  20. DDPG
  21. AC、A2C、A3C算法